全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
OpenAI Blog ★★★☆☆ 2022-06-28

DALL·E 2 pre-training mitigations

推荐理由:涉及AI模型安全机制与内容合规策略,属AI模型发布相关实践。

DALL·E 2在预训练阶段引入多种防护机制,以降低生成违规内容的风险,确保符合内容政策。

Hugging Face Blog ★★★★☆ 2022-06-28

使用 DeepSpeed 加速大模型训练

推荐理由:深入讲解热门 AI 训练框架 DeepSpeed 的核心技术与实践方法

本文介绍如何利用微软的 DeepSpeed 框架优化和加速大语言模型的训练过程,涵盖 ZeRO 技术、混合精度训练及实际部署技巧。

Hugging Face Blog ★★★★☆ 2022-06-28

宣布在 Hugging Face Hub 上推出评估功能

推荐理由:涉及 AI 模型评测新工具,符合模型评测与开源生态兴趣

Hugging Face 推出 Hub 上的评估功能,支持对 AI 模型进行标准化自动评测,涵盖多种任务和指标,并与主流框架集成,便于开发者快速比较模型性能。

OpenAI Blog ★★★★☆ 2022-06-23

Learning to play Minecraft with Video PreTraining

推荐理由:展示了通用AI智能体在复杂环境中的学习能力,涉及新训练方法和人机交互接口

研究团队通过视频预训练(VPT)方法,利用大量人类玩《我的世界》的无标签视频和少量标注数据,训练出能使用键盘鼠标操作、完成复杂任务(如制作钻石工具)的AI智能体。

Hugging Face Blog ★★★★☆ 2022-06-23

嵌入(Embeddings)入门指南

推荐理由:嵌入是AI模型理解语义的核心技术,对开发和优化AI应用至关重要。

本文介绍嵌入(Embeddings)的基本概念、生成方法及其在AI应用中的作用,涵盖常见模型如Word2Vec、BERT,并提供使用开源库(如Hugging Face)实操示例。

Hugging Face Blog ★★★★☆ 2022-06-15

英特尔与 Hugging Face 合作推动机器学习硬件加速普及

推荐理由:涉及主流 AI 工具库优化与硬件加速落地,对开发者有实用价值

英特尔与 Hugging Face 合作,通过优化 Transformers 库和 OpenVINO 工具套件,提升在英特尔 CPU、GPU 和 NPU 上的 AI 模型推理性能,降低硬件加速门槛。

OpenAI Blog ★★★★☆ 2022-06-13

AI-written critiques help humans notice flaws

推荐理由:涉及AI辅助人类评估AI生成内容,契合AI vibe coding与人机协作主题

研究训练AI模型撰写摘要的批评意见,帮助人类更易发现其中缺陷。更大模型在自我批评方面表现更优,表明AI可辅助人类监督复杂任务中的AI输出。

Lilian Weng's Blog ★★★☆☆ 2022-06-09

Generalized Visual Language Models

推荐理由:涉及多模态AI模型的技术实现,属于AI模型研究范畴

文章探讨如何扩展预训练的通用语言模型,使其能够处理视觉信号,以解决视觉语言任务,如图像描述和视觉问答。

OpenAI Blog ★★★★☆ 2022-06-09

Techniques for training large neural networks

推荐理由:涉及大模型训练关键技术,契合AI模型研发主题

文章探讨了训练大型神经网络的技术挑战,包括如何协调GPU集群以执行同步计算,涉及AI模型训练的核心工程问题。

Hugging Face Blog ★★★★☆ 2022-06-07

The Annotated Diffusion Model

推荐理由:详解扩散模型核心代码,对AI开发者极具参考价值

本文深入解析扩散模型的实现细节,逐行注释代码,涵盖去噪过程、调度策略及训练技巧,适合想深入理解生成模型原理的开发者。

OpenAI Blog ★★★★☆ 2022-06-02

Best practices for deploying language models

推荐理由:涉及大模型部署实践,对AI工程化有参考价值

Cohere、OpenAI 和 AI21 Labs 联合提出一套适用于大模型开发与部署的初步最佳实践指南,涵盖安全、可靠性与责任等方面。

OpenAI Blog ★★★★☆ 2022-05-28

Teaching models to express their uncertainty in words

推荐理由:涉及AI模型输出可靠性,对AI应用落地有实际意义

文章探讨如何训练AI模型用自然语言表达其预测的不确定性,例如说“我不确定”或“这可能不准确”,以提升人机交互的可靠性与透明度。

Hugging Face Blog ★★★★☆ 2022-05-23

无需真实数据的高效表格预训练:TAPEX 简介

推荐理由:介绍创新的表格预训练技术,属于AI模型研发前沿

TAPEX 是一种新颖的表格预训练方法,通过合成 SQL 查询生成训练数据,无需依赖真实表格数据,显著降低数据获取成本并提升模型在表格理解任务上的表现。

Hugging Face Blog ★★★★☆ 2022-05-16

Gradio 3.0 发布!

推荐理由:Gradio 是热门AI工具库,新版提升开发体验,适合AI应用快速原型构建。

Gradio 3.0 正式发布,带来更快的UI渲染、更灵活的组件布局、改进的事件处理机制,并增强对AI模型部署和交互的支持。

Hugging Face Blog ★★★★☆ 2022-05-10

使用 Optimum 和 Transformers Pipeline 实现加速推理

推荐理由:提供主流AI工具库的高效使用方法,适合开发者提升推理性能。

本文介绍如何结合 Hugging Face 的 Transformers Pipeline 与 Optimum 库,在不同硬件(如 GPU、CPU)上优化和加速大模型推理,涵盖量化、编译等实用技巧。

Hugging Face Blog ★★★★☆ 2022-05-06

欢迎 fastai 加入 Hugging Face Hub

推荐理由:涉及热门 AI 工具库整合,便于开发者使用和共享模型。

fastai 库现已集成到 Hugging Face Hub,用户可直接上传、共享和加载 fastai 模型,提升 AI 开发效率。

Hugging Face Blog ★★★☆☆ 2022-05-04

An Introduction to Deep Reinforcement Learning

推荐理由:涵盖AI核心技术及应用,适合学习与实践

本文介绍了深度强化学习的基本概念、核心算法(如DQN、A3C)及其在游戏、机器人等领域的应用,适合初学者入门。

← 上一页 77 / 91 下一页 →