全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
OpenAI Blog ★★★★☆ 2021-10-29

Solving math word problems

推荐理由:涉及AI模型在特定任务上的性能突破与评测

新系统解决小学数学应用题的准确率接近人类儿童水平,比微调后的GPT-3准确率高出近一倍,在相同测试中得分55%(儿童为60%)。

Hugging Face Blog ★★★★☆ 2021-10-26

Large Language Models: A New Moore's Law?

推荐理由:涉及大模型发展趋势与性能演进,契合模型评测与行业应用主题

文章探讨大语言模型的发展是否正形成类似摩尔定律的规律,分析其性能提升、规模增长与成本变化趋势,并讨论对AI行业的影响。

Hugging Face Blog ★★★★☆ 2021-10-25

使用10亿训练对训练句子嵌入模型

推荐理由:涉及AI模型训练方法与开源实践,属热门AI工具库范畴

本文介绍如何利用10亿规模的句子对数据集训练高性能句子嵌入模型,涵盖数据构建、模型架构选择及训练技巧,适用于语义搜索和文本匹配等场景。

Hugging Face Blog ★★★★☆ 2021-10-20

机器学习即代码的时代已经到来

推荐理由:契合AI辅助编程与工具链主题,具实践指导价值

文章探讨了将机器学习模型开发视为软件工程实践的新范式,强调使用现代AI IDE、版本控制和测试框架提升ML开发效率,并介绍相关工具链如MLflow、Weights & Biases及GitHub Copilot在ML项目中的应用。

Hugging Face Blog ★★★★☆ 2021-10-05

Showcase Your Projects in Spaces using Gradio

推荐理由:推荐热门 AI 工具 Gradio 在实际项目中的应用

Hugging Face Spaces 现支持通过 Gradio 快速部署和展示 AI 项目,简化了模型 Demo 的创建与分享流程。

Lilian Weng's Blog ★★★★☆ 2021-09-24

How to Train Really Large Models on Many GPUs?

推荐理由:涵盖大模型训练核心技术,对AI开发者有实用价值

文章综述了在多GPU上训练超大神经网络的关键技术,包括多种并行训练范式、模型架构优化和显存节省策略,并链接到OpenAI博客的升级版内容。

OpenAI Blog ★★★☆☆ 2021-09-23

Summarizing books with human feedback

推荐理由:涉及AI模型训练与人类反馈机制,属AI模型优化方向

探讨如何通过人类反馈扩展对AI系统的监督,以提升AI在难以评估任务(如书籍摘要)中的表现。

OpenAI Blog ★★★★☆ 2021-09-08

TruthfulQA: Measuring how models mimic human falsehoods

推荐理由:涉及AI模型评测与真实性评估,契合模型评测主题

TruthfulQA是一个用于评估大模型生成内容真实性的基准数据集,通过衡量模型模仿人类错误陈述的倾向,帮助识别和减少AI幻觉问题。

OpenAI Blog ★★★★☆ 2021-08-10

OpenAI Codex

推荐理由:涉及AI编程核心模型更新,与AI辅助编程直接相关

OpenAI发布了改进版Codex,该AI系统可将自然语言转为代码,并通过API开启私测。

Hugging Face Blog ★★★★☆ 2021-07-15

互联网上的深度学习:协作训练语言模型

推荐理由:涉及大模型训练新方法,具技术前瞻性和应用潜力

论文提出一种在互联网上协作训练语言模型的新范式,允许多方在不共享原始数据的前提下联合训练模型,兼顾隐私与模型性能。

Hugging Face Blog ★★★★☆ 2021-07-13

Welcome spaCy to the Hugging Face Hub

推荐理由:热门NLP工具库spaCy与Hugging Face集成,提升AI开发者效率

spaCy正式入驻Hugging Face Hub,用户可直接在Hub上访问其预训练模型、配置文件和词汇表,并通过spacy-huggingface-hub插件一键加载模型。

Lilian Weng's Blog ★★★★☆ 2021-07-11

What are Diffusion Models?

推荐理由:系统性介绍AI生成模型核心技术,对理解AIGC底层原理有重要价值

文章深入讲解扩散模型的原理、发展及关键技术,涵盖score-based生成建模、classifier-free guidance、latent diffusion等重要进展,并介绍GLIDE、Imagen、LDM等代表性模型。

Hugging Face Blog ★★★★☆ 2021-07-08

使用 Amazon SageMaker 轻松部署 Hugging Face 模型

推荐理由:实用的 AI 模型部署教程,结合主流平台与开源模型库

本文介绍如何利用 Amazon SageMaker 快速部署 Hugging Face 的 AI 模型,涵盖从模型选择、环境配置到推理服务上线的完整流程,并提供最佳实践和性能优化建议。

← 上一页 80 / 91 下一页 →