全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
Hugging Face Blog ★★★★☆ 2025-02-14

Fixing Open LLM Leaderboard with Math-Verify

推荐理由:涉及AI模型评测方法改进,契合用户对模型评测的关注

文章提出通过引入Math-Verify方法改进开放大语言模型排行榜,解决现有基准测试在数学推理能力评估中的不足,提升评测准确性。

OpenAI Blog ★★★★☆ 2025-02-13

Wayfair is shaping the future of retail with AI

推荐理由:展示了AI在零售业的落地应用与商业价值

Wayfair首席技术官Fiona Tan分享公司如何利用AI重塑零售体验,涵盖个性化推荐、视觉搜索及供应链优化等实际应用案例。

OpenAI Blog ★★★★☆ 2025-02-13

Using OpenAI o1 for financial analysis

推荐理由:展示AI大模型在金融分析领域的商业化落地案例

Rogo利用OpenAI o1模型提升AI驱动的金融研究能力,展示其在财务分析中的实际应用效果。

OpenAI Blog ★★★★☆ 2025-02-12

Sharing the latest Model Spec

推荐理由:涉及AI模型服务发布与技术规范,符合用户兴趣

文章介绍了最新发布的Model Spec,涵盖模型能力、接口规范及使用场景,为开发者提供清晰的集成指南和性能预期。

Hugging Face Blog ★★★★☆ 2025-02-12

构建出色的视频生成数据集

推荐理由:涉及AI视频生成核心技术环节,对开发者有实用价值

本文介绍如何构建高质量视频生成数据集,涵盖数据采集、清洗、标注及格式优化等关键步骤,并推荐相关工具和最佳实践。

OpenAI Blog ★★★☆☆ 2025-02-10

OpenAI partners with Schibsted Media Group

推荐理由:涉及AI模型内容生态扩展,属商业化应用案例

OpenAI与Schibsted媒体集团合作,将《卫报》新闻及档案内容引入ChatGPT,增强其信息来源与时效性。

Hugging Face Blog ★★★☆☆ 2025-02-10

The Open Arabic LLM Leaderboard 2

推荐理由:涉及多语言大模型评测,对AI模型本地化应用有参考价值

发布阿拉伯语开源大模型排行榜,评估多个模型在阿拉伯语任务上的性能表现,涵盖推理、问答和文本生成等能力。

OpenAI Blog ★★★★☆ 2025-02-04

Building a custom math tutor powered by ChatGPT

推荐理由:展示AI在教育领域的落地应用与开发实践

文章介绍如何利用ChatGPT构建个性化数学辅导工具,涵盖提示工程、对话设计及教学逻辑实现,展示AI在教育场景中的具体应用。

Hugging Face Blog ★★★★☆ 2025-02-04

开源 DeepResearch——解放我们的搜索智能体

推荐理由:开源 AI 搜索智能体工具,契合 AI 工具库与技能推荐主题

DeepResearch 是一个开源项目,旨在构建可自主进行深度网络搜索与推理的 AI 智能体,支持多跳信息检索与综合分析,适用于研究、商业情报等场景。

Hugging Face Blog ★★★★☆ 2025-02-04

DABStep:面向多步推理的数据智能体基准测试

推荐理由:提供 AI 智能体多步推理能力的评测标准,契合模型评测兴趣点

DABStep 是一个评估 AI 智能体在多步推理任务中处理真实世界数据能力的新基准,涵盖数据理解、转换与分析等复杂操作。

OpenAI Blog ★★★★☆ 2025-02-02

Introducing deep research

推荐理由:属于AI新工具发布,具备多步推理与信息整合能力

Deep Research 是一款能推理并整合大量在线信息、完成多步骤研究任务的AI代理,现已向Pro用户开放,Plus和Team用户即将可用。

Hugging Face Blog ★★★★☆ 2025-02-02

Open-R1:更新 #1

推荐理由:涉及新开源AI模型发布与评测,符合用户兴趣

Open-R1 首次更新介绍了其开源推理模型的最新进展,包括性能优化、新功能支持及基准测试结果,对标闭源大模型表现。

OpenAI Blog ★★★★☆ 2025-01-31

OpenAI o3-mini

推荐理由:涉及新模型发布及定位,符合AI模型评测兴趣

OpenAI发布o3-mini模型,作为o3系列的轻量版本,主打推理效率与成本优化,适用于对延迟和预算敏感的应用场景。

OpenAI Blog ★★★★☆ 2025-01-31

OpenAI o3-mini System Card

推荐理由:涉及新模型发布及安全评测,符合AI模型评测兴趣点

OpenAI 发布 o3-mini 模型的系统卡,详述其安全评估、外部红队测试及 Preparedness Framework 评测结果。

Hugging Face Blog ★★★★☆ 2025-01-31

Mini-R1:复现 Deepseek R1 的「顿悟时刻」强化学习教程

推荐理由:结合热门大模型现象与RL技术实践,适合AI开发者学习

本文通过简化版 Mini-R1 模型,复现了 Deepseek R1 在训练中出现的“顿悟时刻”现象,并提供了一个可复现的强化学习(RL)教程,帮助开发者理解大模型能力突现的机制。

← 上一页 47 / 89 下一页 →