全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
OpenAI Blog ★★★☆☆ 2026-03-04

Understanding AI and learning outcomes

推荐理由:涉及AI在教育领域的实际应用与效果评测

OpenAI推出学习成果测量套件,用于评估AI在不同教育环境中对学生学习效果的长期影响。

OpenAI Blog ★★★★☆ 2026-03-03

GPT-5.3 Instant System Card

推荐理由:涉及大模型新版本发布及能力评测,契合用户对AI模型更新的关注。

OpenAI发布GPT-5.3的即时系统卡,概述其核心能力、安全措施及应用场景,强调在代码生成、多模态理解和推理方面的显著提升。

OpenAI Blog ★★★★☆ 2026-03-03

GPT-5.3 Instant: Smoother, more useful everyday conversations

推荐理由:涉及大模型新版本发布及应用场景,符合AI模型发布与商业化兴趣

OpenAI发布GPT-5.3 Instant,优化日常对话流畅度与实用性,响应更快、上下文理解更强,适用于客服、个人助理等高频交互场景。

OpenAI Blog ★★★☆☆ 2026-02-28

Our agreement with the Department of War

推荐理由:涉及AI在政府/军事领域的实际部署与合规应用

OpenAI与战争部签署协议,明确AI系统在涉密环境中的部署规范、安全红线及法律保护措施。

OpenAI Blog ★★★★☆ 2026-02-27

OpenAI and Amazon announce strategic partnership

推荐理由:涉及大模型平台落地与云服务集成,属AI商业化重要进展

OpenAI与亚马逊达成战略合作,将OpenAI的前沿平台引入AWS,扩展AI基础设施、定制模型和企业级AI智能体。

OpenAI Blog ★★★★☆ 2026-02-23

Why we no longer evaluate SWE-bench Verified

推荐理由:涉及AI编程模型评测基准的可靠性分析,与AI模型评测密切相关

文章指出SWE-bench Verified存在测试缺陷和训练数据泄露问题,已无法准确评估前沿编码模型进展,建议改用SWE-bench Pro。

OpenAI Blog ★★★★☆ 2026-02-23

OpenAI announces Frontier Alliance Partners

推荐理由:涉及AI商业化落地与企业级应用部署

OpenAI推出Frontier Alliance Partners计划,帮助企业将AI试点项目转化为安全、可扩展的生产级智能体部署。

OpenAI Blog ★★★★☆ 2026-02-20

Our First Proof submissions

推荐理由:涉及AI模型在复杂推理任务中的表现评测

文章展示了AI模型在First Proof数学挑战中的证明尝试,测试其在专家级问题上的研究级推理能力。

OpenAI Blog ★★★★☆ 2026-02-18

Introducing EVMbench

推荐理由:涉及AI模型评测及安全领域应用,契合AI模型评测与商业化场景

OpenAI与Paradigm推出EVMbench,用于评估AI智能体在检测、修复和利用高危智能合约漏洞方面的能力。

OpenAI Blog ★★★★☆ 2026-02-13

Scaling social science research

推荐理由:推荐热门AI开源工具及其在科研领域的应用

OpenAI发布开源工具包GABRIEL,利用GPT将定性文本和图像转化为定量数据,助力社会科学研究规模化分析。

OpenAI Blog ★★★★☆ 2026-02-12

Introducing GPT-5.3-Codex-Spark

推荐理由:涉及AI编程模型新版本发布及性能提升

OpenAI发布GPT-5.3-Codex-Spark,首款实时编码模型,生成速度提升15倍,支持128k上下文,现面向ChatGPT Pro用户开放研究预览。

OpenAI Blog ★★★★☆ 2026-02-09

Bringing ChatGPT to GenAI.mil

推荐理由:涉及大模型在政府/国防领域的商业化落地应用

OpenAI为美国国防团队在GenAI.mil平台部署定制版ChatGPT,提供安全、注重安全性的生成式AI能力。

← 上一页 4 / 32 下一页 →