全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
HackerNews Best ★★★☆☆

将出现深度学习的科学理论

推荐理由:涉及AI基础理论进展,有助于理解大模型底层机制

文章探讨构建深度学习的科学理论的可能性,分析当前理论研究进展与挑战,旨在为模型行为提供可解释性和预测性框架。

HackerNews Best ★★★★☆

OpenAI 在 API 中发布 GPT-5.5 和 GPT-5.5 Pro

推荐理由:涉及大模型新版本发布,符合AI模型发布及评测兴趣

OpenAI 正式在 API 中推出 GPT-5.5 和 GPT-5.5 Pro,带来更强的语言理解和生成能力,适用于复杂任务和高精度场景。

HackerNews Best ★★★☆☆

听你的 AI 代理在你的代码中“受苦”

推荐理由:结合AI编程与开发者体验,具创意的AI辅助编码工具

开源项目 Endless Toil 让 AI 代理执行用户代码并实时播报其“痛苦”体验,通过拟人化反馈帮助开发者理解代码对 AI 的执行难度,提升可维护性。

HackerNews Best ★★★★☆

业余爱好者借助ChatGPT解决一个厄尔多斯难题

推荐理由:体现AI辅助创造性思维与问题解决,契合AI vibe coding主题

一位非专业数学家利用ChatGPT通过“vibe coding”方式,成功解决了一个困扰数学界60年的组合数学难题,展示了AI在辅助复杂问题推理中的潜力。

HackerNews Best ★★★★☆

SWE-bench Verified 不再衡量前沿编码能力

推荐理由:涉及AI编程能力评测基准的有效性讨论,与AI vibe coding和模型评测相关

OpenAI 宣布不再使用 SWE-bench Verified 评估其模型的编程能力,因其已无法有效区分当前前沿模型(如 o1)的性能,指标趋于饱和。

HackerNews Best ★★★★☆

知识工作的拟像

推荐理由:深入讨论AI辅助编程对知识工作的影响,契合AI vibe coding主题

文章探讨AI如何改变知识工作本质,指出当前AI辅助编程等工具虽提升效率,但可能导致表面化产出,缺乏深层理解,引发对AI时代专业能力演变的思考。

HackerNews Best ★★★☆☆

GitHub Copilot is moving to usage-based billing

推荐理由:涉及主流AI编程工具Copilot的计费策略变更,影响用户使用成本

GitHub Copilot 将从固定订阅改为基于使用量的计费模式,按生成代码行数收费,影响高频用户成本。

HackerNews Best ★★★★☆

展示 HN:我构建的开源智能体在 TerminalBench 上登顶 Gemini-3-flash-preview

推荐理由:涉及AI智能体开源项目及基准评测,契合模型评测与工具推荐主题

作者开源了一个名为 Dirac 的终端智能体,在 TerminalBench 基准测试中超越其他 AI 智能体,登顶 Gemini-3-flash-preview 排行榜。项目支持自然语言执行终端命令,具备工具调用和推理能力。

HackerNews Best ★★★★☆

Prompt API

推荐理由:介绍新发布的 AI 开发工具,属于热门 AI 工具库范畴

Chrome 新推出的 Prompt API 允许开发者在浏览器中直接调用 AI 模型生成文本,简化了前端集成 AI 功能的流程,支持多种模型和提示模板。

HackerNews Best ★★★☆☆

Talkie:一个来自1930年的13B复古语言模型

推荐理由:新颖的模型训练思路,具有独特应用场景

Talkie 是一个具有130亿参数的语言模型,训练数据刻意限定在1930年以前的文本,旨在探索历史语言风格和知识边界,适用于特定文化或历史研究场景。

HackerNews Best ★★★★☆

VibeVoice:开源前沿语音AI

推荐理由:热门AI开源项目,涉及语音生成技术及实际应用

微软开源VibeVoice,一个高性能语音生成模型,支持多语言、高自然度语音合成,适用于语音助手、有声读物等场景。

← 上一页 92 / 92