笑笑乐园 - 朝花夕拾

HackerNews Best ★★★☆☆

我取消了Claude：Token问题、质量下降和糟糕的支持

推荐理由：涉及大模型服务质量与用户体验评测

作者批评Claude近期出现token计数异常、输出质量下降及客服响应差等问题，最终决定停用该服务。

阅读原文 →

HackerNews Best ★★★★☆

Show HN：大语言模型如何工作——基于Karpathy讲座的交互式可视化指南

推荐理由：帮助理解AI模型底层原理，提升使用AI编程工具的能力

该项目提供了一个交互式可视化指南，深入浅出地解释大语言模型（LLM）的工作原理，内容基于Andrej Karpathy的经典讲座，适合开发者和AI爱好者理解LLM核心技术。

阅读原文 →

HackerNews Best ★★★☆☆

将出现深度学习的科学理论

推荐理由：涉及AI基础理论进展，有助于理解大模型底层机制

文章探讨构建深度学习的科学理论的可能性，分析当前理论研究进展与挑战，旨在为模型行为提供可解释性和预测性框架。

阅读原文 →

HackerNews Best ★★★★☆

OpenAI 在 API 中发布 GPT-5.5 和 GPT-5.5 Pro

推荐理由：涉及大模型新版本发布，符合AI模型发布及评测兴趣

OpenAI 正式在 API 中推出 GPT-5.5 和 GPT-5.5 Pro，带来更强的语言理解和生成能力，适用于复杂任务和高精度场景。

阅读原文 →

HackerNews Best ★★★★☆

Show HN：一个由你的智能体维护的 Karpathy 风格 LLM 维基（基于 Markdown 和 Git）

推荐理由：结合 AI 智能体与开源协作，实用性强

该项目是一个由 AI 智能体自动维护的 LLM 知识库，采用 Markdown 编写并用 Git 管理，灵感来自 Andrej Karpathy 的理念，适合用于记录和迭代大模型相关知识。

阅读原文 →

HackerNews Best ★★★☆☆

听你的 AI 代理在你的代码中“受苦”

推荐理由：结合AI编程与开发者体验，具创意的AI辅助编码工具

开源项目 Endless Toil 让 AI 代理执行用户代码并实时播报其“痛苦”体验，通过拟人化反馈帮助开发者理解代码对 AI 的执行难度，提升可维护性。

阅读原文 →

HackerNews Best ★★★★☆

使用编码辅助工具重启你原本不会完成的项目

推荐理由：贴合AI辅助编程实践，提供实用技巧

文章探讨如何利用AI编程辅助工具（如GitHub Copilot、Cursor等）重启搁置的个人项目，通过自动化补全和代码生成降低开发门槛，提升完成率。

阅读原文 →

HackerNews Best ★★★★☆

业余爱好者借助ChatGPT解决一个厄尔多斯难题

推荐理由：体现AI辅助创造性思维与问题解决，契合AI vibe coding主题

一位非专业数学家利用ChatGPT通过“vibe coding”方式，成功解决了一个困扰数学界60年的组合数学难题，展示了AI在辅助复杂问题推理中的潜力。

阅读原文 →

HackerNews Best ★★★★☆

SWE-bench Verified 不再衡量前沿编码能力

推荐理由：涉及AI编程能力评测基准的有效性讨论，与AI vibe coding和模型评测相关

OpenAI 宣布不再使用 SWE-bench Verified 评估其模型的编程能力，因其已无法有效区分当前前沿模型（如 o1）的性能，指标趋于饱和。

阅读原文 →

HackerNews Best ★★★★☆

知识工作的拟像

推荐理由：深入讨论AI辅助编程对知识工作的影响，契合AI vibe coding主题

文章探讨AI如何改变知识工作本质，指出当前AI辅助编程等工具虽提升效率，但可能导致表面化产出，缺乏深层理解，引发对AI时代专业能力演变的思考。

阅读原文 →

HackerNews Best ★★★★☆

开源记忆层，让任何AI智能体都能实现Claude.ai和ChatGPT的功能

推荐理由：推荐开源AI记忆层工具，提升智能体上下文理解能力

该项目名为Stash，是一个开源的记忆层，允许AI智能体持久化存储和检索对话历史与上下文，从而实现类似Claude.ai和ChatGPT的长期记忆能力。

阅读原文 →

HackerNews Best ★★★☆☆

GitHub Copilot is moving to usage-based billing

推荐理由：涉及主流AI编程工具Copilot的计费策略变更，影响用户使用成本

GitHub Copilot 将从固定订阅改为基于使用量的计费模式，按生成代码行数收费，影响高频用户成本。

阅读原文 →

HackerNews Best ★★★★☆

展示 HN：我构建的开源智能体在 TerminalBench 上登顶 Gemini-3-flash-preview

推荐理由：涉及AI智能体开源项目及基准评测，契合模型评测与工具推荐主题

作者开源了一个名为 Dirac 的终端智能体，在 TerminalBench 基准测试中超越其他 AI 智能体，登顶 Gemini-3-flash-preview 排行榜。项目支持自然语言执行终端命令，具备工具调用和推理能力。

阅读原文 →

HackerNews Best ★★★★☆

Prompt API

推荐理由：介绍新发布的 AI 开发工具，属于热门 AI 工具库范畴

Chrome 新推出的 Prompt API 允许开发者在浏览器中直接调用 AI 模型生成文本，简化了前端集成 AI 功能的流程，支持多种模型和提示模板。

阅读原文 →

HackerNews Best ★★★☆☆

Talkie：一个来自1930年的13B复古语言模型

推荐理由：新颖的模型训练思路，具有独特应用场景

Talkie 是一个具有130亿参数的语言模型，训练数据刻意限定在1930年以前的文本，旨在探索历史语言风格和知识边界，适用于特定文化或历史研究场景。

阅读原文 →

HackerNews Best ★★★★☆

VibeVoice：开源前沿语音AI

推荐理由：热门AI开源项目，涉及语音生成技术及实际应用

微软开源VibeVoice，一个高性能语音生成模型，支持多语言、高自然度语音合成，适用于语音助手、有声读物等场景。

阅读原文 →