笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2025-09-10

使用 Together AI 微调 Hugging Face Hub 上的任意大语言模型

推荐理由：提供实用的大模型微调教程，适合开发者快速上手AI模型定制。

本文介绍如何利用 Together AI 平台对 Hugging Face Hub 上的任意大语言模型进行高效微调，涵盖数据准备、训练配置及部署流程。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-10

Jupyter Agents：训练大语言模型通过笔记本进行推理

推荐理由：结合AI编程与LLM推理，属热门AI工具库方向

该项目提出Jupyter Agents，通过在Jupyter Notebook环境中训练大语言模型，使其能执行代码、分析数据并进行多步推理，提升AI在交互式编程和数据分析中的能力。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-09

mmBERT：ModernBERT 支持多语言

推荐理由：涉及新多语言模型发布及性能评测

mmBERT 是基于 ModernBERT 架构的多语言大模型，支持多种语言理解与生成，在多项多语言基准测试中表现优异。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-04

欢迎 EmbeddingGemma：谷歌新推出的高效嵌入模型

推荐理由：新发布的高效嵌入模型，契合AI模型评测与工具推荐兴趣

谷歌发布 EmbeddingGemma，一款轻量高效的文本嵌入模型，适用于资源受限环境，支持多语言，在多个基准测试中表现优异。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-02

SAIR：利用AI驱动的结构智能加速制药研发

推荐理由：展示了AI在制药行业的具体落地应用和商业价值

SAIR是一家利用AI结构智能技术加速药物研发的公司，其平台通过分析蛋白质结构与相互作用，提升新药发现效率，已在多个制药合作项目中验证效果。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-09-02

通过提前编译让你的 ZeroGPU Spaces 飞起来

推荐理由：涉及热门AI部署优化技巧，实用性强

本文介绍如何在 Hugging Face 的 ZeroGPU Spaces 上使用提前编译（AOT）技术加速 AI 应用，提升推理性能并降低成本。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-20

NVIDIA 发布600万规模多语言推理数据集

推荐理由：该数据集对训练和评测多语言AI模型具有重要价值，属于AI模型基础设施资源。

NVIDIA开源了一个包含600万条样本的多语言推理数据集，涵盖多种语言和复杂推理任务，旨在推动大模型在多语言理解和逻辑推理能力上的发展。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-19

使用 Claude 和 Hugging Face 生成图像

推荐理由：展示了主流AI工具链在图像生成中的协同应用

本文介绍如何结合 Anthropic 的 Claude 模型与 Hugging Face 平台生成图像，涵盖 API 调用、提示工程及开源模型集成方法。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-18

从零到GPU：构建和扩展生产级CUDA内核指南

推荐理由：涉及AI底层加速技术，对理解大模型推理优化有实用价值。

本文深入讲解如何从零开始编写、优化并部署高性能CUDA内核，涵盖内存管理、并行策略及在AI模型推理中的实际应用。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-18

用于研究的MCP：如何将AI连接到研究工具

推荐理由：聚焦MCP在科研场景的实用集成技巧，契合AI工具库及skill推荐主题

本文介绍如何使用MCP（Model Context Protocol）将AI模型与各类科研工具（如文献管理、数据分析、实验平台）集成，提升研究效率，并提供具体连接方法和示例。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-14

Kimina-Prover-RL

推荐理由：涉及AI模型在形式化验证领域的创新应用与开源工具

Kimina-Prover-RL 是一个基于强化学习的自动定理证明器，结合大语言模型与形式化验证技术，旨在提升AI在数学推理和代码正确性验证中的能力。项目开源并提供训练框架与基准测试。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-13

Arm 与 ExecuTorch 0.7：将生成式 AI 带给大众

推荐理由：涉及热门 AI 工具库 ExecuTorch 的新版本及边缘 AI 部署方案

Arm 联合 Meta 推出 ExecuTorch 0.7，优化生成式 AI 模型在移动端和边缘设备的部署，提升推理效率与能效，降低 AI 应用门槛。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2025-08-12

TextQuests: How Good are LLMs at Text-Based Video Games?

推荐理由：评测LLM在交互式文本环境中的推理与记忆能力

论文《TextQuests》评估了大语言模型（LLMs）在纯文本视频游戏中的表现，测试其理解复杂叙事、记忆状态和规划能力，并与人类玩家对比。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2025-08-12

🇵🇭 FilBench - 大语言模型能理解和生成菲律宾语吗？

推荐理由：涉及大模型多语言能力评测，符合模型评测兴趣点

FilBench 是一个评估大语言模型在菲律宾语（Filipino）理解和生成能力的基准测试，涵盖多种任务类型，旨在推动多语言AI在低资源语言上的发展。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-08

推出 AI Sheets：一款使用开源 AI 模型处理数据集的工具！

推荐理由：推荐热门 AI 工具库及实用技能

AI Sheets 是一个基于开源 AI 模型的数据处理工具，允许用户通过自然语言操作和分析数据集，提升数据清洗、转换和洞察效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-08

加速 ND-Parallel：高效多 GPU 训练指南

推荐理由：涉及AI模型训练优化，属热门AI工具库与训练技巧

本文介绍 ND-Parallel 技术，通过在多个 GPU 上并行化模型的不同维度（如数据、张量、流水线），显著提升大模型训练效率，并提供实践配置示例。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-07

Vision Language Model Alignment in TRL ⚡️

推荐理由：介绍热门AI工具库TRL的新功能，涉及多模态模型对齐技术

TRL库新增视觉语言模型对齐支持，提供多模态RLHF训练工具，适用于Llama-3.2、Phi-3.5等开源模型。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-05

欢迎 GPT OSS，OpenAI 推出的全新开源模型系列！

推荐理由：涉及新开源大模型发布，符合AI模型发布及评测兴趣

OpenAI 发布了名为 GPT OSS 的全新开源大模型系列，旨在推动社区创新与透明研究，提供多种规模版本及工具支持。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-04

在 DeepResearch 基准上评测开源 Llama Nemotron 模型

推荐理由：涉及大模型评测与基准测试，符合用户对AI模型发布及评测的兴趣。

文章评估了开源的 Llama Nemotron 系列模型在 DeepResearch 基准上的表现，涵盖推理、代码生成和多跳问答等维度，并与同类模型进行对比。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-08-01

📚 3LM：面向阿拉伯语大语言模型在STEM和编程领域的基准测试

推荐理由：涉及AI模型评测与多语言编程能力，契合AI模型评测与工具使用主题

3LM是一个专为评估阿拉伯语大语言模型在科学、技术、工程、数学（STEM）及编程任务中表现的新基准，涵盖多种难度级别的代码与推理问题。

阅读原文 →