笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2025-02-04

DABStep：面向多步推理的数据智能体基准测试

推荐理由：提供 AI 智能体多步推理能力的评测标准，契合模型评测兴趣点

DABStep 是一个评估 AI 智能体在多步推理任务中处理真实世界数据能力的新基准，涵盖数据理解、转换与分析等复杂操作。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-02-02

Open-R1：更新 #1

推荐理由：涉及新开源AI模型发布与评测，符合用户兴趣

Open-R1 首次更新介绍了其开源推理模型的最新进展，包括性能优化、新功能支持及基准测试结果，对标闭源大模型表现。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-31

Mini-R1：复现 Deepseek R1 的「顿悟时刻」强化学习教程

推荐理由：结合热门大模型现象与RL技术实践，适合AI开发者学习

本文通过简化版 Mini-R1 模型，复现了 Deepseek R1 在训练中出现的“顿悟时刻”现象，并提供了一个可复现的强化学习（RL）教程，帮助开发者理解大模型能力突现的机制。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-30

如何在 AWS 上部署和微调 DeepSeek 模型

推荐理由：涵盖主流大模型的部署与微调实操，适合开发者参考

本文详细介绍了在 AWS 平台上部署和微调 DeepSeek 大模型的完整流程，包括环境配置、训练脚本优化及推理服务搭建。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-28

欢迎使用 Hub 上的推理提供商 🔥

推荐理由：介绍热门 AI 平台新功能，便于开发者快速接入大模型服务。

Hugging Face Hub 推出 Inference Providers 功能，允许用户直接通过 Hub 调用多家服务商的大模型 API，简化 AI 模型部署与调用流程。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-28

Open-R1：DeepSeek-R1 的完全开源复现

推荐理由：涉及大模型开源复现与技术细节，符合AI模型发布及评测兴趣

Open-R1 是对 DeepSeek-R1 模型的完全开源复现，包含训练数据、代码和模型权重，旨在推动透明、可复现的大模型研究。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-27

Diffusers 中开源视频生成模型的现状

推荐理由：涵盖热门 AI 视频生成模型及开源工具库使用，符合工具与模型评测兴趣

文章介绍了 Hugging Face Diffusers 库中当前支持的开源视频生成模型，包括 SVD、CogVideoX 等，并对比其性能、使用方式及生成效果。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-24

我们现已在 smolagents 中支持视觉语言模型（VLMs）！

推荐理由：热门 AI 工具库更新，支持多模态能力，值得开发者关注。

smolagents 工具库新增对视觉语言模型（VLMs）的支持，开发者可利用 VLM 实现图像理解与多模态智能体交互，提升 AI 应用的感知能力。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-23

使用 KVPress 掌握大语言模型中的长上下文处理

推荐理由：涉及大模型关键技术优化，属热门AI工具库方向

本文介绍 KVPress，一种提升大语言模型处理长上下文效率的新方法，通过压缩键值缓存减少计算开销，在保持性能的同时显著提升推理速度。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-23

SmolVLM 变得更小——推出 2.56 亿和 5 亿参数模型！

推荐理由：轻量级多模态模型发布，适合边缘部署和快速推理。

SmolVLM 推出更轻量的 256M 和 500M 参数视觉语言模型，适合资源受限场景，保持高效推理能力。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-22

Hugging Face 与 FriendliAI 合作加速模型在 Hub 上的部署

推荐理由：涉及主流 AI 模型服务平台与推理优化工具的集成，对开发者部署模型有实用价值。

Hugging Face 与 FriendliAI 合作，通过集成 FriendliAI 的推理优化技术，显著提升 Hugging Face Hub 上模型的部署速度和性能，支持更快、更高效的 AI 模型服务。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-16

Timm ❤️ Transformers：在 Transformers 中使用任意 timm 模型

推荐理由：整合热门CV模型库timm与Transformers，提升AI开发效率

Hugging Face Transformers 现支持直接加载 timm（PyTorch Image Models）中的计算机视觉模型，简化了模型调用流程，提升开发效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-16

Text Generation Inference 引入多后端支持（TRT-LLM、vLLM）

推荐理由：涉及主流AI推理框架集成，对部署优化有实用价值

Hugging Face 的 Text Generation Inference（TGI）新增对 TRT-LLM 和 vLLM 后端的支持，提升大模型推理性能与部署灵活性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-15

使用 Sentence Transformers 将静态嵌入模型训练速度提升 400 倍

推荐理由：涉及热门AI工具库Sentence Transformers的高效使用技巧

文章介绍了一种利用 Sentence Transformers 加速静态嵌入模型训练的新方法，速度提升高达400倍，适用于高效构建文本嵌入模型。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-01-13

AI 智能体来了，接下来怎么办？

推荐理由：深入解析AI智能体技术与落地场景，契合AI商业化与工具趋势

文章探讨了当前AI智能体（AI Agents）的发展现状、核心能力及其在实际应用中的潜力，涵盖主流框架、典型产品案例及未来挑战。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2025-01-09

CO₂ Emissions and Models Performance: Insights from the Open LLM Leaderboard

推荐理由：涉及大模型性能评测与环保指标关联，具参考价值

文章基于开源LLM排行榜数据，分析模型性能与CO₂排放之间的关系，探讨高效模型设计对环境的影响。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-12-31

介绍 smolagents：用代码编写动作的轻量级智能体

推荐理由：推荐热门开源 AI 智能体框架，契合 AI 编程与工具库兴趣

Hugging Face 推出 smolagents，一个轻量级 AI 智能体框架，允许代理直接用 Python 编写并执行动作代码，支持工具调用、搜索和模型间通信，适用于快速构建可编程 AI 应用。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2024-12-24

Visualize and understand GPU memory in PyTorch

推荐理由：提升AI开发效率的实用技巧

介绍如何在PyTorch中可视化和理解GPU内存使用情况，帮助开发者优化模型训练时的显存占用。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-12-23

使用 NVIDIA 的 LogitsProcessorZoo 控制语言模型生成

推荐理由：介绍实用的AI模型控制工具，提升生成质量与可控性

NVIDIA 推出 LogitsProcessorZoo，提供多种 logits 处理器用于精细控制大模型文本生成行为，如限制输出格式、引导内容方向等，适用于推理优化与可控生成场景。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-12-20

Evaluating Audio Reasoning with Big Bench Audio

推荐理由：涉及AI模型音频推理能力评测，符合模型评测兴趣点

Big Bench Audio 是一个评估大模型音频推理能力的新基准，涵盖语音理解、声学场景分析等任务，旨在推动多模态AI在音频领域的进展。

阅读原文 →