笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2025-07-01

使用 Sentence Transformers v5 训练和微调稀疏嵌入模型

推荐理由：介绍热门AI工具库新功能，涉及嵌入模型训练技巧

Sentence Transformers v5 新增对稀疏嵌入模型（如 SPLADE）的训练与微调支持，提升检索效率与效果，并提供开源工具链。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-27

欢迎 NVIDIA Llama Nemotron Nano VLM 登陆 Hugging Face Hub

推荐理由：新发布的轻量级多模态模型，适合部署与应用

NVIDIA 推出轻量级视觉语言模型 Llama Nemotron Nano VLM，并已上线 Hugging Face Hub，适用于边缘设备和低资源场景。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-26

Gemma 3n 现已在开源生态中全面可用！

推荐理由：涉及新开源AI模型发布，符合用户对模型发布及评测的兴趣

Google 推出 Gemma 3n，作为其轻量级开源大模型系列的最新版本，现已全面开放给开发者使用，支持多种应用场景并兼容主流AI框架。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-23

Transformers backend integration in SGLang

推荐理由：涉及热门AI工具库集成，实用性强

SGLang新增对Transformers后端的支持，提升模型兼容性与推理效率，便于开发者无缝集成Hugging Face生态中的模型。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-19

在消费级硬件上对 FLUX.1-dev 进行 LoRA 微调

推荐理由：实用的 AI 模型微调技巧，适合开发者实践

本文介绍如何使用 LoRA 技术在消费级 GPU 上高效微调 FLUX.1-dev 文生图模型，降低显存需求并提升训练效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-16

Groq 登陆 Hugging Face 推理服务提供商 🔥

推荐理由：涉及 AI 推理服务发布与性能优势，属热门工具集成

Groq 现已加入 Hugging Face 推理服务提供商，用户可通过其超高速 LPU 加速运行大模型推理，显著提升生成速度。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-12

长提示如何阻塞其他请求——优化大语言模型性能

推荐理由：涉及大模型服务性能优化，属AI模型部署关键问题

文章探讨长提示（long prompts）在大语言模型推理过程中如何占用资源并阻塞其他请求，分析了其对吞吐量和延迟的影响，并提出若干优化策略以提升LLM服务效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-12

5分钟学会 Hugging Face Kernel Hub

推荐理由：介绍热门AI工具库新功能，实用性强

本文快速介绍 Hugging Face 新推出的 Kernel Hub，一个用于共享和运行 AI 模型推理代码的平台，涵盖基本使用方法和示例。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2025-06-12

Featherless AI 登陆 Hugging Face 推理服务提供商 🔥

推荐理由：介绍新上线的AI推理服务，涉及模型部署与工具生态

Featherless AI 现已加入 Hugging Face 推理服务提供商行列，提供高效、低成本的 LLM 推理能力，支持多种开源模型，适合开发者快速集成和部署。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-11

针对LeRobot SO-101机械臂的Isaac GR00T N1.5后训练

推荐理由：涉及AI模型在机器人领域的具体应用与优化，属AI商业化落地案例。

NVIDIA发布Isaac GR00T N1.5模型，通过后训练优化其在LeRobot SO-101机械臂上的控制性能，提升机器人任务执行精度与泛化能力。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-11

推出训练集群即服务——与 NVIDIA 的新合作

推荐理由：涉及 AI 模型训练基础设施，属热门 AI 服务发布

AWS 联合 NVIDIA 推出 Training Cluster as a Service，提供端到端托管的 AI 训练基础设施，支持大规模大模型训练，集成 NVIDIA GPU 与 AWS 网络、存储及管理工具。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-06

ScreenSuite - 最全面的GUI智能体评测套件！

推荐理由：属于AI模型评测工具，契合GUI智能体评估需求

ScreenSuite是一个专为GUI智能体设计的综合性评测套件，涵盖多种任务和环境，用于评估AI代理在图形用户界面中的操作能力与泛化性能。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-04

KV Cache from scratch in nanoVLM

推荐理由：涉及AI模型底层技术实现，适合开发者理解KV Cache优化

本文从零实现nanoVLM中的KV缓存机制，深入讲解其在视觉语言模型推理中的作用与优化方法。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2025-06-03

在Arm平台上实现实时AI声音生成：一款释放创意自由的个人工具

推荐理由：涉及AI音频生成工具及本地化部署实践，契合AI工具库推荐主题

文章介绍了一款可在Arm设备上运行的实时AI声音生成工具，利用轻量化模型实现低延迟音频创作，适合音乐人和开发者本地部署使用。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-03

Holo1：新型GUI自动化视觉语言模型家族，驱动GUI智能体Surfer-H

推荐理由：涉及AI在GUI自动化领域的创新应用，属于AI工具库及技能推荐范畴。

Holo1是一系列专为图形用户界面（GUI）自动化设计的视觉语言模型（VLM），可驱动名为Surfer-H的GUI智能体，实现跨平台、高精度的界面交互与任务自动化。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-03

SmolVLA：基于Lerobot社区数据训练的高效视觉-语言-动作模型

推荐理由：涉及AI模型发布及评测，属热门具身智能方向

SmolVLA是一个轻量级视觉-语言-动作模型，利用Lerobot社区开源机器人数据训练，适用于具身智能和机器人控制任务，强调高效推理与部署。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-06-03

不让任何GPU掉队：在TRL中通过共置vLLM提升效率

推荐理由：涉及热门AI工具库vLLM与TRL的整合技巧，提升GPU效率

文章介绍如何在Transformer Reinforcement Learning（TRL）框架中集成vLLM推理引擎，通过将模型训练与推理共置于同一GPU资源，显著提升硬件利用率和训练效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-05-28

CodeAgents + Structure：一种更优的动作执行方式

推荐理由：涉及AI辅助编程新范式，契合vibe coding趋势

文章介绍CodeAgents与Structure结合的新方法，通过结构化代码代理提升AI在执行复杂编程任务中的准确性与可控性，适用于AI辅助编程场景。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-05-25

🐯 Liger GRPO meets TRL

推荐理由：涉及AI模型训练新方法及开源工具库整合

Liger GRPO 是一个结合了广义策略优化（GRPO）与TRL（Transformer Reinforcement Learning）库的新方法，旨在提升大模型强化学习训练的效率和稳定性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2025-05-23

Dell Enterprise Hub：本地构建AI的一站式平台

推荐理由：聚焦AI本地化部署工具链，契合AI商业化落地需求

戴尔推出Enterprise Hub，提供本地化AI开发所需的数据管理、模型训练和部署工具，支持主流AI框架，简化企业私有化AI部署流程。

阅读原文 →