笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2023-10-24

基于PPO的RLHF的N个实现细节

推荐理由：详解RLHF与PPO结合的核心实现技巧，对AI模型训练有实用参考价值

文章深入解析了使用近端策略优化（PPO）实现人类反馈强化学习（RLHF）的关键技术细节，涵盖奖励建模、策略训练和稳定性优化等实践要点。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-24

探索SDXL的简单优化方法

推荐理由：涉及主流AI生成模型SDXL的优化实践，属热门AI工具库应用

文章探讨了对Stable Diffusion XL（SDXL）模型进行简单优化的技术手段，包括推理加速、内存占用降低和生成质量微调等实用技巧。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-19

Gradio-Lite：完全在浏览器中运行的无服务器 Gradio

推荐理由：推荐热门 AI 工具库 Gradio 的创新用法，便于本地和前端集成。

Gradio-Lite 是一个新版本的 Gradio，可在浏览器中无需服务器直接运行 AI 应用，基于 Pyodide 技术，适合快速部署轻量级 demo。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-04

使用 ONNX Runtime 加速超过 13 万个 Hugging Face 模型

推荐理由：涉及主流 AI 模型优化工具与开源生态整合，实用性强。

微软宣布通过 ONNX Runtime 对 Hugging Face 上超 13 万 AI 模型提供推理加速支持，涵盖 NLP、CV 等领域，显著提升性能并降低部署成本。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-03

🧨 使用 JAX 在 Cloud TPU v5e 上加速 Stable Diffusion XL 推理

推荐理由：涉及热门AI模型部署优化与工具库实践

本文介绍如何利用 JAX 框架在 Google Cloud TPU v5e 上优化 Stable Diffusion XL 的推理速度，涵盖代码示例与性能对比。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-03

聊天模板：终结隐形性能杀手

推荐理由：涉及大模型推理性能优化，属AI模型服务关键细节

文章探讨了大模型推理中因聊天模板（chat templates）使用不当导致的性能下降问题，分析了其对token处理效率的影响，并提出优化建议。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-10-02

使用推理API部署AI漫画工厂

推荐理由：实用的AI模型部署教程，适合开发者快速上手生成式AI应用

本文介绍如何利用Hugging Face的Inference API快速部署AI Comic Factory模型，实现文本到漫画图像的生成，涵盖API调用、参数配置及集成到应用的完整流程。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-29

使用TRL通过DDPO微调Stable Diffusion模型

推荐理由：涉及热门AI模型微调技术及开源工具TRL的实践应用

本文介绍如何利用TRL库结合DDPO（去噪扩散策略优化）方法对Stable Diffusion模型进行微调，提升生成图像与文本提示的一致性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-28

非工程师指南：训练一个 LLaMA 2 聊天机器人

推荐理由：提供实用的AI模型训练教程，适合非工程师入门

本文面向非技术人员，手把手指导如何使用开源工具和云平台微调 LLaMA 2 模型，打造个性化聊天机器人，涵盖数据准备、训练流程和部署建议。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-26

Llama 2 在 Amazon SageMaker 上的基准测试

推荐理由：涵盖主流大模型在云平台的性能评测，符合模型评测兴趣点

本文评测了 Llama 2 模型在 Amazon SageMaker 平台上的性能表现，包括推理速度、资源占用和扩展性等关键指标。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-19

Rocket Money 与 Hugging Face：在生产环境中扩展不稳定的机器学习模型

推荐理由：涉及AI模型生产部署与Hugging Face工具链实战

Rocket Money 团队分享如何利用 Hugging Face 工具链在生产环境中高效部署和扩展高波动性的 ML 模型，涵盖模型监控、弹性伸缩及推理优化实践。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-18

3D高斯泼溅入门介绍

推荐理由：涉及AI驱动的3D内容生成前沿技术，属热门AI工具库范畴

文章介绍了3D Gaussian Splatting技术的基本原理、实现方式及其在神经渲染中的应用，涵盖训练流程、渲染效果与传统NeRF方法的对比。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-18

Object Detection Leaderboard

推荐理由：提供AI模型性能评测与横向对比，符合用户对模型评测的兴趣。

该排行榜展示了当前主流目标检测模型在多个基准数据集上的性能对比，涵盖精度、速度和参数量等指标。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-15

Optimizing your LLM in production

推荐理由：聚焦LLM生产部署优化，实用性强

文章探讨了在生产环境中优化大语言模型（LLM）的关键策略，包括推理加速、成本控制、缓存机制和监控方法，并结合实际案例说明如何提升性能与效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-13

推出 Würstchen：用于图像生成的快速扩散模型

推荐理由：介绍新发布的高效图像生成模型，属AI模型发布及评测范畴

Würstchen 是一种新型高效扩散模型，通过解耦潜在空间显著加速图像生成，在保持高质量的同时比传统扩散模型快数倍。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-13

使用 PyTorch FSDP 微调 Llama 2 70B

推荐理由：涉及主流大模型微调技术与开源工具实践

本文介绍如何利用 PyTorch 的 Fully Sharded Data Parallel（FSDP）技术对 Llama 2 70B 大模型进行高效微调，涵盖内存优化、训练策略和实操代码。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-12

🤗 Transformers 中原生支持的量化方案概览

推荐理由：涵盖热门AI工具库的实用技术细节，助力模型优化与部署

文章介绍了 Hugging Face Transformers 库中原生支持的多种模型量化方案，包括其原理、使用方法及适用场景，帮助开发者更高效地部署大模型。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-11

SafeCoder 与闭源代码助手对比

推荐理由：聚焦AI编程工具对比，契合AI vibe coding主题

文章对比了开源模型SafeCoder与主流闭源AI编程助手（如Copilot、Cursor）在代码生成能力、安全性及本地部署优势等方面的差异，强调SafeCoder在隐私敏感场景下的适用性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-09-08

使用T2I-Adapters实现SDXL的高效可控生成

推荐理由：涉及热门AI图像生成模型SDXL的实用控制技术，属流行AI工具库范畴

本文介绍了一种名为T2I-Adapters的新方法，可在保持SDXL模型生成质量的同时，实现高效、轻量级的可控图像生成，适用于多种控制条件如深度图、边缘检测等。

阅读原文 →

Hugging Face Blog ★★★★★ 2023-09-06

展翅高飞：Falcon 180B 来了

推荐理由：重磅开源大模型发布，性能强且可商用，值得关注。

Falcon 180B 是由 TII 推出的开源大语言模型，拥有 1800 亿参数，在多项基准测试中表现优异，支持多语言且可商用，适合企业及研究机构部署。

阅读原文 →