笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2023-05-16

Large-scale Near-deduplication Behind BigCode

推荐理由：涉及AI编程领域关键数据处理技术，对理解代码大模型训练有参考价值。

文章介绍BigCode项目中用于大规模代码近似去重的技术，涵盖数据清洗流程、算法选择及对大模型训练质量的影响。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-05-16

小即是美：Q8-Chat，在至强处理器上实现高效的生成式AI体验

推荐理由：涉及新AI模型发布及CPU端高效推理，契合模型评测与工具应用兴趣

英特尔推出Q8-Chat，一款专为Xeon CPU优化的小型高效生成式AI模型，强调在通用服务器硬件上实现高性能推理，适合企业本地部署。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-05-15

使用 ROCm 在单张 GPU 上运行类 ChatGPT 聊天机器人

推荐理由：涉及开源 AI 模型部署与硬件适配，实用性强

本文介绍如何利用 ROCm 平台在单张 AMD GPU 上部署和运行类似 ChatGPT 的聊天机器人，涵盖模型选择、优化技巧及推理性能实测。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-05-15

介绍 RWKV——兼具 Transformer 优势的 RNN

推荐理由：介绍新型 AI 模型架构，属于热门开源模型及技术评测范畴

RWKV 是一种新型 RNN 架构，结合了 Transformer 的长程建模能力和 RNN 的高效推理特性，支持线性复杂度推理且无需注意力机制。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-05-11

辅助生成：一种面向低延迟文本生成的新方向

推荐理由：涉及AI模型推理优化新技术，属模型服务性能提升范畴

论文提出“辅助生成”（Assisted Generation）新方法，通过小型辅助模型预测大语言模型的输出，显著降低文本生成延迟，提升推理效率。

阅读原文 →

OpenAI Blog ★★★★☆ 2023-05-09

Language models can explain neurons in language models

推荐理由：涉及AI模型可解释性研究及开源数据集发布

研究利用GPT-4自动生成大语言模型中神经元行为的解释，并对解释进行评分，同时发布了GPT-2所有神经元的解释与评分数据集。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-05-09

使用 StarCoder 创建一个编程助手

推荐理由：提供 StarCoder 实战教程，契合 AI 辅助编程主题

本文介绍如何基于 StarCoder 模型构建一个 AI 编程助手，涵盖模型选择、本地部署、API 集成及与编辑器结合的实践步骤。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-05-08

深入探索文本生成视频模型

推荐理由：覆盖热门AI模型评测与应用，符合用户对AI模型发布及评测的兴趣

本文深入分析当前主流文本生成视频（Text-to-Video）AI模型的技术原理、性能表现及应用场景，涵盖Sora、Pika、Runway等代表性模型的对比评测。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-05-04

StarCoder：一款前沿的代码大语言模型

推荐理由：属于AI模型发布及评测范畴，聚焦代码生成领域

StarCoder 是由 BigCode 项目推出的高性能代码大语言模型，支持80多种编程语言，在多个代码生成基准上表现优异，并已开源权重和训练数据。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-05-01

如何安装和使用 Hugging Face Unity API

推荐理由：涉及热门 AI 工具库在新场景（Unity）中的应用，属实用技能推荐

本文介绍了如何在 Unity 游戏引擎中安装并调用 Hugging Face 的 API，实现 AI 模型（如文本生成、图像识别）与游戏开发的集成。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-04-27

使用🤗 Transformers、TensorFlow和TPU训练语言模型

推荐理由：涉及主流AI工具库与大模型训练实战，契合用户对AI开发工具及模型训练的兴趣。

本文介绍如何利用Hugging Face Transformers库，结合TensorFlow和谷歌TPU高效训练大语言模型，涵盖环境配置、数据准备到训练流程的完整实践。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-04-26

在免费版 Google Colab 上使用 🧨 diffusers 运行 IF 模型

推荐理由：实用教程，帮助开发者低成本体验先进AI图像生成模型。

本文介绍了如何在免费的 Google Colab 环境中，利用 Hugging Face 的 diffusers 库运行 Stability AI 发布的 IF 文生图模型，包含代码示例和资源优化技巧。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-04-26

Databricks ❤️ Hugging Face：大语言模型训练和微调速度提升高达40%

推荐理由：涉及AI模型训练效率提升及主流工具链整合，实用性强。

Databricks与Hugging Face合作优化LLM训练和微调流程，在MLflow和Databricks平台上实现最高40%的速度提升，支持主流开源模型并简化部署。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2023-04-24

Introducing HuggingFace blog for Chinese speakers: Fostering Collaboration with the Chinese AI community

推荐理由：有助于中文用户获取Hugging Face最新AI工具和模型资讯

Hugging Face 推出面向中文用户的博客，旨在加强与中国AI社区的合作，分享模型、工具和最佳实践等内容。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-04-17

使用 AWS Inferentia2 加速 Hugging Face Transformers

推荐理由：涉及主流AI模型部署优化，实用性强

本文介绍如何利用 AWS Inferentia2 芯片加速 Hugging Face Transformers 模型的推理，提升性能并降低成本，涵盖部署流程与实测效果。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-04-14

Graph Classification with Transformers

推荐理由：涉及AI模型新应用及热门工具库推荐

文章探讨使用Transformer架构进行图分类任务的方法，对比传统GNN模型的优劣，并介绍相关开源工具库和实验结果。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-04-12

使用 Substra 构建隐私保护的 AI

推荐理由：涉及热门 AI 工具库及隐私计算应用

本文介绍如何利用开源框架 Substra 实现联邦学习，构建隐私保护的 AI 系统，适用于医疗等对数据隐私要求高的行业。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-04-06

Snorkel AI 与 Hugging Face 合作：为企业解锁基础模型能力

推荐理由：聚焦AI商业化落地与模型定制，具行业参考价值

Snorkel AI 与 Hugging Face 合作，通过数据标注和微调工具链，帮助企业更高效地定制和部署基础模型，提升AI落地效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-04-05

StackLLaMA：使用RLHF训练LLaMA的实战指南

推荐理由：涵盖热门开源模型LLaMA与RLHF训练技巧，实用性强

本文提供了一份详细的实战教程，指导如何使用人类反馈强化学习（RLHF）从头训练LLaMA大模型，涵盖数据准备、奖励建模和策略微调等关键步骤。

阅读原文 →

Hugging Face Blog ★★★★☆ 2023-03-28

大型语言模型的快速推理：BLOOMZ在Habana Gaudi2加速器上的部署

推荐理由：涉及大模型部署优化与硬件加速，属AI模型服务评测范畴

文章介绍了如何在Habana Gaudi2加速器上高效运行BLOOMZ大语言模型，实现快速推理，并对比了其性能与成本效益。

阅读原文 →