笑笑乐园 - 朝花夕拾

Hugging Face Blog ★★★★☆ 2024-09-25

Llama 现在能看图并在你的设备上运行——欢迎 Llama 3.2

推荐理由：大模型多模态升级及本地部署能力，属核心AI模型发布与评测范畴

Meta 发布 Llama 3.2，新增视觉理解能力并支持本地设备部署，包含 11B 和 90B 两种参数规模版本，适用于移动端和边缘设备。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2024-09-23

探索 Hugging Face 的每日论文页面

推荐理由：帮助用户追踪最新 AI 模型研究与开源项目

本文介绍了 Hugging Face 的 Daily Papers 页面，该页面每日更新精选 AI 论文，涵盖大模型、多模态、语音等方向，并提供一键运行示例和相关模型链接。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-09-20

使用 Optimum-Intel 和 OpenVINO GenAI 进行优化与部署

推荐理由：推荐热门AI部署工具链的实用教程

本文介绍如何利用 Optimum-Intel 和 OpenVINO GenAI 工具链对大模型进行优化和高效部署，提升推理性能并降低资源消耗。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-09-18

将大语言模型微调至1.58位：极致量化变得简单

推荐理由：涉及大模型压缩与量化技术，属热门AI工具库/模型优化方向

本文介绍了一种新方法，可将大语言模型（LLMs）微调至仅1.58位精度，实现极致量化，同时保持模型性能，显著降低部署成本和资源消耗。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-09-16

HuggingChat 推出社区工具

推荐理由：涉及AI工具集成与开源生态，契合AI工具库及skill推荐主题

HuggingChat 新增社区工具功能，允许用户集成自定义工具（如搜索、代码执行、API调用等），提升AI对话的实用性与可扩展性，支持开源生态协作。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-09-13

Accelerate 1.0.0

推荐理由：热门AI工具库更新，提升模型训练效率

Hugging Face 发布 Accelerate 1.0.0，这是一个用于简化分布式训练和推理的开源库，支持多GPU/TPU环境，提供易用API以降低大模型训练门槛。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2024-09-04

Hugging Face partners with TruffleHog to Scan for Secrets

推荐理由：涉及AI开发安全工具集成，属热门AI工具库应用

Hugging Face 与 TruffleHog 合作，利用其开源工具扫描代码库中的敏感信息（如API密钥），以提升AI模型和数据集的安全性。该集成有助于开发者在共享代码前自动检测并清除潜在泄露的凭证。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-08-22

Hugging Face 上5个被低估的工具

推荐理由：推荐热门AI平台上的实用工具，契合用户对AI工具库的兴趣

文章介绍了 Hugging Face 平台上五个功能强大但关注度较低的 AI 工具，涵盖模型推理、数据处理和部署等实用场景，适合开发者提升效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-08-21

通过使用 Flash Attention 2 打包提升 Hugging Face 训练效率

推荐理由：涉及热门AI工具库优化技巧，实用性强

本文介绍如何结合序列打包（packing）与 Flash Attention 2 技术，显著提升 Hugging Face 上大模型训练的计算效率和吞吐量。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-08-19

在 Google Cloud Vertex AI 上部署 Meta Llama 3.1 405B

推荐理由：涉及主流大模型部署实践，契合AI模型服务发布与应用主题

本文介绍如何在 Google Cloud Vertex AI 平台上部署 Meta 最新发布的 Llama 3.1 405B 大模型，涵盖配置环境、优化推理性能及成本控制等实操细节。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2024-08-14

A failed experiment: Infini-Attention, and why we should keep trying?

推荐理由：探讨AI模型研发中的失败案例，有助于理解技术边界与改进方向。

文章回顾了Infini-Attention这一失败的AI模型实验，分析其设计缺陷与训练问题，并强调从失败中学习对推动AI进步的重要性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-08-13

Introduction to ggml

推荐理由：介绍热门 AI 推理库 ggml，适合本地部署和边缘计算

ggml 是一个用于在 CPU 上高效运行大语言模型的 C 库，支持量化、多线程和跨平台部署，适用于本地 AI 推理场景。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-08-12

欢迎 Falcon Mamba：首个强大的无注意力机制 7B 模型

推荐理由：发布新型大模型，符合AI模型发布及评测兴趣

Falcon Mamba 是由 TII 推出的首个高性能无注意力机制的 70 亿参数语言模型，基于 Mamba 架构，在保持高效推理的同时，在多个基准测试中表现优异。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-08-12

工具调用，统一化

推荐理由：涉及AI模型工具调用能力的前沿进展与实用框架

文章探讨了大模型在工具调用（Tool Use）方面的最新进展，强调通过统一接口和标准化协议提升AI系统调用外部工具的能力，并介绍了相关框架和实践案例。

阅读原文 →

Hugging Face Blog ★★★☆☆ 2024-08-06

引入用于文档图像的文本图像增强技术

推荐理由：涉及AI在文档处理领域的技术应用与模型优化

文章介绍了一种名为TextImage Augmentation的新方法，用于增强文档图像中的文本内容，提升OCR和文档理解模型的训练效果。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-31

谷歌发布 Gemma 2 2B、ShieldGemma 和 Gemma Scope

推荐理由：涉及新AI模型发布及配套工具，契合模型评测与工具推荐兴趣。

谷歌发布轻量级大模型 Gemma 2 2B，以及用于内容安全的 ShieldGemma 和调试工具 Gemma Scope，提升模型安全性与可解释性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-30

使用 Quanto 和 Diffusers 实现内存高效的扩散 Transformer

推荐理由：涉及热门AI工具库整合与优化技巧，实用性强

本文介绍如何结合 Quanto 量化库与 Hugging Face Diffusers 库，实现内存占用更低的扩散 Transformer（DiT）模型推理，提升生成效率。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-29

使用 Hugging Face 和 NVIDIA NIM 实现无服务器推理

推荐理由：涉及热门AI工具链集成与模型服务部署方案

本文介绍如何结合 Hugging Face 和 NVIDIA NIM 部署大模型的无服务器推理服务，提升AI应用部署效率与可扩展性。

阅读原文 →

Hugging Face Blog ★★★★☆ 2024-07-25

LAVE：基于LLM在Docmatix上进行零样本视觉问答评估——我们还需要微调吗？

推荐理由：涉及大模型零样本能力与评测，契合AI模型评测主题

论文提出LAVE方法，利用大语言模型在Docmatix数据集上实现零样本视觉问答（VQA）评估，探讨是否仍需微调。实验表明，先进提示策略可显著提升零样本性能，挑战传统微调必要性。

阅读原文 →

Hugging Face Blog ★★★★★ 2024-07-23

Llama 3.1 发布：405B、70B 和 8B 版本，支持多语言和长上下文

推荐理由：重磅开源大模型更新，具备强大性能与实用特性

Meta 发布 Llama 3.1 系列模型，包含 405B、70B 和 8B 参数版本，均支持多语言处理和长达 128K 的上下文长度，显著提升推理与多语言能力。

阅读原文 →