使用 Sentence Transformers v5 训练和微调稀疏嵌入模型
推荐理由:介绍热门AI工具库新功能,涉及嵌入模型训练技巧
Sentence Transformers v5 新增对稀疏嵌入模型(如 SPLADE)的训练与微调支持,提升检索效率与效果,并提供开源工具链。
推荐理由:介绍热门AI工具库新功能,涉及嵌入模型训练技巧
Sentence Transformers v5 新增对稀疏嵌入模型(如 SPLADE)的训练与微调支持,提升检索效率与效果,并提供开源工具链。
推荐理由:新发布的轻量级多模态模型,适合部署与应用
NVIDIA 推出轻量级视觉语言模型 Llama Nemotron Nano VLM,并已上线 Hugging Face Hub,适用于边缘设备和低资源场景。
推荐理由:涉及新开源AI模型发布,符合用户对模型发布及评测的兴趣
Google 推出 Gemma 3n,作为其轻量级开源大模型系列的最新版本,现已全面开放给开发者使用,支持多种应用场景并兼容主流AI框架。
推荐理由:涉及热门AI工具库集成,实用性强
SGLang新增对Transformers后端的支持,提升模型兼容性与推理效率,便于开发者无缝集成Hugging Face生态中的模型。
推荐理由:实用的 AI 模型微调技巧,适合开发者实践
本文介绍如何使用 LoRA 技术在消费级 GPU 上高效微调 FLUX.1-dev 文生图模型,降低显存需求并提升训练效率。
推荐理由:涉及 AI 推理服务发布与性能优势,属热门工具集成
Groq 现已加入 Hugging Face 推理服务提供商,用户可通过其超高速 LPU 加速运行大模型推理,显著提升生成速度。
推荐理由:涉及大模型服务性能优化,属AI模型部署关键问题
文章探讨长提示(long prompts)在大语言模型推理过程中如何占用资源并阻塞其他请求,分析了其对吞吐量和延迟的影响,并提出若干优化策略以提升LLM服务效率。
推荐理由:介绍热门AI工具库新功能,实用性强
本文快速介绍 Hugging Face 新推出的 Kernel Hub,一个用于共享和运行 AI 模型推理代码的平台,涵盖基本使用方法和示例。
推荐理由:介绍新上线的AI推理服务,涉及模型部署与工具生态
Featherless AI 现已加入 Hugging Face 推理服务提供商行列,提供高效、低成本的 LLM 推理能力,支持多种开源模型,适合开发者快速集成和部署。
推荐理由:涉及AI模型在机器人领域的具体应用与优化,属AI商业化落地案例。
NVIDIA发布Isaac GR00T N1.5模型,通过后训练优化其在LeRobot SO-101机械臂上的控制性能,提升机器人任务执行精度与泛化能力。
推荐理由:涉及 AI 模型训练基础设施,属热门 AI 服务发布
AWS 联合 NVIDIA 推出 Training Cluster as a Service,提供端到端托管的 AI 训练基础设施,支持大规模大模型训练,集成 NVIDIA GPU 与 AWS 网络、存储及管理工具。
推荐理由:属于AI模型评测工具,契合GUI智能体评估需求
ScreenSuite是一个专为GUI智能体设计的综合性评测套件,涵盖多种任务和环境,用于评估AI代理在图形用户界面中的操作能力与泛化性能。
推荐理由:涉及AI模型底层技术实现,适合开发者理解KV Cache优化
本文从零实现nanoVLM中的KV缓存机制,深入讲解其在视觉语言模型推理中的作用与优化方法。
推荐理由:涉及AI音频生成工具及本地化部署实践,契合AI工具库推荐主题
文章介绍了一款可在Arm设备上运行的实时AI声音生成工具,利用轻量化模型实现低延迟音频创作,适合音乐人和开发者本地部署使用。
推荐理由:涉及AI在GUI自动化领域的创新应用,属于AI工具库及技能推荐范畴。
Holo1是一系列专为图形用户界面(GUI)自动化设计的视觉语言模型(VLM),可驱动名为Surfer-H的GUI智能体,实现跨平台、高精度的界面交互与任务自动化。
推荐理由:涉及AI模型发布及评测,属热门具身智能方向
SmolVLA是一个轻量级视觉-语言-动作模型,利用Lerobot社区开源机器人数据训练,适用于具身智能和机器人控制任务,强调高效推理与部署。
推荐理由:涉及热门AI工具库vLLM与TRL的整合技巧,提升GPU效率
文章介绍如何在Transformer Reinforcement Learning(TRL)框架中集成vLLM推理引擎,通过将模型训练与推理共置于同一GPU资源,显著提升硬件利用率和训练效率。
推荐理由:涉及AI辅助编程新范式,契合vibe coding趋势
文章介绍CodeAgents与Structure结合的新方法,通过结构化代码代理提升AI在执行复杂编程任务中的准确性与可控性,适用于AI辅助编程场景。
推荐理由:涉及AI模型训练新方法及开源工具库整合
Liger GRPO 是一个结合了广义策略优化(GRPO)与TRL(Transformer Reinforcement Learning)库的新方法,旨在提升大模型强化学习训练的效率和稳定性。
推荐理由:聚焦AI本地化部署工具链,契合AI商业化落地需求
戴尔推出Enterprise Hub,提供本地化AI开发所需的数据管理、模型训练和部署工具,支持主流AI框架,简化企业私有化AI部署流程。