使用 Together AI 微调 Hugging Face Hub 上的任意大语言模型
推荐理由:提供实用的大模型微调教程,适合开发者快速上手AI模型定制。
本文介绍如何利用 Together AI 平台对 Hugging Face Hub 上的任意大语言模型进行高效微调,涵盖数据准备、训练配置及部署流程。
推荐理由:提供实用的大模型微调教程,适合开发者快速上手AI模型定制。
本文介绍如何利用 Together AI 平台对 Hugging Face Hub 上的任意大语言模型进行高效微调,涵盖数据准备、训练配置及部署流程。
推荐理由:结合AI编程与LLM推理,属热门AI工具库方向
该项目提出Jupyter Agents,通过在Jupyter Notebook环境中训练大语言模型,使其能执行代码、分析数据并进行多步推理,提升AI在交互式编程和数据分析中的能力。
推荐理由:涉及新多语言模型发布及性能评测
mmBERT 是基于 ModernBERT 架构的多语言大模型,支持多种语言理解与生成,在多项多语言基准测试中表现优异。
推荐理由:新发布的高效嵌入模型,契合AI模型评测与工具推荐兴趣
谷歌发布 EmbeddingGemma,一款轻量高效的文本嵌入模型,适用于资源受限环境,支持多语言,在多个基准测试中表现优异。
推荐理由:展示了AI在制药行业的具体落地应用和商业价值
SAIR是一家利用AI结构智能技术加速药物研发的公司,其平台通过分析蛋白质结构与相互作用,提升新药发现效率,已在多个制药合作项目中验证效果。
推荐理由:涉及热门AI部署优化技巧,实用性强
本文介绍如何在 Hugging Face 的 ZeroGPU Spaces 上使用提前编译(AOT)技术加速 AI 应用,提升推理性能并降低成本。
推荐理由:该数据集对训练和评测多语言AI模型具有重要价值,属于AI模型基础设施资源。
NVIDIA开源了一个包含600万条样本的多语言推理数据集,涵盖多种语言和复杂推理任务,旨在推动大模型在多语言理解和逻辑推理能力上的发展。
推荐理由:展示了主流AI工具链在图像生成中的协同应用
本文介绍如何结合 Anthropic 的 Claude 模型与 Hugging Face 平台生成图像,涵盖 API 调用、提示工程及开源模型集成方法。
推荐理由:涉及AI底层加速技术,对理解大模型推理优化有实用价值。
本文深入讲解如何从零开始编写、优化并部署高性能CUDA内核,涵盖内存管理、并行策略及在AI模型推理中的实际应用。
推荐理由:聚焦MCP在科研场景的实用集成技巧,契合AI工具库及skill推荐主题
本文介绍如何使用MCP(Model Context Protocol)将AI模型与各类科研工具(如文献管理、数据分析、实验平台)集成,提升研究效率,并提供具体连接方法和示例。
推荐理由:涉及AI模型在形式化验证领域的创新应用与开源工具
Kimina-Prover-RL 是一个基于强化学习的自动定理证明器,结合大语言模型与形式化验证技术,旨在提升AI在数学推理和代码正确性验证中的能力。项目开源并提供训练框架与基准测试。
推荐理由:涉及热门 AI 工具库 ExecuTorch 的新版本及边缘 AI 部署方案
Arm 联合 Meta 推出 ExecuTorch 0.7,优化生成式 AI 模型在移动端和边缘设备的部署,提升推理效率与能效,降低 AI 应用门槛。
推荐理由:评测LLM在交互式文本环境中的推理与记忆能力
论文《TextQuests》评估了大语言模型(LLMs)在纯文本视频游戏中的表现,测试其理解复杂叙事、记忆状态和规划能力,并与人类玩家对比。
推荐理由:涉及大模型多语言能力评测,符合模型评测兴趣点
FilBench 是一个评估大语言模型在菲律宾语(Filipino)理解和生成能力的基准测试,涵盖多种任务类型,旨在推动多语言AI在低资源语言上的发展。
推荐理由:推荐热门 AI 工具库及实用技能
AI Sheets 是一个基于开源 AI 模型的数据处理工具,允许用户通过自然语言操作和分析数据集,提升数据清洗、转换和洞察效率。
推荐理由:涉及AI模型训练优化,属热门AI工具库与训练技巧
本文介绍 ND-Parallel 技术,通过在多个 GPU 上并行化模型的不同维度(如数据、张量、流水线),显著提升大模型训练效率,并提供实践配置示例。
推荐理由:介绍热门AI工具库TRL的新功能,涉及多模态模型对齐技术
TRL库新增视觉语言模型对齐支持,提供多模态RLHF训练工具,适用于Llama-3.2、Phi-3.5等开源模型。
推荐理由:涉及新开源大模型发布,符合AI模型发布及评测兴趣
OpenAI 发布了名为 GPT OSS 的全新开源大模型系列,旨在推动社区创新与透明研究,提供多种规模版本及工具支持。
推荐理由:涉及大模型评测与基准测试,符合用户对AI模型发布及评测的兴趣。
文章评估了开源的 Llama Nemotron 系列模型在 DeepResearch 基准上的表现,涵盖推理、代码生成和多跳问答等维度,并与同类模型进行对比。
推荐理由:涉及AI模型评测与多语言编程能力,契合AI模型评测与工具使用主题
3LM是一个专为评估阿拉伯语大语言模型在科学、技术、工程、数学(STEM)及编程任务中表现的新基准,涵盖多种难度级别的代码与推理问题。