GPT-3 powers the next generation of apps
推荐理由:体现GPT-3在真实应用中的商业化落地案例
超过300款应用通过API集成GPT-3,实现搜索、对话、文本补全等AI功能,展示其在实际产品中的广泛应用。
推荐理由:体现GPT-3在真实应用中的商业化落地案例
超过300款应用通过API集成GPT-3,实现搜索、对话、文本补全等AI功能,展示其在实际产品中的广泛应用。
推荐理由:揭示AI模型内部机制,对理解多模态模型有重要价值
研究发现CLIP模型中存在多模态神经元,能对同一概念的不同表现形式(如字面、符号或抽象)作出响应,有助于解释其强大的图像分类能力,并揭示模型学到的关联与偏见。
推荐理由:涉及大模型能力与局限,契合模型评测与应用关注点
文章深入探讨大语言模型的能力边界、局限性及其对社会的影响,涵盖技术原理、实际应用中的挑战及伦理问题。
推荐理由:涉及大模型基础设施,与AI模型训练密切相关
OpenAI分享将Kubernetes集群扩展至7500节点的经验,支撑GPT-3、CLIP、DALL·E等大模型训练及小规模快速迭代研究。
推荐理由:涉及AI模型发布及多模态生成技术,属核心AI进展
OpenAI发布DALL·E模型,可根据自然语言文本生成对应图像,展示AI在多模态生成领域的强大能力。
推荐理由:重要多模态模型发布,具零样本能力
OpenAI发布CLIP模型,通过自然语言监督学习视觉概念,支持零样本图像分类,仅需提供类别名称即可应用于各类视觉任务。
推荐理由:涉及AI模型商业化授权,符合AI商业化应用主题
OpenAI授权微软使用GPT-3技术,用于其产品和服务,标志着大模型商业化的重要进展。
推荐理由:涉及AI模型在专业领域的创新应用,属AI技术前沿探索
探索生成式语言模型在自动定理证明中的应用,通过微调大语言模型提升形式化数学推理能力,并在Lean等证明助手中实现初步验证。
推荐理由:涉及AI模型训练方法及性能优化,属模型评测与改进范畴。
通过人类反馈强化学习训练出更优的文本摘要语言模型,提升摘要生成质量。
推荐理由:涉及AI生成模型技术原理与性能评测
研究表明,与语言模型类似,基于像素序列训练的大型Transformer模型可生成连贯图像,并在无监督图像分类任务中表现优异。
推荐理由:涉及 AI 模型服务发布,对开发者有直接使用价值
OpenAI 发布新 API,提供对其最新 AI 模型的访问接口,开发者可集成其先进模型能力到各类应用中。
推荐理由:探讨大模型核心能力,对AI编程与应用有启发
论文提出语言模型可通过少量示例(few-shot)完成任务,无需微调。在多个NLP基准上验证了该能力,展示了大模型的泛化潜力。
推荐理由:涉及AI模型训练效率与算法进展,契合模型评测与技术演进主题
自2012年以来,训练ImageNet分类神经网络所需算力每16个月减半,算法进步带来的效率提升远超摩尔定律,凸显AI领域算法优化的重要性。
推荐理由:热门AI开源项目,涉及生成式AI在音乐领域的创新应用
OpenAI发布Jukebox,一个能生成多种风格音乐及简单人声的神经网络模型,并开源模型权重、代码及音频样本探索工具。
推荐理由:涉及AI开发透明度与可信机制,契合AI商业化落地中的合规与评估需求。
多机构联合发布报告,提出10种机制提升AI系统声明的可验证性,帮助开发者证明AI的安全性、公平性等,供用户和政策制定者评估AI开发流程。
推荐理由:涉及AI模型内部机制可视化,属模型评测与分析工具
OpenAI发布Microscope,提供8个视觉模型各层神经元的可视化,助力可解释性研究。
推荐理由:涉及主流AI框架选型,影响开发者技术栈
OpenAI宣布将深度学习框架统一为PyTorch,表明其对PyTorch生态的全面投入,可能影响未来AI模型开发和工具链选择。
推荐理由:涉及大模型核心训练规律,对AI模型研发有重要参考价值
论文探讨神经语言模型的缩放规律,分析模型性能随参数量、数据量和计算资源增长的变化趋势,为大模型训练提供理论指导。
推荐理由:涉及大模型与强化学习在复杂场景的应用,具技术参考价值
文章介绍使用大规模深度强化学习技术训练AI在Dota 2游戏中达到人类顶尖水平,展示了复杂环境下的多智能体协作与决策能力。
推荐理由:揭示大模型训练中的关键现象,对AI模型开发有指导意义
研究发现双下降现象普遍存在于CNN、ResNet和Transformer等模型中,表现为模型性能随规模、数据量或训练时间增加先升后降再升,需通过正则化缓解。