全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
Lilian Weng's Blog ★★★★☆ 2018-12-27

Object Detection Part 4: Fast Detection Models

推荐理由:涵盖主流AI视觉模型及其技术原理,属AI模型评测与应用范畴

本文介绍了一阶段目标检测模型(如SSD、RetinaNet和YOLO系列),这些模型跳过区域提议阶段,直接在密集采样区域进行检测,适用于对速度要求高的场景。

OpenAI Blog ★★★★☆ 2018-12-14

How AI training scales

推荐理由:涉及AI模型训练机制与可扩展性,属核心技术进展

研究发现梯度噪声尺度可预测神经网络训练的并行性,表明大批次训练在未来将更有效,有助于AI系统扩展。

OpenAI Blog ★★★☆☆ 2018-12-06

Quantifying generalization in reinforcement learning

推荐理由:涉及AI模型评测与训练环境创新,有助于理解泛化能力

OpenAI发布CoinRun训练环境,用于量化强化学习智能体在新情境中的泛化能力,解决了该领域长期存在的难题。该环境复杂度适中,比传统平台游戏简单,但仍对当前先进算法构成泛化挑战。

OpenAI Blog ★★★★☆ 2018-11-08

Spinning Up in Deep RL

推荐理由:推荐热门RL学习资源,含实用代码与教程

OpenAI发布Spinning Up in Deep RL,提供清晰的深度强化学习代码示例、教程和练习,帮助用户掌握RL实践技能。

OpenAI Blog ★★★★☆ 2018-11-07

Learning concepts with energy functions

推荐理由:涉及新型AI模型架构与跨域迁移能力,具技术前瞻性。

研究提出一种基于能量的模型,仅需5个示例即可快速学习空间概念(如“靠近”“之间”),并能将2D环境中学习的概念迁移到3D机器人任务中。

Lilian Weng's Blog ★★★☆☆ 2018-10-13

Flow-based Deep Generative Models

推荐理由:属于AI模型基础研究,有助于理解生成模型技术演进

文章介绍基于流的深度生成模型(Flow-based Models),作为与GAN、VAE并列的第三类生成模型,其特点是可以显式学习输入数据的概率密度函数。

OpenAI Blog ★★★☆☆ 2018-08-06

OpenAI Five Benchmark: Results

推荐理由:展示大模型在复杂环境下的决策与协作能力,具技术参考价值

OpenAI Five在Dota 2比赛中击败了99.95%分位的顶尖玩家团队,包括多名职业选手,展示了其在复杂策略游戏中的AI决策能力。

OpenAI Blog ★★★★☆ 2018-07-30

Learning dexterity

推荐理由:涉及AI在机器人领域的前沿应用与技术实现

OpenAI训练出具备前所未有灵巧度的人形机器人手,可精准操控物理物体,展示了强化学习在机器人控制领域的最新进展。

OpenAI Blog ★★★★☆ 2018-07-09

Glow: Better reversible generative models

推荐理由:涉及新AI模型发布及开源工具,符合模型发布与工具库推荐兴趣

OpenAI发布Glow,一种基于可逆1x1卷积的新型可逆生成模型,能生成高分辨率图像、支持高效采样,并提供代码和可视化工具。

OpenAI Blog ★★★☆☆ 2018-06-25

OpenAI Five

推荐理由:展示AI在复杂策略游戏中的实战能力,属AI模型应用案例

OpenAI开发的由五个神经网络组成的AI系统OpenAI Five,已开始在Dota 2游戏中击败业余人类战队。

Lilian Weng's Blog ★★★★☆ 2018-06-24

Attention? Attention!

推荐理由:系统梳理注意力机制核心技术,对理解大模型基础至关重要。

文章深入讲解注意力机制的发展历程及多种变体,包括Transformer、Pointer Network、Neural Turing Machines等,并附有代码实现链接。

OpenAI Blog ★★★★☆ 2018-06-11

Improving language understanding with unsupervised learning

推荐理由:涉及大模型核心技术及性能突破,符合AI模型发布与评测主题

文章介绍了一种结合Transformer和无监督预训练的语言理解方法,在多项任务上取得SOTA结果,并开源了该系统,验证了无监督预训练与监督学习结合的有效性。

OpenAI Blog ★★★★☆ 2018-05-25

Gym Retro

推荐理由:热门AI开源项目,适用于强化学习研究与开发

OpenAI发布Gym Retro完整版,支持超1000款游戏用于强化学习研究,并开源新增游戏的工具。

OpenAI Blog ★★★★☆ 2018-05-16

AI and compute

推荐理由:揭示AI发展核心驱动力——算力增长趋势,对理解模型演进和未来能力有重要参考价值。

文章分析了2012年以来AI训练所用算力呈指数增长,每3.4个月翻倍,远超摩尔定律,强调算力进步对AI发展的关键作用及未来影响。

OpenAI Blog ★★★★☆ 2018-04-18

Evolved Policy Gradients

推荐理由:涉及AI模型训练新方法,属前沿模型技术探索

OpenAI发布实验性元学习方法Evolved Policy Gradients(EPG),通过进化学习智能体的损失函数,使其在训练分布外的新任务上快速适应,如在测试时成功导航到训练中未见过位置的物体。

OpenAI Blog ★★★★☆ 2018-04-10

Gotta Learn Fast: A new benchmark for generalization in RL

推荐理由:涉及AI模型评测与新基准发布,契合用户关注点

提出新强化学习基准Gotta Learn Fast(GLaF),用于评估智能体在分布外任务上的泛化能力,包含多样化环境和难度渐进机制,并对现有算法进行评测。

Lilian Weng's Blog ★★★★☆ 2018-04-08

Policy Gradient Algorithms

推荐理由:涵盖主流强化学习算法,属AI模型核心技术内容

深入解析策略梯度算法原理及近年提出的多种变体,包括PPO、SAC、DDPG、A3C等,并持续更新最新方法。

OpenAI Blog ★★★☆☆ 2018-03-15

Improving GANs using optimal transport

推荐理由:涉及AI模型优化方法,属热门研究方向

论文提出利用最优传输理论改进生成对抗网络(GANs),通过更稳定的训练目标和更好的分布对齐提升生成质量。

← 上一页 85 / 92 下一页 →