笑笑乐园 - 朝花夕拾

Lilian Weng's Blog ★★★★☆ 2018-12-27

Object Detection Part 4: Fast Detection Models

推荐理由：涵盖主流AI视觉模型及其技术原理，属AI模型评测与应用范畴

本文介绍了一阶段目标检测模型（如SSD、RetinaNet和YOLO系列），这些模型跳过区域提议阶段，直接在密集采样区域进行检测，适用于对速度要求高的场景。

阅读原文 →

OpenAI Blog ★★★★☆ 2018-12-14

How AI training scales

推荐理由：涉及AI模型训练机制与可扩展性，属核心技术进展

研究发现梯度噪声尺度可预测神经网络训练的并行性，表明大批次训练在未来将更有效，有助于AI系统扩展。

阅读原文 →

OpenAI Blog ★★★☆☆ 2018-12-06

Quantifying generalization in reinforcement learning

推荐理由：涉及AI模型评测与训练环境创新，有助于理解泛化能力

OpenAI发布CoinRun训练环境，用于量化强化学习智能体在新情境中的泛化能力，解决了该领域长期存在的难题。该环境复杂度适中，比传统平台游戏简单，但仍对当前先进算法构成泛化挑战。

阅读原文 →

OpenAI Blog ★★★★☆ 2018-11-08

Spinning Up in Deep RL

推荐理由：推荐热门RL学习资源，含实用代码与教程

OpenAI发布Spinning Up in Deep RL，提供清晰的深度强化学习代码示例、教程和练习，帮助用户掌握RL实践技能。

阅读原文 →

OpenAI Blog ★★★★☆ 2018-11-07

Learning concepts with energy functions

推荐理由：涉及新型AI模型架构与跨域迁移能力，具技术前瞻性。

研究提出一种基于能量的模型，仅需5个示例即可快速学习空间概念（如“靠近”“之间”），并能将2D环境中学习的概念迁移到3D机器人任务中。

阅读原文 →

Lilian Weng's Blog ★★★☆☆ 2018-10-13

Flow-based Deep Generative Models

推荐理由：属于AI模型基础研究，有助于理解生成模型技术演进

文章介绍基于流的深度生成模型（Flow-based Models），作为与GAN、VAE并列的第三类生成模型，其特点是可以显式学习输入数据的概率密度函数。

阅读原文 →

OpenAI Blog ★★★★☆ 2018-10-02

FFJORD: Free-form continuous dynamics for scalable reversible generative models

推荐理由：介绍了一种创新的可逆生成模型架构，属于AI模型技术进展

FFJORD是一种基于连续时间常微分方程（ODE）的可逆生成模型，通过自由形式的动态建模实现高效、可扩展的概率密度估计，在图像生成等任务中优于传统方法。

阅读原文 →

OpenAI Blog ★★★☆☆ 2018-08-06

OpenAI Five Benchmark: Results

推荐理由：展示大模型在复杂环境下的决策与协作能力，具技术参考价值

OpenAI Five在Dota 2比赛中击败了99.95%分位的顶尖玩家团队，包括多名职业选手，展示了其在复杂策略游戏中的AI决策能力。

阅读原文 →

OpenAI Blog ★★★★☆ 2018-07-30

Learning dexterity

推荐理由：涉及AI在机器人领域的前沿应用与技术实现

OpenAI训练出具备前所未有灵巧度的人形机器人手，可精准操控物理物体，展示了强化学习在机器人控制领域的最新进展。

阅读原文 →

OpenAI Blog ★★★★☆ 2018-07-09

Glow: Better reversible generative models

推荐理由：涉及新AI模型发布及开源工具，符合模型发布与工具库推荐兴趣

OpenAI发布Glow，一种基于可逆1x1卷积的新型可逆生成模型，能生成高分辨率图像、支持高效采样，并提供代码和可视化工具。

阅读原文 →

OpenAI Blog ★★★☆☆ 2018-06-25

OpenAI Five

推荐理由：展示AI在复杂策略游戏中的实战能力，属AI模型应用案例

OpenAI开发的由五个神经网络组成的AI系统OpenAI Five，已开始在Dota 2游戏中击败业余人类战队。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2018-06-24

Attention? Attention!

推荐理由：系统梳理注意力机制核心技术，对理解大模型基础至关重要。

文章深入讲解注意力机制的发展历程及多种变体，包括Transformer、Pointer Network、Neural Turing Machines等，并附有代码实现链接。

阅读原文 →

OpenAI Blog ★★★★☆ 2018-06-11

Improving language understanding with unsupervised learning

推荐理由：涉及大模型核心技术及性能突破，符合AI模型发布与评测主题

文章介绍了一种结合Transformer和无监督预训练的语言理解方法，在多项任务上取得SOTA结果，并开源了该系统，验证了无监督预训练与监督学习结合的有效性。

阅读原文 →

OpenAI Blog ★★★★☆ 2018-05-25

Gym Retro

推荐理由：热门AI开源项目，适用于强化学习研究与开发

OpenAI发布Gym Retro完整版，支持超1000款游戏用于强化学习研究，并开源新增游戏的工具。

阅读原文 →

OpenAI Blog ★★★★☆ 2018-05-16

AI and compute

推荐理由：揭示AI发展核心驱动力——算力增长趋势，对理解模型演进和未来能力有重要参考价值。

文章分析了2012年以来AI训练所用算力呈指数增长，每3.4个月翻倍，远超摩尔定律，强调算力进步对AI发展的关键作用及未来影响。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2018-05-05

Implementing Deep Reinforcement Learning Models with Tensorflow + OpenAI Gym

推荐理由：涵盖热门AI工具库与实践教程，适合开发者学习参考。

本文介绍如何使用TensorFlow和OpenAI Gym实现多种经典深度强化学习模型，并提供完整开源代码。

阅读原文 →

OpenAI Blog ★★★★☆ 2018-04-18

Evolved Policy Gradients

推荐理由：涉及AI模型训练新方法，属前沿模型技术探索

OpenAI发布实验性元学习方法Evolved Policy Gradients（EPG），通过进化学习智能体的损失函数，使其在训练分布外的新任务上快速适应，如在测试时成功导航到训练中未见过位置的物体。

阅读原文 →

OpenAI Blog ★★★★☆ 2018-04-10

Gotta Learn Fast: A new benchmark for generalization in RL

推荐理由：涉及AI模型评测与新基准发布，契合用户关注点

提出新强化学习基准Gotta Learn Fast（GLaF），用于评估智能体在分布外任务上的泛化能力，包含多样化环境和难度渐进机制，并对现有算法进行评测。

阅读原文 →

Lilian Weng's Blog ★★★★☆ 2018-04-08

Policy Gradient Algorithms

推荐理由：涵盖主流强化学习算法，属AI模型核心技术内容

深入解析策略梯度算法原理及近年提出的多种变体，包括PPO、SAC、DDPG、A3C等，并持续更新最新方法。

阅读原文 →

OpenAI Blog ★★★☆☆ 2018-03-15

Improving GANs using optimal transport

推荐理由：涉及AI模型优化方法，属热门研究方向

论文提出利用最优传输理论改进生成对抗网络（GANs），通过更稳定的训练目标和更好的分布对齐提升生成质量。

阅读原文 →