全部 ♥ 收藏 36氪 - AI Anthropic Research Google AI Blog HackerNews Best Hugging Face Blog LangChain Blog Lilian Weng's Blog MIT Tech Review - AI OpenAI Blog The Verge - AI 机器之心 李沐 稚晖君 量子位
Lilian Weng's Blog ★★★★☆ 2020-08-06

Neural Architecture Search

推荐理由:涉及AI模型自动化设计,属热门AI工具库与技术方向

文章探讨神经架构搜索(NAS)技术,将其方法分解为搜索空间、搜索算法和子模型演化策略三部分,综述了实现更高效、低成本自动设计高性能神经网络的前沿思路。

Lilian Weng's Blog ★★★★☆ 2020-04-07

The Transformer Family

推荐理由:深入解析主流AI模型架构演进,契合模型评测与技术发展兴趣

文章系统梳理了Transformer模型的多种改进版本,涵盖长序列注意力、计算与内存优化、强化学习任务适配等方向,并于2023年更新至第二版,涵盖2020年以来的新进展。

Lilian Weng's Blog ★★★★☆ 2019-11-10

Self-Supervised Representation Learning

推荐理由:涵盖主流自监督学习模型与技术演进,对理解AI模型训练有重要参考价值。

文章深入探讨自监督表征学习在图像、视频和控制问题中的多种方法,包括对比预测编码、MoCo、SimCLR、BYOL等关键技术。

Lilian Weng's Blog ★★★☆☆ 2019-09-05

Evolution Strategies

推荐理由:涉及AI模型训练的替代优化方法,属AI技术底层研究

文章介绍进化策略(ES)作为黑盒优化方法,适用于无法计算梯度的场景,并探讨其在深度强化学习中的应用。

Lilian Weng's Blog ★★★☆☆ 2019-06-23

Meta Reinforcement Learning

推荐理由:涉及AI前沿模型技术,符合模型发布与评测类兴趣

文章探讨元强化学习(Meta-RL),即在多个强化学习任务上训练后,智能体能快速适应新任务。内容涵盖Meta-RL的起源及其三大核心组件,属于AI模型方法论的深入解析。

Lilian Weng's Blog ★★★★☆ 2019-01-31

Generalized Language Models

推荐理由:覆盖多个重要大模型的技术演进,符合AI模型发布及评测兴趣

文章系统梳理了从ELMo、GPT、BERT到RoBERTa、T5、GPT-3等主流大语言模型的发展脉络与技术特点,涵盖其预训练方法和在各类NLP任务中的表现。

Lilian Weng's Blog ★★★★☆ 2018-12-27

Object Detection Part 4: Fast Detection Models

推荐理由:涵盖主流AI视觉模型及其技术原理,属AI模型评测与应用范畴

本文介绍了一阶段目标检测模型(如SSD、RetinaNet和YOLO系列),这些模型跳过区域提议阶段,直接在密集采样区域进行检测,适用于对速度要求高的场景。

Lilian Weng's Blog ★★★☆☆ 2018-10-13

Flow-based Deep Generative Models

推荐理由:属于AI模型基础研究,有助于理解生成模型技术演进

文章介绍基于流的深度生成模型(Flow-based Models),作为与GAN、VAE并列的第三类生成模型,其特点是可以显式学习输入数据的概率密度函数。

Lilian Weng's Blog ★★★★☆ 2018-06-24

Attention? Attention!

推荐理由:系统梳理注意力机制核心技术,对理解大模型基础至关重要。

文章深入讲解注意力机制的发展历程及多种变体,包括Transformer、Pointer Network、Neural Turing Machines等,并附有代码实现链接。

Lilian Weng's Blog ★★★★☆ 2018-04-08

Policy Gradient Algorithms

推荐理由:涵盖主流强化学习算法,属AI模型核心技术内容

深入解析策略梯度算法原理及近年提出的多种变体,包括PPO、SAC、DDPG、A3C等,并持续更新最新方法。

Lilian Weng's Blog ★★★☆☆ 2018-01-23

The Multi-Armed Bandit Problem and Its Solutions

推荐理由:涵盖AI决策算法及开源实现,适用于推荐系统等商业化场景

文章介绍了多臂老虎机问题及其在探索与利用权衡中的应用,并提供了伯努利老虎机的算法实现,涉及在线推荐和广告等AI应用场景。

Lilian Weng's Blog ★★★☆☆ 2017-12-31

Object Detection for Dummies Part 3: R-CNN Family

推荐理由:涵盖主流AI模型技术演进,符合AI模型评测与学习需求

文章系统讲解了R-CNN家族的四个关键目标检测模型(R-CNN、Fast R-CNN、Faster R-CNN和Mask R-CNN),分析其演进与速度优化,适合理解经典AI视觉模型发展。

Lilian Weng's Blog ★★★☆☆ 2017-10-15

Learning Word Embedding

推荐理由:涉及AI基础技术中的词嵌入模型与表示学习

文章介绍了词嵌入(word embedding)的基本概念及其学习方法,包括如何将自然语言转换为数值向量,并对比了one-hot编码与稠密向量表示的优劣。

Lilian Weng's Blog ★★★☆☆ 2017-09-28

Anatomize Deep Learning with Information Theory

推荐理由:涉及AI模型理论基础与训练机制,对理解大模型有启发

文章介绍了Tishby教授提出的用信息论研究深度学习的新视角,包括信息瓶颈方法和DNN训练的两个阶段:拟合与压缩。

Lilian Weng's Blog ★★★☆☆ 2017-08-20

From GAN to WGAN

推荐理由:详解GAN到WGAN的技术演进,对理解生成模型训练机制有帮助

文章深入讲解了GAN的数学原理及其训练难点,并介绍了Wasserstein GAN(WGAN)如何通过使用更平滑的概率分布距离度量来改善训练稳定性。

Lilian Weng's Blog ★★★☆☆ 2017-08-01

How to Explain the Prediction of a Machine Learning Model?

推荐理由:涉及AI模型透明性与落地合规,契合AI商业化应用主题

文章探讨机器学习模型可解释性,涵盖可解释模型与黑盒模型的解释方法,并讨论可解释AI在医疗、司法等关键领域的必要性。

Lilian Weng's Blog ★★★☆☆ 2017-07-08

Predict Stock Prices Using RNN: Part 1

推荐理由:提供AI模型实战教程及开源代码,契合AI工具使用与应用落地主题

本文教程介绍如何使用TensorFlow构建RNN模型预测标普500指数价格,附完整开源代码,适合学习AI在金融时序预测中的基础应用。

← 上一页 2 / 2