OPINION

Eric Jang – Reconstruire AlphaGo from scratch avec les outils IA modernes

En revisitant AlphaGo, Eric Jang éclaire les limites du RL dans les LLMs et les contours d'une future explosion d'intelligence.

Dwarkesh Patel·Dwarkesh Patel·15 mai 2026

Image · Source originale

Eric Jang explique comment reconstruire AlphaGo avec les outils IA actuels, en soulignant que ce système reste l'exemple le plus clair des primitives de l'intelligence : recherche, apprentissage par expérience et self-play. Il compare le RL naïf des LLMs, confronté au problème d'attribution de crédit sur des trajectoires de 100 000 tokens, au MCTS d'AlphaGo qui propose une cible d'entraînement strictement supérieure à chaque coup. La discussion aborde aussi les parties de la recherche IA déjà automatisables par les LLMs et celles qui résistent encore.

Chaleur 0

Pertinence 72

Nouveauté 45

OUVRIR LA SOURCE ↗

#reinforcement-learning #AlphaGo #LLM #self-play #intelligence-explosion