RECHERCHE
MTG Bench : évaluer la capacité des LLM à jouer à Magic: The Gathering
Un benchmark original teste les grands modèles de langage sur leur aptitude à jouer à Magic: The Gathering, jeu de cartes à règles complexes.
Hacker News (filtré IA)·@CallumFerg·11 juin 2026

Image · Source originale
MTG Bench propose un cadre d'évaluation inédit pour mesurer les performances des LLM sur le jeu de cartes Magic: The Gathering, dont la complexité des règles et la profondeur stratégique en font un terrain d'évaluation exigeant. Les résultats révèlent des disparités significatives entre modèles, mettant en lumière leurs limites en matière de raisonnement règlementaire et de prise de décision sous contraintes.