RECHERCHE
Diagnostic de l'interprétation de grammaires formelles dans les LLM
Une nouvelle étude révèle que les LLM peinent à interpréter fidèlement des grammaires hors contexte, notamment face à la récursivité profonde.
arXiv cs.AI · cs.LG · cs.CL·Hanqi Li, Lu Chen, Kai Yu·22 avril 2026

Le framework RoboGrid évalue la capacité des LLM à interpréter des grammaires hors contexte (CFG) inédites selon trois dimensions : syntaxe, comportement et sémantique. Les résultats montrent une dégradation hiérarchique systématique : les modèles maintiennent la syntaxe de surface mais échouent à préserver la sémantique structurelle sous forte densité (récursivité profonde, branchements complexes). Les lexiques « aliens » révèlent en outre que les LLM s'appuient sur des mots-clés familiers plutôt que sur une induction symbolique pure, ce qui constitue un obstacle pour les agents agnostiques aux grammaires.