RECHERCHE

Diagnostic de l'interprétation de grammaires formelles dans les LLM

Une nouvelle étude révèle que les LLM peinent à interpréter fidèlement des grammaires hors contexte, notamment face à la récursivité profonde.

arXiv cs.AI · cs.LG · cs.CL·Hanqi Li, Lu Chen, Kai Yu·22 avril 2026

Le framework RoboGrid évalue la capacité des LLM à interpréter des grammaires hors contexte (CFG) inédites selon trois dimensions : syntaxe, comportement et sémantique. Les résultats montrent une dégradation hiérarchique systématique : les modèles maintiennent la syntaxe de surface mais échouent à préserver la sémantique structurelle sous forte densité (récursivité profonde, branchements complexes). Les lexiques « aliens » révèlent en outre que les LLM s'appuient sur des mots-clés familiers plutôt que sur une induction symbolique pure, ce qui constitue un obstacle pour les agents agnostiques aux grammaires.

Chaleur 0

Pertinence 72

Nouveauté 68

OUVRIR LA SOURCE ↗

#LLM #grammaires formelles #agents #raisonnement symbolique #benchmark