RECHERCHE
Citations non vérifiées : évaluation de l'attribution de sources dans les agents de recherche LLM
Un nouveau framework évalue la fiabilité des citations générées par les agents de recherche IA — et les résultats sur la précision factuelle sont préoccupants.
arXiv cs.AI · cs.LG · cs.CL·Hailey Onweller, Elias Lumer, Austin Huber, Pia Ramchandani·7 mai 2026

Image · Source originale
Des chercheurs introduisent le premier framework d'évaluation de l'attribution de sources pour les agents de recherche LLM, basé sur un parser AST reproductible. Le système teste les citations selon trois dimensions : accessibilité des liens, pertinence du contenu et exactitude factuelle. Sur 14 modèles benchmarkés, la validité des liens dépasse 94 % et la pertinence 80 %, mais la précision factuelle n'atteint que 39 à 77 %. La précision chute d'environ 42 % avec l'augmentation de la profondeur de recherche.