RECHERCHE
LedgerAgent : un état structuré pour des agents outil-calling conformes aux politiques
Une méthode d'inférence qui externalise l'état des tâches dans un registre dédié pour éviter les violations de politique dans les agents de service client.
arXiv cs.AI · cs.LG · cs.CL·Md Nayem Uddin, Amir Saeidi, Eduardo Blanco, Chitta Baral·18 juin 2026

Image · Source originale
LedgerAgent propose une approche d'inférence où l'état de la tâche (faits, contraintes, conditions) est maintenu dans un registre séparé plutôt que reconstitué à chaque tour depuis le prompt. Ce registre permet également de vérifier les contraintes de politique avant d'exécuter des appels d'outils modifiant l'environnement, bloquant ainsi les violations. Évalué sur quatre domaines de service client avec des modèles open- et closed-weights, LedgerAgent améliore le pass^k moyen, notamment sous des métriques de cohérence multi-essais strictes.