SAFETY
Suivi des trajectoires comportementales des agents adaptatifs
Une méthode pour mesurer et surveiller l'évolution des traits comportementaux des agents IA à travers leurs fichiers de configuration.
arXiv cs.AI · cs.LG · cs.CL·Jonah Leshin, Manish Shah, Ian Timmis·1 juin 2026

Image · Source originale
Des chercheurs proposent un cadre pour quantifier les « traits » comportementaux des agents IA en définissant ces traits comme des directions dans l'espace d'embedding de fichiers de compétences. Un modèle linéaire entraîné sur des paires de diffs « avant/après » permet d'atteindre 91,2 % de précision de classification et une corrélation de rang de Spearman ρ = 0,82. Le framework intègre un protocole agent-à-agent via un intermédiaire de confiance pour évaluer les mises à jour de fichiers de compétences.