RECHERCHE
Vérification probabiliste efficace et formellement fondée pour les agents IA
Un framework basé sur l'optimisation robuste distributionnelle pour auditer les politiques de sécurité des agents IA face à l'incertitude.
arXiv cs.AI · cs.LG · cs.CL·Alaia Solko-Breslin, Pramod Kaushik Mudrakarta, Mihai Christodorescu, Somesh Jha·18 juin 2026

Image · Source originale
Les approches actuelles de monitoring d'agents IA se limitent à des politiques déterministes, insuffisantes face aux prédicats probabilistes (détecteurs de PII, declassifiers). Les auteurs proposent un framework fondé sur l'optimisation robuste distributionnelle, calculant des bornes supérieures garanties sur la probabilité de violation de politique, sans hypothèses d'indépendance. Sur des benchmarks d'agents à terminaux et d'appels d'outils, l'approche améliore le compromis sécurité-utilité tout en fournissant des garanties rigoureuses.