RECHERCHE

Vérification probabiliste efficace et formellement fondée pour les agents IA

Un framework basé sur l'optimisation robuste distributionnelle pour auditer les politiques de sécurité des agents IA face à l'incertitude.

arXiv cs.AI · cs.LG · cs.CL·Alaia Solko-Breslin, Pramod Kaushik Mudrakarta, Mihai Christodorescu, Somesh Jha·18 juin 2026

Image · Source originale

Les approches actuelles de monitoring d'agents IA se limitent à des politiques déterministes, insuffisantes face aux prédicats probabilistes (détecteurs de PII, declassifiers). Les auteurs proposent un framework fondé sur l'optimisation robuste distributionnelle, calculant des bornes supérieures garanties sur la probabilité de violation de politique, sans hypothèses d'indépendance. Sur des benchmarks d'agents à terminaux et d'appels d'outils, l'approche améliore le compromis sécurité-utilité tout en fournissant des garanties rigoureuses.

Chaleur 16

Pertinence 62

Nouveauté 74

OUVRIR LA SOURCE ↗

#agents #sécurité #vérification formelle #probabilistic-inference #Datalog