SAFETY
AVISE : un framework open-source pour évaluer la sécurité des systèmes IA
Des chercheurs présentent AVISE, un cadre modulaire d'évaluation des vulnérabilités IA, incluant un test automatisé de jailbreak sur neuf LLM récents.
arXiv cs.AI · cs.LG · cs.CL·Mikko Lempinen, Joni Kemppainen, Niklas Raesalmi·22 avril 2026

AVISE (AI Vulnerability Identification and Security Evaluation) est un framework open-source modulaire conçu pour identifier les vulnérabilités des systèmes et modèles IA. Les auteurs étendent l'attaque multi-tour Red Queen via un Adversarial Language Model et développent un Security Evaluation Test (SET) de 25 cas de test atteignant 92 % de précision. Les neuf LLM évalués se révèlent tous vulnérables à des degrés divers à l'attaque augmentée.
Chaleur 27
Pertinence 78
Nouveauté 65