SAFETY

AVISE : un framework open-source pour évaluer la sécurité des systèmes IA

Des chercheurs présentent AVISE, un cadre modulaire d'évaluation des vulnérabilités IA, incluant un test automatisé de jailbreak sur neuf LLM récents.

arXiv cs.AI · cs.LG · cs.CL·Mikko Lempinen, Joni Kemppainen, Niklas Raesalmi·22 avril 2026

AVISE (AI Vulnerability Identification and Security Evaluation) est un framework open-source modulaire conçu pour identifier les vulnérabilités des systèmes et modèles IA. Les auteurs étendent l'attaque multi-tour Red Queen via un Adversarial Language Model et développent un Security Evaluation Test (SET) de 25 cas de test atteignant 92 % de précision. Les neuf LLM évalués se révèlent tous vulnérables à des degrés divers à l'attaque augmentée.

Chaleur 0

Pertinence 78

Nouveauté 65

OUVRIR LA SOURCE ↗

#jailbreak #red-teaming #sécurité-ia #LLM #open-source