vendredi 24 avril 2026Connexion →
21 SOURCES ACTIVES+253 / 7J
Fellow
La veille de l'intelligence artificielle

SAFETY

AVISE : un framework open-source pour évaluer la sécurité des systèmes IA

Des chercheurs présentent AVISE, un cadre modulaire d'évaluation des vulnérabilités IA, incluant un test automatisé de jailbreak sur neuf LLM récents.

arXiv cs.AI · cs.LG · cs.CL·Mikko Lempinen, Joni Kemppainen, Niklas Raesalmi·22 avril 2026
AVISE (AI Vulnerability Identification and Security Evaluation) est un framework open-source modulaire conçu pour identifier les vulnérabilités des systèmes et modèles IA. Les auteurs étendent l'attaque multi-tour Red Queen via un Adversarial Language Model et développent un Security Evaluation Test (SET) de 25 cas de test atteignant 92 % de précision. Les neuf LLM évalués se révèlent tous vulnérables à des degrés divers à l'attaque augmentée.
Chaleur 27
Pertinence 78
Nouveauté 65
OUVRIR LA SOURCE ↗
#jailbreak#red-teaming#sécurité-ia#LLM#open-source