2 items
#sécurité-ia
Toutes les news taguées avec ce sujet.
- SAFETYheat 52
AVISE : un framework open-source pour évaluer la sécurité des systèmes IA
Des chercheurs présentent AVISE, un cadre modulaire d'évaluation des vulnérabilités IA, incluant un test automatisé de jailbreak sur neuf LLM récents.
- SAFETYheat 62
ASMR-Bench : un benchmark pour détecter le sabotage dans la recherche ML
Des chercheurs évaluent la capacité des LLMs à détecter des manipulations subtiles dans des codebases de recherche en machine learning.