SAFETY · Anthropic
Mesurer la capacité des LLM à développer des exploits
Anthropic publie une évaluation inédite testant dans quelle mesure les grands modèles de langage peuvent concevoir des exploits de cybersécurité.
Anthropic Research·22 mai 2026

Image · Source originale
Anthropic présente un cadre d'évaluation dédié à mesurer la capacité des LLM à développer des exploits informatiques. Cette recherche vise à quantifier le risque cybersécurité posé par les modèles avancés, en distinguant ce qu'ils peuvent accomplir seuls de ce qu'ils apportent comme aide supplémentaire à un attaquant humain. Les résultats doivent alimenter les politiques d'usage responsable et les garde-fous des modèles futurs.