SAFETY · Anthropic

Mesurer la capacité des LLM à développer des exploits

Anthropic publie une évaluation inédite testant dans quelle mesure les grands modèles de langage peuvent concevoir des exploits de cybersécurité.

Anthropic Research·22 mai 2026

Image · Source originale

Anthropic présente un cadre d'évaluation dédié à mesurer la capacité des LLM à développer des exploits informatiques. Cette recherche vise à quantifier le risque cybersécurité posé par les modèles avancés, en distinguant ce qu'ils peuvent accomplir seuls de ce qu'ils apportent comme aide supplémentaire à un attaquant humain. Les résultats doivent alimenter les politiques d'usage responsable et les garde-fous des modèles futurs.

Chaleur 0

Pertinence 78

Nouveauté 68

OUVRIR LA SOURCE ↗

#cybersécurité #exploit #évaluation #red-teaming #LLM