SAFETY

Ce qui s'est passé après que 2 000 personnes ont tenté de pirater mon assistant IA

Un développeur analyse les résultats d'une expérience publique d'adversarial prompting sur son assistant IA juridique, après 2 000 tentatives de jailbreak.

Hacker News (filtré IA)·@cuchoi·26 juin 2026

Image · Générée · OpenAI GPT Image 2

L'auteur a ouvert son assistant IA dédié au droit chilien aux tentatives de détournement du public. Il documente les attaques les plus fréquentes — injection de prompts, jailbreaks, tentatives de manipulation contextuelle — et tire des enseignements concrets sur la robustesse des garde-fous. L'article constitue un retour d'expérience empirique sur la sécurité des LLM en production.

Chaleur 25

Pertinence 72

Nouveauté 45

OUVRIR LA SOURCE ↗

#prompt-injection #jailbreak #red-team #LLM #assistant-IA