SAFETY
Ce qui s'est passé après que 2 000 personnes ont tenté de pirater mon assistant IA
Un développeur analyse les résultats d'une expérience publique d'adversarial prompting sur son assistant IA juridique, après 2 000 tentatives de jailbreak.
Hacker News (filtré IA)·@cuchoi·26 juin 2026

Image · Générée · OpenAI GPT Image 2
L'auteur a ouvert son assistant IA dédié au droit chilien aux tentatives de détournement du public. Il documente les attaques les plus fréquentes — injection de prompts, jailbreaks, tentatives de manipulation contextuelle — et tire des enseignements concrets sur la robustesse des garde-fous. L'article constitue un retour d'expérience empirique sur la sécurité des LLM en production.