1 item
#classifieur
Toutes les news taguées avec ce sujet.
- SAFETYanthropicheat 72
Constitutional Classifiers : se défendre contre les jailbreaks universels
Anthropic présente une approche de classification constitutionnelle pour contrer les tentatives de contournement systématiques des garde-fous des LLM.