1 item
#scalable-oversight
Toutes les news taguées avec ce sujet.
- SAFETYanthropicheat 78
Chercheurs en alignement automatisés : utiliser les LLM pour mettre à l'échelle la supervision
Anthropic explore comment des LLM peuvent automatiser une partie du travail de recherche en alignement pour accélérer la supervision scalable.