2 items

#représentations-internes

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

SAFETY
anthropicheat 72
Auto-encodeurs en langage naturel : transformer les pensées de Claude en texte
Anthropic explore une nouvelle approche pour rendre les représentations internes de Claude lisibles par l'humain via des auto-encodeurs en langage naturel.
RECHERCHE
heat 42
Représentations implicites de la grammaticalité dans les modèles de langage
Les LLM développent-ils une notion interne de grammaticalité distincte de la probabilité de séquence ? Une sonde linéaire révèle des représentations latentes surprenantes.