Toutes les news taguées avec ce sujet.
Anthropic explore une nouvelle approche pour rendre les représentations internes de Claude lisibles par l'humain via des auto-encodeurs en langage naturel.
Les LLM développent-ils une notion interne de grammaticalité distincte de la probabilité de séquence ? Une sonde linéaire révèle des représentations latentes surprenantes.