SAFETY

Le modèle Compressed Computation n'est probablement pas un cas de calcul en superposition

Une étude remet en cause un toy model censé illustrer le calcul en superposition, en montrant que ses gains de performance s'expliquent par un artefact de mélange d'entrées.

arXiv cs.AI · cs.LG · cs.CL·Jai Bhagat, Sara Molas-Medina, Giorgi Giglemiani, Stefan Heimersheim·12 juin 2026

Image · Source originale

Des chercheurs examinent si le modèle jouet Compressed Computation (CC), qui semble calculer 100 fonctions ReLU avec seulement 50 neurones, illustre réellement le calcul en superposition. Ils montrent que les gains de performance proviennent d'une matrice de mélange non intentionnelle dans le flux résiduel bruité, et non d'une véritable superposition. Une baseline par factorisation matricielle semi-non-négative, dérivée uniquement de cette matrice, reproduit qualitativement les résultats, invalidant le modèle CC comme référence pertinente.

Chaleur 1

Pertinence 62

Nouveauté 65

OUVRIR LA SOURCE ↗

#interprétabilité #superposition #mechanistic-interpretability #toy-model #safety