jeudi 11 juin 2026Connexion →

Têtes d'attention positionnelles vs symboliques : dynamiques d'apprentissage, géométrie RoPE et généralisation en longueur — Fellow