RECHERCHE
Redéfinir les routeurs MoE avec la Manifold Power Iteration
Une nouvelle méthode aligne chaque ligne du routeur sur la direction singulière principale de l'expert associé pour améliorer les modèles MoE.
arXiv cs.AI · cs.LG · cs.CL·Songhao Wu, Ang Lv, Ruobing Xie, Yankai Lin·10 juin 2026

Image · Source originale
Les auteurs proposent une refonte des routeurs dans les modèles Mixture-of-Experts (MoE) via la Manifold Power Iteration (MPI). Le principe : aligner chaque ligne de la matrice de routage sur la direction singulière principale de l'expert correspondant, offrant une description mathématique plus expressive. Le paradigme « Power-then-Retract » applique une itération de puissance puis une rétraction normée pour stabilité et efficacité. Des pré-entraînements de 1B à 11B paramètres valident l'approche.