RECHERCHE

Vers des modèles Mixture-of-Experts calibrés sous dérive de distribution

Une étude analyse comment la calibration des experts individuels interagit avec les mécanismes de routage dans les MoE soumis à des shifts de distribution.

arXiv cs.AI · cs.LG · cs.CL·Gina Wong, Drew Prinster, Suchi Saria, Rama Chellappa·18 juin 2026

Image · Source originale

Ce travail examine le comportement des modèles Mixture-of-Experts (MoE) face aux dérives de distribution, en s'intéressant à l'interaction entre routage et calibration des experts. Les auteurs montrent que la calibration au niveau des experts suffit à garantir la calibration globale dans les modèles à routage dur, mais pas dans les modèles à routage doux. Ils proposent une méthode de repondération adversariale qui améliore le compromis précision-calibration sur plusieurs tâches et types de distribution shift.

Chaleur 16

Pertinence 62

Nouveauté 65

OUVRIR LA SOURCE ↗

#mixture-of-experts #calibration #distribution-shift #incertitude #routage