RECHERCHE · Hugging Face

EMO : pré-entraînement d'un mixture of experts pour une modularité émergente

AllenAI présente EMO, une approche MoE où la spécialisation des experts émerge naturellement du pré-entraînement sans supervision explicite.

Hugging Face Blog·8 mai 2026

Image · Source originale

EMO (Emergent Modularity with MoE) est une méthode de pré-entraînement développée par AllenAI qui exploite les architectures Mixture of Experts pour induire une spécialisation modulaire émergente des experts, sans recourir à des labels de routage supervisés. L'approche vise à améliorer l'efficacité et l'interprétabilité des grands modèles de langage en permettant aux experts de se spécialiser spontanément sur différents types de connaissances ou de tâches.

Chaleur 0

Pertinence 72

Nouveauté 75

OUVRIR LA SOURCE ↗

#mixture-of-experts #pré-entraînement #modularité #LLM #AllenAI