RECHERCHE
Estimer la sortie attendue de MLP aléatoires larges sans échantillonnage
Des chercheurs proposent une méthode analytique pour estimer la sortie d'un MLP à l'initialisation, surpassant le Monte Carlo en efficacité.
arXiv cs.AI · cs.LG · cs.CL·Wilson Wu, Victor Lecomte, Michael Winer, George Robinson·6 mai 2026

Image · Source originale
Plutôt que d'estimer la perte attendue par échantillonnage Monte Carlo, les auteurs exploitent des outils comme les cumulants et les expansions d'Hermite pour approcher analytiquement les distributions d'activations couche par couche. Pour des réseaux suffisamment larges, leur estimateur atteint une erreur quadratique cible avec nettement moins de FLOPs. La méthode s'avère particulièrement efficace pour estimer les probabilités d'événements rares et ouvre une voie vers des modèles présentant moins de risques catastrophiques en queue de distribution.