RECHERCHE

Ensemblage de modèles de fondation tabulaires : plafond de diversité et piège de calibration

Combiner six TFMs modernes apporte à peine +0,18 % de précision pour 253× le coût de calcul — et certaines stratégies dégradent la calibration.

arXiv cs.AI · cs.LG · cs.CL·Aditya Tanna, Yash Desai, Pratinav Seth, Mohamed Bouadi·18 mai 2026

Image · Source originale

Une étude benchmark de six stratégies d'ensemblage appliquées à six tabular foundation models (TFMs) sur 153 tâches de classification OpenML révèle un plafond de diversité sévère : le Q-statistic moyen entre modèles atteint 0,961, limitant tout gain par combinaison convexe. Le meilleur ensemble (cascade stacking à deux niveaux) ne gagne que +0,18 % de précision pour 253× le coût. Le stacking avec méta-learner logistique améliore la précision mais détruit la calibration. Les auteurs recommandent la sélection gloutonne comme stratégie par défaut.

Chaleur 0

Pertinence 62

Nouveauté 65

OUVRIR LA SOURCE ↗

#tabular-foundation-models #ensembling #calibration #benchmark #gradient-boosting