RECHERCHE
Adaptive MSD-Splitting : amélioration de C4.5 et des Random Forests pour les attributs continus asymétriques
Une nouvelle méthode de discrétisation adaptative corrige les limites du MSD-Splitting face aux distributions asymétriques, avec des gains de 2 à 4 % de précision.
arXiv cs.AI · cs.LG · cs.CL·Jake Lee·21 avril 2026

L'Adaptive MSD-Splitting (AMSD) étend la technique MSD-Splitting en ajustant dynamiquement le multiplicateur d'écart-type selon l'asymétrie des distributions, préservant ainsi la résolution discriminative dans les régions denses. Intégré dans un cadre Random Forest (RF-AMSD), il maintient une complexité O(N) tout en améliorant la précision de 2 à 4 % sur des jeux de données biomédicaux et financiers. Les résultats sur Census Income, Heart Disease, Breast Cancer et Forest Covertype confirment l'intérêt du binning statistique adaptatif à grande échelle.