RECHERCHE
Reconstruction neurale de la structure lexicale historique des langues bantoues à partir de données modernes
Des modèles transformer entraînés sur des données morphologiques modernes parviennent à retrouver des cognats proto-bantous avec une précision de 90,9 %.
arXiv cs.AI · cs.LG · cs.CL·Hillary Mutisya, John Mugane·24 avril 2026

Image · Source originale
En utilisant BantuMorph v7, un transformer entraîné sur des paradigmes morphologiques bantous modernes, les chercheurs analysent 14 langues d'Afrique orientale et australe. Les embeddings extraits permettent d'identifier 728 candidats cognats nominaux et 1 525 verbaux, dont 90,9 % des meilleurs candidats nominaux correspondent à des formes proto-bantoues déjà reconstruites. Une validation croisée avec le modèle NLLB-600M confirme la robustesse des regroupements phylogénétiques obtenus.