RECHERCHE
SN-WER : une métrique normalisée par script pour l'évaluation ASR multilingue
Une nouvelle métrique d'évaluation de la reconnaissance vocale qui corrige les biais liés aux variations d'écriture dans les langues indiennes.
arXiv cs.AI · cs.LG · cs.CL·Priyaranjan Pattnayak·1 juin 2026

Image · Source originale
Le Word Error Rate (WER) surestime les erreurs ASR lorsque référence et hypothèse utilisent des scripts différents pour les mêmes mots, phénomène fréquent en contexte multilingue avec des sorties romanisées. SN-WER translittère les deux textes dans un script canonique avant calcul. Testé sur 5 langues indiennes, il réduit jusqu'à 12 % les écarts artificiels entre modèles et atténue de 67 % l'inflation de WER due à la romanisation, tout en restant sensible aux erreurs sémantiques réelles.