RECHERCHE

Optimisation de LLMs centrés sur le coréen par token pruning

Une étude benchmark compare plusieurs LLMs multilingues après réduction de vocabulaire, en ciblant les tâches NLP coréennes.

arXiv cs.AI · cs.LG · cs.CL·Hoyeol Kim, Hyeonwoo Kim·17 avril 2026

Des chercheurs ont évalué l'impact du token pruning — technique supprimant les tokens de langues hors cible — sur des modèles Qwen3, Gemma-3, Llama-3 et Aya, selon trois configurations de vocabulaire. Les résultats montrent que cette compression améliore la stabilité de génération en réduisant la confusion linguistique, et renforce souvent les performances en traduction automatique vers le coréen. La réduction de taille de vocabulaire est validée comme stratégie efficace pour des déploiements contraints en mémoire, malgré des gains limités en latence d'inférence.

Chaleur 0

Pertinence 55

Nouveauté 58

OUVRIR LA SOURCE ↗

#token-pruning #LLM #coréen #compression #multilingue