RECHERCHE
Classification de sentiments et émotions sur des avis e-commerce indonésiens via BiLSTM multi-tâche et AutoML
Un pipeline à deux voies combine AutoML et BiLSTM pour analyser des avis en indonésien mêlant argot, emprunts régionaux et emojis.
arXiv cs.AI · cs.LG · cs.CL·Hermawan Manurung, Ibrahim Al-Kahfi, Ahmad Rizqi, Martin Clinton Tosima Manullang·27 avril 2026

Image · Source originale
Les chercheurs appliquent un pipeline de classification dual au dataset PRDECT-ID (5 400 avis e-commerce indonésiens) pour deux tâches : sentiment binaire et classification en cinq émotions. La première voie utilise TF-IDF avec un sweep AutoML via PyCaret ; la seconde déploie un réseau BiLSTM PyTorch avec encodeur partagé et deux têtes de sortie. Un module de prétraitement en 14 étapes intègre un dictionnaire d'argot de 140 entrées. Les modèles sont déployés via Gradio sur Hugging Face Spaces.