RECHERCHE
Supervision vs. apprentissage en contexte pour la classification des expressions idiomatiques
Une étude compare LLMs et modèles supervisés pour détecter les constructions verbales légères idiomatiques en turc, révélant une forte sensibilité au prompting.
arXiv cs.AI · cs.LG · cs.CL·Sercan Karakaş, Yusuf Şimşek·5 juin 2026

Image · Source originale
Des chercheurs évaluent la détection des constructions verbales légères (LVC) idiomatiques en turc, un défi car elles partagent leur forme de surface avec des constructions littérales. Ils comparent un encodeur supervisé (BERTurk) à trois LLMs instruction-tuned en zero-shot, one-shot et few-shot. En zero-shot, les LLMs détectent mal les LVC ; le few-shot améliore les résultats pour GPT-OSS-20B et Qwen 2.5-14B, mais la sensibilité au prompt reste élevée.