RECHERCHE
Étude empirique des capacités d'apprentissage en contexte des Transformers
Une analyse systématique révèle comment la dimension des données, le nombre d'exemples et la diversité des tâches influencent l'ICL des Transformers.
arXiv cs.AI · cs.LG · cs.CL·Rushil Chandrupatla, Leo Bangayan, Sebastian Leng, Arya Mazumdar·28 avril 2026

Image · Source originale
Des chercheurs mènent une étude empirique approfondie de l'in-context learning (ICL) sur des tâches de classification binaire à mélanges gaussiens. Ils examinent comment la précision dépend de la dimension des entrées, du nombre d'exemples en contexte et du nombre de tâches de pré-entraînement. L'étude caractérise également l'émergence du « benign overfitting », où le modèle mémorise des labels bruités tout en conservant de bonnes performances sur des données propres.