RECHERCHE

Des contraintes de mémoire de travail améliorent l'apprentissage des Transformers en données limitées

Intégrer des mécanismes d'attention inspirés de la cognition humaine dans GPT-2 améliore la précision grammaticale quand les données d'entraînement sont rares.

arXiv cs.AI · cs.LG · cs.CL·Pranava Madhyastha, Dagmar Adamcova·22 avril 2026

Des chercheurs ont intégré des contraintes de mémoire de travail humaine dans l'architecture Transformer via des variantes d'attention à fenêtre fixe et à décroissance temporelle. Des modèles GPT-2 entraînés de zéro sur des corpus réduits (10M et 100M mots) montrent une meilleure précision grammaticale sur le benchmark BLiMP et une plus forte corrélation avec les temps de lecture humains. Ces contraintes cognitives agissent comme un biais inductif bénéfique, particulièrement en situation de pénurie de données.

Chaleur 0

Pertinence 62

Nouveauté 68

OUVRIR LA SOURCE ↗

#transformer #mémoire-de-travail #attention #linguistique #données-limitées