vendredi 24 avril 2026Connexion →
21 SOURCES ACTIVES+253 / 7J
Fellow
La veille de l'intelligence artificielle

RECHERCHE

Des contraintes de mémoire de travail améliorent l'apprentissage des Transformers en données limitées

Intégrer des mécanismes d'attention inspirés de la cognition humaine dans GPT-2 améliore la précision grammaticale quand les données d'entraînement sont rares.

arXiv cs.AI · cs.LG · cs.CL·Pranava Madhyastha, Dagmar Adamcova·22 avril 2026
Des chercheurs ont intégré des contraintes de mémoire de travail humaine dans l'architecture Transformer via des variantes d'attention à fenêtre fixe et à décroissance temporelle. Des modèles GPT-2 entraînés de zéro sur des corpus réduits (10M et 100M mots) montrent une meilleure précision grammaticale sur le benchmark BLiMP et une plus forte corrélation avec les temps de lecture humains. Ces contraintes cognitives agissent comme un biais inductif bénéfique, particulièrement en situation de pénurie de données.
Chaleur 21
Pertinence 62
Nouveauté 68
OUVRIR LA SOURCE ↗
#transformer#mémoire-de-travail#attention#linguistique#données-limitées