RECHERCHE
Multi-Stream LLMs : libérer les modèles de langage avec des flux parallèles de pensées, d'entrées et de sorties
Une architecture d'instruction-tuning à flux parallèles permettrait aux LLM d'agir, lire et raisonner simultanément, brisant le goulot d'étranglement séquentiel des agents actuels.
arXiv cs.AI · cs.LG · cs.CL·Guinan Su, Yanwu Yang, Xueyan Li, Jonas Geiping·12 mai 2026

Image · Source originale
Les agents IA actuels, même avancés, opèrent sur un flux unique séquentiel hérité des premiers modèles type ChatGPT : lire, penser, puis agir successivement. Cette recherche propose le paradigme Multi-Stream LLMs, où chaque rôle (entrée, raisonnement, sortie) est traité dans un flux parallèle distinct via un instruction-tuning adapté. Chaque passe du modèle lit et génère simultanément dans plusieurs flux causalement liés. Les auteurs avancent des gains en efficacité, sécurité et monitorabilité.