RECHERCHE
StreamMA : communication en streaming pour les systèmes multi-agents
Un nouveau système pipelines les étapes de raisonnement entre agents dès leur génération, réduisant la latence et améliorant la qualité des réponses.
arXiv cs.AI · cs.LG · cs.CL·Zhen Yang, Xiaogang Xu, Wen Wang, Cong Chen·3 juin 2026

Image · Source originale
StreamMA remplace le paradigme « generate-then-transfer » des systèmes multi-agents par un streaming étape par étape, permettant de paralléliser les agents adjacents. Cette approche réduit la latence et améliore l'efficacité, car les premières étapes de raisonnement sont plus fiables et évitent de propager des erreurs tardives. Sur huit benchmarks (mathématiques, sciences, code), avec Claude Opus 4.6 et GPT-5.4, StreamMA surpasse les baselines de +7,3 pp en moyenne (+22,4 pp max). Les auteurs identifient également une « loi d'échelle au niveau des étapes », orthogonale au scaling par nombre d'agents.