RECHERCHE
ESI-Bench : un benchmark pour l'intelligence spatiale incarnée en boucle perception-action
Un nouveau benchmark évalue la capacité des agents IA à explorer activement leur environnement pour résoudre des tâches spatiales complexes.
arXiv cs.AI · cs.LG · cs.CL·Yining Hong, Jiageng Liu, Han Yin, Manling Li·18 mai 2026

Image · Source originale
ESI-Bench propose un benchmark complet pour l'intelligence spatiale incarnée, couvrant 10 catégories de tâches construites sur OmniGibson. Contrairement aux approches passives, les agents doivent combiner perception, locomotion et manipulation pour accumuler des preuves spatiales. Les expériences montrent que l'exploration active surpasse nettement les approches passives, mais que la majorité des échecs provient de mauvais choix d'actions plutôt que d'une perception défaillante.