RECHERCHE

ESI-Bench : un benchmark pour l'intelligence spatiale incarnée en boucle perception-action

Un nouveau benchmark évalue la capacité des agents IA à explorer activement leur environnement pour résoudre des tâches spatiales complexes.

arXiv cs.AI · cs.LG · cs.CL·Yining Hong, Jiageng Liu, Han Yin, Manling Li·18 mai 2026

Image · Source originale

ESI-Bench propose un benchmark complet pour l'intelligence spatiale incarnée, couvrant 10 catégories de tâches construites sur OmniGibson. Contrairement aux approches passives, les agents doivent combiner perception, locomotion et manipulation pour accumuler des preuves spatiales. Les expériences montrent que l'exploration active surpasse nettement les approches passives, mais que la majorité des échecs provient de mauvais choix d'actions plutôt que d'une perception défaillante.

Chaleur 0

Pertinence 68

Nouveauté 72

OUVRIR LA SOURCE ↗

#benchmark #embodied-ai #intelligence spatiale #MLLM #agents