RECHERCHE
Pelican-Unified 1.0 : un modèle d'intelligence incarnée unifiant compréhension, raisonnement, imagination et action
Un seul checkpoint pour comprendre, raisonner, imaginer et agir : Pelican-Unified 1.0 propose un paradigme unifié pour la robotique fondationnelle.
arXiv cs.AI · cs.LG · cs.CL·Yi Zhang, Yinda Chen, Che Liu, Zeyuan Ding·14 mai 2026

Image · Source originale
Pelican-Unified 1.0 est présenté comme le premier modèle fondationnel embodied entraîné selon un principe d'unification stricte. Un unique VLM gère compréhension et raisonnement, tandis qu'un Unified Future Generator (UFG) produit conjointement vidéos futures et actions via deux têtes de décodage dans un même processus de débruitage. Le modèle atteint 64,7 sur huit benchmarks VLM, la première place sur WorldArena (66,03) et la deuxième sur RoboTwin (93,5), sans compromis entre spécialisation et généralité.