RECHERCHE
DexHoldem : jouer au Texas Hold'em avec un système embarqué dextère
Un benchmark système complet pour évaluer la manipulation dextère, la perception agentique et la prise de décision incarnée autour du poker.
arXiv cs.AI · cs.LG · cs.CL·Feng Chen, Tianzhe Chu, Li Sun, Pei Zhou·18 mai 2026

Image · Source originale
DexHoldem est un benchmark réel basé sur le Texas Hold'em impliquant une main robotique ShadowHand. Il fournit 1 470 démonstrations téléopérées couvrant 14 primitives de manipulation, un benchmark de politique physique et un benchmark de perception agentique. Sur l'exécution des primitives, π₀.₅ atteint 61,2 % de complétion ; sur la perception, Opus 4.7 obtient 34,3 % de précision stricte tandis que GPT 5.5 atteint 66,8 % par champ, révélant un écart entre sous-capacités visuelles isolées et récupération complète de l'état.