Toutes les news taguées avec ce sujet.
Un modèle Vision-Language-Action capable d'accélérer en phase sûre et de ralentir lors des contacts précis, via une augmentation de trajectoire à vitesse variable.
NVIDIA détaille comment affiner des modèles VLA pour la conduite autonome en closed-loop, comblant l'écart critique entre entraînement et déploiement réel.
Un framework de distillation réduit de 44× la taille d'un modèle VLA de 7 milliards de paramètres tout en conservant des performances quasi équivalentes.
Une méthode de supervision humaine en boucle élimine les « sauts de geste » lors des prises en main correctrices sur bras robotiques à haute dextérité.