Toutes les news taguées avec ce sujet.
Un nouveau modèle dual DiT découple la planification visuelle basse fréquence et l'exécution d'actions haute fréquence pour améliorer le contrôle embodied.
NVIDIA frappe fort avec un modèle omnimodal Mixture-of-Transformers, un LLM 550B open-weights et un superchip personnel d'un pétaflop.
NVIDIA lance Cosmos 3, un modèle frontier combinant raisonnement physique, simulation du monde réel et génération d'actions pour robots et véhicules autonomes.
Des chercheurs proposent WorldString, une architecture neuronale pour modéliser les états d'objets réels à partir de nuages de points ou de flux RGB-D.
Odyssey dévoile Agora-1, un modèle de monde multi-agents capable de simuler des environnements interactifs complexes.
Un nouveau benchmark mesure objectivement la plausibilité physique des vidéos générées, révélant des défaillances géométriques invisibles aux métriques perceptuelles classiques.
Un agent de code maintient un modèle du monde Python exécutable pour résoudre les jeux ARC-AGI-3, sans logique spécifique à chaque jeu.