6 items

#vision

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

OUTILS
moonshotheat 65
Moonshot AI publie le modèle multimodal Kimi-VL-A3B
Un nouveau modèle vision-langage de 3 milliards de paramètres, optimisé pour l'instruction et disponible en open-weights.
OUTILS
nvidiaheat 45
NVIDIA détaille le post-entraînement de Cosmos 3 en une journée via des agents autonomes
NVIDIA montre comment des agents de codage automatisés accélèrent l'adaptation de modèles de raisonnement visuel pour la production vidéo.
RECHERCHE
heat 52
Des vidéos générées par IA pour stimuler au maximum une région cérébrale cible
Des chercheurs de l'EPFL utilisent l'IA générative pour créer des stimuli visuels optimisés capables d'activer au maximum une zone précise du cerveau.
RECHERCHE
heat 52
CamVLA : un modèle VLA robuste aux changements de caméra sans calibration
Un nouveau modèle Vision-Language-Action permet aux robots d'opérer depuis n'importe quel angle de caméra sans nécessiter de calibration extrinsèque préalable.