Toutes les news taguées avec ce sujet.
NVIDIA détaille les exigences en infrastructure électrique des « AI factories », où la densité de puissance et la continuité de service imposent de repenser le stockage d'énergie.
NVIDIA propose une approche par agents pour accélérer l'évaluation des modèles de reconnaissance vocale dans le domaine médical.
NVIDIA présente Auto-FL, un système d'agents IA intégré à FLARE pour automatiser l'exploration et l'évaluation des configurations en federated learning.
NVIDIA détaille comment convertir un checkpoint FP8 quantifié en moteur TensorRT pour accélérer l'inférence et optimiser l'utilisation GPU en production.
NVIDIA frappe fort avec un modèle omnimodal Mixture-of-Transformers, un LLM 550B open-weights et un superchip personnel d'un pétaflop.
NVIDIA présente Nemotron Ultra 3, un modèle conçu pour les workflows multi-agents à longues séquences de tokens, promettant efficacité et rapidité.
La startup française H Company annonce son adhésion à la coalition Nemotron, initiative portée par NVIDIA autour de ses modèles d'IA.
NVIDIA et Hugging Face publient un guide complet pour adapter le modèle de reconnaissance vocale Nemotron 3.5 ASR à des contextes spécifiques.
NVIDIA lance Cosmos 3, un modèle frontier combinant raisonnement physique, simulation du monde réel et génération d'actions pour robots et véhicules autonomes.
Les GPU Blackwell de NVIDIA décrochent un record de référence STAC-AI pour l'inférence de grands modèles de langage appliquée aux marchés financiers.
Face aux exigences réglementaires croissantes (EU AI Act, AB-2013), NVIDIA propose un toolkit pour générer automatiquement des model cards auditables.
NVIDIA présente DynoSim, un outil de simulation permettant d'explorer les compromis de configuration dans les déploiements LLM à grande échelle.
NVIDIA détaille comment sa technologie DOCA intègre la sécurité directement dans le silicium pour protéger les « AI factories » dédiées aux agents autonomes.
NVIDIA détaille comment affiner des modèles VLA pour la conduite autonome en closed-loop, comblant l'écart critique entre entraînement et déploiement réel.
NVIDIA lance Cosmos 3, un modèle omnimodal open-weights conçu pour le raisonnement et l'action dans les environnements physiques.
Hugging Face détaille comment adapter le modèle Cosmos Predict 2.5 de NVIDIA via LoRA et DoRA pour générer des vidéos de robots.
Unsloth annonce une collaboration avec NVIDIA pour optimiser la vitesse et l'efficacité mémoire de l'entraînement des grands modèles de langage.