Toutes les news taguées avec ce sujet.
NVIDIA détaille les capacités de gestion opérationnelle du DGX Spark pour répondre aux exigences de scalabilité des déploiements IA en entreprise.
La stratégie d'Nvidia sur les PC dotés d'IA repose sur un pari risqué : convaincre les utilisateurs ordinaires au-delà d'une niche d'early adopters.
Nvidia et LG Group annoncent un partenariat pour déployer une « AI factory » et développer des robots humanoïdes sur le sol sud-coréen.
Nvidia s'apprête à lancer une architecture CPU ambitieuse destinée aux PC Windows, un mouvement stratégique qui pourrait redistribuer les cartes sur le marché des puces.
NVIDIA publie Nemotron 3.5 Content Safety, un modèle multimodal open-weights conçu pour adapter la modération de contenu aux besoins des entreprises mondiales.
NVIDIA présente un exemple open source combinant Hermes Agent et NemoClaw pour orchestrer des agents IA sur Outlook, Slack et GitHub tout en maîtrisant la sécurité des données.
Un outil open-source permet de monter la VRAM d'une carte Nvidia comme partition de swap, offrant une mémoire d'échange ultra-rapide pour les workloads IA.
Les deux géants technologiques lancent de nouveaux outils pour permettre aux développeurs de concevoir des agents IA fonctionnant en local sur Windows.
NVIDIA présente NemoClaw et les capacités multi-nœuds du DGX Spark pour faire tourner des agents autonomes en local, sans dépendance au cloud.
Microsoft et Nvidia annoncent RTX Spark, une plateforme conjointe pour accélérer les capacités IA locales sur PC Windows.
Nvidia dévoile le RTX Spark, un ordinateur de bureau ultracompact intégrant un GPU RTX pour l'inférence IA locale et les usages créatifs.
Le modèle multimodal Step 3.7 Flash (198 milliards de paramètres) de StepFun est désormais disponible sur infrastructure NVIDIA pour des déploiements enterprise.
Microsoft intègre une puce Nvidia dans son nouveau Surface Laptop Ultra pour concurrencer directement l'Apple MacBook Pro.
NVIDIA présente DSX OS, une plateforme logicielle complète destinée à orchestrer les « AI factories » sur l'ensemble de la chaîne de valeur.
NVIDIA présente son CPU Vera, conçu pour répondre aux exigences des systèmes d'IA agentiques dans les AI factories de nouvelle génération.
Nvidia dévoile un nouveau chip IA destiné aux PC grand public, signalant une poussée vers l'inférence locale.
Le fabricant de puces IA franchit un nouveau seuil symbolique en surpassant la valeur économique de la quatrième puissance mondiale.
NVIDIA détaille comment son architecture Vera Rubin NVL72 répond aux défis de latence et de scalabilité posés par l'inférence agentique non déterministe.
Le blueprint NVIDIA Metropolis VSS permet de rendre des millions de flux vidéo instantanément interrogeables via des agents et skills IA.
Les équipes NVIDIA s'appuient sur Codex avec GPT-4.5 pour livrer des systèmes en production et transformer des idées de recherche en expériences exécutables.
NVIDIA identifie les causes de friction dans le déploiement de modèles IA et propose des solutions pour fluidifier le passage de l'entraînement à la production.
NVIDIA lance Fleet Intelligence, un outil de monitoring centralisé pour gérer et optimiser les grandes flottes GPU en environnement multi-tenant.
Nvidia publie un compilateur officiel permettant d'écrire du code GPU CUDA directement en Rust, ouvrant la voie à un écosystème plus sûr côté mémoire.
Un essai explore comment Nvidia, dominant du marché des GPU pour l'IA, pourrait perdre toute sa valeur face à des ruptures technologiques.
NVIDIA détaille l'utilisation de son outil Model Optimizer pour quantifier des LLMs et réduire leur empreinte mémoire sur GPU grand public.
Le rack NVIDIA GB200 NVL72 impose une nouvelle contrainte de localité matérielle que les schedulers classiques ignorent — Slurm doit s'adapter.