OUTILS · NVIDIA
Création du checkpoint NVFP4 de NVIDIA Nemotron Ultra avec Model Optimizer
NVIDIA détaille comment le format NVFP4 4-bit de l'architecture Blackwell permet de compresser Nemotron Ultra sans sacrifier les performances.
NVIDIA Developer Blog·Michelle Horton·26 juin 2026

Image · Source originale
NVIDIA publie un guide technique sur la création du checkpoint NVFP4 de Nemotron Ultra via son outil Model Optimizer. Le format NVFP4, un format flottant 4 bits introduit avec l'architecture Blackwell, permet de réduire la taille des poids du modèle pour améliorer les performances sur de longs contextes. La quantization est présentée comme une réponse clé à la complexité croissante des fenêtres contextuelles.