OUTILS · Hugging Face
NVIDIA lance Nemotron 3 Nano Omni, un modèle multimodal longue-contexte pour documents, audio et vidéo
NVIDIA présente Nemotron 3 Nano Omni, un modèle multimodal compact capable de traiter documents, audio et vidéo dans des pipelines agentiques.
Article composé de 2 sources

Image · Source originale
NVIDIA lance Nemotron 3 Nano Omni, modèle multimodal open-weights longue-contexte pour agents traitant documents, audio et vidéo. Son architecture unifiée perception-action remplace les stacks fragmentés (vision, audio, texte séparés), réduisant les sauts d'inférence et améliorant la cohérence cross-modale. Cible les cas d'usage embarqués et edge. Disponible sur Hugging Face.