OUTILS · Hugging Face

NVIDIA lance Nemotron 3 Nano Omni, un modèle multimodal longue-contexte pour documents, audio et vidéo

NVIDIA présente Nemotron 3 Nano Omni, un modèle multimodal compact capable de traiter documents, audio et vidéo dans des pipelines agentiques.

Hugging Face Blog·28 avril 2026·+ 1 source

Article composé de 2 sources

Hugging Face Bloghuggingface.co · source primaire
NVIDIA Developer Blogdeveloper.nvidia.com → mention

Image · Source originale

NVIDIA lance Nemotron 3 Nano Omni, modèle multimodal open-weights longue-contexte pour agents traitant documents, audio et vidéo. Son architecture unifiée perception-action remplace les stacks fragmentés (vision, audio, texte séparés), réduisant les sauts d'inférence et améliorant la cohérence cross-modale. Cible les cas d'usage embarqués et edge. Disponible sur Hugging Face.

Chaleur 0

Pertinence 82

Nouveauté 68

OUVRIR LA SOURCE ↗

#multimodal #NVIDIA #nemotron #agents #longue-contexte