OUTILS · Hugging Face

DeepSeek-V4 : un contexte d'un million de tokens réellement exploitable par les agents

Hugging Face détaille DeepSeek-V4, un modèle offrant une fenêtre de contexte d'un million de tokens pensée pour un usage agent fiable et efficace.

Hugging Face Blog·24 avril 2026·+ 2 sources

Article composé de 3 sources

Hugging Face Bloghuggingface.co · source primaire
DeepSeek (Hugging Face)huggingface.co → mention
Latent Space (Swyx)latent.space → mention

Image · Source originale

DeepSeek lance la famille V4 : modèle Pro (1,6T params MoE) et Flash (284B), entraînés sur 32T tokens en FP4 avec contexte d'1 million de tokens. Deux techniques d'attention compressée (CSA et HCA) réduisent les FLOPs de 27 % et la mémoire KV cache de 10 % vs V3.2. Les versions Base et Instruct sont publiées en open-weights, compatibles avec les puces Huawei Ascend CANN — étape stratégique pour réduire la dépendance aux GPU NVIDIA sous contrôle d'export.

Chaleur 0

Pertinence 88

Nouveauté 72

OUVRIR LA SOURCE ↗

#DeepSeek #long-context #agents #LLM #open-weights