OUTILS · Hugging Face
DeepSeek-V4 : un contexte d'un million de tokens réellement exploitable par les agents
Hugging Face détaille DeepSeek-V4, un modèle offrant une fenêtre de contexte d'un million de tokens pensée pour un usage agent fiable et efficace.
Article composé de 3 sources

Image · Source originale
DeepSeek lance la famille V4 : modèle Pro (1,6T params MoE) et Flash (284B), entraînés sur 32T tokens en FP4 avec contexte d'1 million de tokens. Deux techniques d'attention compressée (CSA et HCA) réduisent les FLOPs de 27 % et la mémoire KV cache de 10 % vs V3.2. Les versions Base et Instruct sont publiées en open-weights, compatibles avec les puces Huawei Ascend CANN — étape stratégique pour réduire la dépendance aux GPU NVIDIA sous contrôle d'export.