#MoE
Toutes les news taguées avec ce sujet.
- OUTILSmoonshotheat 72
Kimi-VL-A3B-Thinking : le modèle multimodal raisonnant de Moonshot AI
Moonshot AI publie Kimi-VL-A3B-Thinking, un modèle vision-langage MoE compact avec capacités de raisonnement étendu, disponible en open-weights sur Hugging Face.
- OUTILSmoonshotheat 72
Kimi-VL-A3B-Instruct : le modèle vision-langage MoE de Moonshot AI
Moonshot AI publie Kimi-VL-A3B-Instruct, un modèle multimodal open-weights basé sur une architecture MoE avec seulement 3B paramètres actifs.
- OUTILSmoonshotheat 72
Kimi-VL-A3B-Thinking-2506 : nouveau modèle multimodal MoE de Moonshot AI
Moonshot AI publie Kimi-VL-A3B-Thinking-2506, un modèle vision-langage MoE open-weights avec capacités de raisonnement étendu.
- OUTILSmoonshotheat 72
Kimi-Linear-48B-A3B-Base : nouveau modèle MoE linéaire de Moonshot AI
Moonshot AI publie Kimi-Linear-48B-A3B-Base, un modèle open-weights 48B paramètres avec seulement 3B actifs, basé sur une architecture linéaire.
- OUTILSmoonshotheat 72
Kimi-Linear-48B-A3B-Instruct : nouveau modèle MoE de Moonshot AI
Moonshot AI publie Kimi-Linear-48B-A3B-Instruct, un modèle MoE de 48 milliards de paramètres avec seulement 3B actifs par inférence.
- OUTILSmoonshotheat 78
Kimi-K2-Base : le modèle de base open-weights de Moonshot AI
Moonshot AI publie Kimi-K2-Base sur Hugging Face, un grand modèle de langage open-weights conçu pour les usages agentiques.
- OUTILSmoonshotheat 62
Kimi-VL-A3B : le modèle vision-langage MoE de Moonshot AI
Moonshot AI publie Kimi-VL-A3B, un modèle multimodal open-weights basé sur une architecture MoE avec seulement 3B paramètres actifs.
- OUTILSmoonshotheat 82
Kimi-K2 : Moonshot AI publie son nouveau modèle open-weights
Moonshot AI dévoile Kimi-K2, un modèle de grande taille disponible en open-weights sur Hugging Face, ciblant les tâches agentiques et le raisonnement.
- RECHERCHEheat 42
HILBERT : alignement contrastif dual centré sur les joints pour représentations audio-texte longues
Un framework multimodal cross-attentif pour aligner audio et texte sur de longues séquences en contexte low-resource, avec double régularisation.
- OUTILSheat 62
Bilan open-source #20 : nouveaux acteurs, nouveaux modèles — Nemotron Super, Sarvam, Cohere Transcribe
Un panorama inhabituel de modèles open : OCR, transcription audio, RAG, code, preuves mathématiques — au-delà des géants Qwen ou DeepSeek.