#open-weights
Toutes les news taguées avec ce sujet.
- OUTILShuggingfaceheat 72
Qwen3.6-27B : nouveau modèle open-weights d'Alibaba sur Hugging Face
Alibaba publie Qwen3.6-27B, un modèle de 27 milliards de paramètres en open-weights, disponible directement sur Hugging Face.
- OUTILSheat 78
Qwen3.6-27B : des capacités de codage de niveau flagship dans un modèle dense 27B
Alibaba présente Qwen3.6-27B, un modèle dense de 27 milliards de paramètres revendiquant des performances de codage comparables aux meilleurs modèles du marché.
- OUTILSmoonshotheat 72
Kimi-VL-A3B-Thinking : le modèle multimodal raisonnant de Moonshot AI
Moonshot AI publie Kimi-VL-A3B-Thinking, un modèle vision-langage MoE compact avec capacités de raisonnement étendu, disponible en open-weights sur Hugging Face.
- OUTILSmoonshotheat 72
Kimi-VL-A3B-Instruct : le modèle vision-langage MoE de Moonshot AI
Moonshot AI publie Kimi-VL-A3B-Instruct, un modèle multimodal open-weights basé sur une architecture MoE avec seulement 3B paramètres actifs.
- OUTILSmoonshotheat 72
Kimi-VL-A3B-Thinking-2506 : nouveau modèle multimodal MoE de Moonshot AI
Moonshot AI publie Kimi-VL-A3B-Thinking-2506, un modèle vision-langage MoE open-weights avec capacités de raisonnement étendu.
- OUTILSmoonshotheat 72
Kimi-Linear-48B-A3B-Base : nouveau modèle MoE linéaire de Moonshot AI
Moonshot AI publie Kimi-Linear-48B-A3B-Base, un modèle open-weights 48B paramètres avec seulement 3B actifs, basé sur une architecture linéaire.
- OUTILSmoonshotheat 72
Kimi-Linear-48B-A3B-Instruct : nouveau modèle MoE de Moonshot AI
Moonshot AI publie Kimi-Linear-48B-A3B-Instruct, un modèle MoE de 48 milliards de paramètres avec seulement 3B actifs par inférence.
- OUTILSmoonshotheat 78
Kimi-K2-Instruct : le nouveau modèle open-weights de Moonshot AI
Moonshot AI publie Kimi-K2-Instruct sur Hugging Face, un modèle d'instruction large en open-weights issu de ses recherches internes.
- OUTILSmoonshotheat 78
Kimi-K2-Base : le modèle de base open-weights de Moonshot AI
Moonshot AI publie Kimi-K2-Base sur Hugging Face, un grand modèle de langage open-weights conçu pour les usages agentiques.
- OUTILSmoonshotheat 72
Kimi-K2-Instruct-0905 : nouveau modèle instruct de Moonshot AI
Moonshot AI publie Kimi-K2-Instruct-0905 sur Hugging Face, une version instruct mise à jour de son modèle frontier K2.
- OUTILSmoonshotheat 72
Kimi-K2-Thinking : le modèle de raisonnement de Moonshot AI
Moonshot AI publie Kimi-K2-Thinking sur Hugging Face, un modèle orienté raisonnement issu de la famille K2.
- OUTILSmoonshotheat 78
Kimi-K2.5 : le nouveau modèle frontier de Moonshot AI
Moonshot AI publie Kimi-K2.5, un modèle frontier open-weights disponible sur Hugging Face, combinant raisonnement avancé et capacités multimodales.
- OUTILSmoonshotheat 72
Kimi-K2.6 : nouveau modèle open-weights de Moonshot AI
Moonshot AI publie Kimi-K2.6 sur Hugging Face, un modèle de langage avancé en accès ouvert issu de ses travaux de R&D.
- OUTILSmoonshotheat 62
Kimi-VL-A3B : le modèle vision-langage MoE de Moonshot AI
Moonshot AI publie Kimi-VL-A3B, un modèle multimodal open-weights basé sur une architecture MoE avec seulement 3B paramètres actifs.
- OUTILSmoonshotheat 72
Kimi-Linear-A3B : un nouveau modèle open-weights de Moonshot AI
Moonshot AI publie Kimi-Linear-A3B sur Hugging Face, un modèle à architecture linéaire de 3 milliards de paramètres actifs.
- OUTILSmoonshotheat 82
Kimi-K2 : Moonshot AI publie son nouveau modèle open-weights
Moonshot AI dévoile Kimi-K2, un modèle de grande taille disponible en open-weights sur Hugging Face, ciblant les tâches agentiques et le raisonnement.
- SIGNALmoonshotheat 72
Kimi K2.5 : Moonshot AI publie son nouveau modèle de frontier
Moonshot AI met en ligne la collection Kimi K2.5 sur Hugging Face, signalant une nouvelle itération de son modèle frontier.
- OPINIONhuggingfaceheat 52
IA et avenir de la cybersécurité : pourquoi l'ouverture est essentielle
Hugging Face défend les modèles open-weights comme levier de confiance et de résilience face aux menaces cybersécurité émergentes.
- SAFETYheat 78
Des lois d'échelle pour la cyberguerre : les LLM améliorent leurs capacités offensives
Une étude de Lyptus Research montre que les modèles IA progressent aussi vite en cyberattaque qu'en performance générale, avec un doublement des capacités tous les 5,7 mois.
- OPINIONheat 62
Quelle est la prochaine étape pour les modèles open-weights ?
Nathan Lambert analyse les dynamiques derrière l'essor des modèles ouverts en 2025 et les contradictions économiques qui les sous-tendent.
- OUTILSheat 62
Bilan open-source #20 : nouveaux acteurs, nouveaux modèles — Nemotron Super, Sarvam, Cohere Transcribe
Un panorama inhabituel de modèles open : OCR, transcription audio, RAG, code, preuves mathématiques — au-delà des géants Qwen ou DeepSeek.
- OPINIONheat 52
Gemma 4 et les conditions de succès d'un modèle open-weights
Nathan Lambert analyse ce qui différencie un modèle open-weights réussi dans un écosystème désormais très concurrentiel.
- OPINIONheat 58
Pourquoi un consortium de modèles open-source est inévitable
Nathan Lambert argumente que seul un consortium industriel peut financer durablement des modèles ouverts proches de la frontière technologique.
- OPINIONheat 52
Nathan Lambert présente ATOM Report, cours de post-training et son livre sur le RLHF
Un point sur plusieurs projets en cours : rapport sur l'écosystème open-source, livre RLHF et nouvelle métrique d'adoption des modèles.
- OPINIONheat 55
L'écart de performance open vs closed : lecture critique des benchmarks actuels
Réduire l'écart entre modèles ouverts et fermés à un seul chiffre masque des dynamiques complexes que les benchmarks composites peinent à capturer.
- OPINIONheat 55
Pronostics sur les modèles ouverts pour mi-2026
Nathan Lambert analyse si les modèles open-weights peuvent tenir le rythme face aux labs fermés, et pose ses paris pour mi-2026.
- OUTILSheat 52
Mr. Chatterbox : un LLM entraîné exclusivement sur des textes victoriens libres de droits
Un modèle de 340 millions de paramètres entraîné sur 28 000 ouvrages britanniques du XIXe siècle, sans aucune donnée postérieure à 1899.
- OUTILShuggingfaceheat 88
Gemma 4 : intelligence multimodale frontier pour les appareils embarqués
Google lance Gemma 4, une nouvelle famille de modèles multimodaux open-weights conçus pour tourner directement sur les appareils.
- OUTILShuggingfaceheat 72
Waypoint-1.5 : des mondes interactifs haute fidélité sur GPU grand public
Hugging Face publie Waypoint-1.5, un modèle de génération de mondes interactifs optimisé pour tourner sur des GPU accessibles au grand public.
- OUTILSdeepmindheat 88
Gemma 4 : les modèles open-weights les plus performants par octet selon DeepMind
DeepMind publie Gemma 4, sa nouvelle génération de modèles open-weights conçus pour le raisonnement avancé et les workflows agentiques.