4 items
#inférence
Toutes les news taguées avec ce sujet.
- OPINIONheat 62
La tarification des LLM n'a jamais eu de sens
Un article d'opinion décortique les incohérences structurelles des modèles de prix pratiqués par les fournisseurs de LLM.
- MARCHEheat 82
Google dévoile de nouvelles puces pour l'entraînement et l'inférence IA, nouveau défi lancé à Nvidia
Google présente ses derniers TPU dédiés à l'entraînement et à l'inférence, intensifiant la concurrence avec Nvidia sur le marché des accélérateurs IA.
- OUTILSdeepmindheat 78
Gemini 3.1 Flash-Lite : intelligence à grande échelle, au moindre coût
DeepMind lance Gemini 3.1 Flash-Lite, le modèle le plus rapide et le plus économique de la série Gemini 3.
- OUTILSgoogleheat 62
Google introduit deux nouveaux niveaux d'inférence dans l'API Gemini
Google lance les tiers Flex et Priority dans l'API Gemini pour permettre aux développeurs d'arbitrer entre coût et latence.