OUTILS · Google
Google introduit deux nouveaux niveaux d'inférence dans l'API Gemini
Google lance les tiers Flex et Priority dans l'API Gemini pour permettre aux développeurs d'arbitrer entre coût et latence.
Google AI·Lucia Loher Product Manager Gemini API·2 avril 2026

Google annonce deux nouveaux niveaux d'inférence pour l'API Gemini : Flex, orienté économies avec une latence plus variable, et Priority, garantissant des performances plus stables à coût plus élevé. Cette segmentation permet aux développeurs d'adapter leurs appels API selon leurs contraintes budgétaires et leurs exigences de fiabilité.
Chaleur 0
Pertinence 78
Nouveauté 45