Toutes les news taguées avec ce sujet.
Une équipe a compressé les capacités d'appel d'outils de Gemini dans un modèle ultra-léger de 26M paramètres via distillation.
NVIDIA détaille dans Dynamo la gestion des échanges agentiques multi-tours, avec streaming de tokens, appels d'outils et rejeu sélectif du raisonnement.