Toutes les news taguées avec ce sujet.
Des chercheurs proposent un système agentique capable de générer automatiquement des benchmarks LLM de bout en bout, réduisant l'intervention humaine.
Un framework d'auto-distillation régionale permet aux modèles multimodaux de mieux analyser les détails visuels fins sans superviseur externe.
Un nouveau benchmark évalue la capacité des agents IA à explorer activement leur environnement pour résoudre des tâches spatiales complexes.