5 items

#MLLM

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 45
ActiveVision : un benchmark révèle l'échec des MLLMs sur l'observation visuelle active
Les modèles multimodaux les plus avancés s'effondrent face à des tâches nécessitant une perception visuelle itérative, loin derrière les humains.
RECHERCHE
heat 52
PEEU : des agents GUI autonomes grâce à l'exploration et la réutilisation d'expériences
Une méthode d'exploration autonome d'environnements GUI permet à un modèle 7B de surpasser Qwen2.5-VL-32B sur la planification de tâches.
RECHERCHE
heat 45
TriViewBench : évaluation des MLLMs sur le raisonnement spatial multi-vues
Un nouveau benchmark contrôlé révèle que les grands modèles multimodaux échouent massivement dès que la complexité spatiale 3D augmente.
RECHERCHE
heat 62
Même preuve, réponse différente : audit de la sensibilité à l'ordre dans les MLLM
Une étude révèle qu'aucun des 18 grands modèles multimodaux testés n'est invariant à l'ordre de présentation des données, avec des taux d'inversion atteignant 50 %.
RECHERCHE