Toutes les news taguées avec ce sujet.
Un nouveau benchmark évalue la capacité des Video-LLMs à justifier leurs réponses par des preuves temporelles précises, révélant des lacunes même chez les modèles propriétaires.