Toutes les news taguées avec ce sujet.
Une analyse systématique des mécanismes de mémoire dans les world models vidéo, qui isole capacité, compression, lecture et récurrence.
L'intelligence des modèles vidéo viendrait avant tout des LLM, pas des données vidéo. Le prochain Sora serait un agent, pas un meilleur modèle génératif.