Toutes les news taguées avec ce sujet.
Une méthode training-free qui exploite les points de bascule intrinsèques des DiTs pour générer des vidéos longues à plusieurs événements distincts.
Un nouveau framework deux étapes combine un générateur léger à l'entraînement et un générateur haute capacité à l'inférence pour produire des vidéos fidèles sans sacrifier le raisonnement.
Un framework d'évaluation automatisé en quatre dimensions pour benchmarker les modèles de génération vidéo appliqués à l'animation de design.
Un décodeur VAE conditionné par une image de référence corrige l'asymétrie architecturale des modèles de diffusion latents pour la génération vidéo.