RECHERCHE
Normalizing Trajectory Models : génération d'images en 4 étapes avec vraisemblance exacte
Une nouvelle architecture combine normalizing flows et diffusion pour générer des images en seulement 4 étapes tout en conservant une vraisemblance exacte.
arXiv cs.AI · cs.LG · cs.CL·Jiatao Gu, Tianrong Chen, Ying Shen, David Berthelot·8 mai 2026

Image · Source originale
Les Normalizing Trajectory Models (NTM) modélisent chaque étape inverse d'un processus de diffusion comme un flux conditionnel normalisé, permettant un entraînement par vraisemblance exacte. L'architecture associe des blocs inversibles peu profonds à un prédicteur parallèle profond sur la trajectoire complète. La vraisemblance exacte permet une auto-distillation : un débruiteur léger entraîné sur les scores du modèle produit des échantillons de haute qualité en quatre étapes. Sur des benchmarks texte-image, NTM égale ou surpasse les baselines en seulement 4 pas d'échantillonnage.