Toutes les news taguées avec ce sujet.
EmbedFilter exploite la matrice de dé-embedding des LLM pour supprimer l'influence des tokens fréquents et améliorer les représentations sémantiques zero-shot.
Un Transformer de style GPT entraîné sur 2 milliards de frames de motion capture pour contrôler des humanoïdes sans données supplémentaires.
Des chercheurs d'IBM proposent d'affiner les requêtes d'embedding à l'inférence via un LLM, avec des gains allant jusqu'à +25% sur des tâches zero-shot.
Des chercheurs proposent un pipeline en trois étapes pour décoder la parole imaginée à partir d'enregistrements MEG non invasifs, sans données annotées d'imagination.
Une méthode sans entraînement qui synchronise trajectoire de caméra et motion d'acteur dans la génération vidéo diffusion.