RECHERCHE
Raffinement adaptatif d'embeddings guidé par un LLM au moment du test
Des chercheurs d'IBM proposent d'affiner les requêtes d'embedding à l'inférence via un LLM, avec des gains allant jusqu'à +25% sur des tâches zero-shot.
arXiv cs.AI · cs.LG · cs.CL·Ariel Gera, Shir Ashury-Tahan, Gal Bloch, Ohad Eytan·12 mai 2026

Image · Source originale
L'approche raffine la représentation vectorielle d'une requête utilisateur grâce aux retours d'un LLM génératif sur un petit ensemble de documents, sans réentraînement du modèle d'embedding. Des expériences sur des benchmarks de recherche et classification montrent des améliorations relatives jusqu'à +25% pour la recherche littéraire, la détection d'intention et l'appariement de points-clés. Cette méthode permet de déployer des modèles d'embedding sur des tâches complexes zero-shot sans recourir à des pipelines LLM coûteux à grande échelle.