RECHERCHE
Doc-to-Atom : une mémoire paramétrique compositionnelle pour les LLM
Doc2Atom décompose les documents en atomes de connaissance typés sémantiquement, chacun compilé en micro-LoRA, pour réduire les coûts mémoire à l'inférence.
arXiv cs.AI · cs.LG · cs.CL·Xingjian Diao, Wenbo Li, Yashas Malur Saidutta, Avinash Amballa·10 juin 2026

Image · Source originale
Doc-to-Atom propose un cadre de mémoire paramétrique compositionnelle qui fragmente chaque document en atomes de connaissance sémantiques, chacun compilé en un adaptateur micro-LoRA indépendant avec une clé de retrieval. À l'inférence, un routeur léger sélectionne et assemble les atomes pertinents en un adaptateur spécifique à la requête, injecté dans un modèle de base gelé. Évalué sur six benchmarks QA, Doc2Atom surpasse les approches Doc-to-LoRA tout en réduisant les coûts mémoire liés à l'internalisation des documents.