Toutes les news taguées avec ce sujet.
Un outil open-source propose de migrer vers un nouveau modèle d'embeddings sans réindexer toute la base vectorielle.
Une étude arXiv interroge l'utilité réelle des LLM dans les pipelines de recherche agentique face aux outils de recherche classiques comme grep.
Une approche semi-paramétrique qui réutilise les données d'entraînement à l'inférence pour corriger les erreurs de généralisation du behavior cloning.
Bonsai explore comment intégrer des agents IA dans les moteurs de recherche OpenSearch et Elasticsearch via un assistant nommé Sid.
Les tokens rejetés lors du débruitage deviennent des signaux utiles pour le RAG dynamique dans les modèles de diffusion discrets.
Un article argue que les systèmes RAG génériques manquent de pertinence clinique faute de modélisation du profil utilisateur patient.
La startup Hyper, incubée chez Y Combinator, lance une plateforme qui centralise la connaissance d'entreprise pour alimenter des agents de développement logiciel.
Perplexity Research explore une approche inédite : traiter la recherche d'information comme un problème de génération de code plutôt que de récupération de documents.
Kapa.ai détaille sa pipeline d'indexation d'images pour les systèmes RAG : une approche technique pour enrichir la recherche documentaire au-delà du texte.
NVIDIA présente un exemple open source combinant Hermes Agent et NemoClaw pour orchestrer des agents IA sur Outlook, Slack et GitHub tout en maîtrisant la sécurité des données.
Hugging Face lance Ettin, une nouvelle famille de modèles de reranking open-weights conçus pour améliorer les pipelines RAG.
Mistral AI introduit un ensemble d'outils dédiés à la recherche augmentée, permettant d'intégrer des capacités de recherche web dans les applications LLM.
Un système multi-agents coopératif qui traite la recherche complexe comme l'assemblage d'un puzzle de preuves complémentaires, surpassant les approches parallèles classiques.
Un développeur défend l'idée que la solution optimale pour la mémoire des agents en 2026 repose sur des fichiers Markdown versionnés plutôt que sur des bases vectorielles complexes.
MeMo propose d'encapsuler les nouvelles connaissances dans un modèle mémoire modulaire, sans modifier les paramètres du LLM sous-jacent.
Un framework RAG multimodal combine notes cliniques et données EHR structurées pour reconstruire avec précision les chronologies de patients atteints de sepsis.
Une étude empirique compare grep et vector retrieval dans des systèmes RAG agentiques, et révèle que le choix du harness compte autant que la stratégie de récupération.
Pour les institutions financières, le succès de l'IA agentique repose moins sur la sophistication des modèles que sur la qualité, la sécurité et l'accessibilité des données sous-jacentes.
IBM lance une nouvelle version de ses modèles d'embeddings multilingues sous licence Apache 2.0, affichant les meilleures performances retrieval sous 100M de paramètres.
Des chercheurs d'IBM proposent d'affiner les requêtes d'embedding à l'inférence via un LLM, avec des gains allant jusqu'à +25% sur des tâches zero-shot.
Un nouveau benchmark mesure la capacité des agents à mémoriser l'expérience d'environnements web complexes, au-delà des historiques utilisateurs classiques.
Un papier arXiv pose les bases théoriques d'agents de retrieval superintelligents capables de dépasser les systèmes RAG actuels.
Google étend les capacités de son API Gemini File Search avec le support multimodal, ouvrant la voie à un RAG combinant texte, images et autres formats.
Un nouveau framework évalue la fiabilité des citations générées par les agents de recherche IA — et les résultats sur la précision factuelle sont préoccupants.
SIRA remplace les boucles d'exploration itératives par une seule action de récupération discriminative, surpassant les retrievers denses sur dix benchmarks BEIR.
Un nouveau paradigme Context-ReAct propose cinq opérations atomiques pour gérer dynamiquement le contexte des agents de recherche multi-étapes.