25 items

#RAG

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 22
Traduction automatique : peut-on faire dépasser aux LLM le cadre de la phrase isolée ?
Une étude propose PAT, un système RAG combinant spécifications utilisateur et corpus comparables pour une traduction de documents entiers, au-delà de la phrase par phrase.
RECHERCHE
heat 15
Earthquaker-AI : un framework RAG avec évaluation par grille critériée pour l'éducation aux séismes en primaire
Un système hybride combine robotique éducative Lego WeDo2 et assistant conversationnel RAG pour enseigner les gestes de sécurité sismique aux élèves du primaire.
OUTILS
pleiasheat 35
Pleias-RAG : une collection de modèles spécialisés pour la recherche augmentée
Le laboratoire français Pleias publie une gamme de modèles conçus spécifiquement pour les usages RAG.
OUTILS
pleiasheat 25
Pleias publie Pleias-RAG-350M-gguf, un petit modèle spécialisé RAG au format GGUF
Le lab français Pleias met en ligne une version quantisée GGUF de son modèle léger dédié aux tâches de retrieval-augmented generation.
OUTILS
pleiasheat 35
Pleias-RAG-1B : un petit modèle spécialisé pour le RAG
Pleias publie un modèle compact de 1 milliard de paramètres, conçu spécifiquement pour les tâches de retrieval-augmented generation.
OUTILS
pleiasheat 35
Pleias-RAG-350M : un petit modèle spécialisé pour le RAG
Pleias publie un modèle compact de 350 millions de paramètres, dédié aux tâches de retrieval-augmented generation.
OPINION
heat 45
La documentation est encore dans le classeur de votre mère
Un plaidoyer pour repenser l'organisation de la documentation à l'ère des LLM et des agents IA qui doivent la consommer.
RECHERCHE
heat 52
SkillCenter : une bibliothèque de compétences open-source pour agents IA autonomes
Plus de 216 000 compétences structurées, sourcées et vérifiables pour équiper les agents IA — la plus grande bibliothèque ouverte du genre selon ses auteurs.
RECHERCHE
heat 52
Co-LMLM : des LLM à mémoire limitée avec requêtes continues
Une nouvelle architecture externalise les connaissances factuelles dans une base de connaissances interrogée par vecteurs continus, surpassant GPT-4o-mini sur certains benchmarks.
RECHERCHE
heat 42
Pitwall : des briefings de stratégie F1 en langage naturel, ancrés dans un moteur Monte Carlo temps réel
Un système de production génère des commentaires stratégiques F1 multilingues en garantissant la fidélité factuelle via un vérificateur de claims intégré à l'architecture.
RECHERCHE
heat 45
DynaKRAG : un framework unifié pour le contrôle adaptatif des preuves en RAG multi-sauts
DynaKRAG introduit une politique apprise pour orchestrer dynamiquement les opérations de récupération de preuves dans les systèmes RAG multi-sauts.
OUTILS
heat 55
Élaguer le contexte RAG pour ne garder que l'essentiel à la réponse
Kapa.ai détaille sa méthode pour réduire le contexte injecté dans un pipeline RAG, en supprimant les passages superflus avant la génération.
RECHERCHE
heat 52
Génération visuelle agentique : repousser les limites de la connaissance par la recherche
Les générateurs d'images hallucinent ce qu'ils ignorent. Un nouveau framework co-entraînement + recherche vise à corriger ce défaut structurel.
OUTILS
heat 52
Anatomie des 3 couches de mémoire persistante : comparatif ContextNest, Mem0 et Zep
Une analyse structurée des architectures de mémoire persistante pour agents IA, à travers trois solutions représentatives du marché.
OPINION
heat 52
Mémoriser les transcriptions de session n'est pas utile
Un développeur conteste l'approche dominante en matière de mémoire pour les agents IA : stocker des transcriptions brutes ne suffit pas.
OUTILS
heat 52
Embeddings 14× plus rapides : la refonte du chemin ONNX dans Manticore Search
Manticore Search détaille comment une réécriture du pipeline ONNX a multiplié par 14 la vitesse de génération d'embeddings.
RECHERCHE
heat 42
PolicyGuard : un moteur neuro-symbolique pour la conformité documentaire aux politiques organisationnelles
PolicyGuard convertit des politiques internes en règles logiques exécutables, combinant LLM et évaluation symbolique pour auditer la conformité des documents.
RECHERCHE
microsoftheat 72
Memora : un système de mémoire harmonique pour agents IA équilibrant abstraction et précision
Microsoft Research présente Memora, un système de mémoire scalable pour agents IA qui réduit jusqu'à 98 % les tokens de contexte tout en battant l'état de l'art sur deux benchmarks.
OPINION
heat 55
Pourquoi les LLMs frontier échouent sur les documents complexes sans experts
Un plafond à 76 % serait atteint par les LLMs pour la lecture de documents difficiles — et seule l'expertise humaine permettrait de le dépasser.
OUTILS
heat 52
La Bible utilisée comme base de données RAG
Un projet expérimental exploite la Bible comme corpus de récupération pour un système RAG, interrogeant les Écritures à la manière d'une base de connaissances vectorielle.
OUTILS
mistralheat 52
Mistral AI renforce le contrôle sur les connecteurs
Mistral AI annonce de nouvelles options de configuration pour les connecteurs, offrant aux développeurs un contrôle plus fin sur l'intégration des sources de données.
OPINION
heat 42
L'émergence d'une couche d'infrastructure web pour les données IA
Les modèles d'IA butent sur un goulot d'étranglement : accéder à des données web dynamiques, non structurées et en temps réel à grande échelle.
OUTILS
heat 52
Haystack : framework open-source pour agents IA et RAG en production
Haystack, le framework Python de deepset, propose une infrastructure modulaire pour construire des pipelines RAG et des agents IA prêts pour la production.
OUTILS
heat 42
Un développeur construit un moteur de mémoire IA en 10 jours, puis cherche un projet pour le valider
Un développeur indépendant présente un moteur de mémoire paramétrique pour agents IA, conçu en dix jours, et cherche des cas d'usage concrets pour en démontrer la valeur.
RECHERCHE
heat 42
TailorMind : génération de contenu multimodal alignée sur les préférences utilisateur
Un système qui traduit les traces comportementales en préférences génératives pour produire du contenu multimodal personnalisé sans pool d'items préexistant.

25 items

#RAG

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 22
Traduction automatique : peut-on faire dépasser aux LLM le cadre de la phrase isolée ?
Une étude propose PAT, un système RAG combinant spécifications utilisateur et corpus comparables pour une traduction de documents entiers, au-delà de la phrase par phrase.
RECHERCHE
heat 15
Earthquaker-AI : un framework RAG avec évaluation par grille critériée pour l'éducation aux séismes en primaire
Un système hybride combine robotique éducative Lego WeDo2 et assistant conversationnel RAG pour enseigner les gestes de sécurité sismique aux élèves du primaire.
OUTILS
pleiasheat 35
Pleias-RAG : une collection de modèles spécialisés pour la recherche augmentée
Le laboratoire français Pleias publie une gamme de modèles conçus spécifiquement pour les usages RAG.
OUTILS
pleiasheat 25
Pleias publie Pleias-RAG-350M-gguf, un petit modèle spécialisé RAG au format GGUF
Le lab français Pleias met en ligne une version quantisée GGUF de son modèle léger dédié aux tâches de retrieval-augmented generation.
OUTILS
pleiasheat 35
Pleias-RAG-1B : un petit modèle spécialisé pour le RAG
Pleias publie un modèle compact de 1 milliard de paramètres, conçu spécifiquement pour les tâches de retrieval-augmented generation.
OUTILS
pleiasheat 35
Pleias-RAG-350M : un petit modèle spécialisé pour le RAG
Pleias publie un modèle compact de 350 millions de paramètres, dédié aux tâches de retrieval-augmented generation.
OPINION
heat 45
La documentation est encore dans le classeur de votre mère
Un plaidoyer pour repenser l'organisation de la documentation à l'ère des LLM et des agents IA qui doivent la consommer.
RECHERCHE
heat 52
SkillCenter : une bibliothèque de compétences open-source pour agents IA autonomes
Plus de 216 000 compétences structurées, sourcées et vérifiables pour équiper les agents IA — la plus grande bibliothèque ouverte du genre selon ses auteurs.
RECHERCHE
heat 52
Co-LMLM : des LLM à mémoire limitée avec requêtes continues
Une nouvelle architecture externalise les connaissances factuelles dans une base de connaissances interrogée par vecteurs continus, surpassant GPT-4o-mini sur certains benchmarks.
RECHERCHE
heat 42
Pitwall : des briefings de stratégie F1 en langage naturel, ancrés dans un moteur Monte Carlo temps réel
Un système de production génère des commentaires stratégiques F1 multilingues en garantissant la fidélité factuelle via un vérificateur de claims intégré à l'architecture.
RECHERCHE
heat 45
DynaKRAG : un framework unifié pour le contrôle adaptatif des preuves en RAG multi-sauts
DynaKRAG introduit une politique apprise pour orchestrer dynamiquement les opérations de récupération de preuves dans les systèmes RAG multi-sauts.
OUTILS
heat 55
Élaguer le contexte RAG pour ne garder que l'essentiel à la réponse
Kapa.ai détaille sa méthode pour réduire le contexte injecté dans un pipeline RAG, en supprimant les passages superflus avant la génération.
RECHERCHE
heat 52
Génération visuelle agentique : repousser les limites de la connaissance par la recherche
Les générateurs d'images hallucinent ce qu'ils ignorent. Un nouveau framework co-entraînement + recherche vise à corriger ce défaut structurel.
OUTILS
heat 52
Anatomie des 3 couches de mémoire persistante : comparatif ContextNest, Mem0 et Zep
Une analyse structurée des architectures de mémoire persistante pour agents IA, à travers trois solutions représentatives du marché.
OPINION
heat 52
Mémoriser les transcriptions de session n'est pas utile
Un développeur conteste l'approche dominante en matière de mémoire pour les agents IA : stocker des transcriptions brutes ne suffit pas.
OUTILS
heat 52
Embeddings 14× plus rapides : la refonte du chemin ONNX dans Manticore Search
Manticore Search détaille comment une réécriture du pipeline ONNX a multiplié par 14 la vitesse de génération d'embeddings.
RECHERCHE
heat 42
PolicyGuard : un moteur neuro-symbolique pour la conformité documentaire aux politiques organisationnelles
PolicyGuard convertit des politiques internes en règles logiques exécutables, combinant LLM et évaluation symbolique pour auditer la conformité des documents.
RECHERCHE
microsoftheat 72
Memora : un système de mémoire harmonique pour agents IA équilibrant abstraction et précision
Microsoft Research présente Memora, un système de mémoire scalable pour agents IA qui réduit jusqu'à 98 % les tokens de contexte tout en battant l'état de l'art sur deux benchmarks.
OPINION
heat 55
Pourquoi les LLMs frontier échouent sur les documents complexes sans experts
Un plafond à 76 % serait atteint par les LLMs pour la lecture de documents difficiles — et seule l'expertise humaine permettrait de le dépasser.
OUTILS
heat 52
La Bible utilisée comme base de données RAG
Un projet expérimental exploite la Bible comme corpus de récupération pour un système RAG, interrogeant les Écritures à la manière d'une base de connaissances vectorielle.
OUTILS
mistralheat 52
Mistral AI renforce le contrôle sur les connecteurs
Mistral AI annonce de nouvelles options de configuration pour les connecteurs, offrant aux développeurs un contrôle plus fin sur l'intégration des sources de données.
OPINION
heat 42
L'émergence d'une couche d'infrastructure web pour les données IA
Les modèles d'IA butent sur un goulot d'étranglement : accéder à des données web dynamiques, non structurées et en temps réel à grande échelle.
OUTILS
heat 52
Haystack : framework open-source pour agents IA et RAG en production
Haystack, le framework Python de deepset, propose une infrastructure modulaire pour construire des pipelines RAG et des agents IA prêts pour la production.
OUTILS
heat 42
Un développeur construit un moteur de mémoire IA en 10 jours, puis cherche un projet pour le valider
Un développeur indépendant présente un moteur de mémoire paramétrique pour agents IA, conçu en dix jours, et cherche des cas d'usage concrets pour en démontrer la valeur.
RECHERCHE
heat 42
TailorMind : génération de contenu multimodal alignée sur les préférences utilisateur
Un système qui traduit les traces comportementales en préférences génératives pour produire du contenu multimodal personnalisé sans pool d'items préexistant.

Traduction automatique : peut-on faire dépasser aux LLM le cadre de la phrase isolée ?

Earthquaker-AI : un framework RAG avec évaluation par grille critériée pour l'éducation aux séismes en primaire

Pleias-RAG : une collection de modèles spécialisés pour la recherche augmentée

Pleias publie Pleias-RAG-350M-gguf, un petit modèle spécialisé RAG au format GGUF

Pleias-RAG-1B : un petit modèle spécialisé pour le RAG

Pleias-RAG-350M : un petit modèle spécialisé pour le RAG

La documentation est encore dans le classeur de votre mère

SkillCenter : une bibliothèque de compétences open-source pour agents IA autonomes

Co-LMLM : des LLM à mémoire limitée avec requêtes continues

Pitwall : des briefings de stratégie F1 en langage naturel, ancrés dans un moteur Monte Carlo temps réel

DynaKRAG : un framework unifié pour le contrôle adaptatif des preuves en RAG multi-sauts

Élaguer le contexte RAG pour ne garder que l'essentiel à la réponse

Génération visuelle agentique : repousser les limites de la connaissance par la recherche

Anatomie des 3 couches de mémoire persistante : comparatif ContextNest, Mem0 et Zep

Mémoriser les transcriptions de session n'est pas utile

Embeddings 14× plus rapides : la refonte du chemin ONNX dans Manticore Search

PolicyGuard : un moteur neuro-symbolique pour la conformité documentaire aux politiques organisationnelles

Memora : un système de mémoire harmonique pour agents IA équilibrant abstraction et précision

Pourquoi les LLMs frontier échouent sur les documents complexes sans experts

La Bible utilisée comme base de données RAG

Mistral AI renforce le contrôle sur les connecteurs

L'émergence d'une couche d'infrastructure web pour les données IA

Haystack : framework open-source pour agents IA et RAG en production

Un développeur construit un moteur de mémoire IA en 10 jours, puis cherche un projet pour le valider

TailorMind : génération de contenu multimodal alignée sur les préférences utilisateur

Traduction automatique : peut-on faire dépasser aux LLM le cadre de la phrase isolée ?

Earthquaker-AI : un framework RAG avec évaluation par grille critériée pour l'éducation aux séismes en primaire

Pleias-RAG : une collection de modèles spécialisés pour la recherche augmentée

Pleias publie Pleias-RAG-350M-gguf, un petit modèle spécialisé RAG au format GGUF

Pleias-RAG-1B : un petit modèle spécialisé pour le RAG

Pleias-RAG-350M : un petit modèle spécialisé pour le RAG

La documentation est encore dans le classeur de votre mère

SkillCenter : une bibliothèque de compétences open-source pour agents IA autonomes

Co-LMLM : des LLM à mémoire limitée avec requêtes continues

Pitwall : des briefings de stratégie F1 en langage naturel, ancrés dans un moteur Monte Carlo temps réel

DynaKRAG : un framework unifié pour le contrôle adaptatif des preuves en RAG multi-sauts

Élaguer le contexte RAG pour ne garder que l'essentiel à la réponse

Génération visuelle agentique : repousser les limites de la connaissance par la recherche

Anatomie des 3 couches de mémoire persistante : comparatif ContextNest, Mem0 et Zep

Mémoriser les transcriptions de session n'est pas utile

Embeddings 14× plus rapides : la refonte du chemin ONNX dans Manticore Search

PolicyGuard : un moteur neuro-symbolique pour la conformité documentaire aux politiques organisationnelles

Memora : un système de mémoire harmonique pour agents IA équilibrant abstraction et précision

Pourquoi les LLMs frontier échouent sur les documents complexes sans experts

La Bible utilisée comme base de données RAG

Mistral AI renforce le contrôle sur les connecteurs

L'émergence d'une couche d'infrastructure web pour les données IA

Haystack : framework open-source pour agents IA et RAG en production

Un développeur construit un moteur de mémoire IA en 10 jours, puis cherche un projet pour le valider

TailorMind : génération de contenu multimodal alignée sur les préférences utilisateur