5 items

#long-horizon

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 62
Un agent mémoire proactif pour améliorer les agents à horizon long
Des chercheurs proposent un module mémoire plug-and-play qui intervient sélectivement pour contrer la dégradation comportementale dans les tâches longues.
RECHERCHE
heat 55
FurnitureVLA : assemblage bimanuels de meubles à grande échelle avec un modèle VLA
Des chercheurs présentent FurnitureVLA, premier système robotique bimanuels capable d'assembler des meubles réels grâce à un modèle Vision-Language-Action.
RECHERCHE
heat 62
AutoMem : apprentissage automatisé de la mémoire comme compétence cognitive pour les LLM
Un framework entraîne les LLM à gérer leur mémoire comme une compétence à part entière, multipliant par 2 à 4 les performances sur des tâches longues.
RECHERCHE
heat 52
QVal : évaluer à moindre coût les signaux de supervision dense pour agents LLM
Un banc d'essai sans entraînement pour comparer 21 méthodes de supervision dense d'agents LLM sur des trajectoires longues.
RECHERCHE
heat 72

5 items

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 62
Un agent mémoire proactif pour améliorer les agents à horizon long
Des chercheurs proposent un module mémoire plug-and-play qui intervient sélectivement pour contrer la dégradation comportementale dans les tâches longues.
RECHERCHE
heat 55
FurnitureVLA : assemblage bimanuels de meubles à grande échelle avec un modèle VLA
Des chercheurs présentent FurnitureVLA, premier système robotique bimanuels capable d'assembler des meubles réels grâce à un modèle Vision-Language-Action.
RECHERCHE
heat 62
AutoMem : apprentissage automatisé de la mémoire comme compétence cognitive pour les LLM
Un framework entraîne les LLM à gérer leur mémoire comme une compétence à part entière, multipliant par 2 à 4 les performances sur des tâches longues.
RECHERCHE
heat 52
QVal : évaluer à moindre coût les signaux de supervision dense pour agents LLM
Un banc d'essai sans entraînement pour comparer 21 méthodes de supervision dense d'agents LLM sur des trajectoires longues.
RECHERCHE
heat 72