RECHERCHE

Recursive Agent Optimization : entraîner des agents à se déléguer des sous-tâches récursivement

RAO est une approche par reinforcement learning pour des agents capables de s'instancier récursivement, améliorant l'efficacité et la généralisation.

arXiv cs.AI · cs.LG · cs.CL·Apurva Gandhi, Satyaki Chakraborty, Xiangjun Wang, Aviral Kumar·7 mai 2026

Image · Source originale

RAO (Recursive Agent Optimization) propose un cadre RL pour entraîner des agents récursifs capables de spawner des sous-agents afin de déléguer des sous-tâches. Cette architecture de type diviser-pour-régner constitue un algorithme de scaling à l'inférence permettant de dépasser la fenêtre contextuelle du modèle. Les agents ainsi entraînés montrent une meilleure efficacité d'entraînement, se généralisent à des tâches plus difficiles que celles vues en formation et réduisent le temps d'exécution par rapport aux systèmes mono-agent.

Chaleur 0

Pertinence 78

Nouveauté 74

OUVRIR LA SOURCE ↗

#agents #reinforcement-learning #inference-time scaling #multi-agent #divide-and-conquer