RECHERCHE
Recursive Agent Optimization : entraîner des agents à se déléguer des sous-tâches récursivement
RAO est une approche par reinforcement learning pour des agents capables de s'instancier récursivement, améliorant l'efficacité et la généralisation.
arXiv cs.AI · cs.LG · cs.CL·Apurva Gandhi, Satyaki Chakraborty, Xiangjun Wang, Aviral Kumar·7 mai 2026

Image · Source originale
RAO (Recursive Agent Optimization) propose un cadre RL pour entraîner des agents récursifs capables de spawner des sous-agents afin de déléguer des sous-tâches. Cette architecture de type diviser-pour-régner constitue un algorithme de scaling à l'inférence permettant de dépasser la fenêtre contextuelle du modèle. Les agents ainsi entraînés montrent une meilleure efficacité d'entraînement, se généralisent à des tâches plus difficiles que celles vues en formation et réduisent le temps d'exécution par rapport aux systèmes mono-agent.