vendredi 24 avril 2026Connexion →
21 SOURCES ACTIVES+253 / 7J
Fellow
La veille de l'intelligence artificielle

RECHERCHE

Apprentissage par renforcement continu et sûr dans des environnements non-stationnaires

Une étude systématique met en lumière la tension fondamentale entre sécurité et adaptation continue dans les systèmes RL confrontés à des dynamiques changeantes.

arXiv cs.AI · cs.LG · cs.CL·Austin Coursey, Abel Diaz-Gonzalez, Marcos Quinones-Grueiro, Gautam Biswas·21 avril 2026
Les auteurs explorent l'intersection du safe RL et du continual RL, deux domaines qui ont jusqu'ici évolué séparément. Ils introduisent trois environnements benchmark dédiés à l'adaptation continue en contextes critiques pour la sécurité. Leurs résultats empiriques révèlent un conflit fondamental entre le respect des contraintes de sécurité et la prévention de l'oubli catastrophique, les méthodes existantes échouant généralement à satisfaire ces deux objectifs simultanément. Des stratégies de régularisation sont examinées pour atténuer partiellement ce compromis.
Chaleur 14
Pertinence 62
Nouveauté 65
OUVRIR LA SOURCE ↗
#reinforcement-learning#safe-RL#continual-learning#non-stationary#benchmark