RECHERCHE

Apprentissage par renforcement continu et sûr dans des environnements non-stationnaires

Une étude systématique met en lumière la tension fondamentale entre sécurité et adaptation continue dans les systèmes RL confrontés à des dynamiques changeantes.

arXiv cs.AI · cs.LG · cs.CL·Austin Coursey, Abel Diaz-Gonzalez, Marcos Quinones-Grueiro, Gautam Biswas·21 avril 2026

Les auteurs explorent l'intersection du safe RL et du continual RL, deux domaines qui ont jusqu'ici évolué séparément. Ils introduisent trois environnements benchmark dédiés à l'adaptation continue en contextes critiques pour la sécurité. Leurs résultats empiriques révèlent un conflit fondamental entre le respect des contraintes de sécurité et la prévention de l'oubli catastrophique, les méthodes existantes échouant généralement à satisfaire ces deux objectifs simultanément. Des stratégies de régularisation sont examinées pour atténuer partiellement ce compromis.

Chaleur 0

Pertinence 62

Nouveauté 65

OUVRIR LA SOURCE ↗

#reinforcement-learning #safe-RL #continual-learning #non-stationary #benchmark