RECHERCHE
Apprentissage à cible cachée optimal pour l'optimisation de stocks en ligne sur ensembles convexes généraux
Un nouveau principe théorique améliore les garanties de regret pour l'optimisation de stocks en ligne sur des ensembles de capacité convexes arbitraires.
arXiv cs.AI · cs.LG · cs.CL·Anthony Pineci, Yunzong Xu·12 juin 2026

Image · Source originale
Ce papier étudie l'optimisation de stocks en ligne (OIO), une variante de l'optimisation convexe en ligne où la mémoire physique (report de stock) rend l'ensemble d'actions faisables dépendant du passé. Les auteurs prouvent qu'un principe de cible cachée projetée sur l'ensemble faisable courant est optimal pour OIO sur tout ensemble de capacité convexe borné. La méthode améliore la meilleure garantie de regret connue, passant d'une dépendance inverse à inverse-racine-carrée sur la probabilité de demande commune, avec une borne inférieure correspondante établie.