Toutes les news taguées avec ce sujet.
Une analyse de convergence serrée pour EF et EF21, deux algorithmes majeurs de compression de gradient en apprentissage distribué.
Une étude théorique démontre pour la première fois la convergence d'AdaGrad en optimisation non-convexe sous bruit à queue lourde, sans clipping ni connaissance préalable du tail index.
Des algorithmes Q-learning adaptés à l'optimisation risk-averse par utilité exponentielle dans les processus de décision markoviens escomptés.