RECHERCHE
DNQ : un réseau Deep Nash Q pour les jeux à n joueurs avec information partielle
DNQ propose un cadre d'apprentissage par renforcement guidé par l'équilibre de Nash pour entraîner des agents d'enchères multi-tours en environnement compétitif.
arXiv cs.AI · cs.LG · cs.CL·Qintong Xie, Edward Koh, Xavier Cadet, Peter Chin·4 juin 2026

Image · Source originale
DNQ est un framework combinant collecte de trajectoires, estimation de gains par critique partagé, calcul d'équilibre via solveur externe et imitation de politique. Deux variantes sont étudiées : une formulation exacte (tenseur N-joueurs) et une formulation par paires plus scalable. Les expériences montrent que la méthode par paires passe à l'échelle sur un plus grand nombre d'agents, tandis que la méthode exacte devient impraticable à mesure que le jeu joint croît.