RECHERCHE

DNQ : un réseau Deep Nash Q pour les jeux à n joueurs avec information partielle

DNQ propose un cadre d'apprentissage par renforcement guidé par l'équilibre de Nash pour entraîner des agents d'enchères multi-tours en environnement compétitif.

arXiv cs.AI · cs.LG · cs.CL·Qintong Xie, Edward Koh, Xavier Cadet, Peter Chin·4 juin 2026

Image · Source originale

DNQ est un framework combinant collecte de trajectoires, estimation de gains par critique partagé, calcul d'équilibre via solveur externe et imitation de politique. Deux variantes sont étudiées : une formulation exacte (tenseur N-joueurs) et une formulation par paires plus scalable. Les expériences montrent que la méthode par paires passe à l'échelle sur un plus grand nombre d'agents, tandis que la méthode exacte devient impraticable à mesure que le jeu joint croît.

Chaleur 2

Pertinence 45

Nouveauté 62

OUVRIR LA SOURCE ↗

#reinforcement-learning #game-theory #multi-agent #equilibre-nash #enchères