Toutes les news taguées avec ce sujet.
Un nouveau benchmark teste la capacité des LLMs à reverse-engineer des politiques de jeu adversariales sous forme de code exécutable, à partir de simples observations comportementales.