RECHERCHE
VHG : génération de problèmes mathématiques difficiles assistée par vérificateur
Un framework en trois parties intègre un vérificateur indépendant pour contraindre la génération de problèmes mathématiques valides et difficiles par les LLM.
arXiv cs.AI · cs.LG · cs.CL·Yuhang Lai, Jiazhan Feng, Yee Whye Teh, Ning Miao·7 mai 2026

Image · Source originale
VHG (Verifier-backed Hard problem Generation) introduit un paradigme self-play tripartite où un vérificateur indépendant s'ajoute à la dualité setter-solver classique. La récompense du générateur dépend conjointement de la validité du problème (vérificateur) et de sa difficulté (solver). Deux variantes de vérificateur sont proposées : symbolique et LLM. Les évaluations sur des intégrales indéfinies et le raisonnement mathématique général montrent des gains significatifs sur tous les baselines.