4 items

#calibration

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 25
Calibration séquentielle efficace avec une borne d'erreur en O(T^(2/3-ε))
Un nouveau forecaster randomisé améliore la barrière classique de calibration en ligne, en combinant SPR-Calibration et une couche de correction de type Blackwell.
RECHERCHE
heat 40
Agents multimodaux QA par calibration et raisonnement incrémental
Une architecture multi-agents surpasse les systèmes classifs au challenge QANTA 2026 via des politiques de raisonnement ciblées.
RECHERCHE
heat 62
L'apprentissage par renforcement avec feedback métacognitif fait émerger l'incertitude dans les LLM
Une nouvelle approche combine RL et feedback métacognitif pour que les LLM expriment leur incertitude de façon calibrée.
RECHERCHE
heat 62
Le reinforcement learning avec feedback métacognitif améliore l'expression de l'incertitude dans les LLMs
Une nouvelle méthode, RLMF, exploite la métacognition pour aligner la confiance exprimée des LLMs sur leur incertitude réelle, réduisant les hallucinations.