OUTILS · Hugging Face

olmo-eval : un environnement d'évaluation pour le cycle de développement de modèles

Allen AI publie olmo-eval, un workbench open-source conçu pour intégrer l'évaluation au cœur du pipeline de développement de LLM.

Hugging Face Blog·12 juin 2026

Image · Source originale

Allen AI présente olmo-eval, un outil d'évaluation pensé pour s'intégrer directement dans la boucle de développement de modèles de langage. La plateforme vise à standardiser et automatiser les évaluations tout au long du cycle d'entraînement, facilitant le suivi des performances sur des benchmarks variés. L'outil s'inscrit dans l'écosystème OLMo, la famille de LLM open-weights d'Allen AI.

Chaleur 41

Pertinence 75

Nouveauté 55

OUVRIR LA SOURCE ↗

#évaluation #LLM #open-source #benchmark #OLMo