1 item
#closed-book
Toutes les news taguées avec ce sujet.
- RECHERCHEheat 42
BAGEL : un benchmark pour évaluer les connaissances animalières des LLMs
Un nouveau benchmark en closed-book testing mesure la maîtrise des LLMs sur la taxonomie, le comportement et la biodiversité animale.