Toutes les news taguées avec ce sujet.
Un développeur analyse les conditions d'utilisation de Claude et découvre une clause permettant à Anthropic de restreindre discrètement le modèle chez des concurrents.
Une analyse empirique de la calibration des modèles IA : leurs scores de confiance reflètent-ils vraiment la probabilité d'avoir raison ?
Une étude révèle que les LRMs peinent à aligner leur confiance interne et leur expression linguistique, malgré des chaînes de raisonnement étendues.
Selon des données Pew et Gallup, la défiance des Américains envers l'IA et ses responsables reste largement majoritaire en 2025.
Un nouveau framework détecte si un modèle vision-langage répond grâce à l'image ou uniquement à partir de ses priors linguistiques.
Une simple métrique d'entropie sur le premier token généré rivalise avec les méthodes de self-consistency multiple, à une fraction du coût computationnel.