9 items

#chain-of-thought

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 45
X³-OPD : distillation de raisonnement pour modèles audio-langage
Un nouveau cadre transfère le raisonnement logique de modèles textuels vers des modèles audio via un alignement on-policy.
RECHERCHE
heat 35
Deep Interaction : une méthode efficace d'interaction humain-IA pour les modèles de raisonnement
Une nouvelle méthode permet de corriger directement les erreurs de raisonnement des LLM sans tout régénérer, avec un gain de correction de 25%.
OUTILS
heat 62
Un outil web pour visualiser et modifier le raisonnement d'un LLM avant sa réponse
Un développeur indépendant publie Lucid, un outil qui expose et rend éditables les étapes de réflexion d'un modèle d'IA avant qu'il génère sa réponse.
RECHERCHE
heat 52
OpenCoF : raisonner par génération vidéo via le Chain-of-Frame
Un framework open-source qui transforme la génération vidéo en mécanisme de raisonnement séquentiel, alternatif au Chain-of-Thought textuel.
RECHERCHE
heat 42
VAORA : aligner le raisonnement visuel et l'action pour la physique interactive
Un nouveau mécanisme de récompense double pour ancrer le raisonnement des VLMs dans la réalité physique et réduire les hallucinations dans les tâches interactives.
RECHERCHE
heat 52
Auto-réflexion visuellement ancrée pour les modèles vision-langage via l'apprentissage par renforcement
Le framework VRRL entraîne les modèles vision-langage à corriger leurs erreurs en s'appuyant réellement sur les entrées visuelles, même hors distribution.
SAFETY
heat 62
Model Forensics : détecter si un comportement problématique traduit un désalignement réel
Un protocole d'investigation propose d'aller au-delà de la détection de comportements suspects pour établir si un modèle d'IA est réellement mal aligné.
RECHERCHE
heat 52
IV-CoT : raisonnement visuel implicite pour la génération texte-image structurée
Un framework de Chain-of-Thought visuel latent améliore le suivi des contraintes structurelles (comptage, relations spatiales, attributs) en génération texte-image.
SAFETY
heat 72
Le texte affiché dans la sortie 'Extended Thinking' de Claude Code n'est pas authentique
Une analyse remet en question la nature réelle du contenu affiché lors du mode de réflexion étendue de Claude Code : s'agit-il d'une véritable pensée ou d'une reconstruction ?

9 items

#chain-of-thought

Toutes les news taguées avec ce sujet.

Chronologie · 60 derniers jours

RECHERCHE
heat 45
X³-OPD : distillation de raisonnement pour modèles audio-langage
Un nouveau cadre transfère le raisonnement logique de modèles textuels vers des modèles audio via un alignement on-policy.
RECHERCHE
heat 35
Deep Interaction : une méthode efficace d'interaction humain-IA pour les modèles de raisonnement
Une nouvelle méthode permet de corriger directement les erreurs de raisonnement des LLM sans tout régénérer, avec un gain de correction de 25%.
OUTILS
heat 62
Un outil web pour visualiser et modifier le raisonnement d'un LLM avant sa réponse
Un développeur indépendant publie Lucid, un outil qui expose et rend éditables les étapes de réflexion d'un modèle d'IA avant qu'il génère sa réponse.
RECHERCHE
heat 52
OpenCoF : raisonner par génération vidéo via le Chain-of-Frame
Un framework open-source qui transforme la génération vidéo en mécanisme de raisonnement séquentiel, alternatif au Chain-of-Thought textuel.
RECHERCHE
heat 42
VAORA : aligner le raisonnement visuel et l'action pour la physique interactive
Un nouveau mécanisme de récompense double pour ancrer le raisonnement des VLMs dans la réalité physique et réduire les hallucinations dans les tâches interactives.
RECHERCHE
heat 52
Auto-réflexion visuellement ancrée pour les modèles vision-langage via l'apprentissage par renforcement
Le framework VRRL entraîne les modèles vision-langage à corriger leurs erreurs en s'appuyant réellement sur les entrées visuelles, même hors distribution.
SAFETY
heat 62
Model Forensics : détecter si un comportement problématique traduit un désalignement réel
Un protocole d'investigation propose d'aller au-delà de la détection de comportements suspects pour établir si un modèle d'IA est réellement mal aligné.
RECHERCHE
heat 52
IV-CoT : raisonnement visuel implicite pour la génération texte-image structurée
Un framework de Chain-of-Thought visuel latent améliore le suivi des contraintes structurelles (comptage, relations spatiales, attributs) en génération texte-image.
SAFETY
heat 72
Le texte affiché dans la sortie 'Extended Thinking' de Claude Code n'est pas authentique
Une analyse remet en question la nature réelle du contenu affiché lors du mode de réflexion étendue de Claude Code : s'agit-il d'une véritable pensée ou d'une reconstruction ?

X³-OPD : distillation de raisonnement pour modèles audio-langage

Deep Interaction : une méthode efficace d'interaction humain-IA pour les modèles de raisonnement

Un outil web pour visualiser et modifier le raisonnement d'un LLM avant sa réponse

OpenCoF : raisonner par génération vidéo via le Chain-of-Frame

VAORA : aligner le raisonnement visuel et l'action pour la physique interactive

Auto-réflexion visuellement ancrée pour les modèles vision-langage via l'apprentissage par renforcement

Model Forensics : détecter si un comportement problématique traduit un désalignement réel

IV-CoT : raisonnement visuel implicite pour la génération texte-image structurée

Le texte affiché dans la sortie 'Extended Thinking' de Claude Code n'est pas authentique

X³-OPD : distillation de raisonnement pour modèles audio-langage

Deep Interaction : une méthode efficace d'interaction humain-IA pour les modèles de raisonnement

Un outil web pour visualiser et modifier le raisonnement d'un LLM avant sa réponse

OpenCoF : raisonner par génération vidéo via le Chain-of-Frame

VAORA : aligner le raisonnement visuel et l'action pour la physique interactive

Auto-réflexion visuellement ancrée pour les modèles vision-langage via l'apprentissage par renforcement

Model Forensics : détecter si un comportement problématique traduit un désalignement réel

IV-CoT : raisonnement visuel implicite pour la génération texte-image structurée

Le texte affiché dans la sortie 'Extended Thinking' de Claude Code n'est pas authentique