Toutes les news taguées avec ce sujet.
Stack Overflow annonce une offre spécifiquement conçue pour les agents IA, afin de leur donner accès à sa base de connaissances technique.
Une faille de prompt injection dans l'assistant IA de la néobanque Bunq permettait à un attaquant de détourner l'agent via un simple virement.
Apache Burr est un framework open-source conçu pour développer des agents et applications IA robustes et déterministes.
Un utilisateur signale que Claude Desktop démarre silencieusement une machine virtuelle en arrière-plan, sans interface pour l'interrompre.
Des agents LLM surpassent des experts humains sur des tâches biologiques à double usage, soulevant de nouvelles questions de biosécurité.
GitButler expérimente la réécriture de Git en Rust en s'appuyant sur des agents IA pour accélérer et structurer le processus.
Un framework multi-agents simule une rédaction complète pour produire des articles de data-journalisme interactifs, sourcés et vérifiables automatiquement.
Notion exploite Codex d'OpenAI pour automatiser des specs techniques, développer une saisie vocale IA et démultiplier la productivité de ses petites équipes.
Nextdoor s'appuie sur Codex et GPT-5.5 pour déboguer des problèmes difficiles à reproduire et accélérer le développement multiplateforme.
Une étude arXiv interroge l'utilité réelle des LLM dans les pipelines de recherche agentique face aux outils de recherche classiques comme grep.
NVIDIA propose une approche par agents pour accélérer l'évaluation des modèles de reconnaissance vocale dans le domaine médical.
NVIDIA présente Auto-FL, un système d'agents IA intégré à FLARE pour automatiser l'exploration et l'évaluation des configurations en federated learning.
Ethan Mollick a eu accès en avant-première à Claude 5 Fable et livre ses impressions : un bond qualitatif significatif sur l'ensemble des tâches testées.
Un agent IA orchestre deux Spaces Hugging Face en séquence pour générer automatiquement une galerie 3D interactive représentant Paris.
Premier simulateur iOS natif interactif centré sur une identité utilisateur persistante, iOSWorld teste les agents sur 133 tâches réparties dans 26 applications.
SIGA permet à un agent de codage généraliste de configurer des simulateurs scientifiques complexes en 5 minutes, contre 3 heures pour un expert humain.
Un essai explore ce que signifie réellement « l'agentivité » appliquée aux systèmes d'IA, et pourquoi la métaphore mérite d'être interrogée.
Un nouveau benchmark basé sur Unreal Engine 5 évalue des agents VLM dans 12 jeux en modes Solo, PvP et Coop, avec un protocole de réflexion autonome.
Anthropic publie une réflexion sur le déploiement d'agents autonomes dans la recherche biologique, entre promesses thérapeutiques et risques biosécurité.
OpenEnv s'impose comme la référence open source pour l'entraînement par renforcement des agents IA, avec le soutien croissant de la communauté.
Un nouveau benchmark teste si les agents IA peuvent réellement se comporter comme des chercheurs humains — et les résultats révèlent des lacunes persistantes.
Une étude sur les données de production de Perplexity compare Search et Computer, et mesure l'impact concret des agents autonomes sur le travail intellectuel.
Nightwatch propose un agent IA d'ingénierie de fiabilité des sites (SRE) entièrement open-source, opérant en mode lecture seule pour surveiller les systèmes.
Un framework plug-and-play dissocie perception et raisonnement pour traiter des vidéos de plusieurs heures sans explosion du contexte token.
Un framework multi-agents simule 10 ans de vie sociale pour entraîner des LLMs à mieux comprendre et reproduire les comportements humains.
Un outil open-source qui exploite les LLMs comme tuteurs actifs, forçant l'utilisateur à comprendre plutôt qu'à copier-coller.
Le salon Computex 2026 confirme la montée en puissance des agents IA sur PC, mais les promesses restent encore en avance sur les usages réels.
OpenAI détaille comment ses ingénieurs intègrent Codex dans des workflows agentiques pour automatiser et accélérer le développement logiciel.
Une étude quantifie précisément comment les tokens sont consommés par les agents IA dans les tâches de développement logiciel.
Un projet issu du hackathon Hugging Face explore l'automatisation de la recherche d'emploi grâce à des agents IA légers.