#agents
Toutes les news taguées avec ce sujet.
- RECHERCHEheat 72
SWE-chat : premier dataset massif d'interactions réelles avec des agents de codage IA
6 000 sessions réelles, 63 000 prompts, 355 000 appels d'outils : une étude empirique inédite sur l'usage concret des agents de codage.
- RECHERCHEheat 52
Diagnostic de l'interprétation de grammaires formelles dans les LLM
Une nouvelle étude révèle que les LLM peinent à interpréter fidèlement des grammaires hors contexte, notamment face à la récursivité profonde.
- OUTILSheat 62
Intégrez votre propre agent IA dans Microsoft Teams
Microsoft ouvre Teams aux agents tiers via son SDK : les développeurs peuvent désormais connecter leurs propres agents conversationnels à la plateforme.
- OUTILSheat 30
Tableau de bord pour surveiller vos sessions Pi / OMP
Un outil open-source pour monitorer en temps réel les sessions Pi et OMP via une interface web dédiée.
- OUTILSopenaiheat 78
OpenAI lance des agents IA pour les environnements professionnels
OpenAI déploie des agents dédiés aux entreprises, intégrés aux outils de productivité et capables d'automatiser des tâches métier complexes.
- RECHERCHEanthropicheat 72
Project Vend : phase deux — Anthropic teste l'autonomie commerciale des agents IA
Anthropic publie les résultats de la seconde phase de Project Vend, une expérience évaluant la capacité d'agents IA à opérer de façon autonome dans un contexte commercial réel.
- OUTILSopenaiheat 62
Accélérer les workflows agentiques avec les WebSockets dans la Responses API
OpenAI détaille comment les WebSockets et le cache de connexion ont réduit la latence du modèle dans la boucle agentique de Codex.
- OUTILSheat 72
Zed introduit les agents parallèles dans son éditeur de code
L'éditeur Zed permet désormais d'exécuter plusieurs agents IA simultanément, ouvrant la voie à un développement assisté multi-tâches.
- OUTILSopenaiheat 88
ChatGPT introduit des agents de travail propulsés par Codex
OpenAI lance des « workspace agents » dans ChatGPT : des agents autonomes basés sur Codex pour automatiser des workflows complexes en équipe.
- OUTILSopenaiheat 52
Agents workspace dans ChatGPT : construire et déployer des workflows automatisés
OpenAI publie un guide pour créer, utiliser et déployer des agents workspace dans ChatGPT afin d'automatiser les opérations d'équipe.
- OUTILSheat 62
Daemons : un outil pour gérer les effets de bord des agents IA
Après avoir développé des agents IA, l'équipe de CharlieLabs a pivoté vers la gestion des conséquences et résidus laissés par ces agents.
- OUTILSheat 62
Ctx : un fichier /resume universel pour Claude Code et Codex
Ctx propose un contexte partagé et persistant entre plusieurs assistants de coding IA, évitant de répéter les instructions à chaque session.
- OPINIONheat 52
Moins d'agents IA à apparence humaine, s'il vous plaît
Un essai plaide pour des agents IA moins anthropomorphisés, plus transparents et explicites dans leurs intentions et limites.
- OUTILSheat 52
Zindex – Infrastructure de diagrammes pour agents IA
Zindex propose une couche d'infrastructure dédiée à la génération et à la gestion de diagrammes pour les agents IA.
- RECHERCHEheat 42
A-MAR : récupération multimodale d'œuvres d'art par agents pour une compréhension fine-grained
Un framework d'agents IA décompose les requêtes artistiques en plans de raisonnement structurés pour améliorer l'explication et la traçabilité des réponses.
- OUTILSheat 52
Kuri – une alternative de navigation par agents basée sur Zig
Kuri propose un navigateur orienté agents IA développé en Zig, alternative légère aux solutions existantes pour l'automatisation web.
- SIGNALheat 72
Brief IA #68 : pubs dans ChatGPT, Translate et Claude Cowork
OpenAI teste la publicité dans ChatGPT pour les utilisateurs gratuits, lance un outil de traduction et Anthropic étend Claude Code aux fichiers locaux.
- MARCHEheat 35
Trellis AI (YC W24) recrute des ingénieurs pour des agents auto-améliorants
La startup Trellis AI, issue de la promotion YC W24, cherche des ingénieurs pour développer des agents capables de s'améliorer d'eux-mêmes.
- OUTILSmoonshotheat 78
Kimi-K2-Base : le modèle de base open-weights de Moonshot AI
Moonshot AI publie Kimi-K2-Base sur Hugging Face, un grand modèle de langage open-weights conçu pour les usages agentiques.
- OUTILSheat 72
CrabTrap : un proxy HTTP LLM-as-a-judge pour sécuriser les agents en production
Brex publie CrabTrap, un proxy HTTP qui utilise un LLM en tant que juge pour intercepter et filtrer les requêtes d'agents IA en production.
- SIGNALheat 72
Le brief IA #70 : Anthropic sans pub, Claude Opus 4.6 et GPT-5.2 accéléré
Anthropic confirme l'absence de publicité dans Claude, lance Opus 4.6 avec 1M de tokens de contexte, et OpenAI accélère GPT-5.2 de 40 %.
- OPINIONheat 62
Pourquoi tous vos agents IA vont devenir asynchrones
L'auteur argumente que le modèle synchrone des agents IA atteint ses limites et que l'architecture asynchrone s'impose comme la prochaine norme.
- OUTILSmoonshotheat 82
Kimi-K2 : Moonshot AI publie son nouveau modèle open-weights
Moonshot AI dévoile Kimi-K2, un modèle de grande taille disponible en open-weights sur Hugging Face, ciblant les tâches agentiques et le raisonnement.
- MARCHEgoogleheat 82
Les TPU de huitième génération de Google : deux puces pour l'ère agentique
Google dévoile sa 8e génération de TPU, avec deux variantes conçues pour répondre aux exigences des systèmes d'agents IA.
- SIGNALheat 88
Anthropic lance Opus 4.7 et Mythos, son modèle réservé à la cybersécurité
Opus 4.7 s'impose sur SWE-bench Pro devant GPT-5.4, tandis que Mythos reste inaccessible au public en raison de capacités offensives jugées trop dangereuses.
- MARCHEgoogleheat 82
Google lance deux TPU spécialisés pour l'ère des agents IA
Google dévoile la huitième génération de ses TPU avec deux puces dédiées aux charges de travail agentiques et inférentielles.
- RECHERCHEanthropicheat 62
Vibe physics : l'IA comme assistant de recherche en physique
Anthropic explore comment ses modèles peuvent jouer le rôle d'un étudiant en thèse de physique, entre raisonnement scientifique et limites pratiques.
- RECHERCHEanthropicheat 72
Claude optimisé pour les calculs scientifiques de longue durée
Anthropic dévoile des avancées pour permettre à Claude de gérer des tâches de calcul scientifique s'étendant sur de longues périodes.
- SAFETYanthropicheat 78
Chercheurs en alignement automatisés : utiliser les LLM pour mettre à l'échelle la supervision
Anthropic explore comment des LLM peuvent automatiser une partie du travail de recherche en alignement pour accélérer la supervision scalable.
- SAFETYanthropicheat 72
Agents dignes de confiance : les pratiques recommandées par Anthropic
Anthropic publie ses réflexions sur la conception d'agents IA fiables, entre sécurité, autonomie et supervision humaine.