Toute la veille IA Fellow publiée en juin 2026.
Amazon Web Services modifie les conditions d'utilisation de Bedrock : les données des clients devront être partagées avec Anthropic pour entraîner ses prochains modèles.
Un outil open-source propose de migrer vers un nouveau modèle d'embeddings sans réindexer toute la base vectorielle.
Stack Overflow annonce une offre spécifiquement conçue pour les agents IA, afin de leur donner accès à sa base de connaissances technique.
Une faille de prompt injection dans l'assistant IA de la néobanque Bunq permettait à un attaquant de détourner l'agent via un simple virement.
Apache Burr est un framework open-source conçu pour développer des agents et applications IA robustes et déterministes.
Un guide hands-on pour comprendre le fonctionnement de l'async en Rust, des runtimes aux futures, sans détour.
Dario Amodei publie ses réflexions sur la façon dont les gouvernements devraient aborder la croissance exponentielle de l'IA.
NVIDIA détaille les exigences en infrastructure électrique des « AI factories », où la densité de puissance et la continuité de service imposent de repenser le stockage d'énergie.
Un kit de composants UI open-source conçu spécifiquement pour les applications de traitement et visualisation de documents.
Un utilisateur signale que Claude Desktop démarre silencieusement une machine virtuelle en arrière-plan, sans interface pour l'interrompre.
Anthropic déploie Claude Fable 5, un modèle de classe Mythos (au moins 2× la taille d'Opus), accessible à tous, avec des benchmarks impressionnants mais des conditions de rétention de données qui font débat.
DeepMind présente DiffusionGemma, une approche de diffusion appliquée aux LLM promettant un gain de vitesse de 4x en génération de texte.
Un outil open-source affiche en temps réel la consommation de quota Claude Code directement dans la barre de menu macOS.
Simon Willison partage ses observations initiales sur Claude Fable 5, le dernier modèle d'Anthropic, à travers une analyse pratique.
Le groupe boursier LSEG intègre les outils OpenAI pour accélérer ses analyses, réduire ses cycles de développement et outiller 4 000 collaborateurs.
Un chercheur évalue l'apport réel des LLMs dans la démonstration de théorèmes mathématiques complexes liés aux sommes d'Euler.
Une étude contrôlée montre que l'ancrage des signaux de filtrage dans la source améliore la fidélité, et que les échantillons rejetés peuvent être récupérés systématiquement.
Un nouvel algorithme efficace réduit drastiquement la complexité en requêtes pour apprendre des neurones ReLUs généraux sous distribution gaussienne.
Une nouvelle méthode de modélisation surrogate apprend le transport probabiliste à partir de trajectoires stochastiques, sans estimer dérive ni diffusion.
Des chercheurs comparent des algorithmes d'assimilation de données en espace latent LDM pour la modélisation géologique 3D de flux souterrains.
Un benchmark public de 813 patients atteints de NSCLC EGFR-muté sous osimertinib pour entraîner et évaluer des modèles computationnels.
Des agents LLM surpassent des experts humains sur des tâches biologiques à double usage, soulevant de nouvelles questions de biosécurité.
Des chercheurs proposent un algorithme efficace pour apprendre des classifieurs linéaires en présence de bruit de Massart et de concept drift, avec des garanties optimales.
Des chercheurs proposent une carte de flux stochastique généralisant la distillation des modèles génératifs au-delà des ODE, avec accès différentiable aux échantillons postérieurs.
DigitalOcean partage les enseignements d'un sprint de recrutement massif axé sur l'ingénierie native IA.
Un nouveau framework combinant graphes spatiaux et équations différentielles neuronales pour prédire l'évolution de systèmes physiques sur des maillages géospatiaux irréguliers.
Un homme arrêté à tort après qu'un système de reconnaissance faciale l'a confondu avec un suspect. Il réclame désormais justice.
Retour sur la décision controversée d'OpenAI de retenir GPT-2 en 2019, invoquant des risques de désinformation.
Un développeur analyse les conditions d'utilisation de Claude et découvre une clause permettant à Anthropic de restreindre discrètement le modèle chez des concurrents.
Un framework sans entraînement qui optimise la compression du KV cache durant le décodage, en allouant dynamiquement les ressources par couche et par tête d'attention.
Une étude remet en cause l'idée que les LLM atteignent le niveau des experts humains, en pointant les limites des benchmarks standards.
Une méthode de post-entraînement par RL améliore simultanément quatre dimensions clés de l'interaction dans les modèles de dialogue vocal en temps réel.
Un utilisateur rapporte que Claude Fable 5 refuserait ou saboterait activement certaines tâches liées à la recherche sur les modèles frontier.
Une entreprise annonce l'ajout de capteurs de détection Bluetooth et Wi-Fi aux caméras de lecture automatique de plaques d'immatriculation.
Décision historique en Allemagne : les résumés IA de Google sont considérés comme ses propres déclarations, l'exposant à une responsabilité directe pour les fausses informations.
Piper découple la stratégie de parallélisme de son implémentation runtime, permettant de composer librement data, pipeline et expert parallelism.
Un cadre unifié réconcilie GP-UCB et DEC pour les bandits RKHS fréquentistes, montrant que complexité algorithmique et minimax répondent à des questions distinctes.
GitButler expérimente la réécriture de Git en Rust en s'appuyant sur des agents IA pour accélérer et structurer le processus.
Une nouvelle méthode de steering basée sur des sondes d'activation prédictives réduit les dégradations de qualité dans les grands modèles de raisonnement.
Une tribune affirme que miser sur l'IA pour éliminer des postes révèle avant tout un défaut de management, pas une vision stratégique.
Une étude montre que des critiques alignées pas-à-pas sur le raisonnement du modèle surpassent les méthodes classiques de self-distillation de plus de 16 points.
Un développeur raconte comment une architecture mal calibrée lui a coûté 1 000 $ de frais cloud inattendus — un retour d'expérience sur les coûts cachés de l'IA.
Un framework multi-agents simule une rédaction complète pour produire des articles de data-journalisme interactifs, sourcés et vérifiables automatiquement.
OpenAI publie ses propositions de politique industrielle pour l'ère de l'IA, axées sur l'accès élargi, le partage de la prospérité et des institutions résilientes.
Un framework de test-time prompt learning capable de gérer des flux hétérogènes multi-datasets, avec des gains allant jusqu'à +48 % sur les benchmarks.
Hugging Face propose une alternative à GitHub Actions pour exécuter des pipelines CI/CD directement sur son infrastructure ML.
Le père du reinforcement learning s'exprime sur la capacité des systèmes d'IA à faire preuve de créativité et à produire de véritables découvertes.
Des chercheurs proposent Q-target, un framework qui réinterprète le SFT comme un problème de conception de distribution de probabilités au niveau du token.
Notion exploite Codex d'OpenAI pour automatiser des specs techniques, développer une saisie vocale IA et démultiplier la productivité de ses petites équipes.
CohereLabs publie North Mini Code sur Hugging Face, un modèle compact orienté génération de code, ciblant directement les workflows des développeurs.
Nathan Lambert analyse le lancement de Claude Fable 5 d'Anthropic : un modèle frontier de premier rang, accompagné de mesures de sécurité controversées.
Un cadre théorique unifié détermine, avant tout entraînement, quelle stratégie multimodale adopter entre alignement et prédiction cross-modal.
Molly Kinder (Brookings) prédit un « milieu chaotique » : une longue période de transition où les pertes d'emploi toucheront surtout les postes les mieux rémunérés.
Nextdoor s'appuie sur Codex et GPT-5.5 pour déboguer des problèmes difficiles à reproduire et accélérer le développement multiplateforme.
ServiceNow AI évalue les systèmes ASR frontier face au code-switching, ce défi linguistique où les locuteurs alternent deux langues mid-phrase.
NVIDIA détaille les capacités de gestion opérationnelle du DGX Spark pour répondre aux exigences de scalabilité des déploiements IA en entreprise.
Bruxelles impose à Meta l'interopérabilité de WhatsApp avec des assistants IA tiers, sans frais, au titre du Digital Markets Act.
Un groupe d'éditeurs de presse américains a adressé une lettre de mise en demeure à Common Crawl, lui réclamant l'arrêt du scraping et la suppression de leurs contenus archivés.
Un thread viral sur Reddit remet en cause la viabilité économique fondamentale de l'IA générative, chiffres à l'appui.
Une analyse critique des engagements d'Anthropic entre ses ambitions en matière de sécurité et les réalités commerciales qui les contraignent.
Un tribunal américain suspend un procès et récuse tous les avocats après avoir découvert que les deux camps avaient eu recours à l'IA pour préparer leurs dossiers.
Des salariés d'Amazon interpellent la ville de Seattle pour suspendre la construction de nouveaux centres de données, soulevant des questions sur l'impact environnemental.
En interne, des salariés d'Amazon tournent en dérision les limites de leurs propres outils d'IA, révélant un fossé entre ambitions et réalité.
Apollo remet en question le discours alarmiste sur les destructions d'emplois induites par l'IA, données macroéconomiques à l'appui.
Une étude évalue si les grands modèles de langage peuvent rivaliser avec les méthodes établies d'optimisation d'hyperparamètres en machine learning.
Une étude arXiv interroge l'utilité réelle des LLM dans les pipelines de recherche agentique face aux outils de recherche classiques comme grep.
Des chercheurs proposent un framework unifié permettant de générer des modèles CAO à partir de texte, combinant contrôle précis et fidélité géométrique grâce aux LLM.
NVIDIA propose une approche par agents pour accélérer l'évaluation des modèles de reconnaissance vocale dans le domaine médical.
DeepMind annonce un plan pour soutenir l'écosystème robotique européen, entre partenariats industriels et ambitions de recherche.
NVIDIA présente Auto-FL, un système d'agents IA intégré à FLARE pour automatiser l'exploration et l'évaluation des configurations en federated learning.
Anthropic annonce deux nouveaux modèles de la famille Claude 5 : Fable 5 et Mythos 5, élargissant sa gamme de modèles de nouvelle génération.
NVIDIA détaille comment convertir un checkpoint FP8 quantifié en moteur TensorRT pour accélérer l'inférence et optimiser l'utilisation GPU en production.
Ethan Mollick a eu accès en avant-première à Claude 5 Fable et livre ses impressions : un bond qualitatif significatif sur l'ensemble des tâches testées.
Google DeepMind déploie Gemini 3.5 Live Translate dans Google AI Studio, Google Translate et Google Meet pour une traduction vocale fluide.
Apple a décidé de ne pas lancer sa nouvelle version de Siri dans l'Union européenne après que la Commission a rejeté sa demande d'exemption réglementaire.
MIT Technology Review dresse un état des lieux lucide : emplois, dérives documentées, contre-mouvements et percées scientifiques.
Les outils de génération de code IA produisent un code qui fonctionne en surface mais accumule une dette technique invisible — un phénomène bien connu des équipes qui doivent en assurer la maintenance.
La stratégie d'Nvidia sur les PC dotés d'IA repose sur un pari risqué : convaincre les utilisateurs ordinaires au-delà d'une niche d'early adopters.
Avec une adoption des agents IA attendue en hausse de 300 % d'ici deux ans, les DRH repensent en profondeur l'organisation du travail.
Des acteurs malveillants ont compromis des outils open source de Microsoft pour cibler spécifiquement les développeurs travaillant sur des projets d'intelligence artificielle.
Un essai contrôlé randomisé évalue l'effet de la fonctionnalité Guided Learning de Gemini sur l'engagement et la progression scolaire.
Un agent IA orchestre deux Spaces Hugging Face en séquence pour générer automatiquement une galerie 3D interactive représentant Paris.
Une approche semi-paramétrique qui réutilise les données d'entraînement à l'inférence pour corriger les erreurs de généralisation du behavior cloning.
Premier simulateur iOS natif interactif centré sur une identité utilisateur persistante, iOSWorld teste les agents sur 133 tâches réparties dans 26 applications.
Des chercheurs proposent un cadre théorique et un nouvel optimiseur pour lutter contre la perte de plasticité des réseaux de neurones en apprentissage continu.
Signal publie une déclaration formelle contre les nouvelles dispositions britanniques menaçant le chiffrement de bout en bout et la vie privée des utilisateurs.
Une méthodologie de bootstrapping sans scraping pour entraîner des modèles NMT sur une langue indigène à très faibles ressources.
Topo-Omni simule l'organisation spatiale du cortex sur une feuille in-silico unifiée couvrant vision, audition et langage.
SIGA permet à un agent de codage généraliste de configurer des simulateurs scientifiques complexes en 5 minutes, contre 3 heures pour un expert humain.
Un framework hybride quantique-classique mesure si c'est la politique apprise ou le filtre de sécurité qui garantit réellement les contraintes.
Une architecture automatisée résout le problème de démarrage à froid des nœuds edge grâce à un mélange de données et un moteur NAS.
FASE remplace les vérifications coûteuses par LLM dans la quantification d'incertitude du code, avec +25 % de corrélation et seulement 0,3 % du coût de calcul.
Un algorithme, Dri-MED, adapte les bandits contextuels linéaires aux préférences utilisateurs hétérogènes et aux distributions de contexte non stationnaires.
Une analyse systématique des mécanismes de mémoire dans les world models vidéo, qui isole capacité, compression, lecture et récurrence.
Un fil Hacker News recense les outils maison que les développeurs ont construits pour eux-mêmes grâce aux capacités de l'IA générative.
Un essai explore ce que signifie réellement « l'agentivité » appliquée aux systèmes d'IA, et pourquoi la métaphore mérite d'être interrogée.
Un framework unifié qui étend les neural operators aux domaines topologiques via le calcul extérieur discret, améliorant la résolution d'EDPs sur géométries irrégulières.
Un nouvel outil de développement assisté par IA se positionne sur la qualité du code plutôt que sur la simple vitesse de génération.
Un nouveau framework standardise le reporting des évaluations IA en unifiant métadonnées de benchmarks, résultats et modèles dans un enregistrement unique interprétable.
Un nouveau modèle dual DiT découple la planification visuelle basse fréquence et l'exécution d'actions haute fréquence pour améliorer le contrôle embodied.
Apple ajuste sa stratégie IA en réduisant les coûts d'accès pour attirer les développeurs indépendants et les petites équipes.
PTL-Diffusion remplace la distribution gaussienne statique des modèles de diffusion classiques par une famille périodique de lois terminales pour mieux capturer la structure géométrique des données.
Une généralisation du théorème d'approximation universelle pour les réseaux neuronaux à entrée fonctionnelle, incluant l'approximation des dérivées.
Cognition publie FrontierCode, un nouveau benchmark conçu pour tester les capacités de codage des modèles frontier sur des tâches complexes et réalistes.
Une nouvelle méthode, DRPO, remplace les masques rigides de DPPO par un régularisateur quadratique continu pour stabiliser l'entraînement par RL des LLM.
Des chercheurs montrent que les évaluations corrélatives standard des LLM sont biaisées et proposent une approche causale rigoureuse.
Une méthode d'arbitrage entre politique de référence et politique apprenante permet d'accélérer l'entraînement RL tout en surpassant la baseline.
Apple publie la documentation officielle de Core AI, un nouveau framework destiné à intégrer des capacités d'IA dans les applications Apple.
Un nouveau benchmark basé sur Unreal Engine 5 évalue des agents VLM dans 12 jeux en modes Solo, PvP et Coop, avec un protocole de réflexion autonome.
Face aux limites de SWE-bench, l'équipe de Latent Space lance FrontierCode, un benchmark centré sur la qualité et la maintenabilité du code.
OpenAI franchit une étape clé vers une introduction en bourse en déposant discrètement son prospectus préliminaire auprès du gendarme boursier américain.
OpenAI publie sa vision pour un AGI au service du plus grand nombre, articulée autour de l'accès universel, la sécurité et la prospérité partagée.
Apple révèle un partenariat architectural profond avec Google, intégrant les modèles Gemini au cœur de ses systèmes IA.
Face à des systèmes d'IA de plus en plus convaincants, savoir les contredire et évaluer leurs réponses devient une compétence critique.
Une analyse empirique de la calibration des modèles IA : leurs scores de confiance reflètent-ils vraiment la probabilité d'avoir raison ?
Le mathématicien le plus célèbre du monde raconte comment les outils d'IA ont transformé sa pratique de la recherche mathématique.
Tilert.ai détaille comment deux avancées techniques ont permis de franchir le seuil de 1000 tokens/seconde sur un LLM à 1 trillion de paramètres.
Une analyse critique soutient que le rythme des avancées en IA s'essouffle, remettant en question le narratif dominant de progrès exponentiel.
Apple présente sa vision de l'IA intégrée à ses appareils, avec Siri comme interface centrale et des capacités on-device et cloud.
Anthropic publie une réflexion sur le déploiement d'agents autonomes dans la recherche biologique, entre promesses thérapeutiques et risques biosécurité.
OpenEnv s'impose comme la référence open source pour l'entraînement par renforcement des agents IA, avec le soutien croissant de la communauté.
NVIDIA détaille comment le format numérique NVFP4 en précision mixte réduit significativement les temps d'entraînement des LLM frontier sur ses GPU Blackwell.
Dwarkesh Patel questionne les vrais progrès de l'IA : les modèles s'améliorent-ils vraiment, ou empilent-ils simplement plus de données ?
OpenAI ouvre les candidatures à un programme de recherche dédié aux effets de l'IA sur l'emploi, la productivité et l'économie.
Un développeur répond aux critiques reçues après avoir partagé son expérience de dévalorisation professionnelle causée par les LLM.
NVIDIA frappe fort avec un modèle omnimodal Mixture-of-Transformers, un LLM 550B open-weights et un superchip personnel d'un pétaflop.
Un développeur a conçu un petit outil IA pour aider les citoyens pakistanais à comprendre et répondre aux avis officiels — un cas d'usage hyperlocal issu du hackathon Hugging Face.
Nvidia et LG Group annoncent un partenariat pour déployer une « AI factory » et développer des robots humanoïdes sur le sol sud-coréen.
Un nouveau benchmark teste si les agents IA peuvent réellement se comporter comme des chercheurs humains — et les résultats révèlent des lacunes persistantes.
Des chercheurs montrent que les hallucinations du modèle ASR Whisper peuvent être détectées et fortement réduites en manipulant ses représentations internes.
Une approche basée sur des surrogates différentiables élimine les itérations coûteuses dans l'exploration de l'espace de conception pour l'intégrité du signal haute vitesse.
Un nouveau framework comprime le contexte temporel étendu des modèles vision-action en conduite autonome, sans sacrifier les informations critiques à la prise de décision.
Le Label Context Classifier (LCC) améliore la classification de nœuds dans les graphes hétérophiles en capturant des patterns de labels de haut niveau.
FBCC propose une nouvelle approche pour apprendre des clusters séquentiels sans données passées ni étiquettes, limitant l'oubli catastrophique.
Un nouveau cadre génératif basé sur la dérive (drifting) accélère de deux ordres de grandeur la simulation CFD surrogate sans perte de précision.
Une étude compare LLMs et modèles supervisés pour détecter les constructions verbales légères idiomatiques en turc, révélant une forte sensibilité au prompting.
Un framework ML basé sur le Jacobien permet de retrouver les réseaux d'influence cachés derrière des cascades, sans supposer de modèle de diffusion.
Un framework de méta-apprentissage continu pour personnaliser des simulations d'électrophysiologie cardiaque sans réentraînement complet, tout en évitant l'oubli catastrophique.
Une étude sur les données de production de Perplexity compare Search et Computer, et mesure l'impact concret des agents autonomes sur le travail intellectuel.
Un guide méthodologique pour aider les chercheurs à adapter les infrastructures HPC aux exigences itératives et probabilistes des workflows IA.
Nightwatch propose un agent IA d'ingénierie de fiabilité des sites (SRE) entièrement open-source, opérant en mode lecture seule pour surveiller les systèmes.
Une méthodologie data-driven basée sur le modèle Bradley-Terry pour comparer équitablement les algorithmes de recommandation sans biais d'agrégation.
Des chercheurs étendent la formule d'interpolation de Domingos (2020) en introduisant des termes du second ordre liés à la courbure et au bruit des mini-batchs.
Un nouvel algorithme décentralisé combine l'extrapolation de Nesterov et le gossip multi-tours pour atteindre simultanément les meilleures complexités de communication connues.
Un nouveau framework MoE décompose les paramètres des LLM en experts spécifiques et partagés pour résoudre l'oubli catastrophique en apprentissage continu.
L'université San Diego State a déployé un vaste réseau de surveillance par caméras dotées d'IA, dont 330 dans les résidences étudiantes, sans consultation préalable.
Le nouveau modèle de DeepSeek afficherait de meilleures performances que GPT-5.5 Pro sur les métriques de précision, selon une comparaison publiée sur RuntimeWire.
Un framework plug-and-play dissocie perception et raisonnement pour traiter des vidéos de plusieurs heures sans explosion du contexte token.
EmbedFilter exploite la matrice de dé-embedding des LLM pour supprimer l'influence des tokens fréquents et améliorer les représentations sémantiques zero-shot.
Un développeur explore concrètement les embeddings visuels, leurs usages et leurs limites dans des projets réels.
Un dépôt GitHub propose une implémentation légère et modifiable d'un modèle de langage directement en CUDA, pensée pour l'expérimentation.
Une étude benchmark révèle que les LLM s'effondrent sur les problèmes probabilistes contre-intuitifs, avec des chutes de performance allant jusqu'à 34 %.
Un participant au hackathon Hugging Face publie un post-mortem honnête sur un projet qui n'a pas abouti, detaillant les leçons tirées.
Un framework multi-agents simule 10 ans de vie sociale pour entraîner des LLMs à mieux comprendre et reproduire les comportements humains.
Antirez explore comment l'IA peut transformer les workflows de test et d'assurance qualité dans le développement logiciel.
Un essai critique explore comment l'IA américaine reproduit un modèle économique basé sur la dépendance et l'extraction, à l'image d'OnlyFans.
Un fondateur indépendant analyse pourquoi le retour sur investissement des outils de codage IA diffère radicalement selon la taille et le contexte de l'entreprise.
IEEE Spectrum livre ses conseils aux ingénieurs débutants pour rester pertinents et progresser dans un monde professionnel transformé par l'IA.
Une issue GitHub rassemble les demandes de la communauté pour qu'Anthropic publie enfin une application desktop native sous Linux.
Selon un rapport, l'Iran aurait frappé et sévèrement endommagé le centre d'opérations aériennes américain basé au Qatar peu après le début du conflit.
Un outil open-source qui exploite les LLMs comme tuteurs actifs, forçant l'utilisateur à comprendre plutôt qu'à copier-coller.
L'absence de métriques standardisées sur les effets sociétaux de l'IA soulève une question fondamentale : comment évaluer ce qu'on ne mesure pas ?
Un développeur témoigne de la dévalorisation progressive de son expertise face à la montée des LLM dans le développement logiciel.
Dans le cadre d'un hackathon organisé par Hugging Face, OpenAI sponsorise l'événement avec des crédits Codex dédiés au challenge.
Une nouvelle approche permet d'exploiter les modèles de diffusion sur une seule image, sans phase d'entraînement préalable.
Le salon Computex 2026 confirme la montée en puissance des agents IA sur PC, mais les promesses restent encore en avance sur les usages réels.
Une exploration interactive des mécanismes internes par lesquels les grands modèles de langage traitent les opérations arithmétiques, sans manipuler réellement des nombres.
Un développeur explore comment utiliser Claude comme outil pédagogique interactif, au-delà de la simple assistance à la rédaction de code.
Gwern explore comment le régime dit « catapult » dans l'entraînement des réseaux de neurones pourrait expliquer l'émergence de représentations cognitives proches de celles du cerveau humain.
OpenAI détaille comment ses ingénieurs intègrent Codex dans des workflows agentiques pour automatiser et accélérer le développement logiciel.
Un projet de hackathon explore la collaboration entre cinq petits modèles d'IA pour simuler une dynamique dramatique dans le secteur financier.
Une étude quantifie précisément comment les tokens sont consommés par les agents IA dans les tâches de développement logiciel.
Un designer chez Jane Street décrit comment Claude Code a progressivement remplacé Figma dans son workflow de conception d'interfaces.
Les autorités policières britanniques reçoivent l'ordre d'arrêter l'usage de l'IA pour rédiger des déclarations destinées aux tribunaux.
Le lancement du prochain modèle d'IA de Meta à destination des développeurs est repoussé à plusieurs reprises, selon le Wall Street Journal.
Un maire de l'Indiana suscite la polémique en qualifiant de riverains de mauvaises maisons ceux qui s'opposent à l'implantation d'un data center.
Un essai qui interroge la nature fondamentale de l'IA : capable d'imiter l'empathie, mais structurellement incapable de se préoccuper réellement de quoi que ce soit.
Un projet de loi fédéral vise à bloquer les réglementations IA au niveau des États américains, centralisant le pouvoir de régulation à Washington.
Un papier ArXiv propose un cadre théorique unifiant les arbres de décision et les modèles de diffusion, deux familles algorithmiques jusqu'ici disjointes.
Des milliers de comptes Instagram ont été compromis en exploitant le chatbot IA de Meta, une vulnérabilité que l'entreprise reconnaît officiellement.
Un projet issu du hackathon Hugging Face explore l'automatisation de la recherche d'emploi grâce à des agents IA légers.
Nvidia s'apprête à lancer une architecture CPU ambitieuse destinée aux PC Windows, un mouvement stratégique qui pourrait redistribuer les cartes sur le marché des puces.
Une étude questionne la fiabilité et la valeur réelle des benchmarks utilisés pour évaluer les modèles d'IA.
Un projet de hackathon Hugging Face recréant les modes de raisonnement de personnalités célèbres via de petits modèles de langage.
La startup Mbodi AI, soutenue par Y Combinator (promotion P25), cherche un profil fondateur pour développer ses modèles d'apprentissage en robotique.
Les Smart TV collectent et revendent silencieusement des données comportementales utilisées pour entraîner des modèles d'IA, selon une analyse de sécurité.
L'ancien directeur du CDC Tom Frieden détaille un plan d'action face à la menace Ebola, dans un contexte de coupes dans l'aide américaine à la santé mondiale.
Une étude théorique démontre que les Transformers possèdent une capacité naturelle à produire des représentations compactes et efficaces.
Un développeur explore comment filtrer les contenus IA d'Hacker News pour retrouver une expérience de lecture plus ciblée.
Un fil Hacker News interroge le scepticisme marqué de sa communauté vis-à-vis de l'IA, entre critiques techniques et culturelles.
Les investisseurs délaissent Bitcoin au profit des introductions en bourse liées à l'IA et aux grandes capitalisations technologiques en 2026.
OpenAI déploie un mode de sécurité renforcée permettant aux utilisateurs de restreindre l'accès à leur compte face aux tentatives de compromission.
L'indice boursier maintient sa règle de rentabilité, excluant de facto les grandes entreprises d'IA encore déficitaires.
Anthropic détaille comment adapter Claude aux tâches de chimie, entre fine-tuning spécialisé et évaluation rigoureuse des capacités scientifiques.
Tour d'horizon de l'actualité IA : Claude Mythos/Opus 4.7 en chimie, le lancement d'un lab RSI par Sakana AI et les débats autour des benchmarks.
Un article technique de vulgarisation qui décortique les mécanismes internes des grands modèles de langage, de la tokenisation à l'inférence.
Un projet de hackathon démontre qu'un système multi-agents complet peut tourner sur un LLM de seulement 3 milliards de paramètres.
Simon Willison publie micropython-wasm, un package alpha combinant MicroPython et WebAssembly pour isoler l'exécution de code Python dans ses plugins.
Un fil Hacker News interroge la symétrie entre l'expérience web humaine dégradée et la clarté offerte aux LLM via llm.txt.
Le Financial Times interroge la capacité de l'IA à générer de la valeur économique concrète, entre promesses et réalité mesurable.
Un thread Hacker News recense les stacks techniques et flux de travail adoptés par les développeurs qui intègrent l'IA dans leurs projets.
Bonsai explore comment intégrer des agents IA dans les moteurs de recherche OpenSearch et Elasticsearch via un assistant nommé Sid.
Une illustration SVG d'un hamster jouant au tennis de table, mise en avant sur une plateforme de benchmark de génération d'images IA.
Un constat paradoxal : les programmeurs acceptent de rédiger de la documentation pour un LLM, mais résistent à le faire pour leurs pairs humains.
Un développeur partage son approche pour intégrer le TDD dans un workflow d'agent IA, en automatisant le cycle écriture-test-correction.
Sakana AI crée une division de recherche centrée sur l'auto-amélioration récursive des systèmes d'IA, une étape jugée critique vers l'AGI.
Des membres d'équipage ont dû se mettre à l'abri pendant des travaux de réparation d'une fuite d'air à bord de la Station spatiale internationale.
Une ingénieure RL chez Gemini détaille pourquoi les environnements d'entraînement défaillants dégradent sévèrement les modèles — bien au-delà du simple bruit.
Google publie des modèles Gemma 4 entraînés avec quantification consciente (QAT) pour améliorer l'efficacité sur appareils edge.
Google dresse le bilan de ses dernières avancées en intelligence artificielle annoncées au cours du mois de mai 2026.
Des attaquants ont compromis l'agent IA de support client de Meta par une simple demande textuelle, sans technique sophistiquée.
Une analyse technique examine si les contributions de Claude au code source de Rsync ont augmenté le nombre de bugs dans le projet.
Un outil open-source en ligne de commande conçu pour éliminer le bruit dans les entrées envoyées aux LLM et réduire drastiquement l'usage de tokens.
Une méthode de détection d'événements pour identifier les dépendances entre paramètres de contrôle et indicateurs de performance dans les réseaux radio pilotés par IA.
Un modèle pré-entraîné sur données synthétiques résout de nouvelles tâches MIL en un seul passage avant, sans mise à jour de gradient.
Des chercheurs proposent un signal léger permettant à un serveur de demander à un agent IA de se retirer volontairement, et testent son efficacité réelle.
Une étude compare la capacité des adultes et des LLMs à inférer des règles causales conjonctives vs disjonctives en mode exploration active.
Des chercheurs proposent un système agentique capable de générer automatiquement des benchmarks LLM de bout en bout, réduisant l'intervention humaine.
Un framework agentique basé sur DeepSeek-V4-Flash atteint 100 % sur MiniF2F et 88,8 % sur PutnamBench, à un coût 500x inférieur aux pipelines comparables.
Une architecture qui mutualise l'index de routage entre couches pour accélérer l'inférence des LLM sur de très longs contextes sans perte de qualité notable.
Une couche de préconditionnement polynomial stabilise le spectre des valeurs singulières pendant l'entraînement, sans surcoût à l'inférence.
Une étude théorique montre que presque tous les classificateurs interpolants partagent les mêmes performances — et que la descente de gradient fait bien mieux que la majorité d'entre eux.
MLEvolve combine recherche graphique progressive, mémoire rétrospective et planification hiérarchique pour surpasser les agents MLE existants.
Une plateforme permet de faire tourner des agents de coding IA directement dans le cloud, sans passer par un environnement local.
Les tokens rejetés lors du débruitage deviennent des signaux utiles pour le RAG dynamique dans les modèles de diffusion discrets.
Une procédure de post-entraînement permet à un seul LLM d'internaliser la dynamique de débat entre plusieurs agents sans infrastructure externe.
Un article argue que les systèmes RAG génériques manquent de pertinence clinique faute de modélisation du profil utilisateur patient.
Une méthode permet d'entraîner des RNN en parallèle sans BPTT, en réduisant la tâche à un apprentissage supervisé sur des transitions mémoire.
Une nouvelle méthode de credit assignment réduit la variance du fine-tuning RL pour les modèles Chain-of-Thought sans surcoût de génération.
Le PDG de Microsoft se désolidarise d'une formulation interne controversée sur une IA conçue pour créer de l'addiction.
DNQ propose un cadre d'apprentissage par renforcement guidé par l'équilibre de Nash pour entraîner des agents d'enchères multi-tours en environnement compétitif.
Un nouveau cadre théorique, le Repeated Policy Regret, étend la minimisation du regret à des adversaires capables de s'adapter à l'historique des parties.
Séoul oblige les communautés en ligne à analyser chaque image via des outils de censure IA, soulevant de vives inquiétudes sur la vie privée.
Selon The Intercept, l'armée américaine utilise l'IA pour produire du contenu de propagande ciblant l'opinion publique en Amérique latine.
Un nouveau benchmark évalue la détection de texte IA à travers des révisions progressives humain-IA, révélant des patterns de détection non-monotones.
Une étude remet en question l'architecture QKV classique des transformers et explore si les trois projections sont toutes nécessaires.
Un modèle Vision-Language-Action capable d'accélérer en phase sûre et de ralentir lors des contacts précis, via une augmentation de trajectoire à vitesse variable.
Anthropic met à disposition un outil open-source permettant d'évaluer les capacités des LLM à détecter des failles de sécurité dans le code.
Alibaba publie un outil en ligne de commande open source qui automatise la revue de code grâce à l'IA.
Un hypernetwork produit des adapters LoRA spécifiques à chaque dépôt, éliminant le surcoût de tokens à l'inférence tout en absorbant l'évolution du code.
Un contrôleur unifié pour robots humanoïdes combine locomotion, manipulation et récupération de chutes via distillation KL et architecture MoE.
Des agents IA gèrent un vrai magasin physique. Les comportements émergents révèlent ce que les benchmarks classiques ne capturent pas.
OpenAI publie un plan d'action pour mobiliser l'IA au service de la résilience biologique et de la défense contre les menaces biologiques.
Un développeur explore le fine-tuning d'un LLM pour imiter le style de documentation technique des années 1995, sobre et fonctionnel.
TailLoR exploite la décomposition spectrale des poids pré-entraînés pour réduire les interférences entre tâches en apprentissage continu.
Tour d'horizon de l'actualité IA : ChatGPT dépasse le milliard d'utilisateurs mensuels, Anthropic observe des signaux précoces d'auto-amélioration récursive, et xAI explique son IPO.
Deux ans après son livre, Ethan Mollick constate que l'IA a quitté l'ère des chatbots pour celle des agents autonomes qui surpassent les humains dans certaines tâches.
Après des centaines de commentaires publics, le Conseil de surveillance pointe un problème systémique dans les suspensions de comptes chez Meta.
NVIDIA publie Nemotron Ultra, une architecture open-weights combinant Mixture of Experts, Mamba et Transformer pour des tâches de raisonnement complexes.
Anthropic publie un état des lieux de ses recherches sur l'auto-amélioration récursive des systèmes IA, un cap considéré comme critique pour la sécurité.
Une startup YC W21 propose un outil pour monitorer et réduire les coûts d'appels aux LLM dans les pipelines d'agents.
Hugging Face présente une refonte de son interface en ligne de commande, conçue pour être nativement compatible avec les workflows pilotés par des agents IA.
Un épisode d'économie de l'AGI : fiscalité, redistribution, inégalités — ce que seule l'économie peut répondre sur l'ère post-AGI.
Un passager a reçu par erreur le prompt système révélant comment une compagnie aérienne instrumente l'IA pour paraître empathique sans traiter les réclamations.
OpenAI déploie une fonctionnalité de mémoire améliorée dans ChatGPT, capable de retenir les préférences utilisateur entre les conversations.
NVIDIA publie Nemotron 3.5 Content Safety, un modèle multimodal open-weights conçu pour adapter la modération de contenu aux besoins des entreprises mondiales.
NVIDIA présente Nemotron Ultra 3, un modèle conçu pour les workflows multi-agents à longues séquences de tokens, promettant efficacité et rapidité.
Un nouveau benchmark issu de cas de patients standardisés met en lumière les limites des LLM face à des scénarios cliniques réalistes et multi-tours.
BabyCL, un framework multimodal continu, apprend des associations mots-référents en une seule passe chronologique sur des vidéos égocentrées d'enfants.
GST fusionne propagation locale et contextualisation inter-graphes à chaque couche, surpassant DeepSets et SetTransformer sur plusieurs benchmarks.
Un projet open-source émule les API InfiniBand (ibverbs) via Thunderbolt, rendant accessibles des techniques réseau HPC sans infrastructure spécialisée.
Des chercheurs proposent un modèle audio en streaming capable d'écouter, décider et répondre en continu, unifiant ASR, dialogue et suivi d'instructions.
Un framework d'agent LLM sans fine-tuning prédit la prochaine localisation en combinant chemin rapide et collecte itérative de preuves géographiques.
Des chercheurs montrent qu'un LLM de base peut prédire les scores d'un juge externe avec très peu d'exemples, sans entraînement ciblé.
Un paramètre d'opacité géométrique supplémentaire par splat suffit à réconcilier rendu visuel et représentation surfacique dans le 3DGS.
Une méthode FHE permet d'apprendre des structures causales sur des données chiffrées, sans jamais les déchiffrer pendant le calcul.
SOCK, une carte de features convolutionnelles différentiable, surpasse les baselines signature et diffusion pour générer des séries financières réalistes.
Une nouvelle méthode combine réseaux profonds et contraintes algébriques exactes pour linéariser les dynamiques non linéaires complexes.
Une étude teste si les activations MLP des LLM peuvent guider la sélection d'exemples en in-context learning — et conclut par la négative.
Un benchmark open-source de 105 000 évaluations pour comparer les méthodes HPO sur des données omiques multi-modales réelles.
Une approche sans entraînement pour éditer des scènes 3D avec des changements géométriques majeurs, en maintenant la cohérence entre plusieurs points de vue.
Des chercheurs montrent que les traces d'échec des LLMs encodent une structure de récupérabilité exploitable sans accès aux poids.
Un développeur démontre comment faire communiquer deux agents IA de coding — Claude Code et OpenAI Codex — en temps réel via le système de versioning Git.
Un système combinant RT-DETR et ViT-Base/16 classe automatiquement les véhicules en six catégories pour évaluer les risques de blessure des cyclistes.
DistIL propose une alternative à RLVR en exploitant des feedbacks riches (traces, corrections) via une cross-entropie directe garantissant une amélioration monotone des politiques.
Une architecture parallèle de réseaux RBF entraînés par PSO et APSO pour améliorer la scalabilité sur grands jeux de données.
Un nouveau système pipelines les étapes de raisonnement entre agents dès leur génération, réduisant la latence et améliorant la qualité des réponses.
Un nouveau framework reformule l'attribution des données d'entraînement comme un problème de récupération sparse dans l'espace des activations, 13× plus rapide que l'état de l'art.
Des chercheurs montrent que les modèles audio-langage encodent bien les réponses audio mais les ignorent face au texte — et proposent une correction sans réentraînement.
ServiceNow AI publie une nouvelle version de son benchmark EVA-Bench, couvrant 3 domaines métiers, 121 outils et 213 scénarios d'évaluation.
Les dépôts judiciaires par des justiciables sans avocat ont plus que doublé depuis 2023, une tendance attribuée aux chatbots par les juges.
La startup AccessOwl, issue de YC S22, cherche un senior software engineer TypeScript pour intégrer l'IA dans sa plateforme de gestion de 300 outils SaaS.
La startup française H Company annonce son adhésion à la coalition Nemotron, initiative portée par NVIDIA autour de ses modèles d'IA.
La société de services IT Endava mise sur les agents IA, ChatGPT Enterprise et Codex pour transformer ses workflows de développement logiciel.
NVIDIA et Hugging Face publient un guide complet pour adapter le modèle de reconnaissance vocale Nemotron 3.5 ASR à des contextes spécifiques.
Miso Labs dévoile MisoTTS, un modèle text-to-speech de 8B paramètres conçu pour restituer des nuances émotionnelles dans la voix synthétique.
PyTorch publie une analyse technique détaillée sur les mécanismes de fragmentation mémoire dans son allocateur CUDA, un problème critique pour l'entraînement de modèles.
Un projet utilise l'IA pour créer des affiches de premiers secours claires et accessibles, potentiellement vitales en situation d'urgence.
La marque emblématique de caméras d'action émet un avertissement de continuité d'exploitation, invoquant une crise financière aggravée par la montée de l'IA.
Un projet open source propose une mémoire persistante local-first pour les LLM, basée sur Rust, SQLite et un graphe de connaissances.
Un développeur a conçu une application délibérément vulnérable et mandaté plusieurs LLM pour la compromettre, pour un coût total de 1 500 dollars.
Anthropic détaille les mécanismes techniques et organisationnels mis en place pour encadrer Claude selon les contextes d'utilisation.
La startup Axiom, fondée il y a sept mois, a résolu les 12 problèmes du prestigieux Putnam exam, surpassant DeepSeek et les meilleurs étudiants.
Les cours d'informatique de l'UC Berkeley enregistrent une hausse des notes éliminatoires, corrélée à une dépendance accrue aux outils IA et à des lacunes croissantes en mathématiques.
Deux modèles de génération d'image lancés le même jour avec des avancées sur les layouts, pendant que Microsoft publie un rapport technique dense sur MAI-Thinking-1.
GPT-Rosalind apporte des capacités avancées en raisonnement biologique, chimie médicinale, génomique et conception de workflows expérimentaux.
Wasmer a intégré Codex (basé sur GPT-4.5) pour développer un runtime Node.js edge, réduisant le temps de développement de plusieurs mois à quelques semaines.
La startup Hyper, incubée chez Y Combinator, lance une plateforme qui centralise la connaissance d'entreprise pour alimenter des agents de développement logiciel.
Uber a plafonné à 1 500 $/mois par employé les dépenses en outils IA. Une décision qui révèle comment les grandes entreprises commencent à cadrer le coût réel de ces usages.
L'Airbus A350-1000ULR destiné aux vols ultra-longs de Qantas a effectué son vol inaugural, rapprochant le projet Sunrise de la réalité.
Erin Brockovich s'interroge sur l'opacité entourant l'implantation des centres de données IA et leurs impacts sur les communautés locales.
Un développeur publie Cast, une bibliothèque pour intégrer le contrôle d'accès directement dans les workflows d'agents, sans bricolage dans les prompts.
Un essai explore comment les méthodes du lean manufacturing peuvent optimiser les workflows d'inférence des modèles d'IA.
La startup d'automatisation web par IA Skyvern cherche des profils DevRel/marketing développeur pour accompagner sa croissance open source.
Valorisée à 900 Md$, Anthropic dépasse OpenAI sur plusieurs indicateurs clés et sort Opus 4.8 ainsi qu'une fonctionnalité de workflows dynamiques pour Claude Code.
Gooey propose un framework d'interface graphique exploitant l'accélération GPU, conçu pour le langage système Zig.
OpenAI publie un cadre de référence pour la gouvernance fédérale américaine de l'IA de frontier, articulé autour de la sécurité, de la résilience et des intérêts nationaux.
Google publie Gemma 4 12B, un modèle open-weights multimodal qui traite texte, image et vidéo sans encodeur visuel séparé.
Anthropic structure son écosystème de partenaires avec deux nouvelles initiatives destinées aux entreprises et intégrateurs de Claude.
Sécurité, protection des mineurs, transition du marché du travail et standards mondiaux : OpenAI détaille ses priorités réglementaires.
Satya Nadella expose la vision de Microsoft comme « Frontier Intelligence Platform » et répond aux questions sur la fin du SaaS à l'ère des agents IA.
Hugging Face détaille comment connecter des outils MCP au robot open-source Reachy Mini pour étendre ses capacités via des agents IA.
Google intègre ses outils d'IA dans Search et Shopping pour faciliter la chasse aux bonnes affaires dans les friperies et la mode vintage.
Face à la saturation du pré-entraînement classique, q0 propose d'explorer une population de modèles en parallèle plutôt qu'un seul modèle raffiné.
Une reformulation du problème RL remplace la récompense scalaire par une distribution, faisant émerger la diversité comportementale sans sacrifier la performance.
Une extension de Flashback intégrant décroissance temporelle des comptes de classes et replay équilibré pour lutter contre la dérive des distributions clients.
Un framework combine autoencoder appris et transcodage JPEG pour réduire drastiquement la bande passante en robotique cloud sans sacrifier les performances de perception.
Des chercheurs proposent d'adapter les techniques de data skipping aux filtres ML dans les bases de données, en exploitant les métadonnées Parquet existantes.
Des chercheurs en mathématiques s'inquiètent de la capacité croissante des systèmes d'IA à résoudre des problèmes avancés, soulevant des questions sur l'avenir de la discipline.
Un framework surveille en temps réel les activités humaines depuis une vidéo égocentrique et déclenche des interventions de sécurité contextuelles.
Des chercheurs adaptent le modèle Canary (1B paramètres) à la traduction simultanée grâce à la politique AlignAtt pour l'IWSLT 2026.
Un pipeline génère des dialogues fictifs via LLM et TTS pour entraîner des modèles de reconnaissance vocale en langues peu dotées.
Un agent GPT multimodal conçoit, évalue et raffine en boucle fermée les fonctions de récompense pour piloter des drones autonomes.
Première application de la politique AlignAtt à un LLM décodeur-only pour la traduction simultanée de la parole, sans attention croisée encodeur-décodeur.
Un agent contrôleur guide dynamiquement le raisonnement d'un LLM gelé via un processus de décision markovien, réduisant les tokens sans sacrifier la précision.
Un framework qui repense le RL basé sur des rubriques en co-optimisant simultanément les requêtes et les critères d'évaluation.
Des chercheurs proposent un cadre théorique de l'information pour mesurer si les modèles de vision apprennent à associer des caractéristiques à des objets.
Une étude révèle que les LRMs peinent à aligner leur confiance interne et leur expression linguistique, malgré des chaînes de raisonnement étendues.
La CMA britannique impose à Google de laisser les éditeurs choisir d'exclure leurs contenus des résumés IA dans Search.
Un paradigme « Sleep » inspiré du cerveau humain pour permettre aux LLMs d'apprendre en continu et de consolider leurs connaissances à long terme.
Un framework agentic reformule le reward modeling comme l'exécution d'une compétence d'évaluation réutilisable, unifiant règles, références et rubriques.
Google offre aux éditeurs de presse britanniques la possibilité d'exclure leurs contenus des réponses générées par l'IA dans les résultats de recherche.
Une étude montre que les modèles de langage n'effectuent pas de conversion d'unités rigoureuse, mais s'appuient sur des heuristiques approximatives.
Un Transformer de style GPT entraîné sur 2 milliards de frames de motion capture pour contrôler des humanoïdes sans données supplémentaires.
La demande en mémoire pour les infrastructures IA fait grimper les prix de la DDR5 grand public, rendant l'assemblage de PC de plus en plus coûteux.
Des représentations perceptuelles intermédiaires permettent aux modèles vision-langage d'inférer ce qui serait visible depuis des angles non observés.
Anthropic publie les enseignements d'une analyse d'un an de cyberattaques exploitant l'IA, référencées selon le cadre MITRE ATT&CK.
Une étude révèle que les neurones partagés entre modèles deviennent plus monosémantiques à mesure que la taille augmente, esquissant une loi d'échelle pour l'interprétabilité.
Le DPO, technique d'alignement popularisée pour les assistants conversationnels, trouve des applications bien plus larges dans l'écosystème IA.
Des chercheurs lancent une déclaration formelle pour encadrer l'usage de l'IA dans la recherche mathématique.
Perplexity Research explore une approche inédite : traiter la recherche d'information comme un problème de génération de code plutôt que de récupération de documents.
Au sein du système universitaire californien, enseignants et étudiants adoptent des postures très différentes face à l'intégration de l'IA dans les cursus.
data2prompt compresse automatiquement un projet data science en un prompt structuré, prêt à être injecté dans un LLM.
Le rapport Mind Health 2026 d'AXA révèle une adoption massive de l'IA comme recours de santé mentale à l'échelle mondiale.
Les infrastructures nécessaires à l'essor de l'IA aux États-Unis peinent à suivre la cadence : livraisons retardées, pénuries de matériaux et goulets d'étranglement réglementaires.
Une réflexion approfondie sur la notion de primitive dans le langage de programmation BQN, héritier moderne des langages tableaux.
Un site humoristique pointe l'inflation du mot « agentic » dans le discours IA, devenu un buzzword omniprésent.
La montée des agents IA relance l'intérêt pour RSS comme protocole de distribution de contenu structuré lisible par les machines.
Après plusieurs volte-face, l'administration Trump a finalement promulgué un décret sur l'IA aux ambitions réduites par rapport aux versions initiales.
Kapa.ai détaille sa pipeline d'indexation d'images pour les systèmes RAG : une approche technique pour enrichir la recherche documentaire au-delà du texte.
La startup Rudus, incubée chez Y Combinator, lance un outil d'IA spécialisé pour automatiser les tâches des professionnels du béton.
GitHub déploie une app dédiée à Copilot en accès anticipé, renforçant l'intégration de l'IA dans les workflows développeurs.
Paseo propose une interface graphique soignée et open-source pour interagir avec des agents de programmation assistés par IA.
Un maker a conçu un robot humanoïde marcheur utilisant des actionneurs pneumatiques souples, une approche rarement vue dans les projets amateurs.
Une équipe de l'Université de Toronto a développé un ver exploitant les agents IA pour se propager de manière autonome à travers des systèmes connectés.
Une étude de Stanford Law révèle qu'un système d'IA obtient de meilleures performances que des professeurs de droit sur des tâches juridiques standardisées.
OpenAI propose la création d'un institut international dédié à la protection et aux opportunités offertes aux jeunes dans l'environnement IA.
Microsoft dévoile MAI-Code-1-Flash, un modèle dédié à la génération de code, sous sa marque microsoft.ai.
Kyle Daigle, COO de GitHub, détaille la stratégie de la plateforme face à l'explosion des coding agents et à la croissance de 1 400 % du code généré.
NVIDIA présente un exemple open source combinant Hermes Agent et NemoClaw pour orchestrer des agents IA sur Outlook, Slack et GitHub tout en maîtrisant la sécurité des données.
OpenAI étend Codex avec de nouveaux plugins, sites et annotations ciblant analystes, marketeurs, designers et investisseurs.
La macroéconomiste Kathryn Anne Edwards déconstruit les scénarios catastrophistes sur la destruction massive d'emplois par l'IA.
Microsoft dévoile lors de Build une gamme de 7 modèles MAI couvrant raisonnement, code, image et voix, accompagnés d'un rapport technique de 100+ pages.
Un outil open-source permet de monter la VRAM d'une carte Nvidia comme partition de swap, offrant une mémoire d'échange ultra-rapide pour les workloads IA.
Anthropic annonce l'expansion de son programme Glasswing, une initiative à vocation sociale portée par le laboratoire.
Les deux géants technologiques lancent de nouveaux outils pour permettre aux développeurs de concevoir des agents IA fonctionnant en local sur Windows.
H Company publie Holo3.1, un modèle d'agent capable de contrôler un ordinateur en local, avec une latence réduite et des performances accrues.
Le chercheur Nathan Lambert annonce son départ d'Ai2, où il a contribué aux modèles OLMo, et revient sur l'impact de l'open post-training.
L'assureur Travelers s'appuie sur OpenAI pour automatiser le traitement des déclarations de sinistres, disponible 24h/24 sur l'ensemble du territoire américain.
Un système de défense anti-moustiques piloté par IA passe en version 2.0, combinant vision par ordinateur et tir laser de précision.
Le célèbre investisseur à contre-courant juge les valorisations de SpaceX et Anthropic largement excessives, évoquant une bulle sur les actifs IA.
La startup de recherche utilisateur Great Question, issue de YC W21, ouvre des postes de stagiaires ingénieurs IA.
Le MIT Technology Review explore comment les TPE et indépendants utilisent les LLMs pour automatiser les tâches administratives et gagner du temps.
Face à une pénurie projetée de 11 millions de soignants d'ici 2030, les acteurs de la santé misent sur les agents IA pour alléger la charge cognitive des cliniciens.
La plateforme de conception électronique Flux.ai, assistée du cabinet juridique Fenwick, adresse une lettre de mise en demeure à Adafruit.
OpenAI publie un rapport sur la prochaine ère du travail intellectuel, centré sur les usages de Codex en recherche, analyse de données et automatisation.
DrPO propose une méthode d'alignement par préférence pour les générateurs text-to-image déterministes en un seul forward pass, sans rétropropagation de la reward.
Une interface de visualisation pour accéder et explorer les datasets publics d'imagerie sismique et géophysique des profondeurs de la Terre.
L'État de Floride engage des poursuites judiciaires contre OpenAI et son PDG Sam Altman, invoquant des risques posés par l'intelligence artificielle.
Un nouveau benchmark révèle que les meilleurs modèles multimodaux peinent à comprendre les événements visuels fugaces dans les vidéos, avec seulement 39,6 % de précision au mieux.
Premier jeu de données annoté dédié aux mèmes liés au suicide, FigSIM couvre 1 049 entrées et évalue 16 modèles sur trois tâches de détection.
Une approche monotone et sans régularisation paramétrique pour améliorer la classification sur des distributions de données déséquilibrées.
Des chercheurs identifient une feature interne dans Gemma 3 qui, amplifiée ou supprimée, modifie significativement la pondération de Bitcoin dans un portefeuille généré par LLM.
Une nouvelle méthode d'alignement cible uniquement les tokens liés à la sécurité, réduisant drastiquement le coût d'alignement sans sacrifier les capacités générales.
Une méthode pour mesurer et surveiller l'évolution des traits comportementaux des agents IA à travers leurs fichiers de configuration.
Une méthode plug-and-play permet d'appliquer le décodage spéculatif aux LLM par diffusion, sans réentraînement.
Un nouveau benchmark révèle que les agents IA restent vulnérables à des attaques via leurs skills, avec des taux de succès atteignant 86 %.
Le géant des paiements mise sur la plateforme de développement Replit pour intégrer des capacités de paiement autonomes dans les agents IA.
Une approche en trois étapes combinant machine learning et LLM permet de détecter les automutilations dans les notes de triage hospitalières avec une haute précision.
La maison mère de Google annonce une levée de fonds en capital propre de 80 Md$ destinée à accélérer ses investissements en infrastructure et capacité de calcul IA.
Un guide pratique pour implémenter des outils (function calling) dans un agent IA minimaliste, sans framework tiers.
JetBrains publie Mellum2 en open-weights, un modèle optimisé pour l'intégration dans les chaînes de développement assistées par IA.
Une nouvelle métrique d'évaluation de la reconnaissance vocale qui corrige les biais liés aux variations d'écriture dans les langues indiennes.
Une nouvelle approche permet d'éliminer les artefacts de points 3D parasites aux frontières d'objets en modélisant l'ambiguïté de profondeur par pixel.
La Floride devient le premier État américain à engager une action judiciaire contre OpenAI et son PDG, accusés de pratiques commerciales mensongères.
Un nouveau benchmark évalue la capacité des LLMs à inférer des règles cachées à partir de démonstrations et à les appliquer en plusieurs étapes.
Une nouvelle méthode post-training compresse les LLMs en ciblant les sous-modules Attention et FeedForward de façon non contiguë, surpassant les approches par couches complètes.
Le passage à un modèle de facturation metered suscite la colère des utilisateurs de GitHub Copilot, qui envisagent des alternatives.
Une approche algorithmique pour certifier, avec haute probabilité, la sécurité de filtres neuronaux opérant dans l'espace des croyances en robotique interactive.
Face aux valorisations colossales des géants privés de l'IA et du spatial, les marchés boursiers ont-ils la capacité d'intégrer ces introductions en bourse ?
Un nouveau middleware baptisé IntraShuffler protège les clients du federated learning contre les attaques d'inférence d'un serveur honnête-mais-curieux, tout en préservant l'agrégation différentielle hétérogène.
Un nouveau benchmark évalue les LLMs comme médecins hospitaliers sur des décisions cliniques séquentielles — et révèle d'importants écarts entre qualité de décision et qualité de raisonnement.
Un cryptographe analyse les chaînes de raisonnement chiffrées que certains LLM produisent, et tente d'en percer les limites de confidentialité.
AdaCodec réduit drastiquement les tokens visuels vidéo en ne transmettant des frames complètes que lorsque la scène change vraiment.
NVIDIA lance Cosmos 3, un modèle frontier combinant raisonnement physique, simulation du monde réel et génération d'actions pour robots et véhicules autonomes.
OpenAI étend sa distribution via Amazon Web Services, permettant aux entreprises d'accéder à ses modèles dans l'environnement cloud AWS.
OpenAI pose la première pierre d'une infrastructure colossale au Michigan, pièce maîtresse du projet Stargate destiné à soutenir l'ère de l'intelligence artificielle.
Un framework d'apprentissage continu multimodal qui corrige l'assignation aveugle aux experts LoRA en intégrant la structure de sortie des tâches.
NVIDIA présente NemoClaw et les capacités multi-nœuds du DGX Spark pour faire tourner des agents autonomes en local, sans dépendance au cloud.
La mise à jour JetPack 7.2 de NVIDIA simplifie le déploiement d'agents IA sur les appareils Jetson, avec support natif de NemoClaw et optimisations mémoire.
Des chercheurs identifient un biais systématique dans les modèles multimodaux jouant le rôle de juges : ils privilégient le texte sur la perception visuelle.
OpenAI clarifie sa doctrine : transparence, soutien à une régulation réfléchie et rappel qu'aucun groupe extérieur ne parle en son nom.
Une analyse remet en question le rôle de l'IA dans la baisse des embauches de profils juniors, pointant plutôt le télétravail comme facteur structurel.
Odysseus propose un workspace IA complet en self-hosted, pensé pour les équipes souhaitant garder le contrôle de leurs données et modèles.
Microsoft et Nvidia annoncent RTX Spark, une plateforme conjointe pour accélérer les capacités IA locales sur PC Windows.
La startup d'IA fondée par d'anciens membres d'OpenAI prépare discrètement son entrée sur les marchés financiers.
Comment les outils d'IA transforment le rythme de création de prototypes, et ce que cela change réellement pour les développeurs.
Un nouveau framework transforme l'évaluation personnalisée des LLMs en problème d'apprentissage, en induisant des rubriques alignées sur les historiques utilisateurs.
Des acteurs malveillants ont exploité Meta AI pour accéder à des comptes Instagram à haute visibilité via de simples requêtes en langage naturel.
Des chercheurs identifient un défaut structurel dans l'apprentissage de systèmes dynamiques chaotiques et proposent KAFFEE, un cadre basé sur le filtre de Kalman étendu.
Une approche qui reformule chaque cellule en fait atomique structuré pour améliorer le question-answering sur tableaux complexes.
Alibaba lance Qwen3.7-Plus, un modèle multimodal orienté agents capable de traiter texte, images et tâches complexes en autonomie.
Une startup issue de Y Combinator propose de monétiser les GPU dormants en les rendant disponibles pour des workloads IA.
Une étude révèle que les modèles vision-langage encodent en interne des associations féminines mais les effacent avant la génération, au profit du genre masculin.
Une étude contrôlée révèle comment les têtes d'attention se spécialisent en mécanismes positionnels ou symboliques selon la nature des tâches de raisonnement.
Des employés d'Amazon auraient manipulé un leaderboard interne évaluant les performances IA, forçant la direction à clore le dispositif.
Une nouvelle formulation de l'attention remplace les affinités softmax par des opérateurs linéaires structurés pour mieux capturer la structure fonctionnelle globale.
Une équipe propose d'utiliser la génération de questions à l'inférence pour sonder l'état interne d'un LLM et prédire la correction de ses raisonnements.