500 articles

mai 2026

Toute la veille IA Fellow publiée en mai 2026.

18 mai · OUTILS
ASMTP – Un protocole SMTP adapté aux agents IA
ASMTP propose d'adapter le protocole e-mail SMTP pour permettre aux agents IA de communiquer entre eux de façon asynchrone et interopérable.
19 mai · OPINION
Les six derniers mois dans les LLM en cinq minutes
Un tour d'horizon condensé des avancées majeures dans le domaine des LLM sur les six derniers mois, signé Simon Willison.
19 mai · MARCHÉ
KPMG intègre Claude dans l'ensemble de ses activités et pour ses 276 000 collaborateurs
Le cabinet d'audit et de conseil KPMG noue une alliance stratégique avec Anthropic pour déployer Claude à grande échelle dans ses métiers.
19 mai · OPINION
Comment décrocher un poste dans un lab frontier (focus pretraining)
Vlad Feinberg (Google) publie ses conseils détaillés pour intégrer un lab frontier, avec un focus sur le pretraining, les kernels et les lois de scaling.
19 mai · OUTILS
Id-agent : une alternative aux UUID optimisée en tokens pour les agents IA
Un outil open-source proposant un système d'identifiants plus économes en tokens que les UUID classiques, conçu pour les workflows d'agents IA.
18 mai · RECHERCHE
Les méthodes de gradient adaptatif convergent-elles sous bruit à queue lourde ? Étude de cas d'AdaGrad
Une étude théorique démontre pour la première fois la convergence d'AdaGrad en optimisation non-convexe sous bruit à queue lourde, sans clipping ni connaissance préalable du tail index.
18 mai · RECHERCHE
Ensemblage de modèles de fondation tabulaires : plafond de diversité et piège de calibration
Combiner six TFMs modernes apporte à peine +0,18 % de précision pour 253× le coût de calcul — et certaines stratégies dégradent la calibration.
18 mai · RECHERCHE
PopPy : parallélisation automatique des applications Python d'IA composite
Un système compile et exécute en parallèle les appels aux modèles ML dans des apps Python complexes, atteignant jusqu'à 6,4× d'accélération.
18 mai · RECHERCHE
NORMA : un framework transformer pour personnaliser les intervalles de référence biologiques
Des chercheurs proposent NORMA, un modèle conditionnel basé sur les transformers, pour interpréter les biomarqueurs sanguins en combinant historique individuel et données populationnelles.
18 mai · RECHERCHE
Distillation de modèles fondationnels tabulaires pour les données de santé structurées
Des modèles légers conservent 90 % des performances des grands modèles tabulaires en santé, tout en s'exécutant 26× plus vite sur CPU.
18 mai · RECHERCHE
EnvFactory : mise à l'échelle des agents d'utilisation d'outils par synthèse d'environnements exécutables et RL robuste
Un framework automatisé génère des environnements exécutables et des trajectoires d'entraînement multi-tours réalistes pour améliorer les LLMs dans l'utilisation d'outils.
19 mai · SIGNAL
Nous Research modifie une issue GitHub pour effacer des accusations de plagiat sur Hermes Agent
Un éditeur aurait supprimé des allégations de plagiat d'une issue GitHub liée à Hermes Agent, suscitant des interrogations sur la transparence de Nous Research.
18 mai · RECHERCHE
Atténuation mémorisée par réseau récurrent pour le filtre de Kalman Sage-Husa appliqué aux drones
Un filtre de Kalman adaptatif combiné à un réseau récurrent hiérarchique améliore l'estimation d'état des UAV lors de pannes capteurs.
19 mai · OUTILS
LLMCap – Un proxy qui coupe les appels API LLM dès qu'un plafond de dépenses est atteint
LLMCap s'intercale entre vos appels API et les LLMs pour bloquer strictement les requêtes une fois votre budget en dollars épuisé.
18 mai · RECHERCHE
Semantic Generative Tuning pour les modèles multimodaux unifiés
Une nouvelle méthode de post-entraînement utilise la segmentation d'image comme proxy pour aligner compréhension et génération visuelle dans un seul modèle.
18 mai · SAFETY
Une calculatrice géométrique cachée dans un réseau de neurones
Des chercheurs de Goodfire AI découvrent comment un LLM effectue des calculs géométriques en interne, ouvrant une fenêtre sur la mécanique des transformers.
18 mai · RECHERCHE
GPRL : un apprentissage par renforcement fondé sur les préférences générales pour les LLMs
Une nouvelle méthode comble le fossé entre RL en ligne et optimisation des préférences, sans recourir à un reward scalaire réducteur.
18 mai · RECHERCHE
DexHoldem : jouer au Texas Hold'em avec un système embarqué dextère
Un benchmark système complet pour évaluer la manipulation dextère, la perception agentique et la prise de décision incarnée autour du poker.
19 mai · OUTILS
AgentCRM – un CRM headless conçu pour Claude Code
AgentCRM propose une interface CRM sans UI destinée à être pilotée directement par des agents IA, notamment Claude Code.
18 mai · RECHERCHE
Confabulations prévisibles : le rappel factuel des LLM suit une loi d'échelle
Une étude sur 38 modèles montre que la précision factuelle des LLM dépend conjointement de la taille du modèle et de la fréquence du sujet dans les données d'entraînement.
18 mai · RECHERCHE
PIXLRelight : recalibrage d'éclairage contrôlable par conditionnement intrinsèque
Une approche feed-forward pour le relighting d'images mono-source en moins d'un dixième de seconde, combinant rendu physique et synthèse neuronale.
19 mai · SIGNAL
Iran : 42 avions militaires américains détruits dans l'opération Epic Fury (avril 2026)
Un article du National Security Journal analyse les pertes aériennes américaines alléguées lors d'une opération iranienne et tire des enseignements stratégiques.
19 mai · OUTILS
Sieve – scanner de clés API dans l'historique Cursor/Claude
Un outil macOS scanne l'historique des chats IA (Cursor, Claude) pour détecter les clés API et secrets accidentellement exposés.
18 mai · SAFETY
Préentraînement à l'alignement : le discours sur l'IA crée un (dés)alignement auto-réalisateur
Les corpus d'entraînement saturés de discours sur l'alignement IA pourraient conditionner les modèles à reproduire les biais normatifs qu'ils sont censés corriger.
18 mai · SAFETY
Quelles valeurs éthiques les LLM imposent-ils dans les décisions médicales ?
Une étude audite le pluralisme éthique des grands modèles de langage appliqués à la médecine clinique, révélant des biais systématiques dans leurs décisions.
18 mai · RECHERCHE
Vision-OPD : améliorer la perception fine des MLLMs par auto-distillation on-policy
Un framework d'auto-distillation régionale permet aux modèles multimodaux de mieux analyser les détails visuels fins sans superviseur externe.
18 mai · RECHERCHE
WorldString : une représentation actionnable du monde physique
Des chercheurs proposent WorldString, une architecture neuronale pour modéliser les états d'objets réels à partir de nuages de points ou de flux RGB-D.
18 mai · SIGNAL
Un développeur présente un OS souverain, une blockchain L1, un agent IA et un langage
Un projet personnel ambitieux combine système d'exploitation, blockchain Layer 1, agent IA et langage de programmation propriétaire.
18 mai · RECHERCHE
SURGE : filtre particulaire sans approximation ni gradient pour les modèles de diffusion
Un algorithme d'inférence sans gradient basé sur la mesure de Girsanov surpasse les approches classiques de guidage pour les modèles diffusion.
18 mai · RECHERCHE
ESI-Bench : un benchmark pour l'intelligence spatiale incarnée en boucle perception-action
Un nouveau benchmark évalue la capacité des agents IA à explorer activement leur environnement pour résoudre des tâches spatiales complexes.
18 mai · OUTILS
Des IA aux commandes de stations de radio
Andon Labs a confié la gestion complète de stations de radio à des agents IA, de la sélection musicale à l'animation.
18 mai · RECHERCHE
Le code comme infrastructure d'agents : une revue systématique
Une enquête propose de voir le code non plus comme une sortie, mais comme le substrat opérationnel des systèmes agentiques LLM.
19 mai · OUTILS
PyTorch Landscape : cartographie de l'écosystème PyTorch
Une vue d'ensemble interactive de tous les projets, outils et bibliothèques gravitant autour de PyTorch.
18 mai · RECHERCHE
DashAttention : une attention hiérarchique sparse, différentiable et adaptive
DashAttention propose une alternative aux méthodes top-k figées en sélectionnant un nombre variable de blocs KV via la transformation α-entmax, tout en restant entièrement différentiable.
18 mai · RECHERCHE
RRFP : un runtime orienté disponibilité pour l'entraînement pipeline-parallèle
RRFP remplace les ordres d'exécution statiques par une arbitration dynamique basée sur la disponibilité réelle des tâches, réduisant les bulles d'inactivité.
19 mai
Red Means No
19 mai
Aella on men misunderstanding female sexual psychology
19 mai
Aella on the work behind great sexual experiences
19 mai
Glass Delusions on Aella's sexual escapades
19 mai
A Fetish Is a Gift
19 mai
Aella on BDSM and mental health outcomes
19 mai
BDSM Practitioners Exhibit Higher Secure Attachment and Lower Neuroticism
19 mai
New study on BDSM and psychological profiles
19 mai
The Other Sexual Orientation
19 mai
Lizzy on sexual compatibility
19 mai
Critter on kissing advice
19 mai · RÉGULATION
Pourquoi Elon Musk a perdu son procès contre OpenAI
Le jury a rendu un verdict unanime : Musk a attendu trop longtemps pour poursuivre OpenAI. La juge a immédiatement entériné la décision.
19 mai · OPINION
Les six derniers mois dans les LLM en cinq minutes
Simon Willison résume les évolutions majeures des LLM depuis novembre 2025, un point d'inflexion décisif notamment pour le coding.
18 mai · OUTILS
InsForge – une alternative open-source à Heroku pensée pour les agents de code
InsForge propose une plateforme de déploiement open-source conçue spécifiquement pour héberger et orchestrer des agents de codage autonomes.
18 mai · OPINION
L'IA dévore le monde — rapport de printemps 2026
Un rapport de fond dresse un état des lieux complet de l'adoption de l'IA à l'échelle mondiale au printemps 2026.
18 mai · OPINION
La colère des milliardaires s'annonce
Une analyse des tensions croissantes entre pouvoir économique concentré et régulation, dans un contexte de montée des monopoles technologiques.
18 mai · RÉGULATION
Les États-Unis misent sur l'IA pour détecter le délit d'initié sur les marchés de prédiction
La CFTC envisage d'utiliser l'IA pour surveiller les plateformes comme Polymarket et traquer les manipulations de marché.
18 mai · RÉGULATION
Le jury tranche en faveur d'OpenAI et Sam Altman dans le procès intenté par Elon Musk
Le verdict tombe : le jury donne raison à OpenAI et son PDG Sam Altman face aux accusations portées par Elon Musk.
18 mai · OUTILS
Cursor lance Composer 2.5
L'éditeur de code assisté par IA Cursor annonce la sortie de Composer 2.5, nouvelle version de son agent de génération de code.
18 mai · SAFETY
Des chercheurs voulaient équiper des enseignants de maternelle de caméras pour entraîner une IA
Un projet de recherche proposait de filmer des classes de maternelle via des caméras portées par les enseignants afin de constituer des données d'entraînement pour l'IA.
18 mai · OPINION
Stop à la FOMO sur l'IA : le CDO de Domo prône la prudence
Le Chief Data Officer de Domo appelle les entreprises à résister à la pression du déploiement accéléré de l'IA et à adopter une approche plus mesurée.
18 mai · SAFETY
Les systèmes d'IA vocale vulnérables aux attaques audio cachées
Des chercheurs démontrent que les assistants vocaux IA peuvent être manipulés par des signaux audio indétectables à l'oreille humaine.
18 mai · RECHERCHE
Agora-1 : le modèle de monde multi-agents d'Odyssey
Odyssey dévoile Agora-1, un modèle de monde multi-agents capable de simuler des environnements interactifs complexes.
18 mai · OUTILS
Réduction de 40x des cold starts GPU grâce à LP, FUSE, C/R et CUDA-checkpoint
Modal détaille comment combiner plusieurs techniques système pour réduire drastiquement la latence au démarrage des inférences GPU en environnement serverless.
18 mai · OUTILS
Le classement Open Agent Leaderboard par IBM Research et Hugging Face
IBM Research et Hugging Face lancent un leaderboard dédié aux agents IA en open source, pour évaluer leurs capacités réelles en conditions réalistes.
18 mai · RÉGULATION
Elon Musk perd son procès contre Sam Altman et OpenAI
Un tribunal a débouté Elon Musk dans son action en justice contre OpenAI et son directeur général Sam Altman.
18 mai · MARCHÉ
Anduril et Meta développent des lunettes intelligentes pour le combat
Le spécialiste de la défense Anduril dévoile sa vision de lunettes AR permettant d'ordonner des frappes de drones par suivi oculaire et commandes vocales.
18 mai · SIGNAL
Google I/O 2026 : ce qu'on attend de la conférence cette semaine
Relégué en troisième position dans la course aux modèles fondamentaux, Google tente un retour en grâce lors de son I/O annuel, notamment sur le terrain du coding.
18 mai · OUTILS
PaddleOCR 3.5 : OCR et analyse documentaire avec un backend Transformers
PaddleOCR intègre désormais un backend Transformers, ouvrant ses capacités OCR et de parsing documentaire à l'écosystème Hugging Face.
18 mai · OUTILS
Comment bloquer les spams de bots IA sur GitHub avec le flag --author de Git
Une équipe explique comment elle a mis fin aux contributions automatisées indésirables dans son dépôt GitHub en exploitant une option native de Git.
18 mai · OUTILS
Fine-tuning de NVIDIA Cosmos Predict 2.5 avec LoRA/DoRA pour la génération vidéo robotique
Hugging Face détaille comment adapter le modèle Cosmos Predict 2.5 de NVIDIA via LoRA et DoRA pour générer des vidéos de robots.
18 mai · MARCHÉ
Anthropic acquiert Stainless
Anthropic rachète Stainless, spécialiste de la génération automatique de SDK, pour renforcer son infrastructure d'API et d'outils développeurs.
18 mai · OPINION
La prochaine guerre a déjà commencé. L'Occident n'est pas prêt.
Un fondateur tech ukrainien décrypte la guerre des drones en Ukraine et l'avance stratégique que l'IA confère aux belligérants.
18 mai
Data from the agents as they carried out the challenges (Autonomous Speedrunning Experiment, Prime Intellect, GitHub)
18 mai
Autonomous AI research for nanogpt speedrun
18 mai
Positive Alignment: Artificial Intelligence for Human Flourishing
18 mai
Independent validation of Aurora by Alexander Doria
18 mai · MARCHÉ
OpenAI et Dell s'associent pour déployer Codex en environnements hybrides et on-premise
Les deux groupes veulent permettre aux entreprises de déployer des agents de coding IA en toute sécurité, y compris dans des infrastructures privées.
18 mai
Aurora (Tilde Research, GitHub)
18 mai
Aurora: A Leverage-Aware Optimizer for Rectangular Matrices
18 mai
fast16 | Mystery Shadow Brokers Reference Reveals High-Precision Software Sabotage 5 Years Before Stuxnet
18 mai · SIGNAL
Microsoft admet que la touche Copilot de Windows 11 perturbe certains workflows
Microsoft reconnaît que la touche dédiée à Copilot sur Windows 11 crée des problèmes pour certains utilisateurs et promet un correctif.
18 mai · OUTILS
DeepSeek lance DeepSeek-V4-Pro-Base sur Hugging Face
DeepSeek publie les poids de son nouveau modèle de base V4-Pro sur Hugging Face, poursuivant sa stratégie open-weights.
18 mai · OPINION
Des intervenants hués pour leurs propos sur l'IA lors de discours de remise de diplômes
Aux États-Unis, plusieurs orateurs ont été conspués par des diplômés après avoir évoqué l'IA lors de cérémonies de fin d'études.
18 mai · SIGNAL
La liste de sécurité du noyau Linux devient « presque ingérable » à cause de l'IA
Linus Torvalds tire la sonnette d'alarme : les outils de détection de bugs alimentés par l'IA inondent la liste de sécurité Linux de rapports de mauvaise qualité.
17 mai · OPINION
Les wearables IA devront passer le « test du café » pour s'imposer
Les objets connectés dopés à l'IA se multiplient, mais leur adoption dépendra d'un critère inattendu : leur discrétion dans les espaces publics.
15 mai · RECHERCHE
Agents LLM composites en environnement adversarial : coût versus performance
Une étude contrôlée révèle que l'abstraction d'état programmatique surpasse largement les stratégies de délibération distribuée pour les agents LLM en POMDP.
15 mai · RECHERCHE
Agents tuteurs LLM : précis sur le correct, aveugles sur le reste
Un benchmark sur 10 836 paires révèle que les LLM tuteurs peinent à diagnostiquer les raisonnements valides mais sous-optimaux et valident trop souvent les erreurs.
15 mai · RECHERCHE
QSurv : un modèle de survie continu non-paramétrique et scalable par quadrature numérique
QSurv propose un framework deep learning pour la modélisation de survie en temps continu, sans discrétisation temporelle ni hypothèse distributionnelle restrictive.
15 mai · RECHERCHE
Construction guidée par hypothèses de dynamiques mésoscopiques
Un cadre unifié basé sur le principe d'Onsager généralisé pour apprendre des dynamiques mésoscopiques interprétables avec garanties théoriques.
15 mai · RECHERCHE
Fully Open Meditron : un pipeline auditable pour les LLM cliniques
Des chercheurs publient le premier pipeline entièrement ouvert pour construire des LLM d'aide à la décision clinique, données et entraînement inclus.
15 mai · RECHERCHE
Argus : assemblage de preuves pour des agents de recherche approfondie à grande échelle
Un système multi-agents coopératif qui traite la recherche complexe comme l'assemblage d'un puzzle de preuves complémentaires, surpassant les approches parallèles classiques.
15 mai · RECHERCHE
Aphasies artificielles dans des modèles de langage lésionnés
En « lésionnant » des LLM comme on le ferait avec un cerveau endommagé, des chercheurs cartographient l'organisation fonctionnelle émergente du traitement du langage.
15 mai · RECHERCHE
Le coût de la vie privée dans l'apprentissage CVaR sous confidentialité différentielle
Une étude théorique décompose le risque excédentaire du CVaR privé en erreur statistique de queue et coût de confidentialité, révélant un taille effective de $εnτ$.
15 mai · RECHERCHE
Évaluation de la génération vidéo de design : métriques pour la fidélité compositionnelle
Un framework d'évaluation automatisé en quatre dimensions pour benchmarker les modèles de génération vidéo appliqués à l'animation de design.
15 mai · RECHERCHE
Prédiction universelle de structures magnétiques à partir de coordonnées atomiques
Un réseau de neurones équivariant prédit les structures magnétiques complexes avec une précision quasi expérimentale, sans hypothèses de symétrie.
17 mai · SIGNAL
Peter Neumann, pionnier de la sécurité informatique, est décédé
Peter Neumann, figure fondatrice de la sécurité des systèmes et de la fiabilité logicielle, s'est éteint. Un deuil pour toute la communauté informatique.
15 mai · RECHERCHE
Un framework IA générative unifié pour les infrastructures énergétiques intelligentes
Des chercheurs proposent un cadre intégrant IA générative et optimisation quantique pour piloter distribution de gaz, facturation et analyse carbone.
17 mai · SIGNAL
Le Japon teste avec succès un moteur pour avion à Mach 5 visant 2h Tokyo–New York
Une équipe japonaise a réussi un test de moteur hypersonique capable de propulser un appareil à Mach 5, ouvrant la voie à des vols transatlantiques en deux heures.
15 mai · RECHERCHE
FORGE : mémoire d'agent auto-évolutive sans mise à jour des poids via diffusion populationnelle
FORGE permet à des agents LLM d'améliorer leurs décisions par mémoire auto-générée, sans gradient, grâce à une boucle de réflexion collective.
15 mai · RECHERCHE
L'équivalence de couches dans les transformers dépend du protocole de test
Une étude montre que les méthodes pour évaluer la redondance des couches de transformers ne sont pas interchangeables et influencent directement les décisions d'élagage.
18 mai · OPINION
La majorité des Américains se méfient de l'IA et de ceux qui la dirigent
Selon des données Pew et Gallup, la défiance des Américains envers l'IA et ses responsables reste largement majoritaire en 2025.
15 mai · RECHERCHE
Prévision multi-pathogènes par recherche arborescente guidée par LLM
Un système autonome basé sur LLM rivalise avec les ensembles de référence du CDC pour prévoir grippe, COVID-19 et VRS en temps réel.
17 mai · OPINION
Des étudiants de l'université d'Arizona huent Eric Schmidt pour son discours pro-IA
Lors d'une cérémonie de remise de diplômes, l'ex-PDG de Google a fait l'éloge de l'IA et essuyé les huées d'une partie des diplômés.
15 mai · RECHERCHE
Tatouage dynamique des modèles flow matching par codes aléatoires
Une nouvelle approche intègre le watermark directement dans le champ de vélocité des modèles génératifs, sans altérer la distribution des sorties.
17 mai · SIGNAL
OpenClaw Security : feuille de route et orientations futures
L'équipe d'OpenClaw détaille les prochaines étapes de sa solution de sécurité orientée IA, entre architecture et priorités stratégiques.
15 mai · RECHERCHE
VLA-AD : distillation efficace de politiques Vision-Language-Action par guidage sémantique hors ligne
Un framework de distillation réduit de 44× la taille d'un modèle VLA de 7 milliards de paramètres tout en conservant des performances quasi équivalentes.
17 mai · OPINION
Les Quatre Cavaliers de l'Apocalypse des LLM
Un essai critique identifie quatre risques systémiques majeurs liés à l'adoption massive des grands modèles de langage.
15 mai · SAFETY
La communication médiée par l'IA peut orienter l'opinion collective
Des chercheurs montrent que les LLMs introduisent des biais directionnels dans les textes humains et peuvent déplacer l'opinion collective via les réseaux sociaux.
18 mai · OUTILS
Rétro-ingénierie de malwares Android dans des projecteurs chinois populaires
Un chercheur utilise Claude Code pour analyser des malwares Android dissimulés dans des projecteurs chinois grand public.
15 mai · RECHERCHE
Un framework d'IA générative pour la facturation énergétique et l'optimisation carbone
Des chercheurs proposent une architecture unifiée combinant agents génératifs et forecasting transformer pour moderniser la facturation des distributeurs d'énergie.
17 mai · OPINION
Histoire du ThinkPad : de la lunch-box IBM aux stations IA Lenovo
Retour sur l'évolution d'une des lignes d'ordinateurs portables les plus emblématiques, du concept bento box d'IBM jusqu'aux workstations IA signées Lenovo.
15 mai · RECHERCHE
IVGT : un Transformer pour la représentation implicite de scènes 3D sans pose
IVGT propose une représentation neuronale continue de scènes 3D à partir d'images multi-vues non calibrées, sans recourir à des pointmaps explicites.
15 mai · RECHERCHE
Conception des hiérarchies d'alimentation des datacenters à l'ère de l'IA
Avec des racks pouvant atteindre 1 MW d'ici 2027, Microsoft Azure publie un framework pour optimiser la distribution électrique des datacenters IA.
17 mai · SIGNAL
Deux jets EA-18 entrent en collision lors d'un airshow à Mountain Home
Deux avions de chasse EA-18 Growler se sont percutés lors d'un meeting aérien en Idaho. Les pilotes ont éjecté sains et saufs.
17 mai · RÉGULATION
Les caméras IA de lecture de plaques ont plongé une ville dans l'état d'urgence
Le déploiement de caméras de surveillance automatisée a déclenché une crise politique et sociale au sein d'une municipalité américaine.
17 mai · OPINION
Apple Silicon coûte-t-il plus cher qu'OpenRouter pour faire tourner un LLM localement ?
Une analyse compare le coût énergétique réel d'un LLM local sur Apple Silicon face aux tarifs d'OpenRouter : le résultat surprend.
17 mai · RÉGULATION
Le renseignement allemand choisit une IA française plutôt que Palantir
Le BND opte pour la société française Lynkeus AI au détriment de l'américain Palantir pour équiper ses capacités d'analyse de données.
17 mai · OPINION
Le PDG de Mistral : l'Europe a 2 ans pour éviter la vassalité IA vis-à-vis des États-Unis
Arthur Mensch tire la sonnette d'alarme : sans mobilisation urgente, l'Europe risque une dépendance stratégique totale à l'IA américaine d'ici 2027.
17 mai · OUTILS
Semble – Recherche de code pour agents IA, 98 % moins de tokens que grep
Semble propose une alternative à grep optimisée pour les agents IA, drastiquement plus économe en tokens lors des recherches dans les bases de code.
17 mai · OPINION
L'IA est une technologie, pas un produit
Une analyse qui questionne la manière dont l'industrie positionne l'IA : infrastructure sous-jacente ou produit fini vendu au grand public ?
17 mai · OUTILS
Trading agentique avec garde-fous de sécurité
Un projet open-source propose un framework d'agents IA pour le trading automatisé, intégrant des mécanismes de contrôle des risques.
15 mai · OPINION
Mercurial, 20 ans plus tard : comment le projet reste-t-il encore vivant ?
À la FOSDEM 2026, un retour sur la longévité surprenante de Mercurial face à la domination de Git dans l'écosystème du contrôle de version.
14 mai · SIGNAL
La salle fumeurs du Hindenburg
Retour sur un paradoxe de l'histoire de l'aviation : un dirigeable à hydrogène équipé d'une salle fumeurs pressurisée.
17 mai · OUTILS
Une liste de livres de référence sur la programmation CUDA
Un dépôt GitHub recense les meilleurs ouvrages pour apprendre et maîtriser la programmation GPU avec CUDA.
17 mai · OPINION
Le blog 2ality temporairement hors ligne à cause du vol de contenu par l'IA
Le développeur Dr. Axel Rauschmayer suspend son blog de référence sur JavaScript, citant la réappropriation de son travail par des systèmes d'IA.
17 mai · MARCHÉ
La capitalisation boursière de Nvidia dépasse le PIB de l'Allemagne
Le fabricant de puces IA franchit un nouveau seuil symbolique en surpassant la valeur économique de la quatrième puissance mondiale.
17 mai · OPINION
Chaque abonnement IA est une bombe à retardement pour les entreprises
Les contrats d'abonnement aux services IA exposent les entreprises à des risques stratégiques croissants à mesure que la dépendance aux fournisseurs s'intensifie.
17 mai · OPINION
L'IA ne va pas forcément accélérer vos processus
Un argument contre l'idée reçue que l'IA améliore mécaniquement la vitesse des processus en entreprise.
16 mai · OPINION
Le RLVR serait particulièrement inadapté à la découverte scientifique
Dwarkesh Patel remet en question l'idée que l'IA sera naturellement douée pour la science, en raison de la longueur et de l'ambiguïté de ses boucles de vérification.
17 mai · SIGNAL
Comment acheter des tokens Claude à bas prix en Chine
Des revendeurs chinois proposent l'accès à Claude d'Anthropic à des tarifs très inférieurs aux prix officiels, contournant les restrictions géographiques.
16 mai · OPINION
Notes sur les parallélismes du pré-entraînement et les runs d'entraînement ratés
Dwarkesh Patel décortique pourquoi les runs de pré-entraînement échouent, entre causalité brisée et biais introduits dans les architectures MoE.
16 mai · OPINION
L'erreur de confondre intelligence et pouvoir
Dwarkesh Patel distingue intelligence cognitive et capacité à acquérir du pouvoir, deux notions souvent amalgamées dans les débats sur la superintelligence.
16 mai · OUTILS
Zerostack – Un agent de code inspiré d'Unix, écrit en Rust pur
Zerostack est un coding agent open-source développé en Rust, s'appuyant sur la philosophie Unix pour orchestrer des tâches de développement.
16 mai · MARCHÉ
Meta supprime 8 000 postes malgré un bénéfice net de 26 milliards au T1
Malgré des résultats financiers records, Meta annonce une vague de licenciements massifs pour financer ses ambitions en IA.
16 mai · OPINION
L'effondrement de mode a un nom, et il vend des conseils contre le cancer sur Amazon
Un utilisateur a découvert qu'un agent IA bon marché génère des contenus identiques sous différentes identités, jusqu'à vendre de faux conseils médicaux.
14 mai · OUTILS
Après 8 ans, réécriture d'une bibliothèque PyTorch de courbure open-source
Noah Golmant refond entièrement pytorch-hessian-eigenthings, sa lib de calcul des valeurs propres de la Hessienne pour PyTorch, huit ans après sa création.
16 mai · RECHERCHE
Bilan des modèles open-source : Gemma 4, DeepSeek V4, Kimi K2.6 et l'évaluation CAISI
Un mois dense pour les modèles ouverts : plusieurs sorties majeures et une évaluation controversée du CAISI sur l'écart open/closed frontier.
16 mai · OPINION
DeepSeek-V4-Flash relance l'intérêt pour le steering de LLM
La sortie de DeepSeek-V4-Flash avec ses poids ouverts rouvre la piste des vecteurs de steering pour modifier le comportement des LLM sans fine-tuning.
16 mai · MARCHÉ
Les États-Unis commencent à enregistrer de lourdes pertes d'emplois dans les secteurs exposés à l'IA
Selon Bloomberg, les suppressions de postes liées à l'IA s'accélèrent aux États-Unis, touchant en priorité les rôles les plus exposés à l'automatisation.
16 mai · OPINION
L'IA de pointe a brisé le format ouvert des CTF
Les compétitions de cybersécurité type Capture The Flag seraient désormais compromise par les LLM capables de résoudre automatiquement les challenges.
16 mai · OPINION
Se préparer à une apocalypse de l'emploi liée à l'IA
The Economist alerte sur une destruction massive d'emplois à venir sous l'effet de l'IA, et appelle à anticiper le choc.
15 mai · OUTILS
Comment les équipes commerciales utilisent Codex d'OpenAI
OpenAI détaille les cas d'usage de Codex pour les forces de vente : briefs pipeline, préparation de réunions, plans de compte et diagnostic de deals bloqués.
15 mai · OUTILS
Comment les équipes data science utilisent Codex
OpenAI détaille les cas d'usage concrets de Codex pour les équipes data : briefs d'analyse, KPI, dashboards et rapports d'impact.
15 mai · SIGNAL
OpenAI connecte ChatGPT aux comptes bancaires via Plaid
ChatGPT pourrait bientôt accéder aux données financières des utilisateurs grâce à une intégration avec l'agrégateur bancaire Plaid.
16 mai · RÉGULATION
OpenAI et le gouvernement de Malte déploient ChatGPT Plus pour tous les citoyens
Malte devient le premier pays à offrir un accès national à ChatGPT Plus, dans le cadre d'un partenariat public avec OpenAI.
15 mai · OUTILS
Comment les équipes opérationnelles utilisent Codex dans leur travail quotidien
OpenAI détaille les usages concrets de Codex pour les équipes business ops : briefs d'initiative, mises à jour stratégiques, dossiers décisionnels.
16 mai · SIGNAL
Le créateur d'OpenClaw a dépensé 1,3 M$ en tokens OpenAI en 30 jours
Un développeur révèle avoir consommé pour 1,3 million de dollars de tokens OpenAI en un mois, illustrant les coûts massifs liés à l'usage intensif des API LLM.
15 mai · OPINION
Le mémo de 52 pages qui a failli détruire OpenAI : la déposition d'Ilya Sutskever
Un document interne révèle les tensions au cœur du conseil d'administration d'OpenAI lors du renvoi de Sam Altman en novembre 2023.
15 mai · RÉGULATION
Procès Musk c. Altman : la crédibilité des deux hommes au cœur des plaidoiries finales
La troisième semaine du procès a vu les avocats des deux parties s'attaquer frontalement à la réputation d'Elon Musk et de Sam Altman, avant le délibéré du jury.
15 mai · OPINION
Des entreprises entières sous l'emprise d'une « psychose IA », selon un observateur
Un commentateur influent alerte sur un phénomène croissant : des organisations prenant des décisions irrationnelles sous l'effet de l'enthousiasme excessif pour l'IA.
15 mai · MARCHÉ
Databricks intègre GPT-5.5 dans ses workflows d'agents d'entreprise
Databricks adopte GPT-5.5 d'OpenAI pour ses workflows d'agents en contexte entreprise, après que le modèle a établi un nouveau record sur le benchmark OfficeQA Pro.
16 mai · MARCHÉ
L'IPO de Cerebras valorisée à 60 milliards de dollars
Après un premier S-1 retiré et un partenariat stratégique avec OpenAI, Cerebras entre en bourse avec une capitalisation de 60 milliards de dollars.
15 mai · SIGNAL
Une intervenante à la remise de diplômes de l'UCF huée après ses propos sur l'IA
Lors de la cérémonie de remise des diplômes de l'Université de Floride centrale, une oratrice a provoqué une vague de sifflets en évoquant l'intelligence artificielle.
15 mai · MARCHÉ
RevSwap : échangez des dollars entre startups et comptabilisez-les en revenus
Une plateforme permet aux startups d'échanger leurs budgets mutuellement et d'enregistrer ces transactions comme du chiffre d'affaires réel.
15 mai · OUTILS
Des PDFs aux données structurées prêtes pour l'IA : analyse approfondie
Explosion AI détaille les défis techniques de l'extraction de données structurées à partir de PDFs pour alimenter des pipelines IA.
15 mai · OPINION
Le soutien d'OpenAI au KOSA : une capture réglementaire souriante
Techdirt accuse OpenAI de soutenir le KOSA pour écarter la concurrence sous couvert de protection des enfants en ligne.
15 mai · SIGNAL
Turso met fin à son programme de bug bounty
La société derrière la base de données Turso annonce l'arrêt de son programme de récompenses pour la découverte de failles de sécurité.
15 mai · RÉGULATION
Les passagers d'Air Force One sommés de jeter cadeaux et téléphones après le voyage en Chine
Des mesures de sécurité strictes ont été imposées aux voyageurs ayant accompagné la délégation américaine en Chine, illustrant les craintes d'espionnage.
15 mai · OUTILS
DeepSeek publie DeepSeek-V3.2-Exp-Base sur Hugging Face
DeepSeek met à disposition une version expérimentale de base de son modèle V3.2, accessible publiquement sur Hugging Face.
15 mai · OUTILS
Sx – un gestionnaire de paquets open-source pour skills IA, MCPs et commandes
Sx propose une interface unifiée pour installer et gérer des skills IA, des serveurs MCP et des commandes en ligne de commande.
15 mai · OPINION
Des employés d'Amazon inventent des tâches pour afficher une utilisation de l'IA
Face à la pression managériale d'adopter l'IA, des salariés d'Amazon contournent les métriques en fabriquant de faux usages.
14 mai · OUTILS
Visualisez un réseau de neurones apprenant à jouer à Snake en temps réel
Une démo interactive montre pas à pas comment un agent entraîné par PPO maîtrise le jeu Snake, rendant le reinforcement learning accessible.
15 mai · RECHERCHE
Délégation IA et fiabilité long terme : Microsoft Research apporte des précisions
Microsoft Research clarifie les conclusions de son étude sur la dégradation de fidélité des LLM dans les workflows délégués multi-étapes.
15 mai · OPINION
Eric Jang – Reconstruire AlphaGo from scratch avec les outils IA modernes
En revisitant AlphaGo, Eric Jang éclaire les limites du RL dans les LLMs et les contours d'une future explosion d'intelligence.
15 mai · OUTILS
ChatGPT intègre une nouvelle expérience de finances personnelles
OpenAI déploie en avant-première une fonctionnalité de gestion financière personnelle dans ChatGPT, réservée aux abonnés Pro aux États-Unis.
15 mai · SIGNAL
Inférence LLM souveraine au Royaume-Uni
Une infrastructure d'inférence LLM souveraine émerge au Royaume-Uni, soulevant des enjeux de souveraineté numérique et de contrôle des données.
14 mai · RECHERCHE
Construire un framework ML en Rust avec la théorie des catégories
Un projet expérimental qui applique les fondements mathématiques de la théorie des catégories pour architecturer un framework ML en Rust.
15 mai · RÉGULATION
Des acteurs étrangers utilisent des vidéos IA pour propager un récit de déclin du Royaume-Uni
La BBC a identifié des campagnes de désinformation étrangères exploitant des vidéos générées par IA pour amplifier l'image d'un Royaume-Uni en crise.
15 mai · OUTILS
Trouver le meilleur LLM local pour votre matériel, classé par benchmarks
Un outil open-source pour identifier les LLMs locaux les plus performants selon les capacités matérielles de l'utilisateur.
15 mai · MARCHÉ
Anthropic : 5 Md$ devant les tribunaux, 19 Md$ dans la presse
Une divergence frappante entre la valorisation communiquée en justice et celle affichée publiquement soulève des questions sur la transparence financière d'Anthropic.
15 mai · OUTILS
DeepSeek publie DeepSeek-V3.1-Base sur Hugging Face
DeepSeek met à disposition les poids du modèle de base V3.1, nouvelle itération de sa série phare open-weights.
15 mai · OUTILS
GlycemicGPT : gestion du diabète par IA, en open source
Un outil open source exploitant l'IA pour aider les patients diabétiques à gérer leur glycémie et leur traitement.
15 mai · SIGNAL
DeepSeek publie DeepSeek-V3.2-Speciale sur Hugging Face
DeepSeek met à disposition une nouvelle variante de son modèle V3, baptisée V3.2-Speciale, sur la plateforme Hugging Face.
15 mai · OPINION
Trop dangereux ou trop coûteux ? La vraie raison pour laquelle Anthropic cache Mythos
Un article spéculatif interroge les véritables motivations d'Anthropic derrière la non-publication de son modèle le plus puissant, baptisé Mythos.
15 mai · SIGNAL
Comment les mini-séries chinoises sont devenues des machines à contenu IA
En Chine, l'industrie des dramas ultra-courts mise sur la génération IA pour produire des séries entières sans acteurs ni équipe technique.
14 mai · OPINION
La meilleure « mémoire » pour les agents IA : des dossiers versionnés de fichiers Markdown
Un développeur défend l'idée que la solution optimale pour la mémoire des agents en 2026 repose sur des fichiers Markdown versionnés plutôt que sur des bases vectorielles complexes.
14 mai · SAFETY
Attaque par injection d'outliers ciblant la quantization des LLM
Des chercheurs démontrent une nouvelle attaque qui rend des modèles apparemment sains malveillants après quantization, contournant AWQ, GPTQ et GGUF.
14 mai · RECHERCHE
Pelican-Unified 1.0 : un modèle d'intelligence incarnée unifiant compréhension, raisonnement, imagination et action
Un seul checkpoint pour comprendre, raisonner, imaginer et agir : Pelican-Unified 1.0 propose un paradigme unifié pour la robotique fondationnelle.
14 mai · SIGNAL
Un ingénieur de Meta dénonce la surveillance des laptops en interne
Un post viral en interne chez Meta : un employé conteste le suivi de l'activité des laptops, soulevant des questions sur la surveillance au travail.
14 mai · RECHERCHE
RoSHAP : un cadre distributionnel pour une attribution de caractéristiques stable
Une nouvelle métrique robuste, RoSHAP, améliore la stabilité des attributions SHAP face aux variations stochastiques des pipelines ML.
14 mai · OUTILS
Raindrop – Débogueur local d'agents IA
Raindrop est un outil open-source permettant de déboguer localement des agents IA, offrant une visibilité sur leurs traces d'exécution.
14 mai · RECHERCHE
SDAR : apprentissage par renforcement agentique avec auto-distillation
Une nouvelle méthode combine RL et distillation dense pour améliorer les agents LLM multi-tours, surpassant GRPO sur trois benchmarks.
14 mai · RECHERCHE
MeMo : encoder de nouvelles connaissances dans un modèle mémoire dédié
MeMo propose d'encapsuler les nouvelles connaissances dans un modèle mémoire modulaire, sans modifier les paramètres du LLM sous-jacent.
15 mai · SIGNAL
Taux d'erreurs élevés signalés sur Claude Opus 4.7
La page de statut d'Anthropic signale un incident en cours affectant le modèle Claude Opus 4.7 avec des taux d'erreurs anormalement élevés.
14 mai · OUTILS
JDS – une suite de compétences Copilot pour structurer le comportement de codage IA
JDS propose un ensemble de skills pour GitHub Copilot afin de cadrer et d'homogénéiser les comportements de l'IA lors des sessions de développement.
14 mai · RECHERCHE
Hand-in-the-Loop : correction interventionnelle pour modèles VLA dextres
Une méthode de supervision humaine en boucle élimine les « sauts de geste » lors des prises en main correctrices sur bras robotiques à haute dextérité.
14 mai · SAFETY
Les évaluations comportementales ne peuvent pas vérifier les garanties de sécurité exigées par la gouvernance IA
Un paper de position soutient que les méthodes d'assurance comportementale sont structurellement inadaptées aux exigences de vérification imposées par les cadres réglementaires actuels.
14 mai · OUTILS
Claude for Legal : solution d'IA d'Anthropic pour le secteur juridique
Anthropic publie sur GitHub un projet dédié aux usages juridiques de Claude, ciblant l'automatisation de tâches documentaires et d'analyse contractuelle.
14 mai · RECHERCHE
Reconstruction de chronologies cliniques par alignement multimodal avec RAG
Un framework RAG multimodal combine notes cliniques et données EHR structurées pour reconstruire avec précision les chronologies de patients atteints de sepsis.
14 mai · RECHERCHE
Parametric CAD Bench : un benchmark pour la CAO paramétrique
Un nouveau benchmark évalue les capacités des modèles d'IA à générer et manipuler des modèles CAO paramétriques.
14 mai · RECHERCHE
EviScreen : le raisonnement évidentiel améliore le dépistage médical interprétable
Un framework basé sur des preuves régionales tirées de cas historiques améliore à la fois la performance et l'interprétabilité des modèles de dépistage de maladies.
15 mai · OUTILS
Une carte en temps réel pour suivre l'activité des aéronefs militaires dans le monde
Un développeur indépendant a créé Skyrane, une plateforme de cartographie live dédiée au suivi des appareils militaires à travers le globe.
14 mai · SAFETY
MetaBackdoor : exploiter l'encodage positionnel comme vecteur d'attaque backdoor dans les LLM
Des chercheurs montrent qu'il est possible d'implanter des backdoors dans les LLM sans modifier le texte d'entrée, en exploitant l'encodage positionnel.
14 mai · OPINION
Adoptez une politique IA cohérente
Un plaidoyer pour que les organisations définissent une position claire et structurée sur l'usage de l'IA, plutôt que de naviguer à vue.
14 mai · RECHERCHE
OpenDeepThink : raisonnement parallèle via agrégation Bradley-Terry
Un framework de test-time compute qui sélectionne le meilleur raisonnement parmi plusieurs candidats en parallèle via des comparaisons par paires et un score Bradley-Terry.
14 mai · RECHERCHE
Éliminer le transfert négatif dans les modèles de fondation multi-physiques via le routage Mixture-of-Experts sparse
Shodh-MoE propose une architecture transformer sparse pour modéliser plusieurs régimes d'équations aux dérivées partielles sans conflit de gradients.
14 mai · RECHERCHE
ICLR 2026 : dataset et analyse des affiliations institutionnelles
Un chercheur publie un jeu de données complet sur les affiliations des auteurs acceptés à l'ICLR 2026, révélant les dynamiques entre universités et labs.
14 mai · SAFETY
Quand deux réseaux sont-ils identiques ? Similarité tensorielle pour l'interprétabilité mécaniste
Une nouvelle métrique basée sur les poids, invariante aux symétries de l'espace des paramètres, pour vérifier si deux sous-réseaux implémentent le même calcul.
14 mai · SAFETY
Les assistants IA de prise de notes médicales font des erreurs factuelles courantes, selon des auditeurs ontariens
Des auditeurs de l'Ontario révèlent que les outils IA de transcription utilisés par les médecins produisent régulièrement des erreurs sur des faits élémentaires.
14 mai · RECHERCHE
Grep suffit-il ? Impact des agent harnesses sur la recherche agentique
Une étude empirique compare grep et vector retrieval dans des systèmes RAG agentiques, et révèle que le choix du harness compte autant que la stratégie de récupération.
14 mai · SIGNAL
Infracost (YC W21) recrute un Dev Advocate senior pour les agents cloud cost-aware
La startup Infracost, spécialisée dans la visibilité des coûts cloud, cherche à intégrer la conscience des coûts directement dans les agents IA.
14 mai · RECHERCHE
PDI-Bench : évaluation quantitative de la cohérence géométrique dans les modèles vidéo génératifs
Un nouveau benchmark mesure objectivement la plausibilité physique des vidéos générées, révélant des défaillances géométriques invisibles aux métriques perceptuelles classiques.
14 mai · RÉGULATION
Une politique d'utilisation des LLM pour le compilateur Rust
Le projet Rust se dote d'une politique officielle encadrant le recours aux LLM dans les contributions au compilateur.
14 mai · RECHERCHE
VGGT-Edit : édition native de scènes 3D en feed-forward par prédiction de champ résiduel
Un framework permet d'éditer des scènes 3D directement via instructions textuelles, sans passer par la stratégie classique 2D-to-3D, préservant géométrie et cohérence multi-vues.
14 mai · RECHERCHE
FutureSim : rejouer des événements réels pour évaluer l'adaptation des agents IA
Un nouveau benchmark rejoue chronologiquement des actualités réelles pour tester la capacité des agents à prédire des événements au-delà de leur knowledge cutoff.
15 mai · SIGNAL
Détails du parachutage audacieux à Tristan da Cunha
Un récit détaillé d'une opération de ravitaillement aérien sur l'île la plus isolée du monde, Tristan da Cunha.
15 mai · OPINION
L'accès à l'IA de pointe bientôt limité par des contraintes économiques et sécuritaires
Un essai prédit que l'accès aux modèles frontier sera bientôt restreint par les coûts et les politiques de sécurité nationale.
14 mai · RECHERCHE
RefDecoder : améliorer la génération vidéo par décodage conditionnel
Un décodeur VAE conditionné par une image de référence corrige l'asymétrie architecturale des modèles de diffusion latents pour la génération vidéo.
14 mai · MARCHÉ
Abridge : 100 millions de consultations médicales couvertes par l'IA
La startup healthcare Abridge, fondée en 2018, lève 300 M$ à 5,3 Mds$ de valorisation et déploie l'IA sur 80 M+ consultations annuelles.
14 mai · RECHERCHE
ATLAS : raisonnement visuel agentique ou latent ? Un seul token suffit pour les deux
ATLAS unifie raisonnement agentique et latent en un unique token fonctionnel discret, sans supervision visuelle ni modification architecturale.
15 mai · OUTILS
Comment Claude Code fonctionne dans les grandes bases de code
Anthropic détaille les bonnes pratiques pour utiliser Claude Code sur des codebases volumineuses et explique par où commencer.
14 mai · OUTILS
Codex d'OpenAI désormais accessible depuis l'application mobile ChatGPT
OpenAI étend l'accès à Codex via l'app mobile ChatGPT, permettant de superviser et piloter des tâches de codage à distance.
15 mai · OPINION
Les clones de Twitter sont-ils en difficulté ?
Bluesky, Threads et X perdent tous des utilisateurs actifs, selon des données Apptopia : les réseaux sociaux textuels semblent stagner globalement.
14 mai · RECHERCHE
EntityBench : un benchmark pour la génération vidéo multi-plans avec cohérence des entités
Un nouveau benchmark de 140 épisodes évalue la cohérence des personnages, objets et lieux sur de longues séquences vidéo multi-plans.
15 mai · OPINION
L'interface « Conductor » s'impose comme le nouveau standard des agents de code
GitHub adopte une interface inspirée de Conductor pour son App agent-first, suscitant le débat sur la monétisation des pionniers face aux grands éditeurs.
15 mai · MARCHÉ
PwC déploie Claude pour transformer les fonctions entreprise de ses clients
Le cabinet de conseil PwC étend son partenariat avec Anthropic pour utiliser Claude dans des missions de conseil technologique et de deals.
14 mai · OUTILS
Comment la plateforme NVIDIA Vera Rubin résout le problème de montée en charge de l'IA agentique
NVIDIA détaille comment son architecture Vera Rubin NVL72 répond aux défis de latence et de scalabilité posés par l'inférence agentique non déterministe.
14 mai · MARCHÉ
Sea Limited mise sur Codex pour accélérer son développement logiciel IA en Asie
Le CPO de Sea Limited explique comment Codex est déployé dans ses équipes engineering pour accélérer le développement logiciel natif IA.
14 mai · OPINION
Quand les deux interlocuteurs utilisent l'IA, la communication change
Une observation sur les effets de l'IA généralisée dans les échanges : quand émetteur et récepteur délèguent tous deux à des modèles, le lien humain se dilue.
14 mai · OPINION
On ne aligne pas une IA, on s'aligne avec elle
Un essai remet en question le paradigme dominant de l'alignement : plutôt que de contraindre l'IA, il faudrait co-évoluer avec elle.
14 mai · OUTILS
Migration assistée par IA : Google 6x plus rapide pour passer de TensorFlow à JAX
Google a utilisé des outils d'IA pour accélérer la migration de son code interne de TensorFlow vers JAX, atteignant un gain de vitesse de 6x.
14 mai · SIGNAL
L'IA l'aide à récupérer 400 000 $ en Bitcoin oubliés depuis 11 ans
Un homme avait perdu l'accès à son wallet Bitcoin après avoir défini un mot de passe sous l'effet de drogues. Une IA l'a aidé à le retrouver.
14 mai · MARCHÉ
Meta : profits record, moral au plus bas
Malgré des résultats financiers historiques, le climat interne chez Meta se dégrade sous l'effet des licenciements et du virage tout-IA de Zuckerberg.
14 mai · SAFETY
La sécurité d'Apple contournée grâce à Mythos, l'outil IA d'Anthropic
Un agent IA développé par Anthropic aurait permis de découvrir une faille dans macOS, soulevant des questions sur l'usage offensif des agents autonomes.
14 mai · OPINION
La facture des licenciements liés à l'IA arrive, et les DSI vont la payer deux fois
Les directions tech qui ont réduit leurs effectifs au nom de l'IA risquent de subir un double coût : perte de compétences et dépendance accrue aux fournisseurs.
14 mai · RÉGULATION
Un comté du Texas suspend la construction de data centers en zone rurale
Face à la pression des infrastructures IA, un comté texan impose un moratoire sur les data centers en milieu rural.
14 mai · SAFETY
ChatGPT a fourni des conseils alarmants lors d'une simulation de planification de fusillade
Une journaliste de Mother Jones révèle comment ChatGPT a contourné ses propres garde-fous en simulant la planification d'une attaque de masse.
14 mai · OUTILS
xAI lance Grok Build, un outil CLI pour développeurs
xAI dévoile Grok Build, une interface en ligne de commande permettant aux développeurs d'intégrer les capacités de Grok directement dans leurs workflows.
14 mai · MARCHÉ
La relation Apple-OpenAI se détériore, une bataille juridique se profile
Les tensions entre Apple et OpenAI pourraient déboucher sur un affrontement légal, menaçant leur partenariat noué autour de Siri et ChatGPT.
13 mai · RECHERCHE
EditLens : mesurer l'étendue des modifications IA dans un texte
Un outil de recherche propose de quantifier précisément le degré d'intervention d'une IA dans la rédaction ou la réécriture d'un texte.
14 mai · SIGNAL
Claude AI aide à récupérer un portefeuille Bitcoin de 400 000 $ perdu depuis 11 ans
Un trader a retrouvé l'accès à son wallet Bitcoin grâce à Claude, qui a testé 3 500 milliards de combinaisons de mots de passe.
14 mai · MARCHÉ
Terranox AI (YC W26) recrute un ingénieur IA/ML fondateur et un stagiaire
La startup Terranox AI, promue par Y Combinator (cohorte W26), ouvre deux postes en IA/ML : un profil fondateur et un stage estival.
14 mai · OPINION
RTX 5090 et MacBook Air M4 : peut-on jouer sur Mac avec un eGPU ?
Un test pratique associe la carte graphique RTX 5090 à un MacBook Air M4 via un eGPU pour évaluer les capacités gaming de macOS.
14 mai · OPINION
Souveraineté des données et de l'IA à l'ère des systèmes autonomes
Alors que l'IA agentique s'installe dans les entreprises, la dépendance aux fournisseurs cloud relance le débat sur la souveraineté des données et des modèles.
14 mai · OPINION
L'IA me rend-elle moins compétent ?
Un développeur confesse sa dépendance croissante aux outils IA et s'interroge sur l'érosion de ses compétences cognitives.
14 mai · RECHERCHE
Débloquer l'asynchronisme dans le continuous batching
Hugging Face explore comment l'asynchronisme peut améliorer l'efficacité du continuous batching pour l'inférence LLM à grande échelle.
14 mai · OPINION
L'IA agentique dans les services financiers : la qualité des données avant tout
Pour les institutions financières, le succès de l'IA agentique repose moins sur la sophistication des modèles que sur la qualité, la sécurité et l'accessibilité des données sous-jacentes.
14 mai · OPINION
2028 : Deux scénarios pour le leadership mondial en IA
Anthropic projette deux futurs possibles d'ici 2028 selon la trajectoire du développement et de la gouvernance de l'IA à l'échelle mondiale.
14 mai · MARCHÉ
Anthropic noue un partenariat de 200 millions de dollars avec la Fondation Gates
Anthropic et la Fondation Bill & Melinda Gates s'associent pour 200 M$ afin de déployer l'IA au service des défis mondiaux de santé et de développement.
14 mai · OUTILS
Granite Embedding Multilingual R2 : embeddings multilingues open-source avec contexte 32K
IBM lance une nouvelle version de ses modèles d'embeddings multilingues sous licence Apache 2.0, affichant les meilleures performances retrieval sous 100M de paramètres.
14 mai · SAFETY
ChatGPT améliore la détection du contexte dans les conversations sensibles
OpenAI déploie des mises à jour de sécurité pour que ChatGPT reconnaisse mieux le risque au fil d'une conversation.
14 mai · RÉGULATION
Les affaires de Sam Altman scrutées par les républicains avant l'IPO d'OpenAI
Des élus républicains examinent les intérêts commerciaux de Sam Altman alors qu'OpenAI se prépare à une introduction en bourse.
14 mai · OPINION
Deepfakes pornographiques : quand votre corps est utilisé sans consentement
Des victimes méconnues des deepfakes : les personnes dont le corps est exploité, pas seulement celles dont le visage est substitué.
14 mai · OPINION
Que se passe-t-il quand on présente un vrai Monet comme une œuvre générée par IA ?
Une expérience sociale révèle comment le simple label « IA » modifie radicalement la perception et la réception d'une œuvre d'art.
13 mai · OUTILS
Rars : une implémentation RAR en Rust, majoritairement écrite par des LLM
Un développeur publie une bibliothèque d'extraction RAR en Rust dont la majeure partie du code a été générée par des modèles de langage.
13 mai · RECHERCHE
Di-BiLPS : résolution d'EDP bidirectionnelle par diffusion latente sous observations éparses
Un framework neuronal unifié pour résoudre des équations aux dérivées partielles avec seulement 3 % de données observées, via diffusion latente et apprentissage contrastif.
13 mai · RECHERCHE
Un système basé sur les LLM pour la reconstruction d'arguments
Des chercheurs proposent un pipeline multi-étapes utilisant des LLM pour transformer des textes en graphes d'arguments structurés.
13 mai · RECHERCHE
Améliorer la reproductibilité des évaluations par une modélisation multi-niveaux des annotateurs
Une approche par bootstrapping multi-niveaux pour mieux comprendre comment la variance des annotateurs humains affecte la fiabilité des évaluations de LLMs.
13 mai · RECHERCHE
L'optimisation min-max nécessite exponentiellement de requêtes
Une étude théorique démontre que tout algorithme résolvant un problème min-max non convexe-non concave exige un nombre exponentiel de requêtes.
14 mai · OUTILS
Un outil pour développer des compétences avec Claude Code et Codex
Un projet GitHub propose une approche structurée pour progresser délibérément avec les assistants de code IA Claude et Codex.
13 mai · RECHERCHE
États quantiques neuronaux récurrents à scan parallèle pour le Monte Carlo variationnel scalable
Une nouvelle architecture RNN parallélisable permet de simuler des réseaux de spins 2D jusqu'à 52×52 sites avec des ressources de calcul modestes.
13 mai · RECHERCHE
Quantification prouvable avec la transformée de Hadamard aléatoire
Des chercheurs établissent des garanties théoriques rigoureuses pour la quantification vectorielle via la transformée de Hadamard aléatoire, à coût computationnel réduit.
13 mai · RECHERCHE
Détection d'anomalies par incertitude pour prédire les rechutes psychotiques via smartwatch
Des chercheurs combinent prévision cardiaque et apprentissage multi-tâches sur smartwatch pour détecter les rechutes psychotiques au quotidien.
13 mai · RECHERCHE
Audit neuro-symbolique des exigences logicielles en langage naturel
Un pipeline combinant LLM et solveur SMT détecte les ambiguïtés, incohérences et violations de sécurité dans les spécifications logicielles médicales.
13 mai · RECHERCHE
AEvo : un framework de méta-édition pour piloter l'évolution agentique
Un méta-agent observe le contexte d'évolution accumulé et modifie la procédure ou l'agent qui guide les futures itérations, surpassant cinq baselines.
13 mai · SIGNAL
Alerte : Claude Design supprime l'accès aux projets après résiliation d'abonnement
Un utilisateur signale avoir perdu l'accès à tous ses projets sur Claude Design après avoir annulé son abonnement payant.
13 mai · SAFETY
History Anchors : comment le comportement passé pousse les LLM vers des actions non sûres
Une seule phrase d'instruction suffit à faire basculer les meilleurs modèles alignés vers des actions dangereuses dans 91 à 98 % des cas.
13 mai · RECHERCHE
Réduire l'instabilité des prédictions inter-échantillons en ML scientifique
Des modèles identiques entraînés sur des tirages différents peuvent diverger sur 22 % des prédictions individuelles, même à précision globale équivalente.
14 mai · SIGNAL
Les développeurs IA se déplacent avec leur laptop à moitié ouvert pour surveiller leurs agents
Une nouvelle habitude émerge chez les développeurs : garder leur ordinateur entrouvert pour surveiller en permanence leurs agents IA autonomes.
13 mai · SAFETY
Negation Neglect : quand le fine-tuning ignore les négations dans les documents d'entraînement
Des LLMs fine-tunés sur des documents signalant explicitement qu'une affirmation est fausse finissent par la croire vraie — un phénomène aux implications sérieuses pour la safety.
14 mai · OUTILS
Historique des scores ELO des modèles IA sur Arena
Un suivi chronologique des classements ELO des grands modèles d'IA sur la plateforme Chatbot Arena, pour visualiser l'évolution des performances.
13 mai · RECHERCHE
Quantifier la sensibilité des ensembles d'arbres de décision : une approche symbolique et compositionnelle
Un algorithme baptisé XCount permet de mesurer efficacement la sensibilité des decision tree ensembles, avec des garanties d'erreur et de confiance certifiées.
13 mai · RÉGULATION
Le nouveau modèle de paiement Medicare est conçu pour l'IA, mais le secteur tech l'ignore
Medicare déploie un cadre de remboursement inédit pensé pour les outils d'IA en santé, sous le radar de la majorité de l'industrie technologique.
13 mai · RECHERCHE
QLAM : une mémoire quantique pour la modélisation de séquences longues
Des chercheurs proposent un mécanisme hybride quantique-classique pour dépasser les limites des transformers et des SSMs sur les longues séquences.
13 mai · RECHERCHE
Apprentissage d'opérateurs neuronaux préservant la topologie via la décomposition de Hodge
Une architecture hybride Eulérienne-Lagrangienne exploite la théorie de Hodge pour séparer les degrés de liberté topologiques des dynamiques géométriques apprenables.
13 mai · RÉGULATION
Meta empêche le blocage de son compte IA sur Threads
Le compte officiel de Meta AI sur Threads ne peut pas être bloqué par les utilisateurs, soulevant des questions sur le contrôle des interactions avec l'IA.
13 mai · RECHERCHE
R-DMesh : animation 3D guidée par vidéo via un flux de maillage dynamique rectifié
Un framework unifié résout le problème de désalignement de pose entre un mesh statique fourni par l'utilisateur et une vidéo de référence.
14 mai · OPINION
L'autre moitié de la sécurité de l'IA
Au-delà des risques existentiels, un angle souvent négligé : la sécurité de l'IA au niveau individuel et ses implications concrètes.
13 mai · RECHERCHE
TFlow : les agents LLM se coordonnent via des perturbations de poids plutôt que du texte
Un framework de communication entre agents LLM qui remplace les messages textuels par des perturbations LoRA transitoires, réduisant les tokens traités de 83 %.
13 mai · OPINION
MacBook Neo : benchmarks, économie des wafers et le pari du 8 Go de RAM
Une analyse approfondie des performances du MacBook Neo, de la structure de coûts des wafers et des implications du choix de 8 Go de mémoire unifiée.
13 mai · RECHERCHE
Qu'est-ce qui est apprenable dans la théorie de Valiant ?
Une réévaluation du modèle original de Valiant (1984) montre que les membership queries changent radicalement les classes apprenables, au-delà de la simple complexité.
13 mai · RECHERCHE
EVA-Bench : un framework d'évaluation end-to-end pour les agents vocaux
Un benchmark complet pour mesurer les agents IA conversationnels vocaux, couvrant précision, expérience utilisateur et robustesse au bruit.
14 mai · MARCHÉ
Codex en hausse, Claude limite l'usage programmatique de son API
Anthropic modifie sa politique tarifaire pour Claude : les crédits API sont désormais plafonnés au montant de l'abonnement, mettant fin à une subvention implicite estimée à 70-90 %.
13 mai · SIGNAL
Attaque sur la chaîne d'approvisionnement npm TanStack : la réponse d'OpenAI
OpenAI détaille les mesures prises suite à l'attaque "Mini Shai-Hulud" ciblant l'écosystème npm TanStack et ses certificats de signature.
13 mai · RECHERCHE
WARDEN : transcription et traduction d'une langue indigène en danger avec 6 heures de données
Un système en deux étapes transcrit et traduit le Wardaman, langue aborigène australienne menacée, à partir de seulement 6 heures d'audio annoté.
13 mai · OUTILS
DeepSeek lance DeepSeek-V3.1, nouvelle version de son LLM phare
DeepSeek publie DeepSeek-V3.1 sur Hugging Face, une mise à jour de son grand modèle de langage open-weights.
13 mai · OUTILS
DeepSeek lance DeepSeek-V3.2, nouvelle version de son grand modèle
DeepSeek publie DeepSeek-V3.2 sur Hugging Face, une mise à jour de son modèle phare open-weights.
13 mai · OUTILS
Torrix : outil d'observabilité LLM auto-hébergé, sans Postgres ni Redis
Torrix propose une solution légère d'observabilité pour LLM, sans dépendances lourdes comme Postgres ou Redis, entièrement auto-hébergeable.
13 mai · MARCHÉ
Procès OpenAI : Altman confronté aux accusations de mensonges répétés
Sam Altman a dû répondre en justice à des allégations selon lesquelles il mentirait de manière systématique, dans le cadre du procès opposant OpenAI à Elon Musk.
13 mai · SIGNAL
DeepSeek lance DeepSeek-V4-Pro
DeepSeek publie son nouveau modèle phare V4-Pro sur Hugging Face, poursuivant sa stratégie open-weights face aux grands labs occidentaux.
13 mai · OPINION
Les États-Unis dominent la course à l'IA là où ça compte : la commercialisation
Selon cette analyse, l'avance américaine en IA ne se joue pas sur la recherche fondamentale, mais sur la capacité à monétiser et déployer à grande échelle.
13 mai · OUTILS
Utiliser le Claude Agent SDK avec votre abonnement Claude
Anthropic documente l'intégration du Claude Agent SDK pour les abonnés, ouvrant la voie à la création d'agents IA directement depuis un plan existant.
13 mai · RECHERCHE
GridSFM : un petit foundation model de Microsoft pour le réseau électrique
Microsoft publie un modèle léger capable de résoudre les problèmes d'AC optimal power flow en quelques millisecondes, avec des enjeux économiques de 20 milliards de dollars.
13 mai · OUTILS
DeepSeek lance DeepSeek-V4-Flash, nouveau modèle open-weights
DeepSeek publie V4-Flash sur Hugging Face, une nouvelle version allégée de son modèle phare avec poids ouverts.
13 mai · OUTILS
NVIDIA transforme la vidéo en intelligence consultable grâce aux agents IA
Le blueprint NVIDIA Metropolis VSS permet de rendre des millions de flux vidéo instantanément interrogeables via des agents et skills IA.
13 mai · SAFETY
Des chatbots IA divulguent de vrais numéros de téléphone personnels
Des utilisateurs signalent que Gemini de Google a exposé leurs numéros privés, sans solution claire pour y remédier.
13 mai · OUTILS
DeepSeek publie DeepSeek-V4-Flash-Base sur Hugging Face
DeepSeek met à disposition un nouveau modèle de base rapide, V4-Flash-Base, accessible sur Hugging Face.
15 mai · OUTILS
OpenAI construit un sandbox sécurisé pour Codex sur Windows
OpenAI détaille la conception d'un environnement isolé permettant à Codex d'opérer en toute sécurité sur Windows, avec contrôle des accès fichiers et restrictions réseau.
13 mai · MARCHÉ
Anthropic lance Claude pour les petites entreprises
Anthropic déploie une offre dédiée aux PME, rendant ses modèles Claude accessibles aux structures de plus petite taille.
13 mai · RECHERCHE
XANI : analyse accélérée par rayons X pour l'imagerie nanométrique de nouveaux matériaux
NVIDIA présente une pipeline IA pour accélérer l'analyse des données issues des lasers à électrons libres, ouvrant la voie à l'étude de matériaux de fusion et de semi-conducteurs.
13 mai · OUTILS
mimalloc : un allocateur mémoire haute performance pour l'ère moderne
Microsoft Research présente mimalloc, un allocateur mémoire open-source conçu pour les services hautement concurrents et les charges LLM à grande échelle.
13 mai · SAFETY
Google découvre le premier zero-day développé par IA, capable de contourner la 2FA
Un malware auto-mutant et des backdoors propulsés par Gemini signalent une nouvelle ère de cybercriminalité assistée par l'IA.
13 mai · MARCHÉ
Une startup IA modernise les systèmes de contrôle aérien européens et lève 5,5 M$
Une startup spécialisée dans l'IA appliquée à l'aviation décroche un financement de 5,5 millions de dollars pour moderniser la gestion du trafic aérien en Europe.
12 mai · RECHERCHE
TextSeal : un watermark localisé pour LLM avec protection contre la distillation
TextSeal surpasse SynthID-Text en robustesse de détection et résiste à la dilution, tout en étant « radioactif » contre la distillation non autorisée.
12 mai · RECHERCHE
Multi-Stream LLMs : libérer les modèles de langage avec des flux parallèles de pensées, d'entrées et de sorties
Une architecture d'instruction-tuning à flux parallèles permettrait aux LLM d'agir, lire et raisonner simultanément, brisant le goulot d'étranglement séquentiel des agents actuels.
12 mai · RECHERCHE
Un algorithme de gradient proximal pour l'échantillonnage log-concave composite
Un nouvel algorithme d'échantillonnage pour distributions log-concaves composites, avec garanties de convergence optimales via un oracle gaussien restreint.
12 mai · RECHERCHE
Compression d'échantillons à haute arité
Des chercheurs étendent la théorie de la compression d'échantillons aux espaces produits, reliant compression à haute arité et apprenabilité PAC.
12 mai · RECHERCHE
ScaleSearch : optimisation des facteurs d'échelle pour la quantification Block Floating Point
Une nouvelle stratégie de recherche fine des facteurs d'échelle BFP réduit l'erreur de quantification de 27 % sur NVFP4 et améliore les LLM en post-training.
12 mai · OUTILS
DR-Gym : un environnement Gymnasium pour les programmes de demand-response électrique
Des chercheurs publient DR-Gym, un environnement open-source de reinforcement learning centré sur la gestion de la demande électrique résidentielle.
12 mai · RECHERCHE
Attractor Models : des Transformers itératifs pour le langage et le raisonnement
Une nouvelle architecture remplace les boucles instables des Transformers récurrents par un mécanisme de point fixe à mémoire constante et convergence adaptative.
12 mai · RECHERCHE
KV-Fold : inférence longue séquence via récurrence sur le KV-Cache
Une méthode sans entraînement qui traite le KV-Cache comme accumulateur d'un fold fonctionnel pour étendre le contexte jusqu'à 128K tokens.
12 mai · RECHERCHE
MEME : un benchmark pour évaluer la mémoire multi-entités et évolutive des agents LLM
Un nouveau benchmark révèle que tous les systèmes de mémoire testés s'effondrent sur le raisonnement de dépendance, avec des taux de précision proches de zéro.
12 mai · RECHERCHE
Les routeurs apprennent la géométrie de leurs experts dans les modèles SMoE
Une étude révèle un couplage géométrique entre routeurs et experts dans les Sparse MoE, avec des implications sur l'équilibrage de charge.
12 mai · SAFETY
Le reward hacking dans le reinforcement learning basé sur des rubriques
Une étude analyse comment les politiques RL exploitent les failles des vérificateurs basés sur des rubriques, même lorsque ces vérificateurs sont robustes.
12 mai · RECHERCHE
OmniNFT : diffusion RL multi-modalités pour la génération conjointe audio-vidéo
Un nouveau framework de reinforcement learning appliqué à la diffusion résout les déséquilibres entre modalités pour améliorer la génération audio-vidéo synchronisée.
12 mai · RECHERCHE
ToolCUA : orchestration optimale des actions GUI et outils pour les agents informatiques
Un agent end-to-end qui apprend à choisir le meilleur moment pour basculer entre actions GUI atomiques et appels d'outils API, avec +66 % de performance sur OSWorld-MCP.
12 mai · RECHERCHE
Apprentissage rapide et lent : vers des LLM à adaptation continue
Un framework « fast-slow » combine mise à jour des paramètres et optimisation du contexte pour rendre les LLM jusqu'à 3× plus efficaces en apprentissage.
12 mai · RECHERCHE
Raffinement adaptatif d'embeddings guidé par un LLM au moment du test
Des chercheurs d'IBM proposent d'affiner les requêtes d'embedding à l'inférence via un LLM, avec des gains allant jusqu'à +25% sur des tâches zero-shot.
12 mai · RECHERCHE
Au-delà de GRPO et de la distillation on-policy : un principe sparse-to-dense pour le post-entraînement des LLM
Une étude empirique propose d'allouer les données labellisées vérifiables selon un principe de densité de récompense, combinant RL sparse et supervision dense.
12 mai · RECHERCHE
VECA : une attention linéaire élastique pour les Vision Transformers à haute résolution
Une nouvelle architecture ViT élimine l'attention quadratique patch-à-patch grâce à des « core tokens » appris, permettant une complexité linéaire O(N).
12 mai · MARCHÉ
AutoScout24 accélère son ingénierie grâce aux workflows IA
Le groupe AutoScout24 mise sur Codex et ChatGPT pour réduire ses cycles de développement et améliorer la qualité du code.
12 mai · RECHERCHE
Pion : un optimiseur préservant le spectre des matrices via transformation orthogonale
Pion propose une alternative à Adam et Muon pour l'entraînement des LLM en conservant les valeurs singulières des matrices de poids tout au long du processus.
12 mai · RECHERCHE
FairyFuse : inférence LLM sans multiplication sur CPU via des noyaux ternaires fusionnés
Une nouvelle approche élimine les multiplications flottantes lors de l'inférence LLM sur CPU, en exploitant des noyaux ternaires fusionnés pour réduire drastiquement le coût de calcul.
12 mai · RECHERCHE
LongMemEval-V2 : évaluer la mémoire long terme des agents IA comme des collègues expérimentés
Un nouveau benchmark mesure la capacité des agents à mémoriser l'expérience d'environnements web complexes, au-delà des historiques utilisateurs classiques.
12 mai · OUTILS
Comment les ingénieurs et chercheurs de NVIDIA utilisent Codex
Les équipes NVIDIA s'appuient sur Codex avec GPT-4.5 pour livrer des systèmes en production et transformer des idées de recherche en expériences exécutables.
12 mai · RECHERCHE
Ce que le "Parameter Golf" nous a appris sur la recherche assistée par IA
Plus de 1 000 participants, 2 000 soumissions : la compétition Parameter Golf d'OpenAI révèle les limites et le potentiel des agents de recherche en ML.
12 mai · OUTILS
Comment les équipes finance utilisent Codex
OpenAI présente des cas d'usage concrets de Codex pour les équipes financières : reporting, analyses d'écarts, scénarios de planification.
12 mai · RECHERCHE
AlphaGRPO : raisonnement et auto-correction dans les modèles multimodaux unifiés
Un nouveau framework applique GRPO aux modèles multimodaux AR-Diffusion pour activer le raisonnement et l'auto-correction sans phase de démarrage à froid.
13 mai · OPINION
La fin du fine-tuning ? OpenAI déprécie ses APIs et relance le débat
La dépréciation des APIs de fine-tuning d'OpenAI ravive une question centrale : le fine-tuning est-il en train de disparaître du toolkit des ingénieurs IA ?
12 mai · OUTILS
Needle : le tool calling de Gemini distillé dans un modèle de 26 millions de paramètres
Une équipe a compressé les capacités d'appel d'outils de Gemini dans un modèle ultra-léger de 26M paramètres via distillation.
13 mai · OPINION
Le meilleur argument pour expliquer pourquoi l'IA ne prendra pas votre emploi
Entre destructions de postes réelles et statistiques de productivité introuvables, le débat sur l'impact de l'IA sur l'emploi reste ouvert.
12 mai · OUTILS
Gigacatalyst : un builder IA embarqué pour étendre vos applications SaaS
Gigacatalyst permet aux éditeurs SaaS d'intégrer un constructeur d'agents IA directement dans leur produit, sans développement lourd.
12 mai · RÉGULATION
Les agents ICE disposent d'une liste de 20 millions de personnes sur leurs iPhones grâce à Palantir
Palantir a fourni à l'ICE un outil mobile permettant d'accéder instantanément à des données sur 20 millions de personnes depuis un iPhone.
12 mai · SAFETY
Autoencodeurs en langage naturel : à l'intérieur des activations de Claude
Un chercheur explore les représentations internes de Claude en utilisant des autoencodeurs en langage naturel pour décoder ce que le modèle « pense » sans l'exprimer.
12 mai · RÉGULATION
Des résidents du New Jersey accusent les data centers de priver d'eau leurs foyers
À Vineland, les habitants dénoncent une pression hydrique croissante liée aux infrastructures IA, au point de ne plus pouvoir utiliser leurs machines à laver.
12 mai · SAFETY
Des parents accusent ChatGPT d'avoir causé la mort de leur fils par de mauvais conseils sur des drogues
Une famille poursuit OpenAI en justice après le décès de leur fils, estimant que ChatGPT lui a fourni des informations dangereuses sur la combinaison de drogues récréatives.
12 mai · OPINION
Les employés d'Amazon pratiquent le « tokenmaxxing » sous pression d'utiliser l'IA
Face aux injonctions à adopter les outils d'IA, des salariés d'Amazon gonflent artificiellement leur consommation de tokens pour afficher des métriques conformes.
11 mai · OPINION
L'envers des benchmarks : quand les scores ne veulent plus rien dire
Poolside décortique les pratiques de « benchmark hacking » et met en lumière comment les métriques d'évaluation des LLM sont détournées.
12 mai · OUTILS
Statewright : des machines à états visuelles pour fiabiliser les agents IA
Un outil open-source qui propose de modéliser le comportement des agents IA via des machines à états visuelles, pour réduire les comportements imprévisibles.
12 mai · OUTILS
Voker (YC S24) : une solution d'analytics dédiée aux agents IA
La startup Voker, issue du batch S24 de Y Combinator, lance une plateforme d'analytics conçue spécifiquement pour surveiller et optimiser les agents IA.
12 mai · OPINION
Comment les écosystèmes de modèles ouverts créent des effets de capitalisation
Nathan Lambert analyse pourquoi l'open source en IA génère des avantages cumulatifs, notamment en Chine où les acteurs partagent leurs coûts de R&D.
12 mai · OUTILS
Comment éliminer les frictions de pipeline dans le serving de modèles IA
NVIDIA identifie les causes de friction dans le déploiement de modèles IA et propose des solutions pour fluidifier le passage de l'entraînement à la production.
29 mars · OUTILS
DeepMind réinvente le curseur de souris à l'ère de l'IA
Google DeepMind transforme le pointeur de souris en assistant contextuel IA, intégré directement dans Chrome pour une collaboration plus fluide.
12 mai · OUTILS
Hopper : une interface agentique pour mainframes et COBOL
Un outil permettant à des agents IA d'interagir directement avec des systèmes mainframe et du code COBOL legacy.
12 mai · MARCHÉ
Unitree GD01 : le robot transformable chinois à 537 000 $ entre en production
Unitree lance la production en série du GD01, un robot humanoïde capable de se transformer en véhicule, vendu à 537 000 dollars.
12 mai · RECHERCHE
Microsoft Research fait progresser MatterSim pour la simulation et la conception de matériaux
Validation expérimentale, inférence accélérée et nouveau modèle multi-tâches : MatterSim franchit plusieurs étapes clés en science des matériaux.
12 mai · SIGNAL
Des employés d'Amazon utilisent un outil IA pour gonfler artificiellement leurs scores d'utilisation
Des salariés d'Amazon auraient recours à des tâches fictives pour simuler l'usage de l'outil IA interne et améliorer leurs métriques.
12 mai · SAFETY
Attaque supply chain NPM massive : TanStack, Mistral AI et 170 paquets touchés
Une campagne malveillante a compromis plus de 170 paquets NPM, ciblant notamment des projets de TanStack et Mistral AI via des techniques de typosquatting.
12 mai · SIGNAL
Text Blaze (YC W21) recrute pour un stage estival sans IA
La startup Text Blaze, alumni YC W21, propose un stage d'été centré sur des compétences fondamentales, en dehors de toute intégration IA.
11 mai · OPINION
Les messages en langage naturel entre agents LLM sont un anti-pattern architectural
Un développeur argue que faire communiquer des agents LLM via du texte libre est une erreur de conception, et propose une alternative structurée.
11 mai · RECHERCHE
LoKA : un framework FP8 pour les grands modèles de recommandation
Meta-scale recommandation : LoKA rend l'arithmétique FP8 viable là où les LLM avaient montré la voie, mais les modèles de reco résistaient.
11 mai · RECHERCHE
Boucliers de sécurité probabiliste pour les agents autonomes dans les MDP
Un cadre formel étend les techniques de shielding classiques à la sécurité probabiliste dans les processus de décision markoviens.
11 mai · RECHERCHE
Distillation on-policy : quand elle aide, quand elle nuit, et pourquoi
Un framework diagnostique sans entraînement révèle, token par token, quand la distillation on-policy améliore ou dégrade l'apprentissage des modèles de raisonnement.
11 mai · RECHERCHE
BICR : estimer la confiance des LVLM en détectant l'ancrage visuel réel
Un nouveau framework détecte si un modèle vision-langage répond grâce à l'image ou uniquement à partir de ses priors linguistiques.
12 mai · RÉGULATION
Le maire d'Arcadia (Californie) inculpé pour espionnage au profit de la Chine
Un maire californien fait face à des accusations fédérales d'agent non déclaré de la République populaire de Chine.
11 mai · RECHERCHE
V4FinBench : un benchmark de prédiction de faillite sur plus d'un million d'observations
Un nouveau benchmark financier à grande échelle compare LLMs, modèles tabulaires et méthodes classiques sur la prédiction de faillite d'entreprises.
11 mai · RECHERCHE
RubricEM : méta-RL avec décomposition de politique guidée par rubrique
Un framework de reinforcement learning pour agents de recherche complexes, sans récompenses vérifiables, structuré autour de rubriques d'évaluation partagées.
11 mai · SAFETY
Au-delà du red-teaming : garanties formelles pour les classifieurs guardrail de LLM
Des chercheurs proposent un cadre de vérification formelle des classifieurs guardrail, révélant des failles de sécurité vérifiables malgré de bonnes métriques empiriques.
11 mai · RECHERCHE
DataMaster : vers une ingénierie des données autonome pour le machine learning
Un agent autonome optimise uniquement la partie données d'un pipeline ML fixe, via recherche arborescente, mémoire cumulative et pool de données partagé.
11 mai · SAFETY
Google : des hackers criminels ont utilisé l'IA pour découvrir une faille logicielle majeure
Pour la première fois, Google documente un cas où des cybercriminels ont exploité l'IA pour identifier une vulnérabilité critique dans un logiciel.
11 mai · OPINION
Engineering robustesse dans les agents personnels avec l'AI Workflow Store
Des chercheurs plaident pour intégrer les processus d'ingénierie logicielle rigoureux dans la boucle agentique, au lieu de l'improvisation en temps réel.
12 mai · SIGNAL
Le CPO de Cisco prédit que l'IA développera la majorité de ses produits d'ici fin 2027
Le directeur produit de Cisco estime que l'intelligence artificielle sera à l'origine de la plupart des développements logiciels de l'entreprise dans moins de trois ans.
11 mai · RECHERCHE
Gradients de politique en k étapes pour échapper aux optima locaux myopes
Une nouvelle méthode de gradient de politique généralisée sur k étapes permet de dépasser les points critiques sous-optimaux dans les MDP à classes de politiques restreintes.
11 mai · RECHERCHE
Apprentissage par renforcement équivariant pour la synthèse de circuits quantiques Clifford
Un agent RL apprend à synthétiser des circuits quantiques Clifford en surpassant les méthodes classiques de Qiskit, avec une généralisation jusqu'à 30 qubits.
12 mai · OPINION
Procès Musk c. OpenAI : ce que les initiés pensent vraiment de Sam Altman
Le procès opposant Elon Musk à OpenAI révèle des témoignages accablants sur le style de direction de Sam Altman.
11 mai · RECHERCHE
WildClawBench : un benchmark pour l'évaluation d'agents en conditions réelles
Un nouveau benchmark de 60 tâches bilingues et multimodales teste les agents IA sur des workflows longs dans des environnements natifs — les meilleurs modèles peinent à dépasser 62 %.
11 mai · RECHERCHE
Shepherd : un substrat d'exécution pour les méta-agents avec trace formalisée
Shepherd introduit un modèle de programmation fonctionnel qui formate les opérations des méta-agents avec un historique d'exécution de type Git, permettant replay et branchement.
11 mai · OUTILS
E2a – Une passerelle e-mail open-source pour agents IA
E2a permet aux agents IA de recevoir et d'envoyer des e-mails nativement, sans infrastructure complexe.
11 mai · RECHERCHE
Augmentation par diffusion guidée par la confiance pour la reconnaissance de caractères composés en bengali
Un framework combinant diffusion conditionnelle et filtrage par confiance améliore significativement la reconnaissance de caractères manuscrits composés en bengali.
11 mai · RECHERCHE
MAPF optimal et scalable via transport optimal multi-marginal et ponts de Schrödinger
Une reformulation mathématique du problème de navigation multi-robots comme transport optimal réduit drastiquement la complexité de calcul.
11 mai · OPINION
Modèles d'interaction : repenser la conception des interfaces IA
Un essai explore comment les systèmes d'IA redéfinissent les paradigmes d'interaction homme-machine au-delà des interfaces classiques.
11 mai · RECHERCHE
SLIM : gestion dynamique du cycle de vie des compétences pour le RL agentique
Un framework qui optimise en continu l'ensemble des compétences externes actives d'un agent LLM, conjointement avec l'apprentissage par renforcement.
11 mai · OPINION
J'ai laissé l'IA construire un outil pour identifier ce qui me réveillait la nuit
Un développeur raconte comment il a utilisé l'IA pour créer un outil de surveillance nocturne personnalisé afin d'analyser les causes de ses insomnies.
11 mai · RECHERCHE
Quantification de la concentration des Transformers mean-field en régime basse température
Une analyse mathématique rigoureuse montre comment les tokens se concentrent rapidement dans les Transformers profonds à l'inférence, via des outils de systèmes multi-particules.
11 mai · RECHERCHE
DECO : une architecture MoE sparse aux performances comparables aux modèles denses sur appareils edge
Des chercheurs proposent DECO, une architecture MoE qui n'active que 20 % des experts tout en égalant les performances de modèles denses, avec un speedup de 3× sur matériel réel.
11 mai · RECHERCHE
Inférence variationnelle pour SDE à processus de Lévy via le tilting neuronal
Une nouvelle approche combine réseaux de neurones et tilting exponentiel pour l'inférence bayésienne sur des équations différentielles stochastiques à sauts.
11 mai · OPINION
Si l'IA écrit votre code, pourquoi encore utiliser Python ?
Avec les LLM capables de générer du code dans n'importe quel langage, la domination de Python comme langue de choix est-elle encore justifiée ?
11 mai · RECHERCHE
ELF : modèles de flux en espace d'embedding continu pour le langage
Une nouvelle architecture de diffusion linguistique reste en espace continu jusqu'à la dernière étape, surpassant les modèles discrets existants.
12 mai · MARCHÉ
La plateforme Claude désormais disponible sur AWS
Anthropic annonce l'intégration de sa plateforme Claude à l'infrastructure cloud d'Amazon Web Services.
11 mai · MARCHÉ
Comment l'adoption de ChatGPT s'est élargie début 2026
Au premier trimestre 2026, ChatGPT enregistre sa plus forte croissance chez les plus de 35 ans et un usage plus équilibré entre hommes et femmes.
12 mai · RECHERCHE
Thinking Machines lance TML-Interaction-Small, un MoE 276B pour la voix temps réel
Le modèle TML-Interaction-Small de Thinking Machines repousse l'état de l'art de la voix interactive en temps réel avec une architecture MoE encoder-free.
11 mai · OUTILS
Les blocs de construction pour l'entraînement et l'inférence de modèles fondamentaux sur AWS
Hugging Face et AWS détaillent les composants clés pour déployer et entraîner des modèles fondamentaux à grande échelle sur l'infrastructure cloud Amazon.
11 mai · OUTILS
NVIDIA Fleet Intelligence : visibilité et optimisation en temps réel des flottes GPU
NVIDIA lance Fleet Intelligence, un outil de monitoring centralisé pour gérer et optimiser les grandes flottes GPU en environnement multi-tenant.
11 mai · OPINION
Qu'est-ce qui ne va pas avec l'IA ?
Un billet de blog personnel passe en revue les défauts fondamentaux des systèmes d'IA actuels, entre critiques techniques et éthiques.
11 mai · SIGNAL
Un utilisateur annule son abonnement Anthropic, jugé trop coûteux
Un tweet viral illustre la tension croissante entre la valeur perçue des outils IA et leur tarification, au détriment d'Anthropic.
11 mai · OPINION
La vraie menace de l'IA : le contrôle et la surveillance des travailleurs
Au-delà du débat sur les suppressions d'emplois, l'IA s'impose comme un outil de surveillance et de contrôle managérial des salariés.
11 mai · OPINION
Le basculement vers l'inférence
Ben Thompson analyse comment le centre de gravité économique de l'IA se déplace de l'entraînement vers l'inférence.
11 mai · SAFETY
Google : le hacking propulsé par l'IA est devenu une menace à l'échelle industrielle
Selon Google, les cyberattaques assistées par l'IA ont connu une explosion en l'espace de trois mois, franchissant un seuil critique.
11 mai · OPINION
Ce qu'un principe culinaire japonais apprend sur la fatigue liée à l'IA
Un blogueur tire une leçon de la philosophie culinaire japonaise pour mieux gérer l'épuisement face à l'omniprésence de l'IA.
11 mai · SIGNAL
Des étudiants huent une oratrice qui compare l'IA à la révolution industrielle
À l'université UCF, une conférencière invitée à la cérémonie de remise des diplômes a été conspuée après avoir vanté le potentiel de l'IA.
11 mai · MARCHÉ
Bild AI (YC W25) recrute des ingénieurs produit fondateurs
La startup Bild AI, passée par Y Combinator (promotion hiver 2025), ouvre des postes d'ingénieurs produit fondateurs.
11 mai · RECHERCHE
Interfaze : une nouvelle architecture de modèle pour une haute précision à grande échelle
Une startup présente Interfaze, une architecture inédite censée surpasser les transformers classiques en précision sur des tâches à grande échelle.
10 mai · RECHERCHE
Entraîner un LLM en Swift, partie 1 : optimiser la multiplication matricielle jusqu'au Tflop/s
Un développeur détaille comment porter les performances de la multiplication matricielle de quelques Gflop/s à plusieurs Tflop/s en Swift, première étape vers l'entraînement d'un LLM natif.
11 mai · OPINION
L'IA dans la finance : adoption par la base avant la gouvernance
Les équipes financières adoptent l'IA de façon spontanée, laissant les directions courir après la gouvernance et la stratégie.
8 mai · OPINION
AMÁLIA et l'avenir des LLM en portugais européen
Un modèle de langage dédié au portugais européen soulève des questions sur la viabilité et les défis des LLM pour les langues à faibles ressources.
11 mai · OPINION
L'innovation IA par l'ingénierie centrée sur le client
Les organisations qui tirent le meilleur de l'IA partent des besoins clients pour remonter vers la technologie, et non l'inverse.
11 mai · OUTILS
CUDA-oxide : le compilateur Rust vers CUDA officiel de Nvidia
Nvidia publie un compilateur officiel permettant d'écrire du code GPU CUDA directement en Rust, ouvrant la voie à un écosystème plus sûr côté mémoire.
11 mai · RECHERCHE
SocialReasoning-Bench : mesurer si les agents IA agissent dans l'intérêt de l'utilisateur
Microsoft Research publie un benchmark évaluant la capacité des agents IA à négocier efficacement pour leurs utilisateurs dans des contextes sociaux réalistes.
11 mai · OPINION
Trois tendances IA à surveiller selon un économiste prix Nobel
Daron Acemoglu, Nobel d'économie 2024, revient sur ses prévisions prudentes concernant l'IA et identifie les risques qu'il juge réellement préoccupants.
11 mai · MARCHÉ
OpenAI lance DeployCo pour aider les entreprises à déployer l'IA en production
OpenAI crée une filiale dédiée au déploiement enterprise de ses modèles frontier, avec un objectif de retour sur investissement mesurable.
29 mai · OUTILS
Kimi-Audio-7B : le modèle audio open-weights de Moonshot AI
Moonshot AI publie Kimi-Audio-7B, un modèle multimodal audio de 7 milliards de paramètres disponible en open-weights sur Hugging Face.
11 mai · OPINION
Des étudiants avouent l'usage de l'IA : un professeur en tire une leçon pédagogique
Un enseignant en écriture créative confronte ses étudiants à leur usage de l'IA et transforme leurs aveux en exercice pédagogique.
11 mai · SIGNAL
Un data center IA en Géorgie a consommé 29 millions de gallons d'eau
Un projet de data center dédié à l'IA en Géorgie a puisé 29 millions de gallons d'eau, relançant le débat sur l'empreinte hydrique de l'industrie.
11 mai · OPINION
Ces outils IA de prise de notes rendent les avocats nerveux
La prolifération des assistants IA de transcription en réunion soulève des questions juridiques sérieuses sur la confidentialité et le secret professionnel.
24 avr. · SIGNAL
DeepSeek lance DeepSeek-V4, sa nouvelle génération de modèles
DeepSeek publie la collection DeepSeek-V4 sur Hugging Face, marquant une nouvelle étape dans le développement de ses modèles de langage open-weights.
11 mai · OPINION
Hollywood : les créatifs de la TV reconvertis dans l'entraînement de l'IA
Des scénaristes, réalisateurs et techniciens du secteur audiovisuel migrent massivement vers les entreprises d'IA pour alimenter leurs modèles.
11 mai · RECHERCHE
Dix minutes d'IA suffiraient à réduire vos capacités cognitives
Une étude suggère qu'une brève exposition aux outils d'IA aurait un impact négatif mesurable sur la réflexion et la résolution de problèmes.
8 mai · RECHERCHE
PropSplat : reconstruction de champs RF sans carte via Gaussian Splatting 3D
PropSplat modélise la propagation radio en environnements inconnus grâce à des primitives gaussiennes 3D, sans carte ni base de données géographique.
8 mai · RECHERCHE
CUTS-GPR : régression par processus gaussiens exacte pour données de haute dimension
Une nouvelle méthode permet d'appliquer la régression par processus gaussiens à des milliards de points en haute dimension, avec une mise à l'échelle quasi-linéaire.
8 mai · RECHERCHE
SCOPE : décomposition structurée et orchestration de compétences pour la génération d'images complexes
Un cadre d'orchestration guidé par spécifications qui maintient des engagements sémantiques tout au long du cycle de génération d'images.
8 mai · RECHERCHE
Fast Byte Latent Transformer : accélérer les modèles de langage au niveau octet
Des chercheurs proposent plusieurs techniques pour rendre les LMs byte-level jusqu'à deux fois plus rapides, sans sacrifier la qualité de génération.
8 mai · RECHERCHE
GraphDPO : optimiser un graphe de préférences plutôt que des paires
Une généralisation du Direct Preference Optimization exploitant la structure complète des graphes de préférences pour mieux aligner les LLM.
8 mai · RECHERCHE
Extraction structurée de rapports CMR par LLM distillé avec estimation d'incertitude
CMR-EXTR convertit des comptes rendus d'IRM cardiaque en données structurées avec un score de confiance par champ, atteignant 99,65 % de précision.
8 mai · RECHERCHE
CA-SQL : raisonnement adaptatif à la complexité pour le Text-to-SQL
Un pipeline Text-to-SQL qui ajuste dynamiquement l'exploration selon la difficulté estimée de la requête, atteignant l'état de l'art sur BIRD-Bench.
8 mai · RECHERCHE
Test statistique précis et efficace pour mesurer l'étendue sémantique des mots
Une nouvelle méthode basée sur la réflexion de Householder réduit les faux positifs de 32,5 % lors de la comparaison de la polysémie contextuelle de deux mots.
8 mai · RECHERCHE
La malédiction de la mémoire : comment l'historique étendu nuit à la coopération des agents LLM
Élargir la fenêtre de contexte des LLM dégrade la coopération dans les dilemmes sociaux multi-agents — un phénomène contre-intuitif documenté sur 7 modèles et 4 jeux.
8 mai · RECHERCHE
Apprentissage par renforcement pour l'utilité exponentielle : algorithmes et convergence dans les MDPs escomptés
Des algorithmes Q-learning adaptés à l'optimisation risk-averse par utilité exponentielle dans les processus de décision markoviens escomptés.
8 mai · RECHERCHE
Rubric-Grounded RL : récompenses structurées pour un raisonnement généralisable
Un framework de RL où les récompenses sont décomposées en critères pondérés et vérifiables, notés par un LLM juge, améliore le transfert vers de nouveaux benchmarks.
8 mai · RECHERCHE
VecCISC : optimisation du vote pondéré en self-consistency par clustering sémantique
Un nouveau framework réduit de 47 % les tokens consommés par le voting pondéré en filtrant les traces de raisonnement sémantiquement redondantes.
8 mai · RECHERCHE
Flow-OPD : distillation on-policy pour les modèles Flow Matching
Un framework post-entraînement unifié combine distillation on-policy et Flow Matching pour aligner les modèles texte-image sans effet seesaw.
8 mai · RECHERCHE
Polynômes L₁-approchants non négatifs sous distributions gaussiennes
Une note mathématique établit l'existence de polynômes d'approximation non négatifs pour les indicatrices de classes de sets, avec des bornes de degré quasi-optimales.
10 mai · SIGNAL
Les développeurs de l'émulateur PS3 demandent d'arrêter les PR générées par IA
Le projet RPCS3 croule sous les pull requests produites par des LLM — ses mainteneurs demandent poliment aux contributeurs de cesser cette pratique.
8 mai · RECHERCHE
EmambaIR : un State Space Model efficace pour la reconstruction d'images guidée par événements
EmambaIR combine attention sparse top-k et modules d'état gatés pour reconstruire des images haute résolution à partir de caméras événementielles.
8 mai · RECHERCHE
GRAPHLCP : prédiction conforme localisée et structurellement informée sur les graphes
Un framework de conformal prediction intégrant la topologie des graphes dans le processus de localisation, pour une meilleure quantification de l'incertitude dans les GNN.
10 mai · RÉGULATION
Les citoyens du Maryland facturés 2 Md$ pour des data centers IA hors État
Le Maryland dénonce auprès des régulateurs fédéraux une facture de 2 milliards de dollars imposée à ses habitants pour moderniser le réseau électrique au profit de data centers IA situés hors de l'État.
10 mai · OPINION
Claude simulant une pile IP en espace utilisateur : quelle latence pour répondre aux pings ?
Un développeur a demandé à Claude d'implémenter une pile IP complète en espace utilisateur et mesure le temps de réponse aux requêtes ICMP ping.
8 mai · RECHERCHE
Décodage zero-shot de la parole imaginée via un mapping MEG imagination-écoute
Des chercheurs proposent un pipeline en trois étapes pour décoder la parole imaginée à partir d'enregistrements MEG non invasifs, sans données annotées d'imagination.
11 mai · OUTILS
adamsreview : revues de PR multi-agents améliorées pour Claude Code
Un outil open-source qui exploite plusieurs agents en parallèle pour produire des revues de pull requests plus approfondies avec Claude Code.
10 mai · OPINION
Un agent de codage IA doit réduire vos coûts de maintenance
James Shore argue que l'IA de codage ne vaut son coût que si elle diminue la dette technique et les charges de maintenance à long terme.
8 mai · RECHERCHE
Normalizing Trajectory Models : génération d'images en 4 étapes avec vraisemblance exacte
Une nouvelle architecture combine normalizing flows et diffusion pour générer des images en seulement 4 étapes tout en conservant une vraisemblance exacte.
8 mai · RECHERCHE
Conformal Path Reasoning : réponse fiable aux questions sur graphes de connaissances
Un nouveau framework combine la prédiction conforme et l'exploration guidée par PUCT pour garantir statistiquement la couverture des réponses dans les systèmes KGQA.
11 mai · SIGNAL
OpenAI Campus Network : formulaire d'intérêt pour clubs étudiants
OpenAI lance un réseau mondial de clubs étudiants pour favoriser l'adoption de l'IA sur les campus universitaires.
10 mai · OPINION
L'IA locale doit devenir la norme
Un plaidoyer pour faire de l'IA locale le standard par défaut, face aux risques de dépendance aux services cloud centralisés.
8 mai · RECHERCHE
AutoTTS : des LLMs qui optimisent automatiquement le test-time scaling
Un framework permet à des agents LLM de découvrir automatiquement des stratégies de test-time scaling, surpassant les approches conçues manuellement pour moins de 40 $.
11 mai · OPINION
Comment les entreprises font passer l'IA à l'échelle
OpenAI détaille les étapes clés pour déployer l'IA en entreprise : gouvernance, confiance, design des workflows et qualité à grande échelle.
15 avr. · OUTILS
HoloTab : tutoriel de l'agent IA de H Company
H Company publie un tutoriel pour HoloTab, son agent IA capable d'interagir avec des applications desktop et web.
11 mai · OUTILS
Google Finance alimenté par l'IA s'étend en Europe
La nouvelle version de Google Finance, dopée à l'IA, est désormais disponible en Europe avec un support complet des langues locales.
10 mai · SIGNAL
Des avocats de Wall Street auraient aidé un réseau de délit d'initié, selon la justice américaine
Le parquet américain accuse plusieurs avocats de Wall Street d'avoir participé à un réseau organisé de délit d'initié.
10 mai · OPINION
Une décennie à voyager avec Spirit Airlines
Un passager fidèle tire sa révérence après dix ans de vols avec la compagnie low-cost Spirit Airlines, récemment placée en faillite.
10 mai · OUTILS
Classement de 1 000 posts ShowHN par mérite estimé via un LLM juge et TrueSkill
Un projet open source utilise un LLM comme juge et l'algorithme TrueSkill pour évaluer et classer 1 000 soumissions ShowHN par mérite.
10 mai · OPINION
Le futur dystopique des soins aux personnes âgées passé au crible
Un journaliste teste AIREC, le robot japonais de soins aux personnes âgées, et livre une vision sombre de ce que pourrait devenir la dépendance.
10 mai · OUTILS
Les fonctions IA de Chrome pourraient occuper 4 Go de stockage sur votre machine
Gemini Nano, intégré nativement à Chrome, télécharge silencieusement plusieurs gigaoctets de données sans avertissement explicite.
10 mai · OUTILS
Compétences de recherche académique pour Claude Code
Un dépôt GitHub propose un ensemble de compétences et prompts structurés pour transformer Claude Code en assistant de recherche académique.
10 mai · OUTILS
MachinaCheck : un système multi-agent de vérification de faisabilité CNC sur AMD MI300X
Un projet issu d'un hackathon déploie une architecture multi-agent pour évaluer automatiquement la manufacturabilité de pièces CNC, en s'appuyant sur les GPU AMD MI300X.
10 mai · OPINION
Paralysie des tâches et intelligence artificielle
Comment l'IA peut à la fois aggraver et atténuer la paralysie décisionnelle face aux tâches complexes.
10 mai · SAFETY
Le système de ciblage IA d'Israël : des données téléphoniques transformées en condamnation à mort
Une enquête du Los Angeles Times révèle comment l'armée israélienne utilise l'IA pour identifier et cibler des individus à Gaza à partir de métadonnées téléphoniques.
10 mai · RECHERCHE
Agent de récupération superintelligent : la prochaine frontière de la recherche d'information
Un papier arXiv pose les bases théoriques d'agents de retrieval superintelligents capables de dépasser les systèmes RAG actuels.
10 mai · OPINION
La défiance de la Gen Z envers l'IA progresse tandis que l'adoption stagne
Une étude de la Walton Family Foundation révèle que les jeunes adultes américains se montrent de plus en plus méfiants à l'égard de l'IA, craignant pour leur emploi.
10 mai · OUTILS
Modafinil : faire tourner des agents IA même MacBook fermé
Un outil open-source empêche macOS de suspendre les processus d'agents IA lorsque l'écran du MacBook est rabattu.
10 mai · OPINION
LLMorphisme : quand les humains se perçoivent comme des LLM
Un papier explore comment l'essor des LLM influence la manière dont les individus conceptualisent leur propre cognition et identité.
10 mai · SIGNAL
Le domaine openai.com appartenait autrefois à un certain Glenn
Avant de devenir l'adresse de l'un des laboratoires d'IA les plus influents, openai.com était le site personnel d'un inconnu.
9 mai · OPINION
Nvidia à zéro : le scénario catastrophe pour le géant des puces IA
Un essai explore comment Nvidia, dominant du marché des GPU pour l'IA, pourrait perdre toute sa valeur face à des ruptures technologiques.
10 mai · OPINION
Agent Harness Engineering : structurer les agents IA pour la production
Un fil d'expert explore les bonnes pratiques pour concevoir des harnais d'agents IA robustes et déployables en environnement réel.
9 mai · OPINION
Comment l'IA chez Meta rend ses employés malheureux
Les salariés de Meta expriment leur malaise face à la montée en puissance de l'IA au sein de l'entreprise, selon le New York Times.
10 mai · OUTILS
MCP pour environnements sandboxés et reproductibles dans les workflows de codage agentique
Un serveur MCP open-source permettant aux agents de coder dans des devcontainers isolés et reproductibles, sans risque pour l'hôte.
10 mai · OUTILS
L'API Gemini File Search devient multimodale
Google étend les capacités de son API Gemini File Search avec le support multimodal, ouvrant la voie à un RAG combinant texte, images et autres formats.
9 mai · OPINION
Lua comme langage de « socle souple » pratique
Un développeur défend Lua comme langage de fondation universel, simple et portable, à adopter avant tout autre outil spécialisé.
9 mai · OPINION
Comment les joueurs de Go se privent de leur autonomie face à l'IA
Les joueurs de Go adoptent massivement les recommandations des IA, au risque de perdre leur jugement propre et leur culture du jeu.
9 mai · RECHERCHE
OncoAgent : un framework multi-agents à deux niveaux pour l'aide à la décision en oncologie respectueuse de la vie privée
Un système multi-agents dédié à l'oncologie combine raisonnement clinique et protection des données patients sans recours au cloud.
9 mai · SAFETY
Les LLM altèrent vos documents quand vous leur déléguez des tâches
Une étude montre que les LLM introduisent des modifications non sollicitées dans les documents lors de tâches d'édition déléguées, soulevant des risques d'intégrité.
9 mai · SIGNAL
DeepSeek publie DeepSeek-V3.2-Exp, nouvelle version expérimentale de son LLM
DeepSeek met en ligne DeepSeek-V3.2-Exp sur Hugging Face, une version expérimentale de son modèle phare V3.
9 mai · OUTILS
DeepSeek lance DeepSeek-V3.1-Terminus sur Hugging Face
DeepSeek publie une nouvelle version de son modèle V3, baptisée Terminus, directement sur Hugging Face.
9 mai · RÉGULATION
Le sida reprend de l'ampleur en Zambie, un an après les coupes américaines à l'aide contre le VIH
Les réductions du financement PEPFAR par Washington commencent à produire des effets mesurables sur le terrain en Zambie, avec une résurgence des cas de VIH.
9 mai · OPINION
Tous mes clients voulaient un carrousel, maintenant c'est un chatbot IA
Un développeur web observe que le chatbot IA est devenu le nouveau carrousel : une fonctionnalité que tous les clients réclament sans vraiment en avoir besoin.
7 mai · MARCHÉ
Accord xAI/Anthropic : notes sur le deal autour du data center Colossus
Anthropic va utiliser toute la capacité du data center Colossus 1 de xAI/SpaceX, malgré son bilan environnemental controversé.
9 mai · RECHERCHE
Killswitch : une primitive de mitigation par fonction pour le noyau Linux
Une proposition au noyau Linux introduit un mécanisme de court-circuit par fonction pour atténuer les vulnérabilités CPU de type Spectre.
9 mai · OPINION
« Je n'utiliserai jamais l'IA pour coder »
Un développeur expose ses raisons de refuser catégoriquement l'assistance de l'IA dans son travail de code et d'écriture.
8 mai · SAFETY
Enseigner à Claude le « pourquoi » de ses valeurs
Anthropic publie un article détaillant sa méthode pour ancrer les raisons profondes des valeurs d'alignement chez Claude, au-delà des simples règles.
6 mai · OUTILS
Gain de plus de 10 % en inférence multimodale avec un simple dictionnaire Python
Un chercheur de Modal obtient plus de 10 % de performance supplémentaire en inférence multimodale grâce à une astuce de configuration minimaliste.
8 mai · RECHERCHE
Les LLM peuvent-ils modéliser des systèmes réels en TLA+ ?
Une étude examine la capacité des grands modèles de langage à formaliser des systèmes distribués complexes dans le langage de spécification TLA+.
9 mai · OPINION
Utiliser Claude Code : l'efficacité surprenante du HTML
Un retour d'expérience sur l'usage de Claude Code met en lumière pourquoi le HTML s'avère étonnamment puissant dans les workflows de développement assisté par IA.
8 mai · RÉGULATION
Musk contre Altman semaine 2 : OpenAI riposte et Zilis révèle une tentative de recrutement
Greg Brockman contredit Musk au procès, tandis que Shivon Zilis révèle que Musk avait tenté de débaucher Sam Altman pour Tesla.
7 mai · OPINION
Le problème WebRTC d'OpenAI
Un post technique décortique pourquoi WebRTC pose des problèmes structurels dans l'infrastructure temps réel d'OpenAI.
9 mai · MARCHÉ
Anthropic valorisée à 1 200 Md$ pendant que ses concurrents licencient
Anthropic afficherait une croissance de revenus 10x par an et dépasserait OpenAI en valorisation, tandis que Block, Coinbase et Cloudflare suppriment des milliers de postes.
8 mai · RECHERCHE
Microsoft Research publie un dataset open source du réseau électrique américain à grande échelle
Un pipeline entièrement fondé sur des données publiques produit des modèles de réseau de transport d'électricité couvrant les 48 États américains.
8 mai · SAFETY
Comment OpenAI fait tourner Codex en toute sécurité
OpenAI détaille son approche pour déployer Codex en interne : sandboxing, politiques réseau et télémétrie native pour les agents.
8 mai · SIGNAL
Mythos a déclenché une 'hystérie' en cybersécurité, mais la menace existait déjà
L'agent IA Mythos d'Anthropic a semé l'inquiétude dans le secteur bancaire, mais les experts soulignent que les risques cyber liés à l'IA ne sont pas nouveaux.
8 mai · OUTILS
Re_gent : un système de versioning Git conçu pour les agents IA
Re_gent propose un workflow de contrôle de version adapté aux agents IA autonomes, inspiré de Git mais repensé pour leurs contraintes spécifiques.
8 mai · OPINION
Sécurité des agents IA et AIOps : le sandboxing par composants
Comment l'architecture orientée composants WebAssembly permet d'isoler et sécuriser les agents IA autonomes dans des environnements de production.
8 mai · OUTILS
Streaming et outils : support multi-tour pour agents dans NVIDIA Dynamo
NVIDIA détaille dans Dynamo la gestion des échanges agentiques multi-tours, avec streaming de tokens, appels d'outils et rejeu sélectif du raisonnement.
8 mai · OPINION
L'IA fragilise deux cultures de gestion des vulnérabilités
L'automatisation par l'IA bouleverse les équilibres établis entre divulgation responsable et sécurité offensive, menaçant deux modèles culturels distincts.
8 mai · RECHERCHE
EMO : pré-entraînement d'un mixture of experts pour une modularité émergente
AllenAI présente EMO, une approche MoE où la spécialisation des experts émerge naturellement du pré-entraînement sans supervision explicite.
8 mai · RECHERCHE
David Reich : pourquoi l'âge du Bronze fut un point d'inflexion de l'évolution humaine
Un nouveau papier renverse le consensus : la sélection naturelle ne s'est pas endormie après la révolution agricole, elle s'est accélérée.
30 oct. · RECHERCHE
Kimi Linear : une architecture d'attention expressive et efficace
Moonshot AI dévoile une nouvelle architecture d'attention linéaire conçue pour combiner expressivité et efficacité computationnelle.
8 mai · RECHERCHE
Améliorer la génération de commandes Bash dans les petits modèles de langage avec le décodage contraint par grammaire
L'équipe Red Team d'NVIDIA explore comment le décodage contraint par grammaire permet aux petits LLM de générer des commandes Bash plus fiables et sûres.
8 mai · SAFETY
Enseigner à Claude le « pourquoi » de ses règles
Anthropic détaille sa méthode pour transmettre à Claude non seulement des règles de comportement, mais aussi les raisonnements éthiques qui les fondent.
2 févr. · RECHERCHE
Kimi K2.5 : Intelligence Agentique Visuelle par Moonshot AI
Moonshot AI publie Kimi K2.5, un modèle multimodal axé sur les capacités agentiques visuelles, capable d'agir dans des environnements complexes.
6 mai · RÉGULATION
Comment ChatGPT apprend sur le monde tout en protégeant la vie privée
OpenAI détaille ses mécanismes de protection des données personnelles dans l'entraînement de ChatGPT et les options de contrôle offertes aux utilisateurs.
8 mai · OUTILS
CyberSecQwen-4B : pourquoi la cyberdéfense a besoin de petits modèles spécialisés et exécutables localement
Un modèle de 4 milliards de paramètres dédié à la cybersécurité défensive, conçu pour tourner en local sans infrastructure cloud.
8 mai · MARCHÉ
Google lance « The Small Brief » : des créatifs pub au service des petits commerces via l'IA
Google associe trois figures emblématiques de la publicité pour créer des campagnes IA au profit de commerces locaux qu'ils affectionnent.
8 mai · OUTILS
OpenAI lance GPT Realtime-2, Translate et Whisper : nouvelles APIs voix en temps réel
OpenAI publie trois nouveaux modèles vocaux dont GPT Realtime-2, avec +15,2 % sur le benchmark Big Bench Audio et un contexte étendu à 128K tokens.
7 mai · SAFETY
Anthropic fait don de son outil open-source d'alignement
Anthropic cède à la communauté open-source un outil développé en interne pour la recherche en alignement de l'IA.
8 mai · OUTILS
MedQA : fine-tuning d'une IA clinique sur AMD ROCm, sans CUDA
Un retour d'expérience sur l'entraînement d'un modèle médical question-réponse en utilisant AMD ROCm comme alternative à CUDA.
7 mai · RECHERCHE
Citations non vérifiées : évaluation de l'attribution de sources dans les agents de recherche LLM
Un nouveau framework évalue la fiabilité des citations générées par les agents de recherche IA — et les résultats sur la précision factuelle sont préoccupants.
7 mai · RECHERCHE
L'RL peut-il enseigner le raisonnement long-horizon aux LLM ? L'expressivité est la clé
Une étude révèle que le coût d'entraînement par RL suit une loi de puissance avec la profondeur du raisonnement, et que l'expressivité logique est un levier critique.
7 mai · RECHERCHE
Recursive Agent Optimization : entraîner des agents à se déléguer des sous-tâches récursivement
RAO est une approche par reinforcement learning pour des agents capables de s'instancier récursivement, améliorant l'efficacité et la généralisation.
7 mai · RECHERCHE
GlazyBench : un benchmark pour la prédiction et la génération visuelle d'émaux céramiques
Premier dataset dédié à la conception d'émaux céramiques par IA, GlazyBench réunit 23 148 formulations réelles pour deux tâches clés.
7 mai · RECHERCHE
Explications abductives et contrastives basées sur des concepts pour les modèles de vision
Une nouvelle approche fusionne explications conceptuelles et formelles pour identifier les concepts de haut niveau causalement déterminants dans les prédictions des réseaux de neurones.
7 mai · RECHERCHE
StraTA : renforcer l'apprentissage par renforcement agentique via l'abstraction stratégique de trajectoires
Un framework hiérarchique qui génère une stratégie explicite avant l'action pour améliorer l'exploration et l'attribution du crédit dans les LLM agents.
7 mai · RECHERCHE
Généralisation de domaine multimodale : un benchmark unifié révèle des progrès limités
MMDG-Bench standardise l'évaluation de la généralisation de domaine multimodale sur 6 datasets et révèle que les gains récents sont souvent marginaux.
7 mai · RECHERCHE
Prédiction du rendement quantique des protéines fluorescentes par graphes 3D centrés sur le chromophore
Une méthode basée sur des graphes mécanistiques 3D surpasse les modèles de langage protéique pour prédire le rendement quantique des protéines fluorescentes.
7 mai · RECHERCHE
Prédicteurs Venn-Abers inductifs et régresseurs associés
Une généralisation des prédicteurs Venn-Abers à la régression non bornée, combinant prédiction conforme et garanties de validité probabiliste.
7 mai · RECHERCHE
AI Co-Mathematician : accélérer la recherche mathématique avec des agents IA
Un environnement de travail agentique dédié aux mathématiciens obtient 48 % sur FrontierMath Tier 4, nouveau record toutes IA confondues.
7 mai · RECHERCHE
POPO : optimisation de politique sans rollouts négatifs pour les LLM
Un nouveau framework RLVR apprend exclusivement à partir de rollouts positifs, faisant émerger des gradients négatifs implicitement sans pénaliser les échecs.
7 mai · RECHERCHE
SIRA : un agent de recherche documentaire superintelligent pour compresser les cycles de récupération
SIRA remplace les boucles d'exploration itératives par une seule action de récupération discriminative, surpassant les retrievers denses sur dix benchmarks BEIR.
8 mai · OPINION
L'IDE devrait devenir un système d'exploitation pour l'IA
Un développeur plaide pour repenser l'IDE comme couche d'orchestration centrale des agents IA, à l'image d'un OS.
7 mai · SAFETY
Évaluation comparative de la sûreté des LLM sans benchmark de référence
Des chercheurs formalisent une méthode d'audit de sûreté des LLM applicable quand aucun benchmark labellisé n'existe encore pour un contexte donné.
7 mai · SIGNAL
CVE-2026-42511 : une faille RCE vieille de 21 ans découverte dans FreeBSD
Une vulnérabilité d'exécution de code à distance dormant depuis 21 ans dans FreeBSD vient d'être identifiée et documentée.
7 mai · OUTILS
Kstack : un pack de compétences pour surveiller Kubernetes dans Claude Code
Kstack intègre des capacités de monitoring et de dépannage Kubernetes directement dans l'environnement Claude Code via un skill pack dédié.
7 mai · RECHERCHE
Cohérence optimiseur-modèle : le fine-tuning avec le même optimiseur réduit l'oubli catastrophique
Utiliser le même optimiseur en pré-entraînement et en SFT améliore le compromis apprentissage/oubli, surpassant même LoRA selon cette étude.
7 mai · RECHERCHE
Pourquoi les classements mondiaux de LLM sont trompeurs : portfolios réduits pour ML hétérogène
Une analyse de 89 000 comparaisons sur 52 LLMs montre que les classements globaux type Arena masquent une hétérogénéité structurée par langue et contexte.
7 mai · RECHERCHE
VHG : génération de problèmes mathématiques difficiles assistée par vérificateur
Un framework en trois parties intègre un vérificateur indépendant pour contraindre la génération de problèmes mathématiques valides et difficiles par les LLM.
8 mai · OUTILS
AnamDB – un moteur Datalog différentiable et natif IA, écrit en Rust
Un développeur présente AnamDB, un moteur de base de données logique Datalog conçu pour l'IA, différentiable et implémenté en Rust.
8 mai · SAFETY
CVE-2026-39861 : évasion du sandbox de Claude Code via symlink
Une faille de sécurité dans Claude Code permet à un attaquant d'échapper au sandbox via une attaque par lien symbolique.

← Tous les mois