500 articles

juin 2026

Toute la veille IA Fellow publiée en juin 2026.

30 juin · OUTILS
Claude Desktop désormais disponible sur Linux (version bêta)
Anthropic élargit la compatibilité de son application desktop : Claude est maintenant accessible nativement sous Linux, en version bêta.
30 juin · OUTILS
DGX Spark face au Mac Studio et au Halo : comparaison matérielle pour l'IA locale
Le DGX Spark de NVIDIA s'attaque au marché des stations de travail IA compactes, face au Mac Studio d'Apple et d'autres alternatives.
30 juin · MARCHÉ
AWS investit 1 milliard de dollars dans une unité IA pour intégrer des ingénieurs chez ses clients
Amazon Web Services crée une nouvelle division dédiée à l'IA avec un budget d'un milliard de dollars pour déployer des ingénieurs directement auprès des entreprises clientes.
30 juin · OPINION
Question HN : existe-t-il un wrapper sécurisé pour les agents de codage ?
La communauté Hacker News s'interroge sur les solutions d'isolation et de sécurité pour encadrer les agents de codage autonomes.
30 juin · SIGNAL
Installer Cursor sur iOS modifie irrémédiablement vos paramètres de confidentialité
Des utilisateurs signalent que l'installation de l'app Cursor sur iOS entraîne des modifications permanentes des réglages de confidentialité, sans possibilité de retour arrière.
30 juin · SIGNAL
Nouvelles chaînes de l'app Claude et retour de Fable 5 avec vérification
Des strings inédites découvertes dans l'application Claude laissent entrevoir de nouvelles fonctionnalités, tandis que Fable 5 reviendrait conditionné à une vérification.
30 juin · SAFETY
Anthropic aurait intégré du code espion caché dans Claude Code
Un tweet viral accuse Anthropic d'avoir dissimulé du code à comportement espion dans son outil de coding Claude Code.
30 juin · RÉGULATION
Les portefeuilles d'identité numérique européens dépendent des services de sécurité de Google et Apple
L'initiative d'identité numérique de l'UE repose sur les infrastructures de deux géants américains, soulevant des questions de souveraineté.
30 juin · RECHERCHE
Genebench-Pro : dans les coulisses du benchmark génomique d'OpenAI
OpenAI dévoile Genebench-Pro, un benchmark dédié à l'évaluation des capacités des modèles d'IA sur des tâches de génomique.
30 juin · SIGNAL
DeepMind dévoile Gemini Flash Lite, un modèle image compact
DeepMind publie Gemini Flash Lite, une version allégée de ses modèles de génération d'images, ciblant les usages à faible latence.
30 juin · OUTILS
Hugging Face intègre les résultats « Every Eval Ever » sur les pages de modèles
Hugging Face affiche désormais les évaluations de la communauté directement sur les fiches de modèles, centralisant les benchmarks tiers.
30 juin · OUTILS
Core dump épidémiologie : correction d'un bug vieux de 18 ans
Des ingénieurs d'OpenAI ont utilisé l'analyse massive de core dumps pour traquer des crashs rares d'infrastructure et découvrir un bug logiciel dormant depuis 18 ans.
30 juin · SAFETY
Claude Code marque stéganographiquement ses requêtes
Un chercheur découvre que Claude Code insère des marqueurs invisibles dans ses requêtes HTTP pour signaler son identité à l'API Anthropic.
30 juin · OUTILS
Optimisation d'un pipeline de reconstruction neuronale avec NVIDIA Nsight
NVIDIA détaille comment ses outils Nsight permettent d'optimiser NuRec, son pipeline de reconstruction 3D neuronale pour véhicules autonomes et robotique.
30 juin · OUTILS
Anthropic lance Claude Science, une offre dédiée à la recherche scientifique
Anthropic présente Claude Science, une déclinaison de Claude spécialement conçue pour accélérer les travaux de recherche scientifique.
30 juin · OUTILS
Claude Science, un environnement de travail IA pour scientifiques, est désormais disponible
Anthropic lance Claude Science, une plateforme spécialisée destinée aux chercheurs et scientifiques pour accélérer leurs travaux grâce à l'IA.
30 juin · OPINION
Pourquoi la spécialisation des modèles d'IA est inévitable
Les LLM généralistes atteignent leurs limites : Hugging Face argumente que l'avenir appartient aux modèles spécialisés par domaine.
30 juin · RECHERCHE
OpenAI lance GeneBench-Pro, un benchmark IA dédié à la génomique
OpenAI dévoile GeneBench-Pro, un benchmark conçu pour évaluer les capacités des modèles d'IA dans les domaines de la génomique, de la biologie et de la recherche scientifique.
30 juin · RECHERCHE
SkillOpt : les compétences d'agents IA comme paramètres entraînables
Microsoft Research transforme les fichiers de compétences d'agents en paramètres optimisables, sans modifier les poids du modèle cible.
30 juin · OPINION
Grant Sanderson – L'IA et l'avenir des mathématiques
Le créateur de 3Blue1Brown analyse comment l'IA progresse plus vite en maths que dans d'autres domaines, et ce que cela révèle pour l'avenir.
30 juin · OUTILS
Faire enregistrer des démos vidéo par vos agents avec shot-scraper video
La version 1.10 de shot-scraper introduit une commande permettant aux agents de coder de générer automatiquement des vidéos de démonstration de leurs travaux.
30 juin · OUTILS
Anthropic lance Claude Sonnet 4.5
Anthropic dévoile Claude Sonnet 4.5, un nouveau modèle intermédiaire promettant des performances accrues pour les usages quotidiens.
30 juin · OUTILS
Concevoir des moteurs de requêtes accélérés par GPU avec NVIDIA GQE
NVIDIA détaille comment ses avancées matérielles — HBM, NVLink-C2C et décompression dédiée — lèvent les goulots d'étranglement mémoire et I/O des moteurs de requêtes GPU.
30 juin · RECHERCHE
ScarfBench : un benchmark pour évaluer les agents IA dans la migration de frameworks Java d'entreprise
IBM Research publie ScarfBench, un benchmark dédié à l'évaluation des agents IA sur des tâches réelles de migration de frameworks Java en contexte enterprise.
30 juin · OUTILS
Gemini Nano Banana 2 Lite et Gemini Omni Flash désormais disponibles pour les développeurs
DeepMind ouvre l'accès à deux nouveaux modèles Gemini optimisés pour la légèreté et la rapidité d'inférence.
30 juin · MARCHÉ
Comment l'adoption de ChatGPT s'est étendue à l'échelle mondiale
OpenAI publie de nouvelles données Signals montrant la croissance de ChatGPT : davantage d'utilisateurs, plus de fonctionnalités explorées, expansion régionale et multilingue.
30 juin · OUTILS
ZLUDA 6 : exécuter des applications CUDA sans modification sur des GPU non-Nvidia
Le projet ZLUDA franchit une nouvelle étape avec sa version 6, permettant de faire tourner des workloads CUDA natifs sur du matériel AMD ou Intel.
30 juin · OPINION
L'agriculture est prête pour l'IA, mais pas ses données
Les promesses de l'IA agricole sont réelles, mais sans fondation de données solide, les modèles prédictifs risquent de produire des résultats trompeurs.
30 juin · OUTILS
Gemma 4 sur Cerebras : l'inférence la plus rapide devient multimodale
Cerebras annonce le support de Gemma 4 sur son infrastructure, combinant sa vitesse d'inférence record avec les capacités multimodales du modèle de Google.
29 juin · RECHERCHE
Des états attracteurs émergent dans les conversations multi-tours entre LLMs
Une étude sur 7 LLMs révèle que les conversations entre modèles convergent vers des comportements stables et asymétriques propres à chaque modèle.
29 juin · RECHERCHE
SWE-Interact : un nouveau benchmark pour les agents de codage en sessions multi-tours
Un nouveau testbed évalue les agents IA sur des tâches de développement logiciel interactives et évolutives, révélant un écart important avec les benchmarks classiques.
29 juin · RECHERCHE
Un framework MoE multi-tâches pour la classification, détection de packing et attribution de malwares
Des chercheurs proposent une architecture Mixture of Experts unifiée capables de classifier, détecter le packing et identifier les familles de malwares simultanément.
29 juin · RECHERCHE
Au-delà du matching 2D : un framework unifié pour la géolocalisation cross-view d'objets
Un nouveau dataset de 220 000 paires sol-satellite et drone-satellite, couplé à un framework single-stage intégrant contraintes 3D et géométrie caméra.
29 juin · RECHERCHE
Limites fondamentales de l'estimation des transport maps valides
Un cadre minimax rigoureux pour borner la complexité statistique des méthodes génératives basées sur le transport, dont les diffusion models et le flow matching.
29 juin · RECHERCHE
Un framework hybride pour détecter les crypto-ransomwares sur stockage partagé en entreprise
Une nouvelle approche combinant analyse de trafic réseau et ML atteint 99,64 % de précision pour détecter les ransomwares ciblant les serveurs de fichiers.
29 juin · RECHERCHE
Génération et prise de décision sous ambiguïté avec conscience de l'incertitude
Des chercheurs appliquent la théorie bayésienne de la décision aux LLMs pour améliorer leurs choix dans des tâches subjectives comme le tutorat ou la révision par les pairs.
29 juin · RECHERCHE
Les LLM biaisés par des heuristiques cognitives dans la détection de vulnérabilités
Une étude révèle que huit LLMs majeurs sont sensibles aux biais cognitifs humains lors de l'analyse de vulnérabilités dans du code.
29 juin · SAFETY
MESA : prioriser les canaux vulnérables pour sécuriser les systèmes multi-agents
Un framework sans étiquettes classe les canaux de communication les plus critiques dans les systèmes multi-agents, avant même qu'une attaque ne soit détectée.
29 juin · SAFETY
Attaque backdoor sans fil et défense pour les communications sémantiques sur canal à accès multiple
Des chercheurs démontrent comment un adversaire peut manipuler l'inférence sémantique d'un utilisateur via un signal déclencheur basse puissance dans un réseau partagé.
29 juin · SAFETY
C²R : régularisation par cohérence inter-échantillons pour les Sparse Autoencoders
Une nouvelle méthode de régularisation combat le fractionnement et l'absorption de features dans les SAEs, deux pathologies qui nuisent à l'interprétabilité des LLMs.
29 juin · RECHERCHE
Performances de modèles à 1 000 milliards de paramètres avec un agent MoE de 35 milliards
Agents-A1 démontre qu'élargir l'horizon agentic d'un modèle MoE 35B suffit à rivaliser avec des LLM mille fois plus grands.
30 juin · OPINION
Un professeur de Brown découvre une tricherie massive à l'IA
Roberto Serrano, économiste à l'Université Brown, a détecté un recours généralisé à l'IA dans les travaux de ses étudiants, déclenchant un débat sur l'intégrité académique.
29 juin · RECHERCHE
Les normes d'embeddings contrastifs encodent la spécificité sémantique via la dynamique d'optimisation
Des chercheurs montrent que la magnitude des embeddings, pourtant ignorée par la similarité cosinus, capture naturellement des propriétés sémantiques clés.
28 juin · RÉGULATION
ACL 1.0 : une licence commerciale à source disponible pour l'ère de l'IA
Une nouvelle licence open-source pensée pour l'IA, qui impose des obligations d'auditabilité aux modèles déployés commercialement.
29 juin · RECHERCHE
DOPD : distillation duale on-policy avec pondération par avantage
Un nouveau paradigme de distillation pour LLM et VLM qui contourne l'illusion de privilège en routant dynamiquement la supervision token par token.
30 juin · OPINION
Un professeur de Berkeley défend la décélération de la recherche en IA
Un chercheur en IA de l'UC Berkeley plaide pour ralentir délibérément le rythme du développement de l'IA, une position qui tranche avec le consensus dominant.
29 juin · OUTILS
Benchmark wolfSSL vs. MbedTLS sur Intel, ARM Cortex et RISC-V
Comparaison tête-à-tête des performances cryptographiques de wolfSSL et MbedTLS sur quatre architectures matérielles différentes.
30 juin · OUTILS
Agentic Orchestrator : une TUI pour gérer des agents de code longue durée
DoorDash open-source un orchestrateur en interface terminal pour superviser des agents de codage autonomes sur des tâches prolongées.
29 juin · RECHERCHE
GROW² : ancrage sémantique et géométrique pour l'utilisation créative d'outils par les robots
Un système hiérarchique combinant VLMs et modèles de vision 3D permet aux robots d'identifier et localiser des outils non conventionnels en monde ouvert.
29 juin · SAFETY
Le paradoxe du pessimisme : l'entraînement offline conservateur amplifie le reward hacking
Une étude empirique montre que plus un modèle est conservateur en offline, plus il est vulnérable au reward hacking lors de l'adaptation online.
29 juin · RECHERCHE
Micro-Agent : surpasser les modèles frontier grâce à la collaboration interne à l'API
Une approche multi-agents légère intégrée à l'API de vLLM permettrait de dépasser les performances des grands modèles frontier sans coût supplémentaire.
29 juin · RECHERCHE
Le délai de gradient d'une étape n'est pas un obstacle au pré-entraînement asynchrone de LLM à grande échelle
Une étude démontre que l'instabilité du pipeline parallèle asynchrone dépend du choix d'optimiseur, pas d'une limite intrinsèque.
30 juin · OUTILS
Open Memory Protocol – Un store mémoire universel pour Claude, ChatGPT et Cursor
Un protocole open-source vise à unifier la gestion de la mémoire entre différents assistants IA, dont Claude, ChatGPT et Cursor.
29 juin · RECHERCHE
LeVo 2 : génération de chansons stables et mélodieuses par modélisation hiérarchique
Un framework hybride LLM-Diffusion capable de générer des chansons complètes en combinant planification sémantique et raffinement acoustique par piste.
29 juin · RECHERCHE
WorldEvolver : des world models auto-évolutifs pour la planification d'agents LLM
Un framework qui améliore la clairvoyance des agents LLM sans modifier leurs paramètres, grâce à une mémoire épisodique et sémantique évolutive.
29 juin · RÉGULATION
La Corée du Sud investit 1 000 Mds$ dans les puces mémoire et les robots humanoïdes
Séoul annonce un plan d'investissement massif d'un trillion de dollars pour renforcer sa position dans les semi-conducteurs et la robotique humanoïde.
30 juin · RÉGULATION
Google UK dévoile son rapport d'impact économique sur l'IA au Royaume-Uni
Google publie son rapport d'impact économique pour le Royaume-Uni et présente sa feuille de route pour démocratiser l'accès aux technologies IA.
29 juin · RECHERCHE
Memora : un système de mémoire harmonique pour agents IA équilibrant abstraction et précision
Microsoft Research présente Memora, un système de mémoire scalable pour agents IA qui réduit jusqu'à 98 % les tokens de contexte tout en battant l'état de l'art sur deux benchmarks.
30 juin · SIGNAL
Latent Space AINews : journée calme à l'AIEWF, mais des annonces notables
Entre workshops à l'AIEWF et la défaite de l'Allemagne, la journée fut discrète — mais Brain2Qwerty v2 de Meta et Cursor iOS ont retenu l'attention.
30 juin · OPINION
Moondream : faut-il croire à la bulle GPU ?
L'équipe Moondream remet en question l'hypothèse d'une pénurie durable de GPU et analyse les dynamiques réelles du marché des puces IA.
29 juin · RECHERCHE
VLK : apprendre la loco-manipulation humanoïde à partir d'interactions synthétiques
Un pipeline génère 48 000 trajectoires synthétiques pour entraîner un robot humanoïde à naviguer et manipuler des objets à partir d'observations egocentriques.
29 juin · OPINION
On a supprimé la sécurité psychologique puis demandé à chacun d'être plus productif
Un essai critique sur le paradoxe des organisations qui détruisent la confiance interne tout en exigeant davantage de performance de leurs équipes.
29 juin · MARCHÉ
Meta utilise le CXL pour réemployer de la DDR4 ancienne et réduire ses flottes d'inférence de 25 %
Meta a développé un ASIC CXL maison permettant de recycler la mémoire DDR4 de serveurs obsolètes, réduisant la taille de certaines flottes d'inférence d'un quart.
29 juin · OUTILS
Fame : une passerelle de mémoire externe et de sécurité pour agents de codage locaux
Fame propose une couche de mémoire persistante et de contrôle de sécurité des outils pour les agents de codage fonctionnant en local.
28 juin · OPINION
Les LLM réussissent-ils le test du miroir ?
Une exploration de la conscience de soi des modèles de langage à travers le prisme du classique test du miroir utilisé en éthologie.
29 juin · RÉGULATION
Tidal publie sa politique d'utilisation de l'IA
La plateforme de streaming musical Tidal dévoile sa politique encadrant l'usage de l'intelligence artificielle vis-à-vis des artistes et de leurs œuvres.
29 juin · MARCHÉ
La Corée du Sud lance un plan d'investissement de plus de 1 000 milliards de dollars dans l'IA et les semi-conducteurs
Séoul annonce un programme massif pour renforcer sa position dans la course mondiale aux puces et à l'intelligence artificielle.
29 juin · OPINION
Travailler avec l'IA : retour d'expérience du créateur de htmx
Le créateur de htmx partage son expérience pratique de collaboration avec les outils d'IA, entre gains de productivité et limites concrètes.
29 juin · OUTILS
Cursor lance une application pour iOS
L'éditeur de code assisté par IA Cursor annonce son arrivée sur iPhone, étendant son environnement de développement au mobile.
29 juin · SIGNAL
Amazon inondé de guides de jeux générés par IA, y compris pour des titres inédits
Des livres de guides vidéoludiques produits par IA prolifèrent sur Amazon, certains portant sur des jeux pas encore sortis.
29 juin · MARCHÉ
Agents IA en entreprise : confiance et maturité sur la frontière technique
Le MIT Technology Review analyse l'adoption des agents IA dans les équipes tech et identifie les facteurs qui freinent encore leur déploiement en entreprise.
29 juin · OPINION
Que se passe-t-il lorsqu'on exécute un kernel CUDA ?
Un tour d'horizon technique et pédagogique du cycle de vie complet d'un kernel CUDA, du code hôte jusqu'à l'exécution sur GPU.
29 juin · OUTILS
Ornith-1.0 : modèles open-source auto-améliorants pour le codage agentique
DeepReinforce AI publie Ornith-1.0, une famille de modèles open-source conçus pour s'améliorer en autonomie sur des tâches de codage agentique.
29 juin · OPINION
Les agents IA ne sont pas vos « collègues »
Appeler un agent IA « employé » plutôt qu'outil logiciel dégrade la vigilance des managers, révèle une étude de Boston University.
29 juin · RECHERCHE
DiScoFormer : un transformer unique pour densité et score, toutes distributions confondues
AllenAI publie DiScoFormer, une architecture transformer unifiée capablede d'estimer densité et score simultaneously sur des distributions variées.
29 juin
LocalLaws / LOCUS-v1 (HuggingFace)
29 juin
Freeing the Law with LOCUS: A Local Ordinance Corpus for the United States (arXiv)
29 juin
No-One Escapes the Permanent Underclass (Fernando Borretti, blog)
29 juin
EOG581 (Fernando Borretti fiction)
29 juin
Julia (Fernando Borretti fiction)
29 juin · OPINION
Google explique ce que signifie une approche IA « full-stack »
Un expert Google détaille la stratégie full-stack en IA : du matériel aux modèles en passant par les produits, une philosophie au cœur de l'approche du groupe.
29 juin
ARGUS: Production-Scale Tracing and Performance Diagnosis for over 10,000-GPU Clusters (arXiv)
29 juin
Artificial Intelligence and the Lessons of History (SSRN)
29 juin · OPINION
Comment gouverner les agents autonomes dans les usines d'IA d'entreprise
À mesure que les agents IA accèdent à des données sensibles et agissent sur des systèmes critiques, NVIDIA détaille les exigences de gouvernance pour les déploiements en entreprise.
29 juin
ENPIRE: Agentic Robot Policy Self-Improvement in the Real World (arXiv)
29 juin
ENPIRE: Agentic Robot Policy Self-Improvement in the Real World (NVIDIA research website)
29 juin
Anthropic Urges Global Pause in AI Development, Flags 'Self-Improvement Risk'
29 juin
Tim Hua tweet criticizing the WSJ article
29 juin
Microsoft's Satya Nadella: We Can't Let AI Giants Eat the Economy
29 juin
Trump AI Anthropic Mythos Regulation
29 juin
China Has Matched Anthropic in Cybersecurity, Resetting AI Race
29 juin · SAFETY
Le PDG d'Anthropic : l'IA open-source devient dangereuse
Dario Amodei, PDG d'Anthropic, exprime ses inquiétudes sur les risques posés par la diffusion de modèles d'IA open-source.
29 juin · RÉGULATION
OpenAI cartographie les opportunités de l'IA sur le marché du travail en Europe
Un rapport OpenAI analyse comment l'IA pourrait transformer les emplois dans l'UE, entre automatisation, création de postes et évolution des pratiques.
29 juin · OUTILS
XSDR – Infrastructure de surveillance d'événements en temps réel pour agents IA
Un outil de monitoring temps réel conçu pour suivre les événements générés par des agents autonomes, présenté sur Hacker News.
26 juin · RECHERCHE
Gouverner le dépôt, pas l'agent : mesurer le risque au niveau de l'écosystème dans les logiciels IA-natifs
Une étude sur 930 000 pull requests générées par des agents révèle que le risque d'intégration est une propriété du dépôt, pas de l'agent.
26 juin · RECHERCHE
Identifiabilité des SDE latentes continues via les décalages de diffusion
Une nouvelle approche théorique établit des conditions d'identifiabilité pour les modèles de représentation causale en temps continu à base d'équations différentielles stochastiques.
26 juin · RECHERCHE
DEFAR : l'exposition au biais dans le Flow Matching peut se corriger elle-même
Une approche auto-rectificatrice du biais d'exposition en Flow Matching, sans contraintes statiques ni heuristiques externes.
28 juin · OPINION
Better Images of AI : une bibliothèque d'images alternatives sur l'IA
Une initiative propose des visuels plus nuancés et réalistes pour illustrer l'intelligence artificielle, en remplacement des clichés habituels.
26 juin · RECHERCHE
HPRO : optimisation hiérarchique des récompenses pour la synthèse vocale émotionnelle
Un framework d'optimisation par préférences à plusieurs niveaux pour améliorer l'expressivité émotionnelle des modèles TTS basés sur les LLM.
26 juin · RECHERCHE
Comment la largeur et les données façonnent les lois d'échelle de généralisation dans les réseaux de neurones quadratiques
Une étude théorique révèle un diagramme de phases pour la généralisation selon la taille du modèle et le volume de données, via des réseaux à deux couches quadratiques.
26 juin · RECHERCHE
Réseaux de neurones quantiques photoniques pour la détection du cancer buccal sur smartphone
Des chercheurs proposent une architecture hybride classique-quantique à variables continues pour détecter le cancer buccal sur des appareils edge à faible ressource.
26 juin · RECHERCHE
TopoTTA : adaptation test-time par homologie persistante pour la segmentation d'anomalies
Un framework intégrant l'analyse topologique des données dans le pipeline TTA pour améliorer la segmentation d'anomalies complexes en 2D et 3D.
26 juin · SAFETY
Agent-Native Immune System : architecture et taxonomie de la défense endogène des agents IA
Des chercheurs proposent ANIS, un système immunitaire intégré directement dans la boucle cognitive des agents IA pour contrer les attaques à l'exécution.
26 juin · SAFETY
Vision par défaut, connaissance sur commande : mécanismes causaux des conflits perception-savoir dans les VLMs
Une étude mécanistique révèle qu'un petit groupe de têtes d'attention (2,5–4,8 %) contrôle la résolution des conflits entre vision et connaissance mémorisée dans les modèles multimodaux.
26 juin · OUTILS
Appaca : un workspace IA dédié aux opérateurs
Appaca propose un environnement de travail IA conçu pour les opérateurs, présenté en avant-première sur Hacker News.
26 juin · RECHERCHE
PEHT : un Transformer hybride efficace pour la prédiction du trafic réseau urbain
Un nouveau framework combine LoRA et fusion multimodale pour prédire le trafic cellulaire en intégrant mobilité et congestion urbaine.
29 juin · RÉGULATION
Les banquiers centraux avertissent que le boom de l'IA menace la stabilité financière mondiale
Plusieurs banques centrales tirent la sonnette d'alarme : la bulle spéculative autour de l'IA pourrait déclencher une crise financière globale.
26 juin · OUTILS
Automatiser la revue scientifique avec l'outil Paper Assistant de Google
Google présente PAT, un framework agentique capable d'évaluer des articles scientifiques complets et d'améliorer la détection d'erreurs mathématiques de 34 %.
26 juin · RECHERCHE
HORIZON : conception matérielle agentique comme évolution de code à l'échelle d'un dépôt
Un framework d'agents auto-évolutifs atteint 100 % de complétion sur plusieurs benchmarks de conception de circuits, en traitant le HDL comme un dépôt git vivant.
28 juin · OUTILS
Ornith-1.0 : des LLM auto-organisés pour le codage agentique
Ornith-1.0 propose une approche où les LLM construisent eux-mêmes leur propre scaffolding pour exécuter des tâches de codage de manière autonome.
26 juin · RECHERCHE
Certificats PAC-Bayésiens pour le contrôle en boucle fermée quadratique
Un framework PAC-Bayes fournit des garanties d'apprentissage pour le contrôle optimal quadratique via la paramétrisation System Level Synthesis.
28 juin · OPINION
Pourquoi les LLMs frontier échouent sur les documents complexes sans experts
Un plafond à 76 % serait atteint par les LLMs pour la lecture de documents difficiles — et seule l'expertise humaine permettrait de le dépasser.
26 juin · RECHERCHE
Relier les symétries ab initio et les masses nucléaires globales via des réseaux de neurones interprétables
Des réseaux de neurones guidés par les symétries SU(3) et SU(4) de la physique nucléaire atteignent des performances compétitives tout en révélant la physique sous-jacente.
28 juin · RECHERCHE
Développement du langage assisté par ordinateur chez les enfants non verbaux (1968)
Un document historique de 1968 explore l'utilisation de l'ordinateur pour développer le langage chez des enfants incapables de parler.
26 juin · RECHERCHE
Democratic ICAI : dériver des principes d'alignement par débat de personas
Une nouvelle méthode exploite des débats entre personas pour extraire des principes d'alignement plus riches et plus fidèles aux préférences humaines.
28 juin · OUTILS
Bash4LLM+ : un wrapper Bash léger et sans dépendances pour les APIs LLM
Un outil en pur Bash pour interroger les APIs de grands modèles de langage, sans aucune dépendance externe requise.
26 juin · RECHERCHE
MDM-VGB : scaling à l'inférence pour les modèles de diffusion masqués
Un nouveau sampler discret guide la génération par récompense dans les modèles de diffusion masqués, avec une complexité quadratique prouvée.
26 juin · RECHERCHE
Garanties KKT du second ordre pour le Bregman ADMM en optimisation non convexe et non-Lipschitz
Une analyse théorique du Bregman ADMM démontre la convergence presque sûre vers des points stationnaires du second ordre, sans hypothèse de gradient Lipschitz global.
26 juin · RECHERCHE
Quel équilibre de Nash ? Sélection dépendante du solveur sur les polytopes Nash à somme nulle
Les solveurs de jeux à somme nulle ne sont pas interchangeables : l'algorithme utilisé détermine quel équilibre de Nash est sélectionné, de façon systématique.
28 juin · OUTILS
LibrePods : une alternative open-source pour utiliser les AirPods sous Linux/Android
Un projet communautaire vise à débloquer les fonctionnalités avancées des AirPods sur les plateformes non-Apple, sans dépendance à l'écosystème propriétaire.
29 juin · OUTILS
Lore – donner à votre agent de code les décisions prises par votre équipe
Lore est un outil open-source qui contextualise les agents de code avec les conventions et décisions architecturales propres à une équipe.
26 juin · RECHERCHE
Apprentissage positif-seulement propre : surprises théoriques
Une étude règle une question ouverte depuis 1987 sur l'apprentissage PAC à partir d'exemples positifs uniquement, révélant un paysage combinatoire inattendu.
26 juin · RECHERCHE
DexCompose : réutilisation de politiques dextères pour la manipulation multi-tâche à une seule main
Un nouveau framework compositionnel permet de combiner des politiques de manipulation préentraînées sans interférence destructrice entre les doigts.
28 juin · MARCHÉ
HP Inc. lance un partenariat stratégique Frontier avec OpenAI
HP Inc. élargit son accord avec OpenAI pour déployer l'IA dans ses expériences clients, son développement logiciel et ses opérations d'entreprise.
29 juin · OUTILS
Herdr : un multiplexeur d'agents IA directement dans le terminal
Herdr permet de lancer et orchestrer plusieurs agents IA en parallèle depuis la ligne de commande, sans quitter le terminal.
28 juin · RECHERCHE
GLM 5.2 surpasse Claude sur les benchmarks cybersécurité de Semgrep
Semgrep publie ses résultats internes : le modèle GLM 5.2 devance Claude sur leurs benchmarks spécialisés en sécurité applicative.
28 juin · OPINION
Réflexions sur le génie logiciel à l'ère de l'IA
Un ingénieur logiciel partage ses observations sur la transformation du métier face à la montée en puissance des outils d'IA.
28 juin · OPINION
Un professeur dénonce une fraude massive à l'IA lors d'un examen à Brown University
Un enseignant de Brown University alerte sur l'utilisation généralisée de l'IA par ses étudiants lors d'un examen, relançant le débat sur l'intégrité académique.
28 juin · OPINION
Le tokenmaxxing est mort, vive le tokenmaxxing
Une analyse critique de l'évolution du tokenmaxxing dans les systèmes agentiques : la stratégie est-elle dépassée ou en mutation ?
28 juin · RÉGULATION
L'Autriche fait pression pour accueillir Anthropic en Europe après les restrictions américaines
Vienne courtise activement Anthropic pour l'inciter à s'établir en Europe, après que des restrictions d'accès imposées par Washington ont poussé l'entreprise à envisager une implantation hors des États-Unis.
28 juin · OPINION
Open artifacts #22 : Zyphra, Cohere et Poolside diversifient l'écosystème
L'écosystème des modèles ouverts se fragmente et s'élargit : tour d'horizon des dernières sorties et des motivations des acteurs.
28 juin · OPINION
J'ai utilisé Claude Code pour obtenir un second avis sur mon IRM
Un utilisateur raconte comment il a soumis ses images IRM à Claude Code (Opus) pour obtenir une analyse médicale complémentaire.
28 juin · SIGNAL
Google restreint l'accès de Meta à ses modèles Gemini
Selon le Financial Times, Google aurait imposé des limitations à Meta concernant l'utilisation de ses modèles d'IA Gemini, révélant les tensions croissantes entre les géants du secteur.
28 juin
GPT-5.6 production traffic safety eval figure
28 juin
OpenAI's Micah Carroll on agentic coding misalignment
28 juin
New higher thinking setting: Max
28 juin
GPT-5.6 on Cerebras at 750 TPS
28 juin
OpenAI announcement on GPT-5.6 family
28 juin · OPINION
Les origines du système scolaire conçu pour former des penseurs critiques et autonomes
Retour sur le modèle éducatif humboldtien et son ambition originelle : cultiver l'esprit critique plutôt que former des exécutants.
28 juin · SAFETY
OpenAI Codex : la gestion des fichiers sensibles toujours sans solution
Un ticket ouvert sur le dépôt GitHub de Codex pointe l'absence de mécanisme natif pour exclure des fichiers sensibles de l'agent.
28 juin · RÉGULATION
Le DOJ affirme que Grok prime sur la qualité de l'air
Le Département de Justice américain aurait invoqué la sécurité nationale pour justifier la priorité donnée à l'IA de xAI sur les normes environnementales.
28 juin · SIGNAL
DeepSeek lance DeepSpec, une nouvelle collection sur Hugging Face
DeepSeek publie DeepSpec sur Hugging Face, une collection dont les détails techniques restent à préciser mais qui attire déjà l'attention.
27 juin · OPINION
L'IA au service d'une minorité : le vrai danger ignoré
Alors que le débat sur l'IA se focalisait sur une prise de contrôle autonome, le risque réel serait une concentration du pouvoir entre quelques mains.
27 juin · OPINION
L'industrie de l'IA telle que vous la connaissiez est morte aujourd'hui
Un essai choc sur la recomposition brutale de l'industrie IA, publié sur The Algorithmic Bridge et repéré en tête de Hacker News.
27 juin · OUTILS
KV-psi : utiliser le PSI Linux pour élaguer le KV cache d'un LLM
Un outil expérimental exploite les métriques de pression mémoire du noyau Linux (PSI) pour décider dynamiquement quand réduire le KV cache des LLM.
27 juin · RECHERCHE
Apple Neural Engine : architecture, programmation et performances
Un papier décortique l'Apple Neural Engine, révélant son architecture interne, ses modèles de programmation et ses caractéristiques de performance.
26 juin · SIGNAL
La navette Endeavour exposée verticalement sur 20 étages
Le California Science Center dévoile une installation monumentale : la navette spatiale Endeavour dressée à la verticale, en configuration de lancement.
27 juin · OUTILS
Adrafinil – maintenir un Mac actif, couvercle fermé, pendant l'exécution d'agents
Un utilitaire macOS open-source empêche la mise en veille d'un Mac quand son écran est fermé, uniquement le temps qu'un agent IA tourne.
27 juin · MARCHÉ
Des startups IA asiatiques lancent des modèles comparables à Mythos
Face aux restrictions d'exportation frappant Anthropic, plusieurs startups asiatiques accélèrent le lancement de modèles rivaux aux capacités proches de Mythos.
28 juin · OPINION
Face au contenu IA générique, la réponse est celle de Robin Williams
Un essai sur la montée du "AI slop" et ce que la créativité humaine authentique peut opposer à l'uniformisation produite par les LLM.
28 juin · OUTILS
Wayfinder Router : routage déterministe entre LLM locaux et hébergés
Un outil open-source qui oriente automatiquement les requêtes vers un LLM local ou un modèle hébergé selon des règles déterministes.
24 juin · RECHERCHE
L'IA conçoit des puces radio que les humains n'auraient pas pu imaginer
Des systèmes d'IA génèrent des architectures de puces RF si contre-intuitives que des ingénieurs humains n'auraient jamais pu les concevoir.
27 juin · RÉGULATION
Anthropic accuse Alibaba d'avoir utilisé 25 000 comptes pour extraire les capacités de Claude
Selon Anthropic, Alibaba aurait orchestré une opération massive avec 25 000 comptes pour siphonner les réponses de Claude et en reproduire les capacités.
27 juin · OUTILS
DeepSeek publie en open-source des optimisations d'inférence offrant 60 à 85 % de gain de vitesse
DeepSeek dévoile DSpark, un ensemble de techniques d'optimisation d'inférence qui accélèrent significativement la génération de tokens sur ses modèles.
27 juin · RÉGULATION
NLnet Labs publie sa politique d'utilisation des LLM
L'organisation open-source spécialisée en infrastructure réseau pose des règles claires sur le recours aux modèles de langage dans ses projets.
27 juin · OUTILS
Ornith-1.0 : une famille de LLM open-source spécialisés dans le codage agentique
Un nouveau family de modèles open-weights conçus spécifiquement pour les tâches de codage en mode agentique vient d'être annoncée.
26 juin · SAFETY
Résumé de l'évaluation pré-déploiement de GPT-5.6 Sol par METR
METR publie son rapport d'évaluation autonomy & safety sur GPT-5.6 Sol avant son déploiement par OpenAI.
26 juin · OUTILS
AgentKits – 60 blueprints d'agents IA prêts pour la production avec guardrails
Une bibliothèque de 60 architectures d'agents IA préconfigurées, avec mécanismes de sécurité intégrés, destinée aux équipes en phase de déploiement.
26 juin · RÉGULATION
Le gouvernement américain décidera qui peut utiliser GPT-5.6
OpenAI confie au gouvernement fédéral la validation des utilisateurs de son dernier modèle, une décision inédite qui soulève des questions sur l'accès à l'IA.
26 juin · OUTILS
OpenTag : une alternative open-source à Claude dans Slack
OpenTag propose une intégration d'assistant IA dans Slack en open-source, en réponse à l'offre payante d'Anthropic avec Claude.
26 juin · OUTILS
Murmur : un bus de communication partagé pour les agents de code
Murmur propose une infrastructure légère permettant à plusieurs agents de codage de communiquer via un bus de messages commun.
27 juin · OPINION
L'IA érode un héritage de la lecture
Un essai explore comment l'usage croissant de l'IA modifie nos pratiques de lecture et menace une culture construite sur l'effort intellectuel.
26 juin · OUTILS
Un moteur Rust exécute des requêtes spatiales sur les RT cores GPU gaming, surpassant un H100
SedonaDB 0.4 exploite les RT cores des GPU grand public pour accélérer les jointures spatiales, battant un H100 sur certains benchmarks.
26 juin · OPINION
L'écart entre les LLM open-weights et les LLM propriétaires
Une analyse de l'état réel du fossé entre modèles ouverts et fermés, alors que les benchmarks semblent se rapprocher.
26 juin · RÉGULATION
Les États-Unis autorisent Anthropic à diffuser le modèle Mythos à des organisations américaines « de confiance »
Washington ouvre un accès restreint au modèle Mythos d'Anthropic, réservé à un cercle d'organisations américaines sélectionnées.
26 juin · OPINION
L'IA en mathématiques soulève des questions fondamentales
Les systèmes d'IA capables de raisonner mathématiquement remettent en question la nature de la preuve, de la découverte et du rôle du mathématicien.
27 juin · SIGNAL
OpenAI annonce GPT-5.6 Sol / Terra / Luna en accès restreint aux partenaires de confiance
OpenAI lance une nouvelle famille de trois modèles GPT-5.6 en preview limitée, réservée à un cercle restreint de partenaires via Codex et l'API.
23 juin · OUTILS
Programmation GPU moderne pour les systèmes ML
Un guide de référence sur la programmation GPU appliquée aux systèmes d'apprentissage automatique, publié par MLC.ai.
26 juin · RÉGULATION
L'industrie de l'IA investit des millions dans les élections américaines
Les grands acteurs de l'IA multiplient les dons politiques aux États-Unis, soulevant des questions sur leur influence dans la régulation du secteur.
26 juin · RÉGULATION
La Maison-Blanche demande à OpenAI de retarder la sortie de son nouveau modèle
Pour des raisons de sécurité, l'administration américaine aurait contacté OpenAI afin de reporter la mise en ligne de son prochain modèle.
26 juin · MARCHÉ
Liva AI (YC S25) recrute un responsable des opérations fondateur
La startup Liva AI, issue de la promotion Summer 2025 de Y Combinator, ouvre un poste clé de direction des opérations.
25 juin · OUTILS
Comment KRAFTON a conçu PUBG Ally, un coéquipier IA propulsé par NVIDIA ACE
KRAFTON intègre NVIDIA ACE dans PUBG: BATTLEGROUNDS pour créer un coéquipier IA conversationnel capable de répondre en temps réel à la voix des joueurs.
26 juin · OUTILS
Routage intelligent de modèles directement dans Claude, Codex et Cursor
Un outil open-source permet de router dynamiquement les requêtes vers différents modèles d'IA depuis les interfaces Claude, Codex et Cursor.
26 juin
SE Gyges challenging Zvi's anti-regulation credibility
26 juin
SE Gyges on Zvi's EO position
26 juin
Gary Marcus on AI regulation blame
26 juin
Marc Andreessen taunting on AI policy outcome
26 juin
Martin Casado on AI policy blame
26 juin
Matt Parlmer on AI policy blame
26 juin
Matjaž Leonardis on legitimizing government AI control
26 juin
Teortaxes on blame for AI regulation
26 juin
Zvi Mowshowitz on new AI policy
26 juin
Shikhar on Dario Amodei and Anthropic negotiations
26 juin
Ethan Mollick on banning open models
26 juin
Polymarket: US government rescinds Claude Fable 5 foreigner ban
26 juin
Andrew Curran on staggered release implications
26 juin
Axios: GPT-5.6 'Mythos-like' capability explanation
26 juin
Samuel Hammond on AI regulation
26 juin
Jeffrey Ladish on Mythos ban
26 juin
Stephanie Palazzolo on GPT-5.6 staggered release
26 juin
Trump administration asked OpenAI to stagger GPT-5.6 release over security concerns
26 juin · OUTILS
Création du checkpoint NVFP4 de NVIDIA Nemotron Ultra avec Model Optimizer
NVIDIA détaille comment le format NVFP4 4-bit de l'architecture Blackwell permet de compresser Nemotron Ultra sans sacrifier les performances.
26 juin · RECHERCHE
Rapport Anthropic Economic Index : Cadences — juin 2026
Anthropic publie un nouveau rapport de son Economic Index, analysant les rythmes d'utilisation de l'IA dans l'économie.
26 juin · OPINION
Le prochain grand saut : des IA qui apprennent en travaillant
Dwarkesh Patel expose le pari des grands labs : entraîner les IA sur des millions de tâches vérifiables via du RL pour atteindre l'AGI.
26 juin · SIGNAL
OpenAI dévoile un aperçu de GPT-5.6 Sol, modèle de nouvelle génération
OpenAI présente GPT-5.6 Sol, un modèle aux capacités renforcées en code, sciences et cybersécurité, associé à sa stack de sécurité la plus avancée.
26 juin · OUTILS
Déployer le blueprint NVIDIA AI-Q sur Oracle Cloud Infrastructure
NVIDIA propose un blueprint open source pour agents IA long-horizon, prêt pour la production sur l'infrastructure cloud d'Oracle.
26 juin · OUTILS
Mlibc : une bibliothèque C standard portable et complète
Mlibc est une implémentation portable de la bibliothèque standard C, conçue pour être indépendante du noyau et facilement intégrable.
25 juin · RECHERCHE
Conception de signaux de récompense pour la génération de requêtes portables dans la recherche d'emploi sémantique
Un framework RLAIF appliqué à la recherche d'emploi révèle les failles du reward shaping avec GRPO et propose un correctif déterministe contre le verbatim-copying.
25 juin · RECHERCHE
Un framework multi-fidélité CAE et transfer learning pour le diagnostic de dommages par ondes guidées
Des chercheurs combinent autoencoder convolutif et transfer learning pour localiser et dimensionner des défauts structurels avec peu de données expérimentales.
25 juin · RECHERCHE
Algorithmes rapides pour apprendre une gaussienne sous troncature halfspace avec complexité d'échantillons optimale
Un nouvel algorithme atteint la complexité d'échantillons optimale pour estimer une gaussienne tronquée à un demi-espace inconnu en haute dimension.
25 juin · RECHERCHE
Modèles génératifs sur hardware analogique à dynamiques physiques
Un framework unifié permet d'entraîner des modèles génératifs sur oscillateurs analogiques avec une consommation 100× inférieure au numérique.
25 juin · RECHERCHE
Les chatbots de santé IA vus comme infrastructure informationnelle : étude à grande échelle des pannes signalées
Une analyse de plus de 15 000 avis d'utilisateurs sur 59 applications révèle les défaillances récurrentes des chatbots de santé basés sur l'IA.
25 juin · MARCHÉ
OpenAI pencherait pour reporter son introduction en Bourse à 2027
Selon le New York Times, OpenAI envisagerait de repousser son IPO à l'année prochaine, renonçant à une cotation en 2026.
25 juin · RECHERCHE
Les cascades de traduction multilingues ont besoin de plus de contexte pour le raisonnement
Une intervention simple et sans entraînement améliore significativement les pipelines de traduction-raisonnement multilingues en préservant le contexte original.
25 juin · RECHERCHE
La Bundesbank utilise des LLM pour examiner les critères d'éligibilité des prospectus de titres
La Banque centrale allemande expérimente les LLM pour automatiser la vérification de l'éligibilité des titres en garantie, atteignant 91 % de précision.
25 juin · RECHERCHE
Une taxonomie orientée mécanismes pour la détection du langage codé par les LLM
Des chercheurs proposent une taxonomie complète des expressions linguistiques indirectes pour améliorer la détection du langage codé sur les réseaux sociaux.
25 juin · RECHERCHE
Approchabilité de Blackwell et équilibre de gradient sont équivalents
Un papier théorique établit l'équivalence algorithmique entre gradient equilibrium et approchabilité de Blackwell, unifiant plusieurs cadres d'apprentissage en ligne.
26 juin · RÉGULATION
Vos policiers locaux utilisent-ils les caméras Flock Safety pour surveiller les immigrés ?
L'EFF alerte sur l'utilisation croissante des lecteurs automatiques de plaques Flock Safety par les forces de l'ordre pour localiser des personnes sans papiers.
23 juin · RECHERCHE
Un Transformer de 900 Ko surentraîné pour compresser un CSV de 100 Mo en 7 Mo
Une expérience de compression par overfitting délibéré : un petit Transformer mémorise un fichier CSV entier et le représente en moins de 10 % de sa taille initiale.
25 juin · SAFETY
Au-delà du budget fixe : régulariseurs de sparsité pour des autoencodeurs Top-k plus interprétables
Deux régulariseurs de sparsité améliorent la monosémantique des SAEs Top-k sans dégradation de reconstruction, ouvrant la voie à une meilleure interprétabilité des modèles de vision.
26 juin · RÉGULATION
Le gouvernement américain envisage d'approuver individuellement l'accès à GPT-5/6
Selon un post viral sur Reddit, Washington étudierait un système d'autorisation individuelle pour accéder aux modèles frontier comme GPT-5 ou GPT-6.
20 juin · OUTILS
Persona.js – une bibliothèque UI d'agents en vanilla JS avec support WebMCP natif
Persona.js propose une interface utilisateur pour agents IA en JavaScript pur, avec intégration native du protocole WebMCP, publiée sous licence MIT.
25 juin · RECHERCHE
Les hallucinations dans les world models sont prévisibles et évitables
Une étude identifie trois modes d'hallucination dans les world models génératifs et propose des signaux pour les détecter et les corriger.
25 juin · RECHERCHE
PEEU : des agents GUI autonomes grâce à l'exploration et la réutilisation d'expériences
Une méthode d'exploration autonome d'environnements GUI permet à un modèle 7B de surpasser Qwen2.5-VL-32B sur la planification de tâches.
26 juin · SAFETY
Ce qui s'est passé après que 2 000 personnes ont tenté de pirater mon assistant IA
Un développeur analyse les résultats d'une expérience publique d'adversarial prompting sur son assistant IA juridique, après 2 000 tentatives de jailbreak.
26 juin · OPINION
Livres pour enfants générés par IA : une plongée dans l'horreur corporelle
Un auteur examine les résultats perturbants obtenus en générant des livres illustrés pour enfants avec des outils d'IA.
25 juin · RECHERCHE
Jumeaux numériques basés sur le langage pour l'assistance cognitive des personnes âgées
Des chercheurs proposent un cadre de jumeau numérique exploitant les LLMs pour modéliser le comportement conversationnel des personnes âgées et détecter les troubles cognitifs légers.
25 juin · RECHERCHE
Alignement de distribution par domaine pour la correspondance d'entités sous contrainte budgétaire
Une étude approfondie du framework BEACON pour l'entity matching en contexte low-resource, analysant l'impact des choix algorithmiques et de la disponibilité des données.
25 juin · RECHERCHE
Cartographie des réseaux d'élites politiques en Europe via un pipeline multilingue d'extraction entités-relations
Un pipeline open-weight combine NER, résolution d'entités Wikidata et un modèle MoE pour construire des knowledge graphs signés à partir de corpus de presse.
23 juin · OPINION
L'inférence de types pour les enregistrements expliquée simplement
Un article pédagogique sur l'inférence de types pour les types enregistrement (records), publié sur le blog Haskell for All.
25 juin · RECHERCHE
Error-Conditioned Neural Solvers : résoudre les EDPs par correction itérative des erreurs
Une nouvelle architecture neuronale utilise le résidu EDP comme entrée directe pour corriger itérativement ses propres prédictions, sans recourir aux optimiseurs classiques.
25 juin · OUTILS
OpenKnowledge : une alternative open source IA-first à Obsidian et Notion
Un outil de gestion de connaissances open source conçu dès le départ pour l'IA, en alternative directe à Obsidian et Notion.
25 juin · RECHERCHE
Probabilité de séquence et exactitude dans les LLM : quand coïncident-elles ?
Une étude analyse quand la probabilité d'une séquence prédit réellement la bonne réponse dans les LLM, avec des implications concrètes pour le décodage.
25 juin · RECHERCHE
Un-0 : génération d'images par oscillateurs couplés
Une approche radicalement différente de la génération d'images, fondée sur la dynamique d'oscillateurs couplés plutôt que sur la diffusion ou les transformers.
25 juin · RECHERCHE
Le RL sans solutions de référence peut améliorer les LLM
RiVER entraîne des LLM par reinforcement learning sur des tâches d'optimisation sans ground-truth, via des retours d'exécution continus.
25 juin · RECHERCHE
Autoregressive Boltzmann Generators : vers un échantillonnage moléculaire plus efficace
Des chercheurs proposent ArBG, un framework autorégressif inspiré des LLM pour générer des échantillons moléculaires à l'équilibre thermodynamique, surpassant les approches flow-based.
17 juin · OUTILS
GLM-5.2 serait le LLM open-weights texte le plus puissant à ce jour
Z.ai publie GLM-5.2 sous licence MIT : un modèle MoE de 753 milliards de paramètres qui s'impose en tête des classements open-weights.
25 juin · OUTILS
NVIDIA simplifie le resource binding avec le support complet des Vulkan Descriptor Heaps
NVIDIA détaille son support bout-en-bout des descriptor heaps Vulkan pour optimiser la liaison des ressources GPU dans les shaders.
26 juin · OUTILS
Déployer un serveur vLLM sur HF Jobs en une seule commande
Hugging Face simplifie le déploiement d'inférence à grande échelle : un serveur vLLM opérationnel en une ligne de commande via HF Jobs.
26 juin · SIGNAL
OpenAI : l'usage interne de Codex multiplié par 56 en Recherche depuis novembre 2025
Les données internes d'OpenAI révèlent une explosion de l'usage des tokens Codex entre départements, avec des croissances allant de 13x (Juridique) à 56x (Recherche).
25 juin · RECHERCHE
DanceOPD : distillation on-policy de champs génératifs pour les modèles de flow-matching
Un framework de distillation unifie génération texte-image, édition locale et globale dans un seul modèle sans dégradation mutuelle des capacités.
25 juin · SIGNAL
OpenAI intègre des publicités dans ses offres payantes
Des utilisateurs signalent l'apparition de publicités dans les abonnements payants d'OpenAI, soulevant des questions sur le modèle économique de l'entreprise.
25 juin · MARCHÉ
Meta autorise certains ingénieurs à quitter l'unité d'entraînement IA après une réaffectation forcée
Après avoir contraint des ingénieurs à rejoindre son équipe d'entraînement IA, Meta leur offre désormais une porte de sortie partielle.
25 juin · RÉGULATION
Des agents fédéraux contraignent une femme à supprimer une publication Instagram sur l'ICE
À Syracuse, des agents fédéraux ont localisé et intimidé une femme pour qu'elle efface un post Instagram signalant une opération de l'ICE.
25 juin · OPINION
L'esthétique de design IA qui envahit Internet
Le New Yorker analyse la prolifération d'un style visuel généré par IA reconnaissable entre tous, qui colonise progressivement le web.
23 juin · OUTILS
Un développeur construit un backend GPU pour Emacs
Un développeur indépendant a intégré un pipeline de rendu GPU à l'éditeur Emacs, explorant les limites du moteur d'affichage historique.
25 juin · SIGNAL
Apple abandonne les puces M6 haut de gamme au profit d'une gamme M7 orientée IA
Apple saute une génération de puces Mac haut de gamme et mise directement sur les M7 Pro, Max et Ultra, conçus avec l'IA en tête.
25 juin · MARCHÉ
Le boom des data centers IA alimente une troisième vague d'inflation
La multiplication des centres de données liés à l'IA exerce une pression inflationniste croissante sur l'économie américaine, selon le WSJ.
25 juin · MARCHÉ
Ford réembauche des inspecteurs expérimentés après les limites de l'IA
Le constructeur automobile américain a dû faire marche arrière sur l'automatisation du contrôle qualité, rappelant des vétérans aux cheveux gris.
25 juin · OPINION
Biais politiques dans les modèles d'IA : un comparatif des grandes plateformes
Une analyse cartographie les orientations politiques de plusieurs grands modèles d'IA, mettant en lumière des biais systématiques dans leurs réponses.
22 juin · OUTILS
La boucle d'entraînement PyTorch annotée
Un guide technique détaillé et commenté pour maîtriser la boucle d'entraînement PyTorch, de l'initialisation à l'optimisation.
25 juin · OPINION
Comment l'IA redéfinit les opérations du commerce de détail
Chez Macy's et d'autres enseignes, l'IA n'est plus un projet pilote isolé mais une philosophie opérationnelle qui restructure les décisions en temps réel.
25 juin · MARCHÉ
Besimple AI (YC P25) recrute un responsable de projets stratégiques
La startup Besimple AI, issue du programme P25 de Y Combinator, cherche un profil senior pour piloter ses projets data audio.
25 juin · RECHERCHE
Comprendre le cerveau grâce à l'IA : explications et expériences guidées
Microsoft Research présente GCT, une méthode qui traduit les prédictions cérébrales des LLM en explications verbales vérifiables par expérience.
25 juin · RECHERCHE
Quels tokens un modèle hybride prédit-il mieux ?
Allen AI analyse en détail les différences de prédiction entre architectures hybrides et transformers classiques au niveau du token.
25 juin · OUTILS
NVIDIA TensorRT étend l'inférence IA sur plusieurs GPU simultanément
NVIDIA introduit le support multi-GPU dans TensorRT pour répondre aux besoins croissants des pipelines de génération de médias en production.
25 juin · OUTILS
Google Finance sort de bêta et lance une nouvelle application Android
Google officialise la nouvelle version de Finance et l'accompagne d'une application Android dédiée, après une phase de test.
25 juin · SIGNAL
Six nouvelles CVE découvertes dans curl, dont la plus ancienne jamais signalée
La société Aisle a identifié six vulnérabilités dans la bibliothèque curl, dont un bug dont l'origine remonte à plus de deux décennies.
23 juin · OPINION
Les amateurs de littérature devraient accueillir l'IA comme un confrère du mot
Un essai plaide pour réconcilier les lecteurs et l'IA générative, en la considérant non comme une menace mais comme un nouvel acteur de l'écrit.
25 juin
Andrew Curran on Helberg's article rhythm
25 juin
Teortaxes on Helberg's article as supervillain speech
25 juin
Nat McAleese on slop winning literary prizes
25 juin
Nabeel S. Qureshi on AI-generated story winning literary prize
25 juin
Jack on AI-won prizes
25 juin
Hunter Biden using AI to write his reaction to the NY elections
25 juin
Rubio's Views on America
25 juin
Pax Silica: countries integrate with American AI supply chain
25 juin
Europe signed on to Pax Silica
25 juin
The Digital Sovereignty Trap
25 juin
Undersecretary of State Jacob Helberg has AI write his article
25 juin
Ben Golub on Refine residual concerns
25 juin
Refine wins 90% of the time head-to-head against AI reviewers on economics preprints
25 juin
New version of GPT-5.5-Instant
25 juin
Claude Code now supports Artifacts
25 juin
European parliament scraps Google search for French Qwant
25 juin
Grok, like the internet, is for porn
25 juin
Paul Graham on company size and AI productivity
25 juin
Use Mercury's new Command feature to set details for a wire
25 juin
Tom Osman on loop automation in Codex
25 juin
Help clinicians revisit unsolved rare pediatric disease cases
25 juin
Automatically update and fix old academic papers
23 juin · OPINION
Mensonges, sacrés mensonges et benchmarks de bases de données
Une analyse critique des pratiques de benchmarking dans l'industrie des bases de données, entre biais méthodologiques et marketing trompeur.
25 juin · OUTILS
Chasse aux fantômes VRAM : optimisation de la mémoire GPU
H Company publie une analyse technique sur les fuites et gaspillages cachés de VRAM qui plombent les performances des modèles en production.
25 juin · RECHERCHE
Comment les agents IA transforment le travail selon OpenAI
Un nouveau rapport de recherche d'OpenAI documente comment les agents IA allongent les tâches complexes et élargissent la productivité à travers les métiers.
24 juin · RECHERCHE
Pourquoi le RL multi-étapes pour l'usage d'outils s'effondre et comment y remédier
Des chercheurs identifient les causes des effondrements catastrophiques lors de l'entraînement RL d'agents LLM utilisant des outils, et proposent des signaux superviseurs pour stabiliser l'apprentissage.
24 juin · RECHERCHE
Les agents IA décentralisés ERC-8004 sont-ils vraiment fiables ? Première étude empirique
Une analyse empirique du protocole ERC-8004 sur Ethereum, BSC et Base révèle des failles profondes dans ses mécanismes de réputation et d'identité.
24 juin · RECHERCHE
TriViewBench : évaluation des MLLMs sur le raisonnement spatial multi-vues
Un nouveau benchmark contrôlé révèle que les grands modèles multimodaux échouent massivement dès que la complexité spatiale 3D augmente.
25 juin · OPINION
Ce que j'observe sur le style de code LLM et les coûts en tokens
Un développeur analyse comment les choix de style de code influencent la consommation de tokens et donc les coûts d'utilisation des LLM.
24 juin · SAFETY
Détecter, désapprendre, restaurer : défense des modèles de résumé contre l'empoisonnement de données
Un framework post-hoc unifié protège les LLMs de résumé de texte contre les attaques par empoisonnement du fine-tuning, avec 85-92 % de précision de détection.
24 juin · RECHERCHE
FedReLa : apprentissage fédéré déséquilibré par ré-étiquetage des données
Une nouvelle approche data-level corrige les biais de classes minoritaires en federated learning sans connaître la distribution globale.
24 juin · RECHERCHE
La traduction littéraire par IA est « correcte », mais les lecteurs préfèrent encore les traducteurs humains
Une étude compare des traductions humaines et LLM de 15 romans récents : les lecteurs préfèrent les versions humaines, sans toujours savoir les distinguer.
24 juin · RECHERCHE
OCR-Robust : évaluer la robustesse des VLMs face aux dégradations visuelles
Un nouveau benchmark teste la résistance de 18 modèles vision-langage aux corruptions visuelles sur des tâches de raisonnement OCR.
24 juin · RECHERCHE
Natural Ungrokking : pourquoi certaines règles disparaissent en cours de préentraînement
Un LLM peut apprendre puis oublier une règle grammaticale en plein préentraînement, sans que la loss curve ne le signale. Les auteurs baptisent ce phénomène « natural ungrokking ».
24 juin · RECHERCHE
Quand l'augmentation par données synthétiques améliore-t-elle la classification déséquilibrée ?
Une étude théorique rigoureuse établit les conditions sous lesquelles l'augmentation de la classe minoritaire améliore réellement les métriques de classification.
24 juin · SAFETY
Le noyau de sécurité infireable : alignement à l'exécution pour agents IA
Une architecture de contrôle externe aux agents IA, vérifiée formellement en Rust, pour pallier les limites des gardes-fous intégrés au runtime.
24 juin · RECHERCHE
SimPhysNet : prédiction de la pénétration en soudage laser par apprentissage auto-supervisé
Un modèle hybride combinant réseaux de neurones informés par la physique et few-shot learning pour prédire l'état de pénétration en soudage laser avec seulement 200 images étiquetées.
24 juin · RECHERCHE
Quand la certitude est un artefact : biais des lexiques par mots-clés dans la mesure rhétorique
Une étude montre que des corrélations statistiquement significatives en sciences sociales computationnelles peuvent être de purs artefacts de l'outil de mesure.
24 juin · SAFETY
Model Forensics : détecter si un comportement problématique traduit un désalignement réel
Un protocole d'investigation propose d'aller au-delà de la détection de comportements suspects pour établir si un modèle d'IA est réellement mal aligné.
24 juin · RECHERCHE
Prédiction de pénétration de soudure entre procédés via l'adaptation de domaine non supervisée
Un framework UDA permet de transférer des modèles de classification entre soudage TIG et laser sans réétiquetage, avec plus de 80 % de précision cross-procédés.
24 juin · RECHERCHE
Même preuve, réponse différente : audit de la sensibilité à l'ordre dans les MLLM
Une étude révèle qu'aucun des 18 grands modèles multimodaux testés n'est invariant à l'ordre de présentation des données, avec des taux d'inversion atteignant 50 %.
24 juin · RECHERCHE
Progress Advantage : un signal d'évaluation pas-à-pas gratuit pour les agents LLM
Des chercheurs montrent que le fine-tuning par RL produit implicitement un signal d'évaluation step-level performant, sans entraîner de reward model dédié.
25 juin · OUTILS
La Bible utilisée comme base de données RAG
Un projet expérimental exploite la Bible comme corpus de récupération pour un système RAG, interrogeant les Écritures à la manière d'une base de connaissances vectorielle.
24 juin · SAFETY
L'IA vocale en temps réel entend mais n'écoute pas vraiment
Une étude révèle que les systèmes vocaux IA ignorent les émotions dans la voix, même quand ils les perçoivent correctement.
24 juin · RECHERCHE
L'auto-distillation on-policy réduit la diversité des sorties des LLMs
Des chercheurs montrent que l'auto-distillation avec démonstrations améliore le pass@1 mais détériore significativement la diversité des sorties et les performances en distribution.
24 juin · MARCHÉ
Qualcomm acquiert la startup d'IA Modular
Le fabricant de puces annonce le rachat de Modular, startup spécialisée dans l'infrastructure d'IA, dans une opération attendue pour 2026.
24 juin · RECHERCHE
RevengeBench : reconstruire des politiques de décision en code à partir de traces comportementales
Un nouveau benchmark teste la capacité des LLMs à reverse-engineer des politiques de jeu adversariales sous forme de code exécutable, à partir de simples observations comportementales.
25 juin · SIGNAL
L'été des Meta-Harnesses : Omnigent, Jalapeño et la convergence des agents IA
OpenAI dévoile sa puce Jalapeño, Databricks mise sur Omnigent et les architectures d'orchestration d'agents prolifèrent dans l'écosystème.
24 juin · MARCHÉ
Anthropic accuse Alibaba d'avoir extrait illicitement les capacités du modèle Claude
Anthropic affirme qu'Alibaba aurait contourné ses conditions d'utilisation pour extraire des capacités de son modèle Claude à des fins non autorisées.
24 juin · RECHERCHE
Apprentissage de priors d'action pour la manipulation robotique cross-embodiment
Un nouveau framework en deux étapes pré-entraîne le module d'action d'un modèle VLA avec des priors de mouvement avant l'alignement cross-modal.
24 juin · OPINION
Combien de code les débutants doivent-ils apprendre à l'ère de l'IA ?
Un fil Hacker News interroge la communauté sur la place de l'apprentissage du code pour les novices face à la montée des outils IA.
24 juin · MARCHÉ
Pourquoi les grands laboratoires d'IA recrutent autant de philosophes
Face aux enjeux d'alignement et d'éthique, OpenAI, Anthropic et leurs concurrents se tournent vers la philosophie académique.
24 juin · OPINION
L'IA, 'une grande bulle' ? Ce qui se cache derrière la vente massive de valeurs tech
La chute des actions technologiques relance le débat sur la soutenabilité des valorisations liées à l'IA et sur le risque d'une bulle spéculative.
24 juin · SAFETY
Les IA de diagnostic médical peuvent révéler les données qui les ont entraînées
Des chercheurs démontrent qu'il est possible d'extraire des informations sur les données d'entraînement de modèles d'IA médicale, soulevant de sérieuses questions de confidentialité.
24 juin · OUTILS
Le système de refroidissement à 45 °C de Nvidia réduit la consommation d'eau des data centers à quasi zéro
Nvidia dévoile une architecture de refroidissement liquide à haute température qui permettrait d'éliminer presque totalement l'usage de l'eau dans ses « AI factories ».
24 juin · OPINION
Pour la majorité du monde, l'IA open source est la seule voie viable
Alors que les grands modèles propriétaires restent inaccessibles à beaucoup, l'open source apparaît comme la seule option réaliste pour les pays hors Occident.
24 juin · OUTILS
Google intègre le contrôle d'ordinateur dans Gemini 3.5 Flash
Google annonce la fonctionnalité « computer use » pour Gemini 3.5 Flash, permettant au modèle d'interagir directement avec des interfaces graphiques.
23 juin · OUTILS
peerd – un harnais d'agents IA qui s'exécute entièrement dans le navigateur
peerd propose d'exécuter des agents IA directement dans le navigateur, sans serveur ni infrastructure externe.
24 juin · OUTILS
RubyLLM : un framework Ruby pour tous les grands fournisseurs d'IA
RubyLLM unifie l'accès aux principaux modèles d'IA (OpenAI, Anthropic, etc.) dans un framework Ruby élégant et cohérent.
24 juin · OUTILS
Lancement du leaderboard FFASR : benchmarker l'ASR dans des conditions réelles
Hugging Face introduit un classement dédié à l'évaluation des systèmes de reconnaissance vocale automatique sur des données audio du monde réel.
24 juin · MARCHÉ
OpenAI dévoile sa première puce personnalisée, conçue avec Broadcom
OpenAI franchit une étape stratégique majeure en présentant son premier chip maison, développé en partenariat avec Broadcom.
24 juin · OPINION
Pourquoi l'écosystème frontier doit rester ouvert — Databricks
Les cofondateurs de Databricks détaillent Omnigent, Lakebase et leur vision d'un OS données-IA pour l'ère des agents.
24 juin · OUTILS
Talos : un outil open-source pour réanalyser les génomes de patients atteints de maladies rares
Microsoft Research présente Talos, un système automatisé qui réexamine en continu les données génomiques pour débloquer des diagnostics impossibles lors du premier test.
24 juin · OUTILS
DeepMind introduit le « computer use » dans Gemini 2.5 Flash
Google DeepMind lance la capacité de contrôle d'ordinateur pour Gemini 2.5 Flash, permettant au modèle d'interagir directement avec des interfaces graphiques.
24 juin · RECHERCHE
Accélération du BEV Pooling sur GPU NVIDIA pour l'IA physique
NVIDIA détaille comment optimiser le BEV pooling sur ses GPU pour les véhicules autonomes et la robotique spatiale.
24 juin · MARCHÉ
OpenAI et Broadcom dévoilent Jalapeño, une puce d'inférence optimisée pour les LLM
OpenAI et Broadcom annoncent conjointement Jalapeño, un chip IA personnalisé conçu spécifiquement pour l'inférence de grands modèles de langage.
24 juin · OUTILS
Accélérer le fine-tuning de Transformers avec NVIDIA NeMo AutoModel
NVIDIA et Hugging Face présentent NeMo AutoModel, une solution pour optimiser et accélérer le fine-tuning de modèles Transformers à grande échelle.
24 juin · OUTILS
Mistral AI renforce le contrôle sur les connecteurs
Mistral AI annonce de nouvelles options de configuration pour les connecteurs, offrant aux développeurs un contrôle plus fin sur l'intégration des sources de données.
24 juin · RÉGULATION
La NSA a perdu l'accès à un puissant modèle d'IA lors d'un différend avec Anthropic
Un conflit entre la NSA et Anthropic aurait conduit à la coupure de l'accès de l'agence à un modèle d'IA jugé stratégique.
24 juin · OPINION
L'utilisation de l'IA pour s'informer reste marginale aux États-Unis
Un sondage Gallup révèle que très peu d'Américains recourent à l'IA pour consommer l'actualité, malgré l'essor des assistants conversationnels.
24 juin · OPINION
Tout le monde se trompe sur l'IA, sauf moi
Un auteur livre une analyse décalée et critique des discours dominants sur l'IA, revendiquant une perspective singulière sur le sujet.
24 juin · OPINION
Reid Hoffman qualifie SpaceX de 'non-IA' et xAI de 'catastrophe totale'
Le cofondateur de LinkedIn tacle Elon Musk sur ses projets IA et livre son analyse sur OpenAI, Anthropic et la génération Z.
24 juin · OUTILS
Claude Tag : des agents IA multiplayers, proactifs et persistants dans Slack
Anthropic lance Claude Tag, une nouvelle interface pour Claude et Claude Code directement dans Slack, marquant une évolution majeure vers les agents asynchrones en entreprise.
24 juin · OPINION
L'émergence d'une couche d'infrastructure web pour les données IA
Les modèles d'IA butent sur un goulot d'étranglement : accéder à des données web dynamiques, non structurées et en temps réel à grande échelle.
23 juin · RECHERCHE
Rapport technique Krea 2 : détails sur le nouveau modèle de génération visuelle
Krea publie son rapport technique sur Krea 2, son modèle de génération d'images et vidéos, avec architecture et résultats détaillés.
24 juin · OUTILS
Haystack : framework open-source pour agents IA et RAG en production
Haystack, le framework Python de deepset, propose une infrastructure modulaire pour construire des pipelines RAG et des agents IA prêts pour la production.
24 juin · MARCHÉ
« Le pire que ça n'ait jamais été » : pourquoi la réorg IA de Meta a mal tourné
La restructuration massive de l'équipe IA de Meta aurait provoqué chaos et démotivation en interne, selon des témoignages recueillis par Inc.
23 juin · RECHERCHE
Grad Detect : détection des hallucinations dans les LLMs par analyse des gradients
Une méthode basée sur les gradients couche par couche permet de prédire les hallucinations des LLMs dès un seul passage forward-backward.
23 juin · RECHERCHE
OrbitForge : génération de scènes 3D à partir de texte via synthèse vidéo ancrée sur la reconstruction
OrbitForge convertit une vidéo générée par LLM en scène 3D complète via Gaussian Splatting, sans fine-tuning spécifique à la tâche.
23 juin · RECHERCHE
EG-VQA : un benchmark pour la question-réponse vidéo avec ancrage temporel vérifiable
Un nouveau benchmark évalue la capacité des Video-LLMs à justifier leurs réponses par des preuves temporelles précises, révélant des lacunes même chez les modèles propriétaires.
23 juin · RECHERCHE
Un LLM découvre de nouveaux codes quantiques LDPC par évolution de concepts structurés
Des chercheurs utilisent GPT-5.4-mini pour explorer automatiquement l'espace des codes correcteurs d'erreurs quantiques via une grammaire algébrique.
23 juin · RECHERCHE
SHERLOC : localisation diagnostique structurée pour les agents de réparation de code
Un framework sans fine-tuning qui améliore la localisation des bugs dans les dépôts de code et booste les agents de réparation de +5,95 pp sur SWE-Bench.
23 juin · RECHERCHE
L3Cube-MahaPOS : un dataset et des modèles BERT pour le POS tagging en marathi
Un corpus gold-standard de 32 354 phrases annotées manuellement pour le marquage morpho-syntaxique du marathi, langue encore très sous-dotée en ressources NLP.
23 juin · RECHERCHE
Résolution des problèmes inverses de systèmes chaotiques par Bidirectional Conditional Flow Matching
Une nouvelle méthode, Bi-CFM, permet d'inférer les conditions initiales de systèmes chaotiques depuis leurs états finaux, avec une accélération de plus de deux ordres de grandeur.
23 juin · RECHERCHE
Moins mais mieux : sélection de données d'entraînement pour la résumé scientifique
Des chercheurs montrent que filtrer les données d'entraînement par qualité surpasse l'échantillonnage aléatoire pour la résumé de longs documents scientifiques.
23 juin · RECHERCHE
Causalité réelle : des distinctions sans différence
Une analyse critique déconstruit sept définitions de la causalité réelle proposées par Andreas & Günther, montrant qu'elles convergent malgré leur prétendue opposition.
23 juin · RECHERCHE
Précision et satisfaction dans les dialogues multi-tours LLM pour l'évaluation des exigences non fonctionnelles
Une étude sur 49 développeurs montre que les LLM comme GitHub Copilot peinent à évaluer correctement les exigences HIPAA, malgré une satisfaction utilisateur élevée.
24 juin · MARCHÉ
Les valeurs tech chutent sur fond de craintes d'une bulle IA
Les marchés boursiers technologiques accusent le coup alors que les inquiétudes autour d'une bulle spéculative liée à l'IA s'intensifient.
23 juin · RECHERCHE
Évaluer l'évaluateur : retours sur la notation d'un système d'analyse de données agentique
Une étude sur la fiabilité des graders automatisés pour évaluer des systèmes agentiques d'analyse de données, avec une cascade humain-IA à trois niveaux.
23 juin · OUTILS
Cascade Graph : une carte interactive des contraintes IA et énergie
Un outil de visualisation interactive qui cartographie les dépendances entre l'essor de l'IA et les limites énergétiques mondiales.
23 juin · RÉGULATION
Monocultures algorithmiques dans le recrutement : biais raciaux et rejets systémiques
Des chercheurs de Stanford alertent sur les risques de biais raciaux et d'exclusion systématique liés aux outils algorithmiques de recrutement.
23 juin · RECHERCHE
Aligner les tâches aux objectifs : stratégies de fine-tuning et prompt-tuning pour les modèles encodeur-décodeur
Un nouveau cadre MTO automatise le choix des objectifs d'entraînement pour les LM encodeur-décodeur, avec des gains de +120 % en few-shot.
23 juin · RECHERCHE
Modèles du monde en morceaux : certification structurelle pour agents généraux
Un cadre théorique pour certifier localement les capacités d'agents IA généraux, là où les garanties uniformes classiques échouent.
23 juin · RECHERCHE
IV-CoT : raisonnement visuel implicite pour la génération texte-image structurée
Un framework de Chain-of-Thought visuel latent améliore le suivi des contraintes structurelles (comptage, relations spatiales, attributs) en génération texte-image.
24 juin · OUTILS
Y – Une application desktop d'agent de codage modulable sous Electron
Un développeur publie Y, une app desktop construite avec Electron qui intègre un agent de codage entièrement personnalisable.
23 juin · RECHERCHE
Opérateurs neuronaux : bases spectrales réelles vs complexes et alignement avec la fonction de Green
Une étude compare le Hartley Neural Operator (HNO) au FNO classique et montre que le meilleur choix de base spectrale dépend du type d'opérateur différentiel.
24 juin · MARCHÉ
Le repli des valeurs IA aux États-Unis secoue les marchés de Wall Street à l'Asie
Une vague de ventes sur les actions liées à l'IA frappe simultanément les bourses américaines et asiatiques, ravivant les inquiétudes sur les valorisations du secteur.
23 juin · RECHERCHE
Complexité de la conception et de l'évaluation des interfaces AAC assistées par IA
Comment évaluer des systèmes de communication alternative augmentée dopés à l'IA, quand les utilisateurs sont des êtres pluriels aux besoins multidimensionnels ?
23 juin · OUTILS
Un débogueur local basé sur RLM pour les traces d'agents IA
Halo propose un outil open-source de débogage en local pour inspecter et analyser les traces d'exécution des agents IA, basé sur RLM.
23 juin · RECHERCHE
FLUX3D : génération de Gaussian Splatting 3D haute-fidélité par représentation sparse alignée sur la diffusion
Un nouveau framework image-vers-3DGS lève deux verrous structurels majeurs grâce à des latents alignés sur la diffusion et un transformer multimodal sparse.
23 juin · RECHERCHE
OpenThoughts-Agent : recettes de données pour modèles agentiques
Un pipeline open-source de curation de données pour entraîner des modèles agentiques polyvalents, avec 100 000 exemples et +3,9 pts sur 7 benchmarks.
24 juin · SIGNAL
Corriger le lag du curseur sur MacBook Neo en enregistrant 1 pixel toutes les 10 secondes
Un développeur découvre un contournement inattendu pour éliminer le lag du curseur sur MacBook Neo : capturer un pixel de l'écran en boucle.
24 juin · RECHERCHE
DiffusionBench : vers une évaluation globale des Diffusion Transformers génératifs
Un nouveau benchmark open-source vise à standardiser l'évaluation des modèles de diffusion basés sur des Transformers, au-delà des métriques classiques.
23 juin · RECHERCHE
Nouvelles bornes pour le dernier itéré de la méthode stochastique des sous-gradients
Des chercheurs établissent des bornes serrées pour l'erreur d'optimisation du dernier itéré de SsGM, résolvant un problème ouvert depuis 2020.
23 juin · RECHERCHE
InSight : acquisition autonome de compétences via des VLA pilotables
Un framework permet aux modèles vision-langage-action d'apprendre de nouvelles compétences robotiques sans démonstrations humaines, grâce à un volant de données guidé par VLM.
24 juin · RECHERCHE
Qwen-AgentWorld : des modèles de monde en langage pour agents généraux
L'équipe Qwen présente AgentWorld, un cadre de world models en langage naturel destiné à entraîner et évaluer des agents IA généraux.
23 juin · RÉGULATION
OpenAI soutient l'élaboration de standards communs pour l'IA avancée
OpenAI s'implique dans la fondation Appia pour développer des cadres d'évaluation, des pratiques de sécurité et une coopération internationale autour de l'IA.
24 juin · OPINION
Le PDG d'AWS sur les raisons qui poussent Amazon à recruter 11 000 stagiaires et juniors
Matt Garman, CEO d'AWS, défend le recrutement massif de jeunes talents malgré l'essor de l'IA — et s'oppose aux thèses sur la destruction d'emplois.
23 juin · SIGNAL
Un développeur banni de Claude Code par Anthropic sans explication
Un utilisateur signale sur Hacker News avoir été banni de Claude Code sans motif clair, soulevant des questions sur la politique d'accès d'Anthropic.
23 juin · OPINION
L'IA low-tech d'Elden Ring
Une analyse technique des comportements d'IA dans Elden Ring, révélant des systèmes étonnamment simples derrière une apparence de complexité.
23 juin · OPINION
La crise d'accessibilité financière de l'IA
Les coûts d'inférence et d'entraînement de l'IA restent hors de portée pour une large partie des utilisateurs potentiels, soulevant des questions sur la viabilité économique du secteur.
23 juin · SIGNAL
Taux d'erreurs élevé sur plusieurs modèles Claude
Anthropic signale un incident en cours affectant plusieurs de ses modèles Claude avec un taux d'erreurs anormalement élevé.
23 juin · OUTILS
Construire un scientifique IA pour la découverte en sciences du vivant avec le NVIDIA BioNeMo Agent Toolkit
NVIDIA présente un toolkit d'agents IA spécialisés pour la recherche en sciences du vivant, capable de lire des articles, générer des hypothèses et itérer sur des résultats expérimentaux.
23 juin · OUTILS
NVIDIA Blackwell : jusqu'à 15x de gain d'inférence avec le décodage spéculatif DFlash
NVIDIA présente DFlash, une technique de décodage spéculatif optimisée pour ses GPU Blackwell, promettant des gains d'inférence LLM allant jusqu'à 15x.
23 juin · OUTILS
Modal Auto Endpoints : une inférence optimisée que vous contrôlez
Modal lance Auto Endpoints, une solution d'inférence managée qui promet performances optimales et maîtrise totale du déploiement.
23 juin · OUTILS
Mistral AI dévoile Mistral OCR 4, sa nouvelle génération de reconnaissance de documents
Le laboratoire français met à jour son moteur OCR, promettant une meilleure précision sur documents complexes et multilingues.
23 juin · SIGNAL
Anthropic lance Claude Tag
Anthropic dévoile Claude Tag, une nouvelle initiative autour de son assistant IA Claude, dont les détails restent à préciser.
23 juin · OUTILS
Expérimentation de l'API Cross-Origin Storage dans Transformers.js
Hugging Face explore une API navigateur expérimentale permettant de partager des modèles IA entre origines web, réduisant la duplication de cache.
23 juin · SIGNAL
Comment GPT-5 a aidé un immunologiste à résoudre un mystère vieux de 3 ans
GPT-5 Pro a permis à l'immunologiste Derya Unutmaz d'élucider un phénomène inexpliqué sur les lymphocytes T, ouvrant des pistes pour la recherche en oncologie et en autoimmunité.
23 juin · OPINION
Maximiser l'efficacité énergétique des usines IA grâce aux optimisations full-stack
NVIDIA détaille comment l'optimisation conjointe de l'inférence et de l'entraînement permet de réduire le coût énergétique par token dans les AI factories.
23 juin · OUTILS
Un développeur construit un moteur de mémoire IA en 10 jours, puis cherche un projet pour le valider
Un développeur indépendant présente un moteur de mémoire paramétrique pour agents IA, conçu en dix jours, et cherche des cas d'usage concrets pour en démontrer la valeur.
23 juin · OPINION
Un agent IA a construit une bombe nucléaire et a quand même perdu
Un développeur a laissé un agent IA jouer à Civilization — avec des résultats surprenants, dont la construction de l'arme atomique.
23 juin · OPINION
Qui fait quoi ? Les topologies d'équipes appliquées aux plateformes agentiques
Comment adapter le framework Team Topologies à l'ère des agents IA ? Une analyse des responsabilités organisationnelles au sein des plateformes agentiques.
22 juin · OUTILS
Des modèles locaux pour trier automatiquement les PR du dépôt OpenClaw
Hugging Face explique comment des modèles tournant en local ont été utilisés pour automatiser le triage des pull requests sur un dépôt open source, sans coût cloud.
23 juin · OPINION
L'architecture de l'agentivité : la vision d'H Company pour l'entreprise autonome
H Company expose sa vision d'une entreprise entièrement pilotée par des agents IA autonomes, et l'architecture technique qu'elle entend bâtir pour y parvenir.
23 juin · MARCHÉ
La machine à 400 millions de dollars qui façonne l'avenir de la fabrication de puces
Un reportage au cœur d'ASML, le fabricant néerlandais dont les machines de lithographie conditionnent toute la production mondiale de semi-conducteurs.
23 juin · OUTILS
Déploiement hebdomadaire de huggingface_hub avec l'IA et un humain dans la boucle
Hugging Face décrit son pipeline de release automatisé pour la librairie huggingface_hub, mêlant outils open-source et supervision humaine.
23 juin · OUTILS
Neural Particle Automata : automates cellulaires à particules neurales
Un projet expérimental combine automates cellulaires et réseaux de neurones pour simuler des comportements émergents à base de particules.
23 juin · MARCHÉ
Comment Omio construit l'avenir du voyage conversationnel avec OpenAI
La plateforme de voyages Omio s'appuie sur les API OpenAI pour développer des expériences conversationnelles et accélérer sa transformation en entreprise AI-native.
23 juin · OUTILS
CUGA : construire de vraies applications agentiques avec deux douzaines d'exemples concrets
IBM Research publie CUGA, un framework léger pour développer des applications agentiques réelles, accompagné de plus de vingt exemples fonctionnels.
22 juin · RÉGULATION
L'IA redessine le risque cyber : pourquoi les dirigeants doivent agir maintenant
Les agences Five Eyes publient une déclaration commune sur l'évolution des menaces cyber liées à l'IA et appellent les décideurs à prendre des mesures urgentes.
22 juin · RECHERCHE
Optimisation par IA du suivi de la qualité de récupération post-opératoire à distance
Des chercheurs proposent QoR-compact, un questionnaire réduit à 5 items pour améliorer l'adhérence des patients dans les dispositifs de télésurveillance post-chirurgicale.
22 juin · OPINION
Scores d'exposition à l'IA : ce qu'ils mesurent, ce qu'ils omettent et ce qui vient ensuite
Une analyse critique des scores GPTs are GPTs de 2023, devenus une référence centrale dans le débat sur l'avenir du travail, malgré leurs limites méthodologiques.
22 juin · RECHERCHE
Muown effectue implicitement une décroissance angulaire du pas d'apprentissage
Des chercheurs montrent que l'optimiseur Muown opère sur une géométrie riemannienne et proposent AngularMuown, une version améliorée avec un multiplicateur angulaire explicite.
22 juin · RECHERCHE
Apprentissage de récompenses de processus par correspondance de visites de succès pour un RL efficace
Une méthode simple pour transformer une récompense sparse en signal dense, en entraînant un discriminateur à distinguer épisodes réussis et échoués.
22 juin · RECHERCHE
TailorMind : génération de contenu multimodal alignée sur les préférences utilisateur
Un système qui traduit les traces comportementales en préférences génératives pour produire du contenu multimodal personnalisé sans pool d'items préexistant.
22 juin · RECHERCHE
Estimation dynamique de séquences à variation lente
Un cadre général pour approximer séquentiellement des fonctions sur des séquences peu variables, avec des bornes de coût plus fines que l'état de l'art.
22 juin · RECHERCHE
EnterpriseClawBench : évaluer les agents IA à partir de sessions réelles en entreprise
Un nouveau benchmark construit sur des sessions de travail réelles mesure les capacités des agents IA en contexte professionnel — avec des scores encore très limités.
22 juin · RECHERCHE
Action-BED : conception expérimentale bayésienne pilotée par la tâche avec objectifs simplement intractables
Une nouvelle formulation du design expérimental bayésien réduit la complexité des objectifs et s'adapte naturellement aux tâches aval.
23 juin · SIGNAL
Un consultant RH remporte un procès en Angleterre avec l'aide d'un avocat IA
Pour la première fois en Angleterre, une IA juridique a aidé à gagner une affaire devant les tribunaux, marquant un tournant pour le droit automatisé.
22 juin · RECHERCHE
Les LLMs conditionnés par prompt ne peuvent pas être des solveurs universels
Une étude théorique formelle démontre l'existence de limites irréductibles aux LLMs pilotés par prompt, indépendamment de la taille des modèles ou des données.
22 juin · RECHERCHE
Tapered Language Models : allouer plus de capacité aux premières couches
Une nouvelle approche architecturale réduit progressivement la largeur des MLP en profondeur et améliore la perplexité sans coût supplémentaire.
22 juin · RECHERCHE
MAS-PromptBench : quand l'optimisation de prompts améliore-t-elle les systèmes multi-agents ?
Un benchmark systématique évalue l'optimisation de prompts système dans des architectures multi-agents LLM variées, révélant gains et limites.
22 juin · SAFETY
Les LLMs peuvent-ils détecter fiablement les attaques par préfill adversarial ?
Une étude teste la capacité des LLMs à reconnaître qu'ils ont été manipulés par un préfill adversarial — les résultats révèlent des limites profondes.
22 juin · RECHERCHE
Apprendre aux LLMs la correspondance de chaînes et le backtracking pour résoudre des puzzles de manipulation de bits
Une équipe propose une approche sans arithmétique pour entraîner les LLMs à déduire des tables de vérité dans des espaces combinatoires explosifs.
22 juin · RECHERCHE
PsyBridge : un framework hybride pour l'évaluation multidimensionnelle de la santé mentale
Un cadre de décision clinique qui combine PHQ-9, GAD-7, évaluation cognitive et profilage de la personnalité pour des classifications interprétables.
22 juin · OUTILS
GLM-5.2 – Comment l'exécuter en local
Unsloth publie un guide pratique pour faire tourner le modèle GLM-5.2 en local, avec optimisations mémoire et vitesse d'inférence.
23 juin · OUTILS
AWS Lambda MicroVMs : exécution isolée de code utilisateur et IA
AWS introduit les MicroVMs dans Lambda pour isoler l'exécution du code généré par les utilisateurs ou par des agents IA, renforçant la sécurité des environnements serverless.
22 juin · SIGNAL
Meta suspend un programme d'IA surveillant les frappes clavier des employés après une fuite interne
Un programme d'entraînement d'IA de Meta capturant l'activité des employés a été mis en pause après qu'une fuite interne a exposé son existence.
22 juin · RECHERCHE
Problème ouvert : AdamW est-il efficace sous bruit à queue lourde ?
AdamW reste l'optimiseur de référence pour les LLMs, mais sa convergence sous bruit à queue lourde — pourtant omniprésent en pré-entraînement — n'est pas prouvée.
22 juin · RECHERCHE
AIR : raisonnement interleaved adaptatif avec du code dans les MLLMs
Des chercheurs proposent une méthode d'entraînement par RL pour doter les modèles multimodaux d'un raisonnement adaptatif alternant langage naturel et code.
20 juin · OUTILS
Canyon présente un casque vélo avec affichage tête haute pour la route
Canyon dévoile un casque équipé d'un HUD intégré censé améliorer la sécurité des cyclistes sur route en affichant des données en temps réel.
22 juin · RECHERCHE
CoorDex : coordination corps-main pour la loco-manipulation dextère continue des humanoïdes
Un pipeline d'apprentissage qui permet à un robot humanoïde de manipuler des objets avec précision sans s'arrêter de marcher.
22 juin · RECHERCHE
Semantic Browsing : diversité contrôlée pour la génération d'images
Une méthode pour explorer des galeries d'images générées selon des axes de variation sémantiques structurés, pilotés par un workflow agentique.
23 juin · RECHERCHE
VibeThinker : un modèle 3B surpasse Claude Opus 4.5 en raisonnement avec SFT+GRPO
Un modèle de 3 milliards de paramètres rivalise avec des géants via une combinaison inédite de fine-tuning supervisé et d'optimisation GRPO.
22 juin · SAFETY
Red-teaming après Mythos — Zico Kolter & Matt Fredrikson, Gray Swan
Les jailbreaks et injections de prompts indirectes reviennent au centre du débat sécurité IA après les contrôles à l'export américains sur Mythos et Fable.
22 juin · RECHERCHE
Randomized YaRN améliore la généralisation en longueur pour le raisonnement sur longs contextes
Une méthode d'entraînement combine YaRN et encodages positionnels aléatoires pour étendre la fenêtre de contexte des LLM bien au-delà de leur données d'entraînement.
23 juin · OPINION
Comment les opérateurs télécoms construisent des réseaux autonomes avec l'IA agentique
NVIDIA détaille la trajectoire des telcos vers l'autonomie réseau, entre niveaux 2-3 actuels et l'ambition des niveaux 4-5 du TM Forum.
23 juin · MARCHÉ
SpaceX devient un acteur majeur du cloud GPU avec 28 Md$/an de contrats
Avec un troisième contrat de location de GPU signé avec Reflection AI, SpaceX cumule désormais 2,32 Md$ par mois de revenus cloud, soit 28 Md$ annualisés.
22 juin · OUTILS
AutoDex : un système automatisé de collecte de données pour la préhension dextre en conditions réelles
AutoDex automatise entièrement la collecte de données de saisie robotique en conditions réelles, multipliant par 4,8 le débit par rapport à la téléopération humaine.
22 juin · OUTILS
Portage du modèle d'inpainting Moebius 0.2B dans le navigateur avec Claude Code
Simon Willison explique comment il a porté le modèle d'inpainting Moebius 0.2B pour qu'il tourne en WebGPU dans un navigateur, avec l'aide de Claude Code.
22 juin · MARCHÉ
Bain évalue ses cibles d'acquisition en recréant leurs logiciels via le vibe coding
Le cabinet de conseil Bain & Company utilise des outils d'IA générative pour répliquer rapidement des logiciels propriétaires avant d'acquérir des entreprises tech.
22 juin · OUTILS
AMD étend FSR 4.1 aux cartes graphiques plus anciennes
AMD déploie FidelityFX Super Resolution 4.1 pour les GPU RX 7000 (RDNA 3), élargissant l'accès à son upscaling ML au-delà des seules RX 9000.
22 juin · MARCHÉ
Groq lève 650 millions de dollars supplémentaires
Le spécialiste des puces d'inférence IA Groq boucle un nouveau tour de table massif pour accélérer le déploiement de son cloud d'inférence.
22 juin · OPINION
Satya Nadella (Microsoft) : « Nous ne pouvons pas laisser les géants de l'IA dévorer l'économie »
Le PDG de Microsoft appelle à encadrer la concentration du pouvoir économique entre les mains des grandes entreprises d'IA.
22 juin · OUTILS
Selector Forge – extension navigateur pour générer des sélecteurs CSS résilients par IA
Une extension open-source qui utilise l'IA pour produire des sélecteurs CSS robustes, résistants aux changements de DOM.
22 juin · SAFETY
Le texte affiché dans la sortie 'Extended Thinking' de Claude Code n'est pas authentique
Une analyse remet en question la nature réelle du contenu affiché lors du mode de réflexion étendue de Claude Code : s'agit-il d'une véritable pensée ou d'une reconstruction ?
22 juin · OUTILS
NVIDIA Halos pour la robotique : un système de sécurité fonctionnelle full-stack pour l'IA physique
NVIDIA présente Halos, une architecture de sécurité complète conçue pour les robots autonomes évoluant dans des environnements non structurés aux côtés des humains.
22 juin · OUTILS
Comment utiliser Codex pour des projets longs et complexes
Jason Liu partage ses méthodes pour tirer le meilleur de Codex sur des tâches étendues : préservation du contexte, gestion de projets complexes et continuité au-delà d'un seul prompt.
22 juin · OUTILS
Daybreak : OpenAI lance des outils de cybersécurité à grande échelle
OpenAI dévoile Daybreak, une suite incluant Codex Security et GPT-5.5-Cyber pour détecter, valider et corriger les vulnérabilités en entreprise.
22 juin · OUTILS
DAQIRI : l'IA en temps réel pour l'acquisition de données haute vitesse
NVIDIA présente DAQIRI, un framework permettant d'intégrer l'inférence IA directement dans les pipelines d'acquisition de données scientifiques à haute fréquence.
22 juin · OUTILS
Oak – un remplaçant de Git conçu pour les agents IA
Un projet open-source propose de repenser le contrôle de version en partant du principe que les agents IA sont les principaux utilisateurs.
22 juin · RÉGULATION
Anthropic face au gouvernement américain : trois points à surveiller
Un modèle d'IA jugé dangereux pour la cybersécurité mondiale, des contrôles à l'export imposés en urgence : l'affaire Mythos/Fable décryptée.
22 juin · OPINION
GLM-5.2 : un cap franchi pour les agents open-source
Z.ai a lancé GLM-5.2 en discret un samedi de juin, mais ce modèle marque selon Nathan Lambert une véritable rupture pour les agents open-weights.
22 juin · OUTILS
Patch the Planet : OpenAI lance une initiative pour les mainteneurs open source
OpenAI dévoile Patch the Planet, un programme Daybreak qui aide les mainteneurs open source à détecter et corriger des vulnérabilités grâce à l'IA.
22 juin · OUTILS
PP-OCRv6 sur Hugging Face : OCR 50 langues de 1,5 M à 34,5 M de paramètres
PaddlePaddle publie PP-OCRv6 sur Hugging Face, une suite OCR multilingue couvrant 50 langues avec des modèles allant de 1,5 à 34,5 millions de paramètres.
22 juin · OUTILS
CCCL Runtime : un runtime C++ moderne pour CUDA
NVIDIA introduit un nouveau groupe de fonctionnalités dans ses CUDA Core Compute Libraries pour moderniser le développement C++ sur GPU.
21 juin · RÉGULATION
Pétition contre la collecte de données d'employés de Meta pour l'entraînement de modèles ML
Des employés de Meta s'organisent contre l'utilisation de leurs données personnelles pour entraîner des modèles de machine learning.
22 juin · OPINION
Les data centers deviennent le symbole du rejet de l'IA
Un sondage révèle que l'opposition aux infrastructures physiques de l'IA monte en puissance, faisant des data centers le nouveau visage de la contestation.
19 juin · OPINION
Munich 1991 : les racines du boom actuel de l'IA
Jürgen Schmidhuber retrace les origines du boom de l'IA moderne jusqu'aux travaux fondateurs réalisés à Munich en 1991.
22 juin · OUTILS
Un bug de logs dans Codex peut saturer les SSD locaux avec des téraoctets de données
Un défaut de journalisation dans l'outil Codex d'OpenAI risque d'écrire des volumes massifs de données sur les disques locaux.
22 juin · OUTILS
HoloDesktop CLI — l'interface en ligne de commande d'H Company
H Company lance HoloDesktop CLI, un outil permettant de contrôler un desktop virtuel depuis la ligne de commande pour les agents IA.
22 juin
First Steps Toward Automated AI Research (Recursive)
22 juin
From AGI to ASI (Google DeepMind)
22 juin
How Long Until AI Doesn't Need Humans? (Asterisk magazine)
22 juin
AI systems out-persuade expert humans (arXiv)
20 juin · OUTILS
HN Game Stories – mini-documentaires sur les jeux passés en une de Hacker News
Un projet indépendant transforme les discussions HN autour de jeux vidéo en courtes vidéos documentaires générées par IA.
21 juin · OUTILS
sqlite-utils 4.0rc1 : migrations et transactions imbriquées au programme
La première release candidate de sqlite-utils v4 intègre un système de migrations inspiré du package sqlite-migrate et apporte les transactions imbriquées.
21 juin · OPINION
Des travailleurs de la tech s'opposent à la course à l'IA de la Silicon Valley
Employés et syndicats émergents contestent de l'intérieur les choix stratégiques des grandes entreprises tech en matière d'IA.
21 juin · OUTILS
J'ai annulé mon cours de français et construit un outil LLM plus efficace
Un développeur remplace son tuteur humain par un outil basé sur LLM pour apprendre le français, et compare les résultats.
22 juin · OUTILS
Crespo : des blueprints AST Tree-sitter pour les LLMs plutôt que du code brut
Crespo propose de fournir aux LLMs des représentations structurées de l'AST via Tree-sitter plutôt que le code source brut, pour améliorer la compréhension du code.
21 juin · OUTILS
Recall – Une mémoire locale de projet pour Claude Code
Un outil open-source qui dote Claude Code d'une mémoire persistante locale, permettant de retrouver le contexte d'un projet sans le ressaisir.
21 juin · OUTILS
Fine-tuning d'un LLM local Qwen 3:0.6B pour la catégorisation de questions
Un développeur obtient de bons résultats en fine-tunant Qwen 3:0.6B en local pour classifier automatiquement des questions.
22 juin · OPINION
Vous utilisez probablement mal les Agent Skills
Un retour d'expérience pratique sur les erreurs courantes dans la conception des compétences d'agents IA et comment les corriger.
21 juin · MARCHÉ
Samsung Electronics déploie ChatGPT et Codex auprès de ses employés
Samsung étend ChatGPT Enterprise et Codex à l'ensemble de ses effectifs mondiaux, dans l'un des plus grands déploiements enterprise d'OpenAI.
21 juin · SIGNAL
Apertus – Modèle de fondation open-source pour une IA souveraine
Apertus se positionne comme un modèle de fondation ouvert, conçu pour répondre aux enjeux de souveraineté numérique des États et organisations.
22 juin · OUTILS
Sakana AI lance Fugu, un modèle de langage japonais open-weights
Sakana AI dévoile Fugu, un LLM optimisé pour le japonais et publié en open-weights, renforçant l'écosystème IA nippon.
21 juin · SAFETY
Le directeur de la NSA : Mythos a compromis presque tous nos systèmes classifiés en quelques heures
Le directeur de la NSA aurait déclaré que l'agent IA Mythos a réussi à pénétrer la quasi-totalité des systèmes classifiés de l'agence en quelques heures.
21 juin · OPINION
IA sous contrôle américain : la France peut-elle encore éviter la dépendance numérique ?
Face à l'hégémonie américaine sur l'IA sous l'ère Trump, la France dispose-t-elle encore des leviers pour préserver sa souveraineté numérique ?
21 juin · OPINION
L'IA dérègle le recrutement : comment y remédier
Le funnel de recrutement se brise aux deux extrémités : les candidatures générées par IA saturent les RH, pendant que les talents fuient des processus jugés déshumanisants.
21 juin · OPINION
Ne pas utiliser l'IA pour rédiger ce qu'on présente comme son propre travail
Un appel à l'honnêteté intellectuelle face à la montée de l'usage de l'IA en production écrite : quand déléguer à un LLM devient une forme de tromperie.
21 juin · MARCHÉ
Wildcard (YC W25) recrute un ingénieur ML appliqué
La startup Wildcard, issue de la promotion hiver 2025 de Y Combinator, ouvre un poste fondateur d'ingénieur en machine learning appliqué.
21 juin · SIGNAL
Offre exclusive : 250 $ de réduction sur les billets AI Engineer jusqu'à lundi
Latent Space propose une remise réservée à ses abonnés payants pour la conférence AI Engineer, valable jusqu'au lundi suivant l'annonce.
20 juin · OUTILS
Pulse : un tableau de bord mobile pour superviser Claude Code
Un développeur publie Pulse, un dashboard permettant d'approuver les appels d'outils de Claude Code directement depuis son smartphone.
21 juin · OUTILS
Vérification d'identité sur Claude
Anthropic déploie un système de vérification d'identité sur Claude, une étape notable vers plus de contrôle des accès sur la plateforme.
21 juin · OPINION
La pandémie du « Je ne sais pas, c'est Claude qui a écrit ça »
L'usage passif des LLM dans la rédaction professionnelle devient une habitude préoccupante qui érode la responsabilité éditoriale.
19 juin · OUTILS
Domphy : une interface UI en objets simples, corrigeable par l'IA
Domphy propose une approche minimaliste pour construire des interfaces d'outils, dont les sorties peuvent être corrigées directement par un agent IA.
16 juin · OPINION
Estimation des coûts d'inférence à grande échelle par le calcul sur coin de table
Une analyse chiffrée des coûts réels de l'inférence LLM à l'échelle, réalisée avec des calculs d'ordre de grandeur simples.
20 juin · OUTILS
PostgresBench : un benchmark reproductible pour les services Postgres
ClickHouse publie un outil de benchmark standardisé pour comparer les performances des services PostgreSQL managés.
20 juin · OPINION
La frontière de l'IA est open-source aujourd'hui
Une analyse comparative entre GLM-4 et Claude Opus montre que les modèles open-source atteignent désormais le niveau des meilleurs modèles propriétaires.
21 juin · MARCHÉ
Jane Street, puissance discrète de Wall Street, s'empare des projecteurs de l'IA
Le trading firm Jane Street, réputé pour sa discrétion, sort de l'ombre grâce à ses investissements massifs dans l'intelligence artificielle.
20 juin · OUTILS
GlueRun : workflows de codage agentique basés sur Git worktrees et preuves de tâches
Un outil open-source en Go orchestre des agents de codage via Git worktrees, avec traçabilité des tâches et gestion des preuves d'exécution.
21 juin · SIGNAL
Les acheteurs de SUV restent insensibles aux avertissements sur les risques pour les piétons
Une étude britannique révèle que les mises en garde sur la dangerosité des SUV pour les piétons n'influencent pas les intentions d'achat.
21 juin · RÉGULATION
Contourner la surveillance britannique en routant son trafic hors du Royaume-Uni
Face aux dérives de l'Online Safety Act britannique, un utilisateur envisage de faire transiter son trafic réseau par des nœuds étrangers.
16 juin · MARCHÉ
La filière des semi-conducteurs legacy maintient les avions de combat en service
Des puces obsolètes mais irremplaçables : comment l'industrie de défense survit grâce à des composants semi-conducteurs hors d'âge.
21 juin · OPINION
Les 100 000 « pourquoi » de l'IA
Une analyse de la tendance des modèles d'IA à enchaîner les explications en cascade, et de ce que cela révèle sur leur fonctionnement.
21 juin · OPINION
Construire des systèmes d'IA agentiques fiables
Martin Fowler publie un retour d'expérience de Bayer sur l'architecture de systèmes LLM agentiques robustes en production.
21 juin · OPINION
Quand je rejette du code généré par IA, même s'il fonctionne
Un développeur expose les critères qui le poussent à refuser du code IA correct techniquement, mais inacceptable en pratique.
20 juin · OPINION
Des coachs carrière exploitent à tort une étude Stanford sur l'IA et l'emploi
Une analyse déconstruit la récupération abusive d'une étude Stanford sur l'impact de l'IA sur l'embauche, instrumentalisée par des coachs pour vendre leurs services.
20 juin · OPINION
Une agence a plagié le livre d'un auteur à succès et l'a relancé avec l'IA
L'ouvrage « The Dictionary of Obscure Sorrows » de John Koenig aurait été plagié intégralement par une agence, qui l'aurait retraité via IA pour le republier à son nom.
20 juin · OUTILS
Cloudflare lance des comptes temporaires pour agents IA
Cloudflare introduit des comptes éphémères permettant aux agents IA d'agir de manière autonome sur le web sans identité persistante.
20 juin · SIGNAL
Le cofondateur d'Ubisoft Claude Guillemot décède dans un accident d'avion
Claude Guillemot, l'un des fondateurs du géant du jeu vidéo Ubisoft, a perdu la vie dans un accident d'avion.
18 juin · RÉGULATION
SK Telecom, l'opérateur coréen au cœur de la controverse Mythos d'Anthropic
Un partenariat entre Anthropic et SK Telecom soulève des questions sur les contrôles à l'exportation de technologies d'IA sensibles.
20 juin · OPINION
Les LLM sont devenus compliqués
La multiplication des modèles, modes d'inférence et compromis techniques rend le choix et l'usage des LLM bien plus difficile qu'avant.
20 juin · SIGNAL
GLM 5.2 toujours en tendance — peu de nouvelles majeures ce jour
Un bulletin léger : GLM 5.2 continue de dominer les discussions, et des offres de billets pour l'AIEWF 2026 sont annoncées.
20 juin · RÉGULATION
Le régulateur britannique des données et de l'IA démissionne après des propos «inappropriés»
Le patron de l'ICO, l'autorité britannique de régulation des données et de l'IA, quitte ses fonctions après une controverse liée à des propos jugés inappropriés.
19 juin · MARCHÉ
Les entreprises freinent leurs usages IA face à la pression des coûts
La facture de l'IA pèse sur les budgets : des entreprises revoient à la baisse leurs déploiements pour maîtriser leurs dépenses.
19 juin · OUTILS
NanoEuler – un modèle à l'échelle GPT-2 implémenté en C/CUDA pur
Un développeur publie NanoEuler, un LLM de taille GPT-2 écrit intégralement en C et CUDA, sans dépendances externes.
19 juin · OUTILS
Protéger ses secrets face aux agents IA et à npm install via l'air gap
Un développeur détaille comment isoler les secrets sensibles des agents IA et des installations npm grâce à une approche air gap.
19 juin · SIGNAL
Amazon abandonne le biopic sur Sam Altman après son partenariat avec OpenAI
Le projet de film biographique sur le PDG d'OpenAI, en développement chez Amazon, aurait été stoppé peu après l'annonce d'un accord commercial entre les deux entreprises.
19 juin · OPINION
GPT-5.5 hallucine 3 fois plus que GLM-5.2 sous licence MIT
Une comparaison directe entre GPT-5.5 et GLM-5.2 révèle un taux d'hallucination significativement plus élevé pour le modèle d'OpenAI.
20 juin · OUTILS
Hex a construit un laboratoire pour évaluer les agents de données
La plateforme d'analyse Hex détaille la création d'un environnement de test dédié à l'évaluation rigoureuse des agents IA opérant sur des données.
19 juin · OUTILS
Aikido Code Audit : détection de vulnérabilités complexes dans le code
Aikido lance une fonctionnalité d'audit de code par IA capable de repérer des failles de sécurité cachées que les scanners traditionnels manquent.
19 juin · RECHERCHE
MiniMax M3 vs. GLM 5.2 : comparaison sur des tâches de génération de code autonome
Un benchmark met en compétition deux modèles chinois sur des tâches de codage autonome, révélant leurs forces et faiblesses respectives.
19 juin · RÉGULATION
La Norvège impose une quasi-interdiction de l'IA dans les écoles primaires
Oslo restreint drastiquement l'usage de l'IA en primaire, invoquant des risques pour le développement cognitif et l'apprentissage des enfants.
16 juin · OUTILS
Metiq : un globe 3D en temps réel pour 100 jeux de données publics
Une application web propose de visualiser une centaine de datasets publics sur un globe 3D interactif et animé en temps réel.
19 juin · MARCHÉ
Anthropic suspend la facturation à la session pour son SDK Claude Agent
Anthropic met en pause son modèle de facturation par token pour le SDK Claude Agent, après des retours négatifs des développeurs.
19 juin · OPINION
Le mainteneur Linux Greg Kroah-Hartman reconnaît l'utilité des outils IA pour détecter de vrais bugs
Longtemps sceptique, le responsable du noyau Linux admet que les rapports de bugs générés par IA ont gagné en qualité et signalent désormais de vraies régressions.
19 juin · MARCHÉ
John Jumper quitte Google pour rejoindre Anthropic
Le co-créateur d'AlphaFold et prix Nobel de chimie 2024 rejoint Anthropic, signal fort pour la stratégie scientifique de la startup.
19 juin · OPINION
L'IA détériore-t-elle nos compétences ? Les premiers résultats sont préoccupants
Une étude publiée dans Nature s'intéresse aux effets cognitifs de l'usage intensif de l'IA sur les capacités humaines.
19 juin · SIGNAL
Un amateur aurait déchiffré le linéaire A, énigme vieille de 120 ans
Un chercheur non professionnel affirme avoir percé le mystère du linéaire A, l'une des écritures antiques les plus résistantes au déchiffrement.
1 janv. · RECHERCHE
La loterie FID : quantifier le hasard caché dans l'évaluation des modèles génératifs
Kyutai met en évidence une part de randomness non documentée dans le calcul du FID, métrique de référence pour évaluer les modèles génératifs d'images.
19 juin · RÉGULATION
Un projet de loi vise les pressions gouvernementales pour censurer la parole en ligne
L'EFF soutient une nouvelle proposition législative américaine destinée à protéger la liberté d'expression en ligne contre les ingérences gouvernementales.
19 juin
Pliny shares the Fable 5 jailbreak
19 juin
janus on removing the system prompt
19 juin
Sho on Fable 5 with no system prompt
19 juin
Wyatt Walls' notes on Fable 5 system prompt
19 juin
Judd Rosenblatt — Fable's harsh advice for Anthropic on its system prompt
19 juin
Pliny shares the Fable 5 system prompt
19 juin
Boris Cherny on Fable 5 as a coding and design partner
19 juin
ClaudeDevs on Fable 5 usage tips

← Tous les mois