RECHERCHE
TingIS : détection temps réel d'incidents critiques dans le cloud à grande échelle
Un système de bout en bout combinant LLMs et indexation efficace pour extraire des alertes exploitables depuis des tickets clients bruités.
arXiv cs.AI · cs.LG · cs.CL·Jun Wang, Ziyin Zhang, Rui Wang, Hang Yu·23 avril 2026

TingIS est un système de découverte d'incidents déployé en production, capable de traiter jusqu'à 2 000 messages par minute. Son moteur de liaison multi-étapes combine techniques d'indexation rapide et LLMs pour regrouper les descriptions utilisateurs hétérogènes en incidents actionnables. Un mécanisme de routage en cascade et un pipeline de réduction du bruit multicouche complètent le dispositif, atteignant une latence P90 de 3,5 minutes et un taux de découverte de 95 % sur les incidents prioritaires.