Innovation, Partenariat écoles

Soutenance de thèse CIFRE – Youcef REMIL

09/10/2023

Une nouvelle soutenance de thèse en lien avec l'INSA de Lyon !

Le 6 octobre 2023, Youcef REMIL, chercheur dans notre agence de Lyon, a soutenu sa thèse CIFRE menée au sein d’Infologic et du LIRIS à l’INSA !

Le jury était composé des personnes suivantes :

M. Romain Robbes, Directeur de Recherche, CNRS, Rapporteur
M. Alexandre Termier, Professeur, Université de Rennes 1, Rapporteur
Mme. Christel Vrain, Professeure, Université d'Orléans, Examinatrice
Mme. Peggy Cellier, Maître de Conférences HDR, INSA-Rennes, Examinatrice
M. Arnaud Soulet, Maître de Conférences HDR, Université de Tours, Examinateur
M. Jean-François Boulicaut, Professeur, INSA-Lyon, Directeur de thèse
M. Mehdi Kaytoue, Maître de Conférences HDR, INSA Lyon et Directeur R&I, Infologic, Co-encadrant
M. Anes Bendimerad, Docteur, Data Scientist, Infologic, Co-encadrant

Résumé de la thèse : "A Data Mining Perspective on Explainable AIOps with Applications to Software Maintenance"

La supervision des systèmes informatiques modernes présente de nouveaux défis en termes de scalabilité, de fiabilité et d’efficacité. Les méthodes traditionnelles de maintenance basées sur l’exécution de tâches manuelles ont prouvé leur inefficacité. De manière similaire, les systèmes experts à base de règles sont limités dans leur capacité actuelle à gérer et anticiper le grand nombre d’alertes générées par les systèmes informatiques. AIOps for Operating Systems (AIOps) propose d’utiliser des techniques avancées d’apprentissage automatique centrées sur la donnée pour améliorer et automatiser les systèmes de supervision. Cependant, il existe plusieurs défis à relever pour concrétiser cette vision, qui sont partagés à la fois par la communauté scientifique et les ingénieurs sur le terrain. Tout d’abord, le manque d’une terminologie claire et unifiée dans le domaine de l’AIOps rend difficile la progression, l’implémentation et la comparaison des contributions provenant de différentes disciplines. De plus, les exigences et les métriques nécessaires à la construction de modèles AIOps, alignés avec les contraintes industrielles, ne sont pas suffisamment élaborées. Deuxièmement, les contributions théoriques en matière d’AIOps se sont principalement concentrées sur les modèles prédictifs pour la détection et prédictions des incidents, en négligeant souvent la capacité des modèles descriptifs à gérer et résoudre les défis liés à la qualité, à la complexité, au volume et à la diversité des données. Troisièmement, la dépendance excessive aux modèles boîte noire opaques limite leur adoption par les praticiens de l’industrie. Enfin, les solutions AIOps existantes ne prêtent pas toujours suffisamment d’importance à l’évaluation des performances des modèles et aux problèmes de scalabilité lors du développement et de l’évaluation des modèles.

Nous proposons d’abord une approche systématique de l’AIOps qui organise les connaissances dans ce domaine de recherche en fournissant une catégorisation en accord avec les normes et les exigences de l’industrie. Deuxièmement, nous explorons l’application de la découverte de sous-groupes qui est une technique prometteuse de fouille de données qui permet l’extraction d’hypothèses intéressantes à partir de vastes ensembles de données diversifiées. Ainsi, les utilisateurs sont en mesure de comprendre, d’interagir avec et d’interpréter les processus sous-jacents aux modèles. Nos contributions dans ce domaine comprennent une application pratique axée sur l’identification de fragments de requêtes SQL suspects permettant de localiser les problèmes de dégradation de performances. De plus, nous développons un mécanisme d’interprétation pour les modèles de triage des incidents, offrant des explications contextualisées pour les décisions prises par le modèle. Nous abordons également le problème de l’analyse des problématiques de saturation de la mémoire Java, caractérisé par un ensemble de données volumineux et complexes intégrant des données hiérarchiques. Enfin, nous traitons la scalabilité en étudiant le problème de la détection de la déduplication des incidents. Notre objectif est de rechercher de manière efficace et rapide les rapports de plantage les plus similaires en combinant des techniques de hachage sensibles à la localité (LSH) et des techniques d’apprentissage contrastif dans un cadre unifié. Pour garantir la pertinence et la praticité de nos propositions, ce projet de thèse implique une collaboration entre des chercheurs en fouille de données et des praticiens d’Infologic, un éditeur de logiciels français.

ADMINISTRATIF

AUTRES MODULES

USINE

MODULES MÉTIERS

Agroalimentaire

Autres filières

ADMINISTRATIF

AUTRES MODULES

USINE

MODULES MÉTIERS

Agroalimentaire

Autres filières

Soutenance de thèse CIFRE – Youcef REMIL

Une nouvelle soutenance de thèse en lien avec l'INSA de Lyon !

Résumé de la thèse : "A Data Mining Perspective on Explainable AIOps with Applications to Software Maintenance"

Découvrez nos autres articles :

Projet ANR SmartFCA

Infologic est présent dans les écoles

Prix de thèse Génie de la programmation et du logiciel

ABONNEZ-VOUS à notre newsletter