Écosystème de prévention des fautes pour les services à mission critique de 5G

 

Défi de développement technologique 5G (ENCQOR)

Écosystème de prévention des fautes pour les services à mission critique de 5G

Date de lancement du défi :

Le 24 mai 2019

Date limite du défi : 

6 septembre 2019

Énoncé du défi :

Les services 5G audio, vidéo et de données (X) à mission critique (MC) demande au système 5G de fournir des services à haute disponibilité et aux faibles délais de communication. Le nuage de type Edge Cloud est une architecture très importante pour les services MCX parce que la fonction de traitement de données est proche du point de service et ainsi elle aide à réduire les délais de communication en réseaux. La fiabilité est essentielle pour les services MCX. On nécessite un niveau de disponibilité de service de 99999 et plus et dans certains cas, de la tolérance zéro aux pannes. Cette spécification met en question le système traditionnel de gestion des défauts qui détecte et corrige les défauts, en utilisant certains schémas HD (Haute Disponibilité) ou TD (Tolérance aux Défauts) pour assurer la disponibilité des services.  De cette façon, même si un service peut être redémarré à la suite d’un défaut, on ne peut pas garantir, par exemple, qu’il n’y a pas de perte de trame vidéo ou d’erreur de séquence dans une application de chirurgie à distance.

Cette recherche permettra d’adresser ce défi et d’explorer des solutions proactives pour traiter les défauts et les défaillances du système. L’objectif est non seulement de détecter à l’avance les signes de défaillances, mais aussi de prévenir les défauts potentiels de l’infrastructure nuage, les défauts à niveaux système et à niveaux applications MCX. La recherche comprend 1) la surveillance efficace des paramètres du système, 2) l’apprentissage, la reconnaissance, la modélisation et la classification des défauts et 3) un écosystème de prévention des défauts.

Partenaire de projet :

Ericsson Canada Inc.

Durée :

2 ans

Financement disponible :

$60,000 ($30,000/an pour les deux Ph.D.)

Type de candidat :

Université au Québec ou en Ontario (possiblement sélectionnée dans le cadre d’une demande de propositions)

Emplacement :

Les travaux peuvent être réalisés conjointement dans les laboratoires de l’Université et sur le site d’Ericsson à Montréal.

Détails du projet :

Les objectifs de la recherche sont :

  • Système de surveillance et de collection de données : Sélection du système de surveillance (les outils) qui surveille l’infrastructure, le système d’exploitation et l’application. Les outils doivent permettre d’enregistrer les paramètres du système a vue complète et en temps réel. De plus, ils doivent être efficaces en termes de capacités de traitement demandé. Construire un pipeline de données efficace à partir de la collecte jusqu’au prétraitement et au stockage.
  • Modélisation des défauts : Apprendre les défauts correspondant à un cas d’utilisation d’un service sélectionné MCX et étudier et simuler les défauts potentiels. Classifier les défauts et analyser les caractéristiques de chaque type de défaut. Construire un modèle d’apprentissage des défauts qui est capable d’apprendre les défauts historiques et en déduit les défauts potentiels.
  • Architecture de traitement des défauts proactive : sélection et apprentissage des modèles pour détecter/prévenir les défauts connus et inconnus. Automatisation de la solution de traitement des défauts en utilisant le type de défaut. Écosystème de prévention et de traitement des défauts à l’aide de méthodes de ML, AI et évolutives. Définir le niveau de maturité du système de prévention des pannes et utiliser le résultat pour faciliter l’installation et la configuration du service MCX.
  • Mise en œuvre et évaluation du banc d’essai: Banc d’essai en nuage distribué 5G pour l’exécution du cas d’utilisation de l’application MCX sélectionné. Tester la solution proposée et évaluer la performance.

Produits livrables:

  • Modèle de défauts qui permet d’apprendre, de définir, de spécifier et mesurer formellement le niveau de gravité des défauts.
  • Architecture pour la prédiction des défauts et la récupération du système par suite d’un défaut
  • Écosystème proactif de prévention des fautes
  • Librairie logicielle pour la prévention des défauts pouvant être utilisée au développement des PoC
  • Démonstration de l’écosystème sur le banc d’essai
  • Rapports techniques

Objectifs / résultats du projet

Les résultats de ce projet comprennent les éléments suivants:

  • Un écosystème de prévention des fautes
  • PoC qui démontre le système de prévention des pannes.
  • Articles scientifiques dans revues réputées et conférences internationales
  • Brevets

Expérience du demandeur

2 chercheurs au niveau du Ph. D. avec:

  • Forte expérience en cloud computing et les systèmes distribués
  • Bonne compréhension des algorithmes évolutifs
  • Expériences en modélisation statistique, apprentissage machine, réseaux neuronaux, analyse de données et l’algorithme de renforcement de l’apprentissage.
  • Bonnes connaissances en programmation Python ou R, connaissance pratique de Docker, Container et Kubernetes.
  • Connaissance en edge computing, IoT et sensor networks est un plus
  • Connaissance du système de gestion des réseaux télécom FCAPS est un plus

Information additionnelle

  • Sans objet

Signifiez votre intérêt

Êtes-vous intéressé par ce projet? Faites-le-nous savoir!

  • Ce champ n’est utilisé qu’à des fins de validation et devrait rester inchangé.