Accedian fait maintenant partie de Cisco |

Supervision proactive des performances de l’infrastructure

Les professionnels de l’exploitation IT doivent faire face à de nombreux défis lorsqu’ils tentent de superviser l’infrastructure de manière proactive et d’en corriger les baisses de performance. Car les environnements IT de l’entreprise sont devenus particulièrement complexes, associant des infrastructures physiques comme virtuelles, hébergées au sein de nombreux sites distants ou plusieurs centres de données… lorsqu’elles ne sont pas dans le Cloud ou encore servies en mode « as-a-service » ! Cela complique alors fortement les efforts des équipes d’exploitation qui cherchent à obtenir une meilleure visibilité sur leur infrastructure. Une visibilité pourtant incontournable lorsque l’on cherche à en superviser les performances de manière proactive.

Au fil de leurs efforts pour superviser l’infrastructure IT et gérer ses performances de manière proactive, les responsables d’infrastructure, du DevOps ou des data centers cherchent surtout à :

  • Jouir d’une visibilité totale et en temps réel sur l’infrastructure IT, à travers tous les hôtes, tous les sites, tous les centres de données, y compris dans les clouds publics, privés ou hybrides et les infrastructures « as-a-service » (SaaS, IaaS, PaaS)
  • Établir un modèle de référence de la performance de l’infrastructure IT au fil du temps, avec ses tendances, ses pics et sa saisonnalité, afin de déterminer les objectifs de performance et les seuils de déclenchement des alertes
  • Définir des seuils d’alerte pour chaque hôte indépendant, chaque application et chaque service, en s’appuyant partout où cela est possible sur des indicateurs de performance (KPI) internes ou des engagements de niveaux de performance tiers (SLA)
  • Superviser la performance de l’infrastructure et des applications pour s’assurer qu’elles atteignent les KPI ou restent dans les SLA attendus, en prenant si nécessaire des actions préventives lorsqu’une tendance à la dégradation est observée
  • Détecter et alerter dès les prémisses d’une chute des performances. Et de préférence avant même que les utilisateurs ne s’en aperçoivent !
  • Déléguer à une équipe spécifique (application, base de données, DevOps, etc) la responsabilité des mesures correctives, en partageant avec eux les traces et les informations utiles au diagnostic du problème

Une supervision efficace et proactive de l’infrastructure et des performances applicatives

Pour atteindre leurs objectifs de supervision proactive des performances de l’infrastructure et des applications (et de correction rapide des problèmes !), les exploitants doivent pouvoir compter sur un outil de supervision qui leur permettra de :

  • Visualiser la totalité de l’infrastructure IT à travers tous les sites, et l’ensemble du trafic applicatif, y compris nord-sud (entre les différents sites et centres de données) et est-ouest (à l’intérieur des centres de données, entre machines virtuelles ou au sein des Clouds et autres plateformes « “as-a-service »”)
  • Capturer le trafic applicatif en temps réel à travers toutes les applications (y compris Citrix et sur HTTPS), tous les hôtes et tous les services, afin de mesurer les performances de l’infrastructure IT sans impact sur celle-ci
  • Compiler des données de performance historiques, mais aussi les pics et les variations saisonnières, afin de déterminer les seuils d’alerte acceptables, en complément des KPI internes et autres SLA
  • Configurer des seuils de performance distincts pour chaque segment de l’infrastructure ou chaque équipement individuel
  • Surveiller les performances, détecter les dégradations et lever des alertes en temps réel, permettant ainsi aux exploitants IT de réagir avant que les utilisateurs ne se plaignent
  • Confirmer les baisses de performance grâce à des indicateurs immédiats qui permettent d’identifier rapidement les tendances baissières et les exceptions. Et cela en pouvant s’appuyer sur des outils capables d’identifier précisément la cause du problème
  • Voir quels utilisateurs, quels hôtes, quels sites ou quels équipements sont affectés par une dégradation des performances de l’infrastructure ou des applications, afin de tenir compte de leurs propres KPI ou SLA
  • Contribuer à la résolution des problèmes par le support technique, en pouvant notamment pointer les responsabilités, alerter les tiers concernés et fournir des données fiables

Une solution de mesure de la performance applicative bien conçue

Une solution de mesure de la performance applicative (APM) bien conçue tiendra compte des meilleures pratiques de supervision et de correction des problèmes de l’infrastructure IT. Elle permettra notamment de mieux visualiser et de mieux comprendre les aspects essentiels de la performance applicative, aussi bien de manière globale qu’en plongeant dans les détails lorsqu’il sera nécessaire d’intervenir. Une telle solution APM offrira notamment les fonctionnalités suivantes :

  • Une visibilité totale à travers toute l’infrastructure IT :
    • Centres de données et sites distants
      • Hôtes, applications, bases de données
    • Applications (y compris sur le web et à travers HTTPS)
    • Bases de données (jusqu’aux transactions SQL individuelles)
    • Équipements réseau (équilibreurs de charges, pare-feu, etc)
    • Serveurs virtuels (VMware)
    • Postes de travail virtuels (infrastructures Citrix XenAPP / XenDesktop)
    • Environnements Cloud (publics, privés, hybrides; sur AWS, Azure, Google Cloud)
    • Plateformes SaaS, IaaS et PaaS
    • Services réseau courants (DNS, NetBIOS, NTP, etc)
    • VoIP (SIP, Skinny, MGCP) et communications unifiées
    • Partages de fichiers (SMB, CIFS)
  • La capacité à capturer des données sur toutes les transactions applicatives et les mesurer en temps réel afin de générer de nouvelles métriques de performance
    • Temps de réponse perçu par l’utilisateur (EURT), débit de l’application, temps de réponse et qualité de l’expérience utilisateur (QoE)
  • La capacité à capturer et à stocker des données de performance sur de longues périodes de temps, permettant ainsi des comparaisons historiques, afin d’en dériver des niveaux de performance standards et ainsi mieux anticiper les chutes de performances
  • La capacité à configurer des seuils d’alerte spécifiques pour chaque application et ses composants individuels
  • La capacité à accéder aux informations de performance des applications sur tous les sites, y compris au sein du trafic habituellement caché à l’intérieur des centres de données (le trafic “est-ouest”), entre les machines et les commutateurs virtuels ou encore au sein des environnements Cloud
  • La capacité à visualiser les performances de l’infrastructure et des applications sur des périodes de temps variées, en détail et en étant capable de les comparer avec des mesures prises à différents moments
  • La capacité à repérer en temps réel les chutes de performance de l’infrastructure ou des applications et identifier les tendances baissières afin de mener des actions préventives
  • La capacité à observer les baisses de performance depuis une vue plus globale, puis de descendre au plus près des causes avec une vue techniqueLa capacité à contribuer aux efforts de remédiation en partageant des traces techniques et des preuves des baisses de performance, y compris la chaîne des événements passés qui ont conduit à l’incident

Le chaînon manquant entre la performance du réseau et le supervision des performances applicatives

Une solution complète qui associe la gestion de la performance des applications (APM) à celle de la performance du réseau (NPM) apporte aux exploitants IT un niveau d’information et une capacité d’anticipation, d’orientation et d’intervention qu’une solution APM seule ne pourra jamais atteindre. En offrant le moyen d’identifier et de comprendre les flux réseau individuels en même temps que les échanges applicatifs, une telle solution NAPM offre une vue contextuelle largement plus riche que ce que leur offrent les solutions APM ou de supervision traditionnelles. Une solution NAPM intégrée permet en effet de démontrer comment une simple baisse de la performance du réseau peut avoir un effet négatif sur la capacité des métiers à produire de la valeur pour l’entreprise.

Une solution intégrée NAPM offrira :

  • Une vision globale en temps réel du réseau et de l’infrastructure IT qu’il supporte, qu’il soit physique, virtualisé, défini par logiciel (SDN), dans le Cloud ou  « “as-a-service »”; ainsi que les applications auquel il permet l’accès, y compris les postes de travail virtuels de type Citrix, toutes les transactions et les applications web accédées par HTTPS
  • La capture des indicateurs de performance de l’ensemble du trafic du réseau et des applications, entre tous les hôtes, tous les sites et tous les centres de données (le trafic  « “nord-sud »”), ainsi qu’au sein même des centres de données et des Clouds (trafic  «“est-ouest »”). Le tout en temps réel et sans impact sur les équipements, les liens, les applications ou les services concernés
  • L’observation du trafic du réseau et des applications à travers toutes les couches jusqu’aux transactions applicatives individuelles
  • La création d’un profil d’usage standard des différents réseaux et applications, mais également leurs variations saisonnières et leurs pics d’utilisation
  • Les moyens nécessaires à la détermination de l’origine des incidents, en permettant aux équipes de descendre jusqu’au niveau des équipements, des liens, des services individuels, et visualiser les chaînes applicatives de manière détaillée, les flux réseau individuels et les transactions applicatives (requêtes SQL, trafic HTTPS, etc)
  • Le partage des traces et des preuves montrant les événements conduisant à une chute des performances (et leurs conséquences précises !), puis fournir les transactions réseau et les échanges applicatifs impliqués

En définitive, une solution intégrée NAPM est un outil de supervision et de correction de la performance de l’infrastructure et des applications particulièrement efficace. Skylight est un bon exemple d’une telle solution, complète et entièrement dédiée à la supervision et la correction de l’infrastructure et des applications de l’entreprise.

Plus d’information à propos de Skylight, la solution de planification de la capacité des réseaux de l’entreprise.