Accedian fait maintenant partie de Cisco |

Identifier les problèmes d’infrastructure et améliorer le temps moyen de réparation (MTTR) avec Skylight

Identifier l’origine des chutes de performance liées à l’infrastructure et améliorer sans cesse le temps moyen de réparation (MTTR) est un véritable défi au sein des environnements IT et des réseaux modernes, devenus particulièrement complexes. Ceux-ci associent en effet désormais aussi bien des réseaux physiques, virtuels que définis par logiciel (SDN), et ils sont répartis à travers de nombreux sites distants, sur plusieurs centres de données ou des plateformes « as-a-service ».

Afin d’identifier les baisses de performance liées à l’infrastructure tout en restant dans un MTTR acceptable, il est nécessaire de :

  • Détecter l’occurrence des problèmes de performance en temps réel
  • Quantifier leur impact
  • En identifier l’origine
  • En assigner la responsabilité
  • Pouvoir partager les traces techniques et les preuves des effets négatifs
  • Corriger la dégradation des performances
  • Contrôler le retour aux niveaux de performance nominaux

Skylight et l’identification des problèmes de performance d’infrastructure

Skylight est une solution complète associant la gestion de la performance réseau (NPM) à des fonctionnalités avancées de gestion de la performance applicative (APM). Elle permet aux équipes d’exploitation réseau de détecter rapidement tous les types de baisses de performance, d’évaluer en quelques clics leur impact, d’en identifier la cause véritable et de transmettre les éléments de correction nécessaires à la bonne équipe qui sera chargée de l’intervention.

  • Mesure les performances sur l’intégralité du réseau, sans impact
  • Détecte en temps réel les chutes de performance, avant que les utilisateurs ne se manifestent
  • Évalue l’impact de la baisse des performances en s’appuyant sur des profils d’usages archivés
  • Détermine quels liens, sites, hôtes, services, équipements et même quels utilisateurs sont concernés par l’incident
  • Identifie la cause initiale de l’incident, même au coeur des environnements IT les plus complexes
  • Produit les preuves nécessaires afin d’aider les équipes en charge de la résolution
  • S’assure du retour des performances aux valeurs nominales

Skylight offre une vision globale de l’infrastructure IT, avec une vision totale sur le réseau et les applications. Il permet d’inspecter à la fois le trafic nord-sud entre les différents sites distants et les data centers, et cela sur des liens physiques, virtualisés ou définis par logiciel (SDN). Mais il couvre aussi le trafic dit est-ouest, à l’intérieur des centres de données et des environnements dans le cloud. Cela permet aux équipes réseau de détecter et d’isoler les incidents de performance où qu’ils aient lieu.

Plutôt que devoir cocher une série de cases dans une check-list, Skylight simplifie le dépannage des infrastructures avec des tableaux de bord en temps réel qui permettent, à partir d’une vue générale, de descendre en à peine 4 clics de souris jusqu’à la moindre donnée technique. Skylight fournit ainsi une visibilité totale sur l’infrastructure, intégrant sous la même interface simplifiée une série d’outils complets et avancés pour la mesure et l’analyse des performances.

Dès lors que les équipes cherchent à identifier la cause d’un ralentissement du réseau, de latences soudaines ou essayent en vain de comprendre pourquoi une application se traîne soudainement, Skylight est la solution NAPM qui accélérera les temps de résolution (MTTR) des incidents liés aux baisses de performance les plus complexes, au sein des environnements IT les plus exigeants.

Identifier et corriger efficacement les baisses de performance de l’infrastructure

Mesurer les performances de l’infrastructure sans l’impacter

  • Une vision à 360° sur la totalité de l’infrastructure IT et ses applications, y compris au sein des environnements cloud et les plateformes « as-a-service » (SaaS, IaaS, PaaS)
  • 100% du trafic réseau et applicatif mesuré au plus proche du câble, à plus de 10 Gbps par équipement de capture (et les liens à 40 Gbps sont supportés)
    • Réseaux physiques, virtuels et SDN, y compris SD-WAN
    • Services réseau courants (DNS, NetBIOS, NTP, etc)
    • VoIP (SIP, Skinny, MGCP) et communications unifiées (UC)
    • Sessions Citrix® XenAPP / XenDesktop
    • Sessions HTTP/S (y compris sur applications SaaS publiques et privées), transactions SQL et partages de fichiers CIFS/SMB
  • Support des techniques d’analyses par flux (NetFlow, sFlow, jFlow, IPFix, etc) et des analyseurs de paquets
  • Conservation des historiques de performance jusqu’à 365 jours, permettant ainsi des comparaisons entre différents profils d’utilisation et l’évaluation précise de l’ampleur des dégradations des performances

Détecter les baisses de performance de l’infrastructure en temps réel

  • Supervision des performances de tous les types de réseau et toutes les chaînes applicatives depuis un tableau de bord unique
  • Création de seuils d’alerte configurables pour identifier de manière proactive les baisses de performances sur les réseaux métiers critiques (BCN) et les applications métiers critiques (BCA)
  • Des indicateurs de performance clés (KPI) tels que le temps de réponse perçu par l’utilisateur final (EURT) ou des engagements de niveau de service tiers (SLA)
  • Des alertes en temps réel dès qu’une application critique offre un ressenti utilisateur en baisse
  • Détection des chutes de performance en s’appuyant sur des mesures objectives, avant que les utilisateurs ne se manifestent

Quantifier l’impact des chutes de performance

  • Accéder aux niveaux de performance nominaux ou à des mesures effectuées jusqu’à 365 jours en arrière, ou encore observer des récurrences telles que les pics d’utilisation ou les changements saisonniers
  • Identifier précisément les réseaux, les sites, les hôtes et même les utilisateurs concernés
  • Savoir immédiatement quand le problème a eu lieu et quels composants étaient impliqués : client, réseau, serveur ou encore un volume de données trop important, par exemple
  • Des tableaux de bord de rejeu instantané synthétisent les données de performance, permettant aux analystes de mieux comprendre :
  • « Que s’est-il passé exactement ? Qui était impliqué ? Où cela s’est-il passé ? Quand ? ». Et, le plus important : « Pourquoi ? »

Identifier la cause des chutes de performance

  • Accéder en un clic aux moindres détails de n’importe quel équipement, n’importe quelle application, base de données ou service dont les performances sont en baisse
  • Identifier instantanément l’origine des baisses de temps de réponse et attribuer rapidement la tâche à la bonne équipe, réduisant ainsi le MTTR vis-à-vis des utilisateurs finaux
  • Accès aux applications de bureau distant : VDI, Terminal Server, couches Citrix
  • Applications clientes : déconnexions, ralentissement des transferts, trafic parasite, etc.
  • Serveurs : déconnexions, ralentissement des transferts
  • Applications avec des temps CPU excessifs ou des erreurs
  • Services réseau traditionnels tels que la résolution de noms (DNS), l’authentification, etc.
  • Équipements réseau : mauvaise configuration (routage, prioritisation), faibles performances (forte latence, perte de paquets), congestion

Partager les traces des chutes de performance

  • Rejeu des transactions applicatives et des conversations réseau individuelles afin d’observer les événements qui ont conduit à la chute de performance
  • Corréler les baisses de performance avec des actions spécifiques d’un utilisateur, ou avec des événements métiers anticipés ou fortuits, afin de déterminer l’origine de la perte de performance
    • Par exemple des mises à jour côté client, des changements dans la configuration d’équipements réseau, le déploiement de services standards, des mises à jour de la politique de sécurité, des modifications de la configuration de serveurs ou des mises à jour applicatives
  • Créer des rapports exportables qui montrent les requêtes réseau exactes ou les échanges applicatifs qui ont conduit à la baisse des performances

Confirmer le retour aux niveaux de performance nominaux

  • Superviser toute la chaîne de performance dont dépend l’utilisateur final afin d’observer instantanément les effets des mesures correctives prises par l’équipe en charge du dépannage
  • Comparer les niveaux de performance actuels avec les valeurs archivées, fermer l’incident et communiquer efficacement