Blog

Comment déployer des capacités de diagnostic réseau et applicatif dans des sites très éloignés?

Lors d’une récente demande client, j’ai été confronté à un besoin de lenteur d’une application fonctionnant, selon les sites : sous Citrix, en client lourd ou encore en http. Les utilisateurs de 5 continents subissaient ces problèmes de performance, quel que soit le mode.

Le client possède déjà une sonde d’analyse SkyLIGHT PVX, la solution aurait donc été de la positionner dans le Datacenter (DC) hébergeant l’application situé en Europe mais il est externalisé auprès d’une société de service. Et, aucune sonde physique ne peut être déployée dans ce DC.

Par ailleurs, le réseau était mis en cause, même si :

  • Cette seule application dysfonctionnait ;
  • Cette problématique était récurrente ;
  • Plusieurs sites étaient impactés.

La question était : comment trouver les causes de ces lenteurs qui empoisonnent depuis plusieurs mois la production sans installer de sonde physique sur le DC ni sur les nombreux sites distants afin de dédouaner le réseau et diagnostiquer le problème ?

Les difficultés que nous avons rencontrés

Le client possède des sondes physiques. Les questions qu’il me posa étaient :

  • « Comment puis-je analyser avec mes deux sondes tous ces sites ? Je ne peux pas envoyer sur chaque site mes sondes en cas de problème, c’est trop compliqué et trop long ! » ;
  • « De plus, comment capitaliser sur les sondes physiques que je possède déjà ? » ;
  • Le client souhaitait s’assurer de la possibilité d’analyser le LAN distant (avec une sonde de capture locale) ainsi que différencier les performances ressenties en fonction des sites (avec la sonde côté DC).

Nous avons fait face à d’autres obstacles :  

    1. Les métiers sont bien dissociés :
      • Il existe plusieurs équipes qui coopèrent mais dont les responsabilités sont bien définies. Pour l’analyse des réseaux WAN, l’organisation s’appuie sur une solution de priorisation des flux qui fournit une mesure de performance réseau mais elle est complexe d’utilisation, s’arrête au niveau TCP et ne suffit pas à dédouaner le réseau. Pour aller plus loin, je vous invite à consulter notre livre blanc :  « 6 bonnes raisons de changer de méthode d’analyse réseau ».
    2. Des compétences sur les sites distants certes, mais limitées :
      • L’objectif du client était de permettre aux équipes locales d’intervenir, il fallait donc qu’elles puissent s’approprier la solution choisie.
    1. Des problèmes de performance aléatoires :
      • Les problèmes de performance étant intermittents, cela impliquait la nécessité d’une solution fonctionnant en 24/24.
    2. Un accès au Datacenter limité :
      • La gestion des ressources étant gérée par un tiers, nous ne pouvions pas installer de sonde physique.
    3. Besoin d’analyser 3 modes de fonctionnement de l’application : http, Citrix, client lourd.
    4. Analyse LAN et WAN.

À problème complexe, solution simple !

Les défis étaient donc multiples.  L’architecture de SkyLIGHT PVX est néanmoins simple et nous avons pu répondre et déployer une solution en quelques jours.

La configuration choisie a été la suivante :

Nous ne pouvions pas installer de sonde principale (Datastore) sur le Datacenter : eh bien nous avons déployé 3 sondes de capture sous forme de VM (Virtual Machine) installées dans les serveurs clé des différents clusters. En effet nous avons tiré avantage des atouts de SkyLIGHT PVX :

  • La solution peut être déployée en mode capture grâce à son fonctionnement basé sur l’analyse temps réel, seules les mesures sont envoyées sur une sonde centrale.
  • Déploiement des sondes sur les sites distants : des serveurs pouvant accueillir une VM sont disponibles sur la majorité des sites de production. Nous avons donc installé des sondes de capture sur chaque site impacté par les dégradations de performance : une dizaine dans un premier temps.
    • Ce déploiement s’est effectué en 2 journées pour les 10 sondes virtuelles. Et la totalité de l’intégration s’est faite à distance sans avoir frais de transport, ni de port.
    • Nous avons installé les 3 VM sur le DC en moins d’une journée.
    Une de leurs sondes physiques a été utilisée en Datastore installé sur un site majeur en France. SkyLIGHT PVX a donc été déployée pour analyser 10 sites en moins de 3 jours sur un environnement complexe et non totalement maîtrisé.

Le résultat a été concluant

Nous avons résolu le problème applicatif, celui-ci était bien dû à un dysfonctionnement d’accès au niveau de la base de données :

  • Les utilisateurs renseignaient leurs données mais les serveurs de base de données étaient parfois indisponibles et l’application ne remontait pas l’information à l’utilisateur.
  • Les sites de production en Inde, Etats-Unis et Brésil, ont ainsi pu économiser de nombreuses journées de « rework » et réduit les pertes de production.
  • Les équipes locales ont accès et utilisent SkyLIGHT PVX pour leur troubleshooting et leur reporting.
  • Fort de ces informations, le client a pu remonter les requêtes en cause auprès de l’éditeur qui a résolu le problème.

Nous sommes actuellement en discussion avec cet éditeur pour l’acquisition de SkyLIGHT PVX.

Aujourd’hui les prochaines étapes sont déjà identifiées afin que :

  • Notre client déploie de nouvelles captures
  • Il puisse upgarder son Datastore pour augmenter ses capacités d’analyse

Même si vous ne maîtrisez pas totalement votre environnement, il existe des solutions faciles de déploiement basées sur l’analyse des flux réseaux physiques ou virtuels, pour étudier simplement et en profondeur les lenteurs dont l’origine peut être localisée soit au niveau :

  • Du réseau
  • D’un des différents tiers applicatifs :
    • Frontal web, Citrix
    • Middleware
    • Back end : base de données
  • D’un site distant
  • Du Datacenter