Les bonnes pratiques d’oXya pour déployer et tester les clusters haute disponibilité

Cluster Haute disponibilité

Les entreprises d’aujourd’hui sont très dépendantes de la fiabilité et de la disponibilité de leurs applications critiques. Pour répondre à des besoins exigeants où le moindre temps d’arrêt peut avoir un impact significatif sur la performance, les clusters de haute disponibilité (HA) deviennent essentiels, garantissant l’absence de point de défaillance.

Dans cet article, nous examinerons de plus près ce qu’est un cluster haute disponibilité et comment il améliore les accords de niveau de service (SLA). Nous donnerons ensuite un aperçu de la méthodologie éprouvée d’oXya pour le déploiement et les tests.

Améliorer votre accord de niveau de service grâce à la haute disponibilité

Un cluster de haute disponibilité désigne généralement deux systèmes situés dans la même région, mais dans des zones différentes, qui répliquent toutes les données et assurent la continuité opérationnelle en un clin d’œil si l’un des systèmes tombent en panne.

Au fur et à mesure que nous augmentons la disponibilité, cette architecture apporte une différence significative dans l’accord de niveau de service, et passe de 99,9 % à 99,95 %. Cela signifie que l’on passe d’environ 10 à 5 minutes de temps d’arrêt par semaine !

La réduction du temps maximum pour remettre le système SAP sur pied (RTO), qui a toujours un impact financier significatif pour le client en raison de la redondance des ressources cloud. Les architectes d’oXya aident les clients à peser le pour et le contre de chaque scénario de cluster haute disponibilité afin de trouver la bonne combinaison.

Pour tirer le meilleur parti de cette solution et l’intégrer avec succès dans l’infrastructure existante, le client doit s’assurer que la solution répond à des exigences spécifiques, telles que l’équilibrage de la charge, l’évolutivité des données et la diversité géographique.

Un cluster haute disponibilité ne doit pas être confondu avec un site de reprise sur sinistre (DR). Avec un cluster haute disponibilité, le basculement est automatisé et effectué dans la même région. Un basculement de site de reprise sur sinistre est déclenché manuellement et démarré dans une autre région.

Maîtriser le déploiement de clusters avec notre solution clé en main

Le déploiement d’un cluster haute disponibilité est une tâche complexe qui nécessite non seulement une expertise technique, mais aussi de suivre de nombreuses étapes basées sur la documentation du fournisseur. Par exemple, le déploiement de 2 instances SAP HANA dans un cluster à haute disponibilité sur Amazon Web Services (AWS) est différent de celui sur Google Cloud (architecture et configurations différentes) et nous devons suivre les instructions des différents fournisseurs (SAP, Red Hat ou Suse, Google, AWS ou Azure).

C’est pourquoi oXya a créé une solution clé en main pour déployer efficacement des clusters haute disponibilité.

En effet, nous avons développé un outil interne pour tous les fournisseurs de cloud, qu’il s’agisse de Google Cloud, Microsoft Azure, Amazon Web Services ou oXya cloud. Nos solutions utilisent des outils d’automatisation, comme Terraform et IaC Express, pour minimiser les risques d’erreur humaine.

Cette méthodologie éprouvée a fait ses preuves auprès de nombreux clients : notre équipe expérimentée maîtrise parfaitement ce processus, comme nous le démontrerons dans un instant avec les tests d’assurance qualité (QA).

Dans le contexte SAP, nous disposons de plusieurs types de clusters haute disponibilité avec une architecture de référence spécifique :

  • Clusters d’instances SAP HANA;
  • Clusters ASCS/ERS;
  • Clusters SCS/ERS (pour les piles JAVA);
  • Clusters SAP ASE;
  • Clusters SAP Webdispatcher;
  • Clusters SAP Cloud Connector;

Nous explorons généralement l’architecture et la configuration de ces clusters haute disponibilité pendant les semaines initiales du projet avec les ateliers techniques oXya.

Exemple de clusters haute disponibilité SAP sur AWS

Exemple de clusters haute disponibilité SAP sur Google Cloud

Test d’assurance qualité pour une configuration résiliente

Une mauvaise configuration d’un cluster haute disponibilité peut avoir un impact négatif sur l’accord sur les niveaux de service de l’application.  Après le déploiement, un test d’assurance qualité est essentiel afin de s’assurer que la configuration a été faite convenablement et qu’il ne subsiste pas de défauts de déploiement potentiels. Mais surtout, le test nous permet de démontrer que nous avons bel et bien respecté toutes les exigences du fournisseur et prévenu tous les problèmes potentiels avec l’ANS.

Chez oXya, nous affectons deux équipes différentes au processus : l’équipe de projet, qui est responsable du déploiement, et l’équipe de livraison, qui est responsable du cluster et du système SAP sur des données artificielles. À ce stade, notre équipe de livraison effectue une série de tests, tels qu’une défaillance, un crash et un arrêt afin de s’assurer que le cluster défaillit correctement sur le nœud opposé.

On peut comparer ces tests au Monkey Testing de Netflix. Ce type de test introduit délibérément un « singe » à l’intérieur du système afin de causer des problèmes. En simulant les actions du singe, nous sommes en mesure de vérifier comment le système réagit à différents scénarios imprévus, tout en nous assurant également que le cluster demeure opérationnel à tous les coups.

Cette approche proactive de tests nous permet de nous assurer que votre configuration est résiliente et qu’elle est conforme aux meilleures pratiques SAP et de cloud public.

Garantir un fonctionnement en continu avec les Services managés cloud d’oXya

À la suite des tests d’assurance qualité, nous utilisons les certificats de livraison des tests QA pour transférer le cluster haute disponibilité de l’équipe de projet à l’équipe de l’état stable. Après le déploiement, il est essentiel de faire un bon suivi. Nous devons agir rapidement pour identifier toute anomalie pour nous assurer que le cluster demeure opérationnel en tout temps.

À l’aide de nos scripts de conception sur ITSM Cockpit, nous fournissons un contrôle proactif pour vous offrir la meilleure protection ANS sur le marché. En outre, les clusters haute disponibilité offrent un temps d’arrêt proche de zéro (nZDT).

Avec oXya, vous avez l’occasion de profiter d’une méthodologie éprouvée et d’une grande expérience avec de multiples clients, qui ont choisi les Services managés cloud d’oXya après une collaboration réussie. Faites les premiers pas vers l’optimisation de votre résilience :  contactez notre équipe dès maintenant ici.

Partager :