Dynamics AX : Haute disponibilité (Part 1)

Qu'est-ce qu'un système hautement disponible ?

Les systèmes configurés afin d'offrir une disponibilité presque en tout temps se nomment système hautement disponible. Ces systèmes offrent un taux de disponibilité élevé généralement en se basant sur de la redondance matérielle et applicative. Un système hautement disponible bien configuré n'a pas de point individuel de défaillance (single point of failure). Entre d'autres mots, chaque composant matériel ou applicatif est redondant.

Lorsqu'une panne survient, un basculement des ressources est automatiquement démarré et le système continue d'être opérationnel. Plus le processus est transparent pour les utilisateurs, meilleur est le système de haute disponibilité.

Planification

Lors de la planification de l'architecture d'un système Dynamics AX, il est important de planifier la redondance des serveurs. Il y a deux façons de planifier la haute disponibilité du système:
  • Mettre en place un système de redondance pour chaque composant.
  • Protéger le système contre les multitudes de pannes possibles.

Dans ce billet, je mets l'accent sur la mise en place du système de redondance pour chaque composant.

Mesurabilité

De façon générale, les entreprises utilisent les deux unités de mesure suivante:

  • The mean time to recovery (MTTR) - temps moyen jusqu’à la remise en route.
  • La disponibilité mesurée en pourcentage.

Dans le premier cas, si vous avez un seul serveur AOS et que celui-ci tombe en panne, combien de temps en moyenne vous faudra-t-il afin de remettre le service en route ? Et si le serveur AOS ne démarrait plus et que vous deviez effectuer une restauration ou une nouvelle installation ? Est-ce acceptable pour l'entreprise ?

Dans le deuxième cas, la disponibilité est mesurée en pourcentage. Par exemple, 99.99% veut dire que le système doit être disponible 99.99% du temps pour une période précise, une année par exemple. Dans cet exemple, le système ne sera pas disponible pendant 52 minutes dans une année incluant les pannes planifiées et non planifiées.



Type de panne

Une panne peut être planifiée ou non planifiée. Les pannes non planifiées peuvent être causées par plusieurs facteurs. Par exemple, panne matérielle, panne logicielle, panne électrique, erreur humaine, etc. Les pannes non planifiées perturbent système parce qu'elles sont difficiles à prédire.

Une panne planifiée peut aussi perturber le système, mais elles sont de façon générale plus facile à prévoir et gérer. Les pannes planifiées comprennent la maintenance, les mises à jour du système, les mises à jour du code, etc.

Tolérance aux pannes vs Haute Disponibilité

Lorsqu'un système hautement disponible tombe en panne, le système peut devenir non disponible pour quelques secondes ou minutes. Par exemple, lors d'une panne matérielle sur un host VMware, vSphere détecte la panne et redémarre les machines virtuelles sur un host différent. Le temps du démarrage, le système sera non disponible pour quelques secondes.

Tolérance aux pannes (Fault Tolerance) est un système qui est insensible aux pannes. Pour ce faire, la solution utilise une technologie qui réplique la machine entière incluant la mémoire vive. Par exemple, Fault Tolerance (FT) de VMware.

Ce billet met l'accent uniquement sur des technologies de haute disponibilité.
Previous
« Prev Post