Maison  >  Article  >  Tutoriel système  >  Optimisez le déploiement de la reprise après sinistre et supprimez les responsabilités d’exploitation et de maintenance

Optimisez le déploiement de la reprise après sinistre et supprimez les responsabilités d’exploitation et de maintenance

WBOY
WBOYavant
2024-01-03 22:36:201200parcourir
Présentation De nos jours, la technologie d'équilibrage de charge locale a résolu le problème de haute disponibilité des clusters de serveurs. Cependant, les pannes de courant, les coupures de câbles optiques, les catastrophes naturelles, etc. peuvent toujours empêcher l'ensemble du centre de données de fonctionner. De plus, le réseau chinois est composé de plusieurs opérateurs et il est incontestable que la qualité de l’interconnexion entre opérateurs est médiocre. Par conséquent, les grandes sociétés Internet ne se contentent plus de fournir des services de sites Web dans un centre de données unique ou actif-actif. De plus en plus de sociétés Internet commencent à envisager de déployer plusieurs clusters de centres de données dans différentes régions et différents opérateurs pour permettre l'accès des utilisateurs à proximité. équilibrage et tolérance aux pannes.

De nos jours, la technologie d'équilibrage de charge locale a résolu le problème de haute disponibilité des clusters de serveurs, mais les pannes de courant, les dommages de construction aux câbles optiques, les catastrophes naturelles, etc. peuvent toujours empêcher l'ensemble du centre de données de fonctionner. De plus, le réseau chinois est composé de plusieurs opérateurs et il est incontestable que la qualité de l’interconnexion entre opérateurs est médiocre. Par conséquent, les grandes sociétés Internet ne se contentent plus de fournir des services de sites Web dans un centre de données unique ou actif-actif. De plus en plus de sociétés Internet commencent à envisager de déployer plusieurs clusters de centres de données dans différentes régions et différents opérateurs pour permettre l'accès des utilisateurs à proximité. équilibrage et tolérance aux pannes.

Lorsqu'il s'agit de déploiement multi-centres de données, il est inévitable de faire face aux trois problèmes suivants.

1. Comment répartir le trafic de plusieurs centres de données ?

2. Comment la surveillance peut-elle détecter les pannes de réseau à temps ?

3. Comment assurer la reprise après sinistre pour plusieurs services de centre de données ?

Si ces trois problèmes ne peuvent pas être résolus efficacement, cela entraînera une mauvaise qualité d'accès des utilisateurs, des trous noirs dans les services et des plaintes des clients. Le personnel d'exploitation et de maintenance derrière le site Web sera fréquemment mis au défi par les ventes, les PM et les dirigeants ! Devenez la cible du blâme. Ce qui est gratifiant, c'est que le produit DNS de résolution cloud d'Alibaba Cloud a désormais aidé les petites et moyennes entreprises à résoudre l'équilibrage de la charge du trafic dans plusieurs centres de données, à obtenir un accès des utilisateurs à proximité, une détection rapide des pannes et une commutation de reprise après sinistre en temps réel.

Casser le jeu Équilibrage de la charge du trafic du centre de données

Lors du déploiement de services dans plusieurs centres de données, vous devez faire face à de nombreux facteurs tels que les différentes bandes passantes d'accès des différents centres de données, les différentes capacités de charge des clusters de serveurs et les coûts d'exploitation. Par conséquent, il est nécessaire de concevoir un ratio d’allocation de trafic correspondant basé sur différents facteurs. Alors, comment pouvons-nous allouer avec précision le trafic d’accès ? Cloud Resolution DNS vous propose quelques solutions de référence.

Cloud Analysis DNS est un système DNS intelligent spécialement conçu qui peut identifier rapidement les informations de localisation d'une adresse IP (y compris le pays, la province, la ville et l'opérateur, etc.), et peut répondre aux requêtes DNS provenant de différentes sources pour différentes adresses IP, pour répondre aux besoins des entreprises en matière d'accès à proximité, de réduction du trafic inter-réseau et de publication en niveaux de gris. Dans le même temps, pour les clusters de centres de données avec différentes capacités de service au même emplacement, le plan global de répartition du trafic peut être défini via WRR (Weighted Resource Record).

Par exemple : le site officiel www de la société example.com dispose de 6 centres de données, dont deux de North China Telecom, deux d'East China Unicom et les deux autres sont hébergés dans le centre de données Alibaba Cloud BGP, Optimisez le déploiement de la reprise après sinistre et supprimez les responsabilités d’exploitation et de maintenance

1. Le rapport de bande passante des deux centres de données d'East China Unicom est de 3 : 7 lors de la configuration de l'équilibrage de charge au sein de la ligne via l'analyse du cloud, définissez les pondérations des adresses IP de service des deux centres de données sur 3 et 7 respectivement. de sorte que le trafic d'accès d'East China Unicom soit le suivant Le ratio d'allocation de 30 % et 70 % ;
2. Le rapport de bande passante des deux centres de données de North China Telecom est de 1 : 1 lors de la configuration de l'équilibrage de charge de ligne via l'analyse du cloud, définissez les pondérations des adresses IP de service des deux centres de données sur 1 respectivement, de sorte que chacune représente 50. % du taux de configuration du trafic d'accès de North China Telecom ; 3. Alibaba Cloud BGP Le rapport entre le nombre d'ECS dans les deux régions est de 8 : 2. Lors de la configuration de l'équilibrage de charge en ligne via l'analyse du cloud, définissez les pondérations des adresses IP élastiques du réseau public des deux régions sur 8. et 2 respectivement, de sorte que le trafic d'accès soit le suivant Le ratio d'allocation de 80% et 20% ;
4. La surveillance du réseau surveille l'adresse IP du service de chaque centre de données en temps réel
 ; 5. La surveillance du réseau renvoie périodiquement les résultats de la surveillance à Cloud Analysis DNS
 ; 6. L'utilisateur lance une demande de requête DNS www.example.com au DNS de North China Telecom
 ; 7. Si le DNS de North China Telecom ne met pas en cache le nom de domaine après avoir reçu la requête de l'utilisateur, il lancera une requête de nom de domaine vers le DNS de résolution cloud
 ; 8. Lorsque Cloud Resolution DNS reçoit la requête DNS de North China Telecom, il interroge et répond aux adresses IP 3.3.3.3 et 4.4.4.4. À l'heure actuelle, la moitié des résultats obtenus par le DNS de North China Telecom sont 3.3.3.3, et l'autre moitié des résultats obtenus par le DNS de North China Telecom sont 4.4.4.4. De la même manière, lorsque Cloud Analysis DNS reçoit la requête DNS d'East China Unicom, il renvoie d'abord 5.5.5.5 trois fois de suite, puis renvoie 6.6.6.6 sept fois de suite, puis répète l'exécution. À ce moment-là, 30 % des résultats DNS d'East China Unicom sont 3.3.3.3, les 70 % restants sont 4.4.4.4.
9. Après avoir reçu la réponse du DNS de résolution cloud, North China Telecom DNS mettra en cache les résultats de la résolution du nom de domaine et les renverra à l'utilisateur final de la requête.
10. Enfin, 50 % des utilisateurs de North China Telecom accèdent aux services du site Web sur 3.3.3.3, et les 50 % restants des utilisateurs de North China Telecom accèdent aux services du site Web sur 4.4.4.4

La surveillance du réseau détecte les défauts à temps 1. Le DNS de résolution cloud aide non seulement les petites et moyennes entreprises à obtenir un accès à proximité et une distribution du trafic grâce à une résolution intelligente et au WRR, mais combine également efficacement la surveillance distribuée d'Alibaba Cloud et utilise des sondes de test de numérotation à l'échelle du réseau pour surveiller les enregistrements de résolution du site Web dans temps réel.


Optimisez le déploiement de la reprise après sinistre et supprimez les responsabilités d’exploitation et de maintenance

2. La surveillance du réseau de Cloud Analysis DNS prend actuellement en charge HTTP/HTTPS et les URL personnalisées. Sur la base de la fourniture de 5 véritables nœuds de test de numérotation Alibaba, 15 points de test de numérotation de haute qualité des trois principaux opérateurs ont été sélectionnés. Dans le même temps, la configuration de jusqu'à 50 tâches de surveillance est complètement en avance sur les concurrents, garantissant que les défauts de temps d'arrêt peuvent être découverts à temps et augmentant la couverture de surveillance.
Optimisez le déploiement de la reprise après sinistre et supprimez les responsabilités d’exploitation et de maintenance
3. La fréquence de surveillance est aussi faible que 1 minute, ce qui équivaut à un contrôle de santé de votre site Web toutes les 3 secondes. Le défaut peut être détecté au plus rapidement dans les 3 minutes suivant le temps d'arrêt, et le basculement peut être effectué via le système global. fonction d'équilibrage de charge.
4. Afin d'éviter les fausses alarmes, nous fixons le seuil de jugement des temps d'arrêt à 50 %, c'est-à-dire que lorsque 50 % des nœuds surveillent anormalement, ils sont considérés comme étant des temps d'arrêt.
5. Bien entendu, l'efficacité du DNS est également affectée par le TTL du cache de l'opérateur. Il est recommandé de définir le TTL de l'enregistrement hôte sur 60 secondes.
6. Si vous êtes un développeur mobile, il est recommandé de l'utiliser avec le service Alibaba Cloud HTTPDNS pour rendre le basculement plus sensible.

Commutation entre les lignes pour obtenir une isolation des défauts

Isolement des défauts
Lors du fonctionnement des services du site Web, des pannes se produiront inévitablement. Alors, comment isoler les défauts ? Le DNS de résolution cloud présente les pratiques suivantes, qui peuvent être utilisées par les petites et moyennes entreprises.
Optimisez le déploiement de la reprise après sinistre et supprimez les responsabilités d’exploitation et de maintenance

1. Un cluster de centres de données 4.4.4.4 de North China Telecom a subi une panne à grande échelle pour des raisons anormales. Le service du site Web a été interrompu et l'accès des utilisateurs a échoué ; 2. La surveillance du site Web a détecté une défaillance du cluster 4.4.4.4 en 2 minutes et a informé le système DNS de résolution cloud de suspendre la résolution de l'adresse IP de North China Telecom : 4.4.4.4 ; 3. Une fois que Cloud Analysis DNS a suspendu la résolution IP défectueuse, il interrogera uniquement le DNS de North China Telecom et renverra l'adresse IP : 3.3.3.3. En même temps, le journal de résolution DNS de Cloud Analysis enregistrera l'heure de défaillance, l'adresse IP et la suspension. Informations sur l'exploitation et notification par SMS et e-mail à votre ingénieur d'exploitation et de maintenance.
4. Enfin, tout le trafic d'accès des utilisateurs sera transféré vers le centre de données de North China Telecom : 3.3.3.3.

Récupération de panne

Une fois le site remis en service, comment migrer facilement le trafic ?

1. Une fois que tout le trafic d'accès des utilisateurs de North China Telecom a migré vers 3.3.3.3, 4.4.4.4 équivaut au statut hors ligne. Vous pouvez organiser les étudiants techniques concernés pour réparer le cluster défectueux. Optimisez le déploiement de la reprise après sinistre et supprimez les responsabilités d’exploitation et de maintenance 2. Une fois la réparation terminée et le test réussi, le système de surveillance peut détecter automatiquement que le service du site Web du centre de données North China Telecom 4.4.4.4 est revenu à la normale et informer le DNS de résolution cloud pour restaurer la résolution de l'adresse IP de North. Chine Télécom 4.4.4.4,
3. Lorsque Cloud Resolution DNS reçoit la requête DNS de North China Telecom, il interroge et répond aux adresses IP 3.3.3.3 et 4.4.4.4. Après un certain temps, la moitié des résultats DNS de North China Telecom étaient 3.3.3.3, et l'autre moitié des résultats DNS de North China Telecom était 4.4.4.4.
4. Le trafic d'accès de l'utilisateur final passera en douceur à 50 % de la configuration d'origine, garantissant ainsi que le trafic d'accès sera restauré en douceur et à l'insu de l'utilisateur.

Reprise après sinistre à distance Pour les grandes sociétés Internet, une chose à considérer est de savoir comment garantir un accès normal aux utilisateurs lorsqu'une situation catastrophique survient


1. Pour des raisons irrésistibles, les deux adresses IP d'accès au centre de données de North China Telecom : 3.3.3.3 et 4.4.4.4 ont toutes échoué et n'ont pas pu être restaurées à temps Optimisez le déploiement de la reprise après sinistre et supprimez les responsabilités d’exploitation et de maintenance ; 2. La surveillance du site Web détecte les défauts à temps et informe Cloud DNS de suspendre la résolution IP pour toutes les lignes North China Telecom
 ; 3. Une fois le DNS de résolution cloud suspendu, la stratégie d'équilibrage de charge inter-lignes sera activée et la requête DNS de l'utilisateur de North China Telecom renverra l'adresse de la région Alibaba Cloud BGP : 1.1.1.1, 2.2.2.2 ; 4. Enfin, le trafic d'accès de tous les utilisateurs de North China Telecom est programmé sur la ligne par défaut Alibaba Cloud BGP Region : 1.1.1.1, 2.2.2.2, garantissant que dans des circonstances extrêmes, les services normaux peuvent toujours être fournis aux utilisateurs de North China Telecom

Résumé

Cloud Resolution DNS est un service DNS faisant autorité et un service de gestion DNS hautement disponibles et hautement évolutifs. Il fournit une variété de stratégies globales d'équilibrage de charge pour aider les petites et moyennes entreprises à acheminer rapidement et précisément les demandes des utilisateurs vers votre centre de données. Il dispose également de capacités de commutation de reprise après sinistre à haute disponibilité, de sorte que même en cas de panne de certains centres de données. , les petites et moyennes entreprises peuvent toujours être garanties. Les services du site Web sont accessibles. À l'avenir, Cloud Resolution DNS sera intégré à davantage de produits Alibaba Cloud, tels que SLB, ECS, CDN, Cloud Shield, etc. Former une solution de site Web tridimensionnelle à haute disponibilité, du portail d'accès aux services back-end, aidant les petites et moyennes entreprises à atteindre un équilibrage de charge complet.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer