Maison >Opération et maintenance >Sécurité >De la surveillance au diagnostic : le pouvoir des données
La surveillance et le diagnostic ont toujours été deux maillons très importants dans l'exploitation et la maintenance des bases de données. Dans le modèle traditionnel d'exploitation et de maintenance, la surveillance et le diagnostic sont centrés sur les personnes, de sorte que la collecte d'indicateurs et de données doit également se concentrer sur les personnes.
Les données de surveillance doivent être consultées par des personnes. Grâce à la visualisation humaine, nous pouvons trouver des anomalies dans les données de surveillance ou dans des zones dignes de vigilance. Les administrateurs de base de données de différents niveaux peuvent voir différents niveaux de risque à partir des données. Parce qu'il faut que les gens le voient, il ne devrait pas y avoir trop d'indicateurs affichés, sinon le personnel de surveillance serait ébloui. En fait, le nombre d’indicateurs clés présentés ci-dessus est trop important pour être surveillé.
Pour une surveillance qui s'appuie sur des personnes, un affichage bref et intuitif des indicateurs est très nécessaire. Pour les bases de données, se concentrer uniquement sur trois ou cinq indicateurs clés permet de mieux réaliser un suivi manuel. Un de mes clients financiers ne prête attention qu'à l'indicateur d'adhésion active pour le système central. Il existe un moniteur qui surveille cet indicateur à tout moment. Lorsqu'une anomalie se produit, il clique sur l'indicateur correspondant pour une analyse diagnostique.
Il s'agit d'une page de suivi des données historiques de l'indicateur modifiée en fonction de leurs besoins. Une fois que l'indicateur du nombre de sessions actives dépasse la norme, cliquez pour diagnostiquer. Sur cette page, nous proposons un outil « Analyse des problèmes ».
Les outils d'analyse des problèmes peuvent analyser les problèmes existants dans le système (problèmes actuels ou problèmes historiques) en fonction de fenêtres temporelles, tandis que les outils d'analyse des événements d'attente peuvent aider les administrateurs de base de données à analyser les performances possibles du système du point de vue des événements en attente. question.
Quoi qu'il en soit, le but du suivi est de faciliter le travail du DBA, de servir les gens et d'être centré sur les gens. Certains amis peuvent ne pas être d'accord avec cela et penser que la surveillance peut également être automatisée, comme les alarmes de base. En fait, l'alarme de base est similaire. Par exemple, l'alarme de base peut vous informer par SMS que le nombre de sessions actives est anormal. Cependant, si le modèle d'alarme de base définit trop d'indicateurs, le traitement des tempêtes d'alarmes sera très gênant. Des alarmes inexactes rendront la fonction d’alarme inutile.
Le diagnostic traditionnel est également centré sur les personnes. Lorsqu'il y a un problème avec le système, diverses informations sont recherchées et analysées dans le système. Cette analyse s'appuie fortement sur les capacités personnelles du DBA. Lorsque les utilisateurs rencontrent un gros problème, ils espèrent toujours que des experts de haut niveau pourront intervenir sur place pour le résoudre le plus rapidement possible.
Avec le développement de la numérisation des entreprises, le coût de ce modèle de surveillance et de diagnostic centré sur l'humain est de plus en plus élevé, et les experts sont de moins en moins disposés à rester en première ligne. Par conséquent, la réduction des coûts de main-d'œuvre et le gain de temps des experts sont devenus une exigence très importante dans l'exploitation et la maintenance des bases de données. En fait, avec le développement du matériel informatique, les coûts de collecte, de stockage et de calcul des données sont devenus très faibles. Par conséquent, dans les systèmes de surveillance de bases de données modernes, il n’est plus trop coûteux de collecter et de sauvegarder des données de surveillance plus complètes.
Si les données collectées quotidiennement sont suffisamment riches, le diagnostic automatisé et le diagnostic à distance deviendront possibles. Les données requises pour le travail de diagnostic se trouvent déjà dans la base de données collectée hors ligne. La plupart des outils de diagnostic n'ont plus besoin de collecter temporairement les données de l'instance de base de données. Ensuite, lorsqu'une anomalie se produit dans la base de données, l'outil de diagnostic automatique peut être utilisé en arrière-plan sans risque. . Effectuer une analyse automatisée.
L'absence de risque mentionnée ici signifie que le travail de diagnostic automatisé lui-même n'entraîne aucun risque pour l'instance de base de données. S'il est nécessaire de collecter temporairement certaines données de la base de données lors d'un diagnostic automatisé, alors si cette collecte elle-même est risquée, cela peut alors être une tentative d'ajouter l'insulte à l'injure sur une instance de base de données déjà défectueuse. Nous avons autrefois créé un outil de diagnostic et d'analyse automatiques de la fragmentation du pool partagé, qui nécessitait d'analyser les données KGH. Cet outil avait autrefois perturbé la base de données. Par conséquent, en termes de collecte automatisée d’indicateurs et de diagnostic automatisé, nous ferons de notre mieux pour éviter la survenance de tels risques.
Pour réaliser tout cela, la puissance la plus importante derrière tout cela, ce sont les données. Les données sont la première base de l'automatisation du suivi et du diagnostic. En fait, dans l'exploitation et la maintenance automatisées des bases de données, l'ensemble d'indicateurs et la collecte de données elles-mêmes contiennent de riches connaissances en matière d'exploitation et de maintenance. Quels indicateurs doivent être collectés par une certaine base de données et comment mieux collecter les indicateurs de base de données sans risque sont des connaissances très précieuses en matière d'exploitation et de maintenance.
Cette année, nous ouvrirons les ensembles d'indicateurs d'Oracle, Mysql, Postgresql, Dameng, Jincang et d'autres bases de données dans D-SMART. Nous espérons également que tout le monde pourra nous rejoindre pour enrichir et améliorer conjointement cet ensemble d'indicateurs open source.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!