ホームページ  >  記事  >  運用・保守  >  監視から診断まで: データの力

監視から診断まで: データの力

PHPz
PHPz転載
2023-06-09 20:11:48909ブラウズ

監視と診断は、データベースの運用と保守において常に 2 つの非常に重要なリンクでした。従来の運用と保守モデルでは、監視と診断は人を中心にしているため、指標とデータの収集も人に焦点を当てる必要があります。

監視から診断まで: データの力

監視データは人が見る必要があり、人が見ることで監視データの異常や警戒すべき箇所を見つけることができます。さまざまなレベルの DBA は、データからさまざまなレベルのリスクを確認できます。人が見る必要があるため、表示される指標が多すぎると監視担当者が目がくらんでしまいます。実際、上の図では主要な指標の数が多すぎて監視できません。

監視から診断まで: データの力

#人に依存した監視では、簡潔で直感的なインジケーター表示が非常に必要です。データベースの場合、3 つまたは 5 つの主要な指標に焦点を当てるだけで、手動監視をより適切に実現できます。私の金融顧客の一人は、基幹システムのアクティブメンバーシップ指標のみに注目しており、この指標を常に監視しているモニターがおり、異常が発生すると、該当する指標をクリックして診断分析を行っています。

監視から診断まで: データの力

#これは、ニーズに応じて変更されたインジケーター履歴データ監視ページです。アクティブ セッション インジケーターの数が標準を超えたら、クリックして診断します。このページでは「問題分析」ツールを提供します。

監視から診断まで: データの力#問題分析ツールは、イベントを待機している間に、システム内に存在する問題 (現在の問題または過去の問題) を時間枠に従って分析できます。分析ツールは、待機中のイベントの観点から問題を分析でき、DBA がシステム内で起こり得るパフォーマンスの問題を分析するのに役立ちます。

何はともあれ、モニタリングの目的は、DBA の仕事を容易にし、人々に奉仕し、人々を中心にすることです。友人の中にはこれに同意せず、ベースラインアラームなどの監視も自動化できると考える人もいるかもしれません。実際、ベースライン アラームも同様で、たとえば、ベースライン アラームは、アクティブなセッションの数が異常であることを SMS を通じて通知します。ただし、ベースライン アラーム テンプレートで設定するインジケーターが多すぎると、アラーム ストームの処理が非常に面倒になります。アラームが不正確だと、アラーム機能が役に立たないように見えます。

従来の診断も人間中心であり、システムに問題が発生した場合、システム内でさまざまな情報が検索され、分析されます。この分析は、DBA の個人的な能力に大きく依存します。ユーザーに大きな問題が発生したとき、ユーザーは常に、高レベルの専門家が現場に来て、できるだけ早く問題に対処してくれることを望んでいます。

企業のデジタル化の進展に伴い、この人間中心の監視および診断モデルのコストはますます高くなり、専門家は最前線に座ることに消極的になっています。したがって、人件費を節約し、専門家の時間を節約することは、データベースの運用と保守において非常に重要な要件となっています。実際、ハードウェアの発展により、データの収集、保管、計算のコストは非常に低くなっています。したがって、最新のデータベース監視システムでは、より完全な監視データを収集して保存するのに法外なコストがかかることはなくなりました。

毎日収集されるデータが豊富であれば、自動診断や遠隔診断も可能になります。診断作業に必要なデータは、オフラインで収集されたデータベースにすでに存在します。ほとんどの診断ツールは、データベース インスタンスからデータを一時的に収集する必要がなくなり、データベースに異常が発生した場合に、リスクなく自動診断ツールをバックグラウンドで使用できます。 . 自動分析を実行します。

ここで言及されているリスクなしとは、自動診断作業自体がデータベース インスタンスにリスクをもたらさないことを意味します。自動診断中にデータベースから一時的にデータを収集する必要がある場合、この収集自体が危険であれば、すでに障害のあるデータベース インスタンスにさらなる損害を与える行為になる可能性があります。以前、KGH データの分析に必要な共有プールの断片化を自動診断および分析するツールを作成しましたが、このツールによりデータベースがダウンしたことがありました。したがって、自動指標収集および自動診断に関しては、そのようなリスクの発生を回避するために最善を尽くします。

これらすべてを達成するために、その背後にある最も重要な力はデータです。データは、監視と診断の自動化の最初の基盤です。実際、データベースの自動運用と保守では、指標セットとデータ収集自体に運用と保守の豊富な知識が含まれています。特定のデータベースでどの指標を収集する必要があるか、リスクなくデータベース指標をより適切に収集する方法は、非常に貴重な運用および保守の知識です。

今年は、Oracle、Mysql、Postgresql、Dameng、Jincang などのデータベースのインジケーター セットを D-SMART でオープンソース化し、皆様も一緒に充実、改善できるようご協力いただければ幸いです。オープンソースのインジケーターセット。

以上が監視から診断まで: データの力の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。