Heim  >  Artikel  >  Backend-Entwicklung  >  Wiederholen Sie Warnungen innerhalb von Minuten mit Grafana-Benachrichtigungen

Wiederholen Sie Warnungen innerhalb von Minuten mit Grafana-Benachrichtigungen

WBOY
WBOYnach vorne
2024-02-09 10:30:291106Durchsuche

使用 Grafana 警报在几分钟内重复警报

php-Editor Youzi stellt Ihnen heute vor, wie Sie mit der Grafana-Alarmfunktion den Alarm innerhalb weniger Minuten wiederholen können, um sicherzustellen, dass wichtige Ereignisse rechtzeitig behandelt werden. Grafana ist ein beliebtes Open-Source-Tool zur Datenvisualisierung und -überwachung, das umfangreiche Dashboards und Warnfunktionen bietet. Durch die Festlegung von Alarmregeln und Benachrichtigungsmethoden können wir Anomalien im System rechtzeitig erkennen und entsprechende Maßnahmen ergreifen. In diesem Artikel wird die Verwendung der Grafana-Alarmfunktion ausführlich vorgestellt und einige praktische Tipps und Vorsichtsmaßnahmen gegeben, damit Sie verschiedene Überwachungsszenarien problemlos bewältigen können.

Frageninhalt

Verwendung von Grafana 9.2.2 und VictoriaMetrics als Datenquellen zum Senden von Warnungen, wenn bestimmte Bedingungen erfüllt sind. Nutzen Sie einen externen Dienst, um Warnungen zu übermitteln, indem Sie die API als Webhook-Touchpoint konfigurieren, über den die Nutzlast gesendet und für die Übermittlung an Slack weiterverarbeitet wird.

Alarmauswertungsverhalten ist auf - Alle 1 Stunde für 0 Sekunden auswerten eingestellt. Sie möchten, dass die Warnung sofort ausgelöst wird, wenn die Bedingung erfüllt ist, und jede Stunde ausgewertet wird, da es so oft neue Datenpunkte gibt.

Erwartetes Verhalten: Benachrichtigung alle 24 Stunden, wenn Bedingungen erfüllt sind.

Tatsächliches Verhalten: Sobald die Bedingung erfüllt ist, wird die Warnung ausgelöst (wie sie sollte). Allerdings wird die gleiche Warnung innerhalb von 5 Minuten erneut gesendet.

Wie gehe ich mit diesem Problem um?

Ausprobierte Optionen:

  1. Benachrichtigungsrichtlinien-Timing – Gruppierung mithilfe von alertnamegrafana-folder 进行分组时,尝试了分组间隔、重复间隔和等待时间,但没有帮助。另外,我尝试使用 alert_uid, dies wird jedoch nicht erklärt. Versuche ich die falsche Zeitkombination (kombiniert mit dem Verhaltenszeitraum der Alarmauswertung)?
  2. Muss ich nach Erhalt der Nutzlast eine Bestätigung an Grafana senden? Wenn ja, teilen Sie uns bitte die Methode mit oder verlinken Sie auf die Dokumentation, die Sie finden können. Ich kann nichts finden, was mit Ja/Nein beantwortet werden kann und wie ich darauf antworten soll. Ich habe das Problem auf Grafana beschränkt und die ausgelöste API wird zweimal aufgerufen.
  3. Option zum Stummschalten und/oder Stummschalten von Warnungen. Ist dies der hier zu verfolgende Ansatz? Wenn ja, sollte der Alarm nach einmaliger Auslösung 24 Stunden lang stummgeschaltet werden (weil Sie diese 24 Stunden nicht wiederholen möchten)?

Vielen Dank. Vielen Dank.

Workaround

Das Problem besteht darin, dass mehrere Instanzen von Grafana unabhängig voneinander laufen. Wir haben zwei Grafana-Pods im Einsatz und beide bearbeiten Anfragen, sodass es zu Duplikaten kommt. Zukünftige Arbeiten erfordern die Untersuchung, wie Grafana im Cluster-Modus ausgeführt wird.

Das obige ist der detaillierte Inhalt vonWiederholen Sie Warnungen innerhalb von Minuten mit Grafana-Benachrichtigungen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:stackoverflow.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen