Maison  >  Article  >  Opération et maintenance  >  Comment configurer les alarmes de surveillance sous Linux

Comment configurer les alarmes de surveillance sous Linux

PHPz
PHPzoriginal
2023-07-05 15:37:071984parcourir

Comment configurer les alarmes de surveillance sous Linux

Dans les systèmes Linux, la configuration des alarmes de surveillance est très importante. En surveillant l'état de fonctionnement du système, nous pouvons découvrir et résoudre les problèmes à temps, garantissant ainsi la stabilité et la sécurité du système. Cet article explique comment configurer les alarmes de surveillance sous Linux et fournit des exemples de code correspondants.

1. Installer des outils de surveillance

Dans les systèmes Linux, de nombreux outils de surveillance sont disponibles, tels que Nagios, Zabbix, etc. Ces outils peuvent surveiller divers indicateurs tels que le processeur, la mémoire, le disque et le réseau du serveur, et envoyer des messages d'alarme lorsque des anomalies se produisent.

En prenant Nagios comme exemple, vous devez d'abord installer le logiciel serveur et client Nagios. Dans les systèmes Debian/Ubuntu, vous pouvez utiliser la commande suivante pour installer :

sudo apt-get install nagios3 nagios-nrpe-plugin

Une fois l'installation terminée, vous devez également configurer le serveur et le client Nagios.

2. Configurer le serveur Nagios

Avant de configurer le serveur Nagios, vous devez créer un fichier de configuration de surveillance pour définir les hôtes et les services qui doivent être surveillés. Dans le dossier de configuration du serveur Nagios, recherchez le répertoire /etc/nagios3/conf.d et créez un nouveau fichier de configuration hosts.cfg et ajoutez-y ce qui suit. Contenu : /etc/nagios3/conf.d目录,并创建一个新的配置文件hosts.cfg,并在其中添加以下内容:

define host {
    use                   linux-server
    host_name             server1
    alias                 My Server
    address               192.168.1.100
    }

define service{
    host_name             server1
    service_description   PING
    check_command         check_ping!100.0,20%!500.0,60%
    }

以上配置文件定义了一个名为server1的主机,它的IP地址为192.168.1.100,并监控了主机的PING状态。

配置完成后,重新启动Nagios服务器。

sudo service nagios3 restart

三、配置Nagios客户端

在要监控的Linux服务器上,需要安装并配置Nagios客户端软件。在Debian/Ubuntu系统中,可以使用以下命令安装:

sudo apt-get install nagios-nrpe-server

安装完成后,还需要配置Nagios客户端,以允许Nagios服务器从远程监控该主机。

首先编辑Nagios客户端配置文件/etc/nagios/nrpe.cfg,并修改以下参数:

allowed_hosts=127.0.0.1,192.168.1.1

上述参数中,192.168.1.1是Nagios服务器的IP地址,可以根据实际情况进行修改。

接下来,在/etc/nagios/nrpe.d目录中创建一个新的配置文件linux.cfg,并在其中添加以下内容:

command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% /
command[check_load]=/usr/lib/nagios/plugins/check_load -w 5,4,3 -c 10,8,6

以上配置文件定义了两个命令check_diskcheck_load,用于监控磁盘空间和系统负载。

配置完成后,重新启动Nagios客户端。

sudo service nagios-nrpe-server restart

四、测试监控报警

配置完成后,可以通过Nagios的Web界面,或者使用nagios-plugins软件包中的命令进行测试。

在Nagios服务器上,可以使用check_nrpe命令测试客户端的运行状况。例如,检查客户端是否可以运行check_disk命令:

/usr/lib/nagios/plugins/check_nrpe -H 192.168.1.100 -c check_disk

如果命令返回正常,则表示监控配置成功。

在Nagios客户端上,可以使用nagios-plugins软件包中的命令测试系统的运行状况。例如,检查磁盘空间:

/usr/lib/nagios/plugins/check_disk -w 20% -c 10% /

如果磁盘空间低于20%或者低于10%,则会触发报警。

五、配置报警

配置监控报警时,往往需要指定报警的方式和接收者。在Nagios中,可以通过编辑/etc/nagios3/conf.d/contacts.cfg文件来配置报警的联系人。

例如,可以添加以下内容来定义一个报警联系人:

define contact{
    contact_name           admin
    alias                  Nagios Administrator
    email                  admin@example.com
    }

以上配置定义了一个名为admin的报警联系人,其邮箱为admin@example.com。

接下来,在/etc/nagios3/conf.d/hosts.cfg

define host{
    ...
    contacts               admin
    }

Le fichier de configuration ci-dessus définit un hôte nommé server1, son adresse IP est 192.168.1.100 et surveille l'état PING de l'hôte.

Une fois la configuration terminée, redémarrez le serveur Nagios.

sudo service nagios3 restart

3. Configurer le client Nagios

Sur le serveur Linux à surveiller, le logiciel client Nagios doit être installé et configuré. Dans les systèmes Debian/Ubuntu, vous pouvez utiliser la commande suivante pour installer : 🎜rrreee🎜Une fois l'installation terminée, vous devez également configurer le client Nagios pour permettre au serveur Nagios de surveiller l'hôte à distance. 🎜🎜Éditez d'abord le fichier de configuration du client Nagios /etc/nagios/nrpe.cfg et modifiez les paramètres suivants : 🎜rrreee🎜Parmi les paramètres ci-dessus, 192.168.1.1 est le Serveur Nagios L'adresse IP peut être modifiée en fonction de la situation réelle. 🎜🎜Ensuite, créez un nouveau fichier de configuration linux.cfg dans le répertoire /etc/nagios/nrpe.d et ajoutez-y le contenu suivant : 🎜rrreee🎜 Ce qui précède Le fichier de configuration définit deux commandes check_disk et check_load, qui sont utilisées pour surveiller l'espace disque et la charge du système. 🎜🎜Une fois la configuration terminée, redémarrez le client Nagios. 🎜rrreee🎜4. Test de surveillance et d'alarme🎜🎜Une fois la configuration terminée, vous pouvez la tester via l'interface Web Nagios ou utiliser les commandes du progiciel nagios-plugins. 🎜🎜Sur le serveur Nagios, vous pouvez utiliser la commande check_nrpe pour tester l'état d'exécution du client. Par exemple, vérifiez si le client peut exécuter la commande check_disk : 🎜rrreee🎜Si la commande revient normale, cela signifie que la configuration de surveillance est réussie. 🎜🎜Sur le client Nagios, vous pouvez utiliser les commandes du package nagios-plugins pour tester l'état de fonctionnement du système. Par exemple, vérifiez l'espace disque : 🎜rrreee🎜Si l'espace disque est inférieur à 20 % ou inférieur à 10 %, une alarme se déclenchera. 🎜🎜5. Configurer les alarmes🎜🎜Lors de la configuration des alarmes de surveillance, vous devez souvent spécifier la méthode d'alarme et le récepteur. Dans Nagios, vous pouvez configurer le contact d'alarme en éditant le fichier /etc/nagios3/conf.d/contacts.cfg. 🎜🎜Par exemple, vous pouvez ajouter le contenu suivant pour définir un contact d'alarme : 🎜rrreee🎜La configuration ci-dessus définit un contact d'alarme nommé admin, dont l'e-mail est admin@example.com. 🎜🎜Ensuite, dans le fichier /etc/nagios3/conf.d/hosts.cfg, ajoutez un contact d'alarme pour l'hôte : 🎜rrreee🎜Une fois la configuration terminée, le serveur Nagios doit être redémarré. 🎜rrreee🎜 6. Résumé🎜🎜Grâce aux étapes ci-dessus, nous pouvons configurer des alarmes de surveillance sur le système Linux. À l'aide d'outils de surveillance, nous pouvons découvrir et résoudre les problèmes du système à temps pour garantir la stabilité et la fiabilité du système. Bien entendu, dans les applications pratiques, les indicateurs de surveillance et les méthodes d’alarme doivent être ajustés en fonction de conditions spécifiques pour répondre aux besoins réels. 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn