Maison >Opération et maintenance >Sécurité >[Surveillance Nightingale] Première rencontre avec Nightingale, toujours aussi fort !
L'observabilité est un casse-tête pour la plupart des petites et moyennes entreprises, principalement dans les aspects suivants :
Le protagoniste de cet article n'est en fait pas unifié. Au stade actuel, différents composants open source implémentent encore des fonctions différentes. Cependant, N9e peut les visualiser sur le même panneau principal, mais la connexion entre les données n'est toujours pas réalisée.
Alors pourquoi avez-vous encore besoin d'étudier le N9e ?
Parce qu’il évolue dans ce sens.
Comme mentionné ci-dessus, Grafana le fait déjà. Sur la base de la combinaison Grafana+Loki+Tempo+Prometheus, le suivi, les indicateurs et les liens peuvent être liés. Quelle est la différence entre N9e et Grafana ?
Selon les mots de M. Qin : Grafana est meilleur dans la gestion des panneaux de surveillance et N9e est meilleur dans la gestion des règles d'alarme.
N9e peut envoyer différentes règles d'alarme à différents groupes d'entreprises et différents groupes pour éviter de générer un grand nombre de messages d'alarme dans un groupe, ce qui mènera à l'histoire du loup qui pleure au fil du temps.
Cela dit, à quoi ressemble le N9e ?
Ce qui suit est un système que j'ai déployé.
Vous pouvez voir que sur ce panneau, nous pouvons mettre en œuvre :
De cette façon, vous n'avez pas besoin de basculer entre plusieurs applications, et c'est rapide.
En parlant de mille à dix mille, si vous ne comprenez pas l'architecture, ce sera en vain.
Voyons maintenant à quoi ressemble l'architecture de N9e. Ce n'est qu'en clarifiant le fonctionnement de N9e à partir de la logique architecturale qu'il sera très utile à la fois au déploiement et à la maintenance.
N9e dispose principalement d'une solution de déploiement à convergence centrale et d'une solution de déploiement hybride Edge Sinking, qui seront expliquées ci-dessous.
Première image :
Cette solution consiste à établir un cluster N9e, et les données de surveillance des autres régions seront envoyées à ce cluster. Cela nécessite que le cluster central et les autres régions le fassent. Il y a une bonne connexion Internet.
Pour le cluster central, il comprend principalement les composants suivants :
Pour les autres régions, il vous suffit de déployer Categraf, qui transmettra les données de surveillance locales vers le cluster central.
Cette architecture se caractérise par sa simplicité et ses coûts de maintenance relativement faibles. Le principe est que les liaisons réseau entre les salles informatiques doivent être relativement bonnes. Si le réseau n'est pas bon, la solution suivante doit être utilisée.
Cette architecture est un complément à la solution de déploiement centralisé, principalement pour les situations où le réseau n'est pas bon :
Dans la salle informatique périphérique, lors du déploiement de la bibliothèque de synchronisation, du moteur d'alarme et de la passerelle de transfert, veuillez noter que le moteur d'alarme doit s'appuyer sur la base de données car il doit synchroniser les règles d'alarme, et la passerelle de transfert doit également s'appuyer sur la base de données car il doit enregistrer des objets dans la base de données, il faut ouvrir le réseau concerné.
!! PS : Pour cette solution, si le réseau lui-même n'est pas bon, et que le réseau doit être connecté, il peut quand même être affecté par des problèmes de réseau.
Pourquoi devrions-nous choisir le déploiement sur une seule machine ici ?
En fait, je souhaite déployer chaque composant les uns à côté des autres, ce qui sera utile pour comprendre le mode de fonctionnement de l'ensemble du N9e.
Il démarrera automatiquement une fois l'installation terminée. Définissez ensuite un mot de passe utilisateur pour la base de données.!! Conseils : Pour moi rapidement, Mariadb est installé
# 更新镜像源 $ sudo apt-get update # 更新软件 $ sudo apt-get upgrade # 安装Mariabd $ sudo apt-get install mariadb-server-10.6
# 连接数据库 $ sudo mysql # 设置权限和密码 > GRANT ALL PRIVILEGES ON *.* TO 'root'@'localhost' IDENTIFIED BY '1234'; >flush privileges;Installez Redis
# 更新镜像源 $ sudo apt-get update # 更新软件 $ sudo apt-get upgrade # 安装Redis $ sudo apt install redis-serverIl démarrera automatiquement par défaut. Il existe de nombreuses options pour installer le TSDB de TSDBN9e :
Prometheus
M3DB
Thanos
# 下载二进制包 $ wget https://github.com/VictoriaMetrics/VictoriaMetrics/releases/download/v1.90.0/victoria-metrics-linux-amd64-v1.90.0.tar.gz # 解压 $ tar xf victoria-metrics-linux-amd64-v1.90.0.tar.gz # 启动 $ nohup ./victoria-metrics-prod &>victoria.log &
# 下载最新版本的二进制包 $ wget https://github.com/ccfos/nightingale/releases/download/v6.0.0-ga.3/n9e-v6.0.0-ga.3-linux-amd64.tar.gz # 解压 $ mkdir n9e $ tar xf n9e-v6.0.0-ga.3-linux-amd64.tar.gz -C n9e/ # 检验目录如下 $ ll total 35332 drwxrwxr-x7 jokerbai jokerbai 40964月 12 14:05 ./ drwxr-xr-x4 jokerbai jokerbai 40964月 12 14:05 ../ drwxrwxr-x3 jokerbai jokerbai 40964月 12 14:05 cli/ drwxrwxr-x 10 jokerbai jokerbai 40964月 12 14:05 docker/ drwxrwxr-x4 jokerbai jokerbai 40964月 12 14:09 etc/ drwxrwxr-x 20 jokerbai jokerbai 40964月 12 14:05 integrations/ -rwxr-xr-x1 jokerbai jokerbai 252805124月6 19:05 n9e* -rwxr-xr-x1 jokerbai jokerbai 108380164月6 19:05 n9e-cli* -rw-r--r--1 jokerbai jokerbai297844月6 19:04 n9e.sql drwxrwxr-x6 jokerbai jokerbai 40964月 12 14:05 pub/
# 导入数据库 $ mysql -uroot -p <n9e.sql
[[Pushgw.Writers]] # Url = "http://127.0.0.1:8480/insert/0/prometheus/api/v1/write" Url = "http://127.0.0.1:8428/api/v1/write"
# 启动服务 $ nohup ./n9e &>n9e.log & # 检测17000端口是否启动 $ ss -ntl | grep 17000 LISTEN 04096 *:17000*:*
Categraf est un agent de surveillance et de collecte qui transmettra les informations collectées à TSDB.
# 下载 $ wget https://download.flashcat.cloud/categraf-v0.2.38-linux-amd64.tar.gz # 解压 $ tar xf categraf-v0.2.38-linux-amd64.tar.gz # 进入目录 $ cd categraf-v0.2.38-linux-amd64/
Modifiez le fichier de configuration. Dans conf/config.toml, les parties modifiées sont les suivantes :
[[writers]] url = "http://127.0.0.1:17000/prometheus/v1/write" [heartbeat] enable = true
Puis démarrez Categraf.
$ nohup ./categraf &>categraf.log &
Ensuite, vous pouvez voir les informations de base sur l'interface principale.
Vous pouvez également consulter les données de surveillance de l'hôte via le tableau de bord intégré, comme suit :
Résumé
Cet article est principalement destiné à vous donner une première impression de Nightingale , a donné une brève introduction à son architecture globale, puis vous a présenté l'installation de 0 à 1, dans le but de donner à chacun une compréhension claire des composants de Nightingale.
Actuellement, Nightingale a été mis à jour vers la version V6. Cette version comporte de nombreuses nouvelles tentatives fonctionnelles, telles que l'accès à ELK, l'accès à Jaeger, etc. Cette série continuera à être mise à jour à l'avenir.Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!