#可觀測性是大部分中小公司比較頭痛的問題,主要表現以下幾個方面:
本文的主角其實也沒有做大一統,目前階段依然是不同的開源元件實現不同的功能,只不過N9e可以在同一個主面板查看它們,但是數據之間的聯繫依然沒有實現。
那為什麼還要學研究N9e呢?
因為它正在朝這方面發展。
上面提到 Grafana 其實已經在做了,基於 Grafana Loki Tempo Prometheus 組合可以實現監控、指標、連結的連動,N9e 和 Grafana 有什麼不同呢?
用秦總的話說:Grafana比較擅長監控面板的管理,N9e比較擅長警告規則的管理。
N9e 可以將不同的告警規則發送到不同的業務組,不同的群體,避免在一個群裡產生大量的告警信息,久而久之就上演了狼來了的故事。
說了這麼多,N9e到底長啥樣?
下面是我部署好的一套系統。
可以看到,在該面板上,我們可以實作:
!! #PS:對於這種方案,本身網路不好,還要打通網絡,可能還是會受網路問題影響。
為什麼這裡要選擇單機部署呢?
其實我是想挨著部署各個元件,這樣對於理解整個 N9e 的運作模式有一定的幫助。
!! #Tips:我這裡使用的是Ubuntu 22.04.1 系統
#!!
!!
# 更新镜像源 $ sudo apt-get update # 更新软件 $ sudo apt-get upgrade # 安装Mariabd $ sudo apt-get install mariadb-server-10.6
安裝完成後會自動啟動。然後為資料庫設定一個用戶密碼。
# 连接数据库 $ sudo mysql # 设置权限和密码 > GRANT ALL PRIVILEGES ON *.* TO 'root'@'localhost' IDENTIFIED BY '1234'; >flush privileges;
# 更新镜像源 $ sudo apt-get update # 更新软件 $ sudo apt-get upgrade # 安装Redis $ sudo apt install redis-server
預設會自動啟動。
# 下载二进制包 $ wget https://github.com/VictoriaMetrics/VictoriaMetrics/releases/download/v1.90.0/victoria-metrics-linux-amd64-v1.90.0.tar.gz # 解压 $ tar xf victoria-metrics-linux-amd64-v1.90.0.tar.gz # 启动 $ nohup ./victoria-metrics-prod &>victoria.log &
觀察8428是否啟動。
安裝 N9e# 下载最新版本的二进制包 $ wget https://github.com/ccfos/nightingale/releases/download/v6.0.0-ga.3/n9e-v6.0.0-ga.3-linux-amd64.tar.gz # 解压 $ mkdir n9e $ tar xf n9e-v6.0.0-ga.3-linux-amd64.tar.gz -C n9e/ # 检验目录如下 $ ll total 35332 drwxrwxr-x7 jokerbai jokerbai 40964月 12 14:05 ./ drwxr-xr-x4 jokerbai jokerbai 40964月 12 14:05 ../ drwxrwxr-x3 jokerbai jokerbai 40964月 12 14:05 cli/ drwxrwxr-x 10 jokerbai jokerbai 40964月 12 14:05 docker/ drwxrwxr-x4 jokerbai jokerbai 40964月 12 14:09 etc/ drwxrwxr-x 20 jokerbai jokerbai 40964月 12 14:05 integrations/ -rwxr-xr-x1 jokerbai jokerbai 252805124月6 19:05 n9e* -rwxr-xr-x1 jokerbai jokerbai 108380164月6 19:05 n9e-cli* -rw-r--r--1 jokerbai jokerbai297844月6 19:04 n9e.sql drwxrwxr-x6 jokerbai jokerbai 40964月 12 14:05 pub/
然後匯入 N9e 的資料庫。
# 导入数据库 $ mysql -uroot -p <n9e.sql修改 N9e 的設定文件,在目前目錄 etc/config.toml 檔案中。
[[Pushgw.Writers]] # Url = "http://127.0.0.1:8480/insert/0/prometheus/api/v1/write" Url = "http://127.0.0.1:8428/api/v1/write"
然後啟動 N9e 服務。
# 启动服务 $ nohup ./n9e &>n9e.log & # 检测17000端口是否启动 $ ss -ntl | grep 17000 LISTEN 04096 *:17000*:*
#Categraf 是監控採集 Agent,會將收集到的資訊推送到 TSDB。
# 下载 $ wget https://download.flashcat.cloud/categraf-v0.2.38-linux-amd64.tar.gz # 解压 $ tar xf categraf-v0.2.38-linux-amd64.tar.gz # 进入目录 $ cd categraf-v0.2.38-linux-amd64/修改設定文件,在 conf/config.toml 中,修改的部分如下:
[[writers]] url = "http://127.0.0.1:17000/prometheus/v1/write" [heartbeat] enable = true
然後啟動 Categraf。
$ nohup ./categraf &>categraf.log &
#現在如果去查看時序資料指標,是查詢不到的,因為沒有新增資料來源。
在系統配置->資料來源處新增資料來源,如下:
然後就能看到對應的指標資料了。
以上是【夜鶯監控】初識夜鶯,還是強!的詳細內容。更多資訊請關注PHP中文網其他相關文章!