프로덕션 환경에서 Node를 서버 언어로 사용하는 경우 과도한 동시성 또는 코드 문제로 인해 OOM(메모리 부족) 또는 CPU 전체 로드가 발생하는 것은 서버에서 흔히 발생하는 문제로, CPU를 모니터링합니다. 및 메모리, 로그 및 릴리스가 결합되어 문제를 쉽게 찾을 수 있습니다.
【동영상 튜토리얼 추천 : node js tutorial】
이 장에서는 로컬 환경과 프로덕션 환경의 메모리 변경을 모니터링하는 방법을 소개합니다
그래서 동적으로 모니터링하는 방법은 Node 프로세스의 메모리 변화 모직옷?
다음은 Node Server의 예시로, 메모리 누수 문제가 있는 예시이며, Shanyue가 오랫동안 프로덕션 환경에서 포지셔닝해 온 문제를 간소화한 버전입니다.
해당 메모리 누수 문제에서 단일 컨테이너의 메모리가 원래 400M에서 700M으로 급등했습니다. 800M 컨테이너 리소스 제한에서 가끔 OOM이 발생하여 다시 시작되었습니다. 문제가 한동안 발견되지 않아서(문제가 너무 늦게 발견되어 반달 전의 시계열 데이터가 삼켜져 Release를 발견하지 못함) 리소스 제한을 1000M으로 늘렸습니다. 나중에 ctx.request가 데이터베이스에 큰 필드를 마운트했기 때문에 발생한 것으로 밝혀졌습니다
const Koa = require('koa') const app = new Koa() function getData () { return Array.from(Array(1000)).map(x => 10086) } app.use(async (ctx, next) => { ctx.data = getData() await next() }) app.use(ctx => { ctx.body = 'hello, world' }) app.listen(3200, () => console.log('Port: 3200'))
일부 문제는 로컬 및 테스트 환경에서 적시에 제거되어야 시스템에 더 큰 영향을 미치지 않습니다. 생산 환경. 그런 다음 로컬에서 메모리를 모니터링하는 방법을 이해하는 것이 중요합니다.
pidstat
는 Linux 성능 디버깅 도구인 sysstat
시리즈의 패키지로 실제로 메모리, 네트워크, IO, CPU 등을 포함한 Linux 성능 문제를 디버깅하는 데 사용됩니다. . pidstat
是 sysstat
系列 linux 性能调试工具的一个包,竟然用它来调试 linux 的性能问题,包括内存,网络,IO,CPU 等。
这不仅试用与 node
,而且适用于一切进程,包括 python
,java
以及 go
# -r: 指输出内存指标 # -p: 指定 pid # 1: 每一秒输出一次 # 100: 输出100次 $ pidstat -r -p pid 1 100
而在使用 pidstat
之前,需要先找到进程的 pid
在 node
中可以通过 process.pid
来找到进程的 pid
> process.pid 16425
虽然通过写代码可以找到 pid
,但是具有侵入性,不太实用。那如何通过非侵入的手段找到 pid
呢?有两种办法
ps
定位进程lsof
定位进程$ node index.js shanyue # 第一种方法:通过多余的参数快速定位 pid $ ps -ef | grep shanyue root 31796 23839 1 16:38 pts/5 00:00:00 node index.js shanyue # 第二种方法:通过端口号定位 pid lsof -i:3200 COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME node 31796 root 20u IPv6 235987334 0t0 TCP *:tick-port (LISTEN)
从以上代码中可以知道,node 服务的 pid 为 31796
,为了可以观察到内存的动态变化,再施加一个压力测试
$ ab -c 10000 -n 1000000 http://localhost:3200/
# -r: 指输出内存指标 # -p: 指定 pid # 1: 每一秒输出一次 # 100: 输出100次 $ pidstat -r -p 31796 1 100 Linux 3.10.0-957.21.3.el7.x86_64 (shuifeng) 2020年07月02日 _x86_64_ (2 CPU) UID PID minflt/s majflt/s VSZ RSS %MEM Command 19时20分39秒 0 11401 0.00 0.00 566768 19800 0.12 node 19时20分40秒 0 11401 0.00 0.00 566768 19800 0.12 node 19时20分41秒 0 11401 9667.00 0.00 579024 37792 0.23 node 19时20分42秒 0 11401 11311.00 0.00 600716 59988 0.37 node 19时20分43秒 0 11401 5417.82 0.00 611420 70900 0.44 node 19时20分44秒 0 11401 3901.00 0.00 627292 85928 0.53 node 19时20分45秒 0 11401 1560.00 0.00 621660 81208 0.50 node 19时20分46秒 0 11401 2390.00 0.00 623964 83696 0.51 node 19时20分47秒 0 11401 1764.00 0.00 625500 85204 0.52 node
对于输出指标的含义如下
RSS
: Resident Set Size
,常驻内存集,可理解为内存,这就是我们需要监控的内存指标VSZ
: virtual size
,虚拟内存从输出可以看出,当施加了压力测试后,内存由 19M 涨到了 85M。
pidstat
是属于 sysstat
下的 linux 性能工具,但在 mac 中,如何定位内存的变化?
此时可以使用 top/htop
$ htop -p 31796
由于目前生产环境大都部署在 k8s
,因此生产环境对于某个应用的内存监控本质上是 k8s 对于某个 workload/deployment
的内存监控,关于内存监控 metric
的数据流向大致如下:
k8s
-> metric server
-> prometheus
-> grafana
架构图如下:
以上图片取自以下文章
最终能够在 grafana
node
로 시도했을 뿐만 아니라 python
, java
및 go
를 포함한 모든 프로세스에 적용됩니다. code>🎜 🎜rrreee🎜pidstat
를 사용하기 전에 먼저 프로세스의 pid
를 찾아야 합니다🎜node
에서 process.pid
를 통해 프로세스의 pid
를 찾을 수 있습니다🎜 rrreee🎜>pid 코드를 작성하여 찾을 수 있지만 방해가 되고 그다지 실용적이지 않습니다. 그렇다면 비침습적 수단을 통해 pid
를 찾는 방법은 무엇일까요? 두 가지 방법이 있습니다🎜ps
와 결합된 중복 매개변수를 사용하여 프로세스를 찾습니다.lsof
와 결합된 포트 번호를 사용하여 프로세스 찾기31796 code>, 메모리의 동적 변화를 관찰한 후 스트레스 테스트를 적용하기 위해🎜rrreeerrreee🎜출력 표시기의 의미는 다음과 같습니다🎜<ul>
<li>
<code>RSS
: 상주 세트 크기
, 메모리로 이해될 수 있는 상주 메모리 세트는 모니터링해야 하는 메모리 표시기입니다.
VSZ
: 가상 크기, 가상 메모리
pidstat
은 sysstat
에 있는 Linux 성능 도구이지만 Mac에서 메모리를 찾는 방법이 변경되었습니다. ? 🎜🎜이때 top/htop
을 사용하시면 됩니다🎜rrreee🎜🎜k8s
에 배포되어 있으므로 >,🎜so 프로덕션 환경에 의한 애플리케이션의 메모리 모니터링은 본질적으로 k8s에 의한 특정 워크로드/배포
의 메모리 모니터링입니다. 메모리 모니터링 metric
의 데이터 흐름입니다. 대략 다음과 같습니다: 🎜🎜k8smetric server
-> prometheus
-> 🎜아키텍처 다이어그램은 다음과 같습니다.🎜🎜🎜🎜🎜🎜🎜위 사진은 다음 기사에서 가져온 것입니다 🎜🎜🎜마지막으로 애플리케이션의 메모리 모니터링 실시간 그래프를 grafana
에 수집할 수 있습니다. :🎜
이 부분은 디자인 내용이 너무 많아서 다음 장에서 소개하겠습니다
이것은 노드 서비스뿐만 아니라 모든 워크로드
에 적용됩니다workload
本章介绍了关于 Node 服务的内存在本地环境及生产环境的监控
1、本地使用 htop/top
或者 pidstat
监控进程内存
2、生产环境使用 k8s/metric-server/prometheus/grafana
요약
htop/top
또는 pidstat
는 프로세스 메모리를 모니터링합니다2. 프로덕션 환경에서 k8s/metric-server/prometheus/grafana
를 사용하여 전체 노드 애플리케이션의 메모리를 모니터링합니다메모리 누수가 감지된 경우 특정 서비스에서 문제를 해결하는 방법은 무엇입니까? 따라서 다음 글에서는 1. 프로덕션 환경에서 전체 애플리케이션의 메모리를 모니터링하는 방법 2. 프로덕션 환경에서 OOM이 발생할 때 이를 빠르게 찾는 방법
3. 실제 제작 환경 🎜 🎜프로그래밍 관련 지식을 더 보려면 🎜프로그래밍 입문🎜을 방문하세요! ! 🎜위 내용은 Node 서비스에서 로컬 환경과 프로덕션 환경의 메모리 변화를 어떻게 모니터링하나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!