Heim >Web-Frontend >js-Tutorial >Eine eingehende Analyse der Prozesse und Threads in Node.js
Dieser Artikel vermittelt Ihnen ein tiefgreifendes Verständnis der Prozesse und Threads in Node.js. Es hat einen gewissen Referenzwert. Freunde in Not können sich darauf beziehen. Ich hoffe, es wird für alle hilfreich sein.
Prozess
und Thread
sind Konzepte, die Programmierer kennen müssen. Sie werden oft in Interviews gefragt, aber in einigen Artikeln geht es nur um theoretisches Wissen, bei einigen kleineren Partnern möglicherweise nicht Ich verstehe es nicht wirklich und es gibt relativ wenige Anwendungen in der tatsächlichen Entwicklung. In diesem Artikel werden nicht nur Konzepte vorgestellt, sondern auch Prozess
und Thread
aus der Perspektive von Node.js erläutert. Außerdem werden einige praktische Anwendungen in Projekten erläutert, damit Sie sich nicht nur damit auseinandersetzen können Der Interviewer Es kann auch perfekt im tatsächlichen Kampf angewendet werden. [Empfohlenes Lernen: „nodejs Tutorial"]进程
与线程
是一个程序员的必知概念,面试经常被问及,但是一些文章内容只是讲讲理论知识,可能一些小伙伴并没有真的理解,在实际开发中应用也比较少。本篇文章除了介绍概念,通过Node.js 的角度讲解进程
与线程
,并且讲解一些在项目中的实战的应用,让你不仅能迎战面试官还可以在实战中完美应用。【推荐学习:《nodejs 教程》】
Node.js是单线程吗?
Node.js 做耗时的计算时候,如何避免阻塞?
Node.js如何实现多进程的开启和关闭?
Node.js可以创建线程吗?
你们开发过程中如何实现进程守护的?
除了使用第三方模块,你们自己是否封装过一个多进程架构?
进程Process
是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础,进程是线程的容器(来自百科)。进程是资源分配的最小单位。我们启动一个服务、运行一个实例,就是开一个服务进程,例如 Java 里的 JVM 本身就是一个进程,Node.js 里通过 node app.js
开启一个服务进程,多进程就是进程的复制(fork),fork 出来的每个进程都拥有自己的独立空间地址、数据栈,一个进程无法访问另外一个进程里定义的变量、数据结构,只有建立了 IPC 通信,进程之间才可数据共享。
const http = require('http'); const server = http.createServer(); server.listen(3000,()=>{ process.title='程序员成长指北测试进程'; console.log('进程id',process.pid) })
运行上面代码后,以下为 Mac 系统自带的监控工具 “活动监视器” 所展示的效果,可以看到我们刚开启的 Nodejs 进程 7663
线程是操作系统能够进行运算调度的最小单位,首先我们要清楚线程是隶属于进程的,被包含于进程之中。一个线程只能隶属于一个进程,但是一个进程是可以拥有多个线程的。
单线程就是一个进程只开一个线程
Javascript 就是属于单线程,程序顺序执行(这里暂且不提JS异步),可以想象一下队列,前面一个执行完之后,后面才可以执行,当你在使用单线程语言编码时切勿有过多耗时的同步操作,否则线程会造成阻塞,导致后续响应无法处理。你如果采用 Javascript 进行编码时候,请尽可能的利用Javascript异步操作的特性。
const http = require('http'); const longComputation = () => { let sum = 0; for (let i = 0; i < 1e10; i++) { sum += i; }; return sum; }; const server = http.createServer(); server.on('request', (req, res) => { if (req.url === '/compute') { console.info('计算开始',new Date()); const sum = longComputation(); console.info('计算结束',new Date()); return res.end(`Sum is ${sum}`); } else { res.end('Ok') } }); server.listen(3000); //打印结果 //计算开始 2019-07-28T07:08:49.849Z //计算结束 2019-07-28T07:09:04.522Z
查看打印结果,当我们调用127.0.0.1:3000/compute
的时候,如果想要调用其他的路由地址比如127.0.0.1/大约需要15秒时间,也可以说一个用户请求完第一个compute
接口后需要等待15秒,这对于用户来说是极其不友好的。下文我会通过创建多进程的方式child_process.fork
和cluster
Artikelnavigation
🎜 Ist Node.js Single-Threaded? 🎜
🎜Wie vermeide ich Blockierungen bei zeitaufwändigen Berechnungen in Node.js? 🎜
🎜Wie realisiert Node.js das Öffnen und Schließen mehrerer Prozesse? 🎜
🎜Kann Node.js Threads erstellen? 🎜
🎜Wie implementieren Sie Prozessschutz während der Entwicklung? 🎜
🎜Haben Sie zusätzlich zur Verwendung von Modulen von Drittanbietern eine Multiprozessarchitektur gekapselt?🎜
Prozess
ist eine laufende Aktivität eines Programms in einem Computer auf einem bestimmten Datensatz. Es ist die Grundeinheit der Ressourcenzuweisung und -planung im System und die Grundlage von Die Betriebssystemstruktur ist ein Thread (aus der Enzyklopädie). Ein Prozess ist die kleinste Einheit der Ressourcenzuweisung. Wenn wir einen Dienst starten und eine Instanz ausführen, öffnen wir einen Dienstprozess. Beispielsweise ist die JVM selbst ein Prozess. In Node.js wird ein Dienstprozess über node app.js
geöffnet . Mehrere Prozesse sind Kopien (Fork). Jeder Prozess, der aus dem Fork kommt, hat seine eigene unabhängige Raumadresse und seinen eigenen Datenstapel. Nur wenn die IPC-Kommunikation hergestellt ist Daten zwischen Prozessen ausgetauscht werden. 🎜const http = require('http'); const fork = require('child_process').fork; const server = http.createServer((req, res) => { if(req.url == '/compute'){ const compute = fork('./fork_compute.js'); compute.send('开启一个新的子进程'); // 当一个子进程使用 process.send() 发送消息时会触发 'message' 事件 compute.on('message', sum => { res.end(`Sum is ${sum}`); compute.kill(); }); // 子进程监听到一些错误消息退出 compute.on('close', (code, signal) => { console.log(`收到close事件,子进程收到信号 ${signal} 而终止,退出码 ${code}`); compute.kill(); }) }else{ res.end(`ok`); } }); server.listen(3000, 127.0.0.1, () => { console.log(`server started at http://${127.0.0.1}:${3000}`); });🎜Nachdem der obige Code ausgeführt wurde, wird der folgende Effekt vom Überwachungstool „Activity Monitor“ angezeigt, das mit dem geliefert wird Mac-System. Sie können sehen, dass wir zum Nodejs-Prozess 7663 gehen, den wir gerade gestartet haben .png" alt="2 .png"/>🎜
const computation = () => { let sum = 0; console.info('计算开始'); console.time('计算耗时'); for (let i = 0; i < 1e10; i++) { sum += i }; console.info('计算结束'); console.timeEnd('计算耗时'); return sum; }; process.on('message', msg => { console.log(msg, 'process.pid', process.pid); // 子进程id const sum = computation(); // 如果Node.js进程是通过进程间通信产生的,那么,process.send()方法可以用来给父进程发送消息 process.send(sum); })🎜Sehen Sie sich die Druckergebnisse an, wenn wir
127.0 aufrufen. 0.1:3000 /compute
, wenn Sie andere Routing-Adressen wie 127.0.0.1/ aufrufen möchten, dauert es etwa 15 Sekunden. Man kann auch sagen, dass ein Benutzer nach der Anforderung des ersten warten muss Die Berechnungsschnittstelle dauert ca. 15 Sekunden, was für Benutzer äußerst unfreundlich ist. Im Folgenden werde ich dieses Problem lösen, indem ich mehrere Prozesse <code>child_process.fork
und cluster
erstelle. 🎜Node.js ist die laufende Umgebung von Javascript auf der Serverseite. Sie basiert auf der ereignisgesteuerten, nicht blockierenden I/. O-Modell und nutzt das Betriebssystem vollständig aus. Die für die Multitasking-Ausführung bereitgestellte asynchrone E/A eignet sich für E/A-intensive Anwendungsszenarien. Aufgrund der Asynchronität muss das Programm nicht blockieren und auf das Ergebnis warten zurückgegeben werden. Stattdessen basiert es auf dem Callback-Benachrichtigungsmechanismus, der für die Bearbeitung anderer Aufgaben verwendet werden kann -gesteuert), wodurch der Aufwand für die Erstellung von Multithread-Threads und den Thread-Kontextwechsel vermieden wird. Nginx ist hauptsächlich in der Sprache C geschrieben. Es wird für Hochleistungs-Webserver verwendet und ist nicht für Unternehmen geeignet.
Wir verwenden das Single-Process + Single-Thread-Modell für die Entwicklung auf einem Single-Core-CPU-System. Auf einem Multi-Core-CPU-System können Sie mehrere Prozesse überWenn Sie in der Web-Geschäftsentwicklung über Anwendungsszenarien mit hoher Parallelität verfügen, ist Node.js eine gute Wahl für Sie.
child_process.fork
starten (Node.js hat Cluster nach Version v0.8 hinzugefügt, um eine Multiprozessarchitektur zu implementieren), also Multiprozess + Single-Thread-Modell. Hinweis: Durch die Aktivierung von Multiprozessen wird die hohe Parallelität nicht gelöst. Es dient hauptsächlich dazu, das Problem der unzureichenden CPU-Auslastung von Node.js im Einzelprozessmodus zu lösen und die Leistung der Multi-Core-CPU voll auszunutzen.
child_process.fork
开启多个进程(Node.js 在 v0.8 版本之后新增了Cluster 来实现多进程架构) ,即 多进程 + 单线程 模式。注意:开启多进程不是为了解决高并发,主要是解决了单进程模式下 Node.js CPU 利用率不足的情况,充分利用多核 CPU 的性能。Node.js 中的进程 Process 是一个全局对象,无需 require 直接使用,给我们提供了当前进程中的相关信息。官方文档提供了详细的说明,感兴趣的可以亲自实践下 Process 文档。
process.env
:环境变量,例如通过 process.env.NODE_ENV
获取不同环境项目配置信息process.nextTick
:这个在谈及 Event Loop
时经常为会提到process.pid
:获取当前进程idprocess.ppid
:当前进程对应的父进程process.cwd()
:获取当前进程工作目录,process.platform
:获取当前进程运行的操作系统平台process.uptime()
:当前进程已运行时间,例如:pm2 守护进程的 uptime 值process.on(‘uncaughtException’, cb)
捕获异常信息、process.on(‘exit’, cb)
进程推出监听process.stdout
标准输出、process.stdin
标准输入、process.stderr
标准错误输出process.title
Prozessmodul Prozess in Node.js Es ist ein globales Objekt, das ohne Bedarf direkt verwendet werden kann. Es liefert uns relevante Informationen im aktuellen Prozess. Die offizielle Dokumentation bietet detaillierte Anweisungen. Wenn Sie interessiert sind, können Sie die Prozessdokumentation selbst üben.
process.env
: Umgebungsvariablen, beispielsweise über process.env.NODE_ENV
, um Konfigurationsinformationen verschiedener Umgebungsprojekte zu erhaltenprocess.nextTick: Dies wird oft erwähnt, wenn über <code>Ereignisschleife
gesprochen wird.
process.pid
: Ruft die aktuelle Prozess-ID ab : Aktuell Der dem Prozess entsprechende übergeordnete Prozessprocess.cwd()
: Ruft das Arbeitsverzeichnis des aktuellen Prozesses ab, process.platform
: Ruft das Betriebssystem ab Plattform, auf der der aktuelle Prozess läuftprocess.uptime(): Die Laufzeit des aktuellen Prozesses, zum Beispiel: der Betriebszeitwert des pm2-Daemons Drei Standard-Streams:Prozessereignis:
process .on('uncaughtException', cb)
Ausnahmen abfangen Informationen,process.on('exit', cb)
Prozessstartüberwachung
process.stdout Standardausgabe, <code>process.stdin
code> Standardeingabe, process.stderr
Standardfehlerausgabe
process.title
gibt den Prozessnamen an, Manchmal müssen Sie einen Namen für den Prozess angeben🎜🎜🎜Das Obige ist nur eine Liste einiger häufig verwendeter Funktionspunkte. Zusätzlich zu Process stellt Node.js auch das Modul child_process zum Betreiben der Prozesserstellung von Nodejs bereit . 🎜🎜🎜Node.js-Prozesserstellung🎜🎜🎜Es gibt viele Möglichkeiten, einen Prozess zu erstellen. In diesem Artikel werden das Modul child_process und das Clustermodul erläutert. 🎜🎜🎜child_process-Modul🎜🎜🎜child_process ist ein integriertes Modul von Node.js. Offizielle Website-Adresse: 🎜🎜🎜child_process Offizielle Website-Adresse: http://nodejs.cn/api/child_process.html#child_process_child_process🎜🎜🎜 Mehrere gemeinsame Funktionen:
Vier Möglichkeiten 🎜child_process.spawn()
:适用于返回大量数据,例如图像处理,二进制数据处理。child_process.exec()
:适用于小量数据,maxBuffer 默认值为 200 * 1024 超出这个默认值将会导致程序崩溃,数据量过大可采用 spawn。child_process.execFile()
:类似 child_process.exec()
,区别是不能通过 shell 来执行,不支持像 I/O 重定向和文件查找这样的行为child_process.fork()
: 衍生新的进程,进程之间是相互独立的,每个进程都有自己的 V8 实例、内存,系统资源是有限的,不建议衍生太多的子进程出来,通长根据系统** CPU 核心数**设置。CPU 核心数这里特别说明下,fork 确实可以开启多个进程,但是并不建议衍生出来太多的进程,cpu核心数的获取方式
const cpus = require('os').cpus();
,这里 cpus 返回一个对象数组,包含所安装的每个 CPU/内核的信息,二者总和的数组哦。假设主机装有两个cpu,每个cpu有4个核,那么总核数就是8。
fork开启子进程解决文章起初的计算耗时造成线程阻塞。
在进行 compute 计算时创建子进程,子进程计算完成通过 send
方法将结果发送给主进程,主进程通过 message
监听到信息后处理并退出。
fork_app.js
const http = require('http'); const fork = require('child_process').fork; const server = http.createServer((req, res) => { if(req.url == '/compute'){ const compute = fork('./fork_compute.js'); compute.send('开启一个新的子进程'); // 当一个子进程使用 process.send() 发送消息时会触发 'message' 事件 compute.on('message', sum => { res.end(`Sum is ${sum}`); compute.kill(); }); // 子进程监听到一些错误消息退出 compute.on('close', (code, signal) => { console.log(`收到close事件,子进程收到信号 ${signal} 而终止,退出码 ${code}`); compute.kill(); }) }else{ res.end(`ok`); } }); server.listen(3000, 127.0.0.1, () => { console.log(`server started at http://${127.0.0.1}:${3000}`); });
fork_compute.js
针对文初需要进行计算的的例子我们创建子进程拆分出来单独进行运算。
const computation = () => { let sum = 0; console.info('计算开始'); console.time('计算耗时'); for (let i = 0; i < 1e10; i++) { sum += i }; console.info('计算结束'); console.timeEnd('计算耗时'); return sum; }; process.on('message', msg => { console.log(msg, 'process.pid', process.pid); // 子进程id const sum = computation(); // 如果Node.js进程是通过进程间通信产生的,那么,process.send()方法可以用来给父进程发送消息 process.send(sum); })
cluster 开启子进程Demo
const http = require('http'); const numCPUs = require('os').cpus().length; const cluster = require('cluster'); if(cluster.isMaster){ console.log('Master proces id is',process.pid); // fork workers for(let i= 0;i<numcpus><h6 data-id="heading-15">cluster原理分析</h6> <p><img src="https://img.php.cn/upload/image/919/390/925/162070174810870Eine%20eingehende%20Analyse%20der%20Prozesse%20und%20Threads%20in%20Node.js" title="162070174810870Eine eingehende Analyse der Prozesse und Threads in Node.js" alt="Eine eingehende Analyse der Prozesse und Threads in Node.js"></p> <p>cluster模块调用fork方法来创建子进程,该方法与child_process中的fork是同一个方法。 cluster模块采用的是经典的主从模型,Cluster会创建一个master,然后根据你指定的数量复制出多个子进程,可以使用<code>cluster.isMaster</code>属性判断当前进程是master还是worker(工作进程)。由master进程来管理所有的子进程,主进程不负责具体的任务处理,主要工作是负责调度和管理。</p> <p>cluster模块使用内置的负载均衡来更好地处理线程之间的压力,该负载均衡使用了<code>Round-robin</code>算法(也被称之为循环算法)。当使用Round-robin调度策略时,master accepts()所有传入的连接请求,然后将相应的TCP请求处理发送给选中的工作进程(该方式仍然通过IPC来进行通信)。</p> <p>开启多进程时候端口疑问讲解:如果多个Node进程监听同一个端口时会出现 <code>Error:listen EADDRIUNS</code>的错误,而cluster模块为什么可以让多个子进程监听同一个端口呢?原因是master进程内部启动了一个TCP服务器,而真正监听端口的只有这个服务器,当来自前端的请求触发服务器的connection事件后,master会将对应的socket具柄发送给子进程。</p> <h5 data-id="heading-16">child_process 模块与cluster 模块总结</h5> <p>无论是 child_process 模块还是 cluster 模块,为了解决 Node.js 实例单线程运行,无法利用多核 CPU 的问题而出现的。核心就是<strong>父进程(即 master 进程)负责监听端口,接收到新的请求后将其分发给下面的 worker 进程</strong>。</p> <p>cluster模块的一个弊端:</p> <p><img src="https://img.php.cn/upload/image/984/507/923/162070176214860Eine%20eingehende%20Analyse%20der%20Prozesse%20und%20Threads%20in%20Node.js" title="162070176214860Eine eingehende Analyse der Prozesse und Threads in Node.js" alt="Eine eingehende Analyse der Prozesse und Threads in Node.js"></p> <p><img src="https://img.php.cn/upload/image/788/562/123/162070176626228Eine%20eingehende%20Analyse%20der%20Prozesse%20und%20Threads%20in%20Node.js" title="162070176626228Eine eingehende Analyse der Prozesse und Threads in Node.js" alt="Eine eingehende Analyse der Prozesse und Threads in Node.js"></p> <p>cluster内部隐时的构建TCP服务器的方式来说对使用者确实简单和透明了很多,但是这种方式无法像使用child_process那样灵活,因为一直主进程只能管理一组相同的工作进程,而自行通过child_process来创建工作进程,一个主进程可以控制多组进程。原因是child_process操作子进程时,可以隐式的创建多个TCP服务器,对比上面的两幅图应该能理解我说的内容。</p> <h4 data-id="heading-17"><strong>Node.js进程通信原理</strong></h4> <p>前面讲解的无论是child_process模块,还是cluster模块,都需要主进程和工作进程之间的通信。通过fork()或者其他API,创建了子进程之后,为了实现父子进程之间的通信,父子进程之间才能通过message和send()传递信息。</p> <p>IPC这个词我想大家并不陌生,不管那一张开发语言只要提到进程通信,都会提到它。IPC的全称是Inter-Process Communication,即进程间通信。它的目的是为了让不同的进程能够互相访问资源并进行协调工作。实现进程间通信的技术有很多,如命名管道,匿名管道,socket,信号量,共享内存,消息队列等。Node中实现IPC通道是依赖于libuv。windows下由命名管道(name pipe)实现,*nix系统则采用Unix Domain Socket实现。表现在应用层上的进程间通信只有简单的message事件和send()方法,接口十分简洁和消息化。</p> <p>IPC创建和实现示意图</p> <p><img src="https://img.php.cn/upload/image/350/147/223/162070177651462Eine%20eingehende%20Analyse%20der%20Prozesse%20und%20Threads%20in%20Node.js" title="162070177651462Eine eingehende Analyse der Prozesse und Threads in Node.js" alt="Eine eingehende Analyse der Prozesse und Threads in Node.js"></p> <p>IPC通信管道是如何创建的</p> <p><img src="https://img.php.cn/upload/image/156/288/885/162070178420660Eine%20eingehende%20Analyse%20der%20Prozesse%20und%20Threads%20in%20Node.js" title="162070178420660Eine eingehende Analyse der Prozesse und Threads in Node.js" alt="Eine eingehende Analyse der Prozesse und Threads in Node.js"></p> <p>父进程在实际创建子进程之前,会创建<code>IPC通道</code>并监听它,然后才<code>真正的</code>创建出<code>子进程</code>,这个过程中也会通过环境变量(NODE_CHANNEL_FD)告诉子进程这个IPC通道的文件描述符。子进程在启动的过程中,根据文件描述符去连接这个已存在的IPC通道,从而完成父子进程之间的连接。</p> <h4 data-id="heading-18"><strong>Node.js句柄传递</strong></h4> <p>讲句柄之前,先想一个问题,send句柄发送的时候,真的是将服务器对象发送给了子进程?</p> <h5 data-id="heading-19"><strong>子进程对象send()方法可以发送的句柄类型</strong></h5> <ul> <li>net.Socket TCP套接字</li> <li>net.Server TCP服务器,任意建立在TCP服务上的应用层服务都可以享受它带来的好处</li> <li>net.Native C++层面的TCP套接字或IPC管道</li> <li>dgram.Socket UDP套接字</li> <li>dgram.Native C++层面的UDP套接字</li> </ul> <h5 data-id="heading-20"><strong>send句柄发送原理分析</strong></h5> <p>结合句柄的发送与还原示意图更容易理解。</p> <p><img src="https://img.php.cn/upload/image/603/327/625/162070181980449Eine%20eingehende%20Analyse%20der%20Prozesse%20und%20Threads%20in%20Node.js" title="162070181980449Eine eingehende Analyse der Prozesse und Threads in Node.js" alt="Eine eingehende Analyse der Prozesse und Threads in Node.js"></p> <p><code>send()</code>方法在将消息发送到IPC管道前,实际将消息组装成了两个对象,一个参数是hadler,另一个是message。message参数如下所示:</p> <pre class="brush:php;toolbar:false">{ cmd:'NODE_HANDLE', type:'net.Server', msg:message }
发送到IPC管道中的实际上是我们要发送的句柄文件描述符。这个message对象在写入到IPC管道时,也会通过JSON.stringfy()
进行序列化。所以最终发送到IPC通道中的信息都是字符串,send()方法能发送消息和句柄并不意味着它能发送任何对象。
连接了IPC通道的子线程可以读取父进程发来的消息,将字符串通过JSON.parse()解析还原为对象后,才触发message事件将消息传递给应用层使用。在这个过程中,消息对象还要被进行过滤处理,message.cmd的值如果以NODE_为前缀,它将响应一个内部事件internalMessage,如果message.cmd值为NODE_HANDLE,它将取出message.type
值和得到的文件描述符一起还原出一个对应的对象。
以发送的TCP服务器句柄为例,子进程收到消息后的还原过程代码如下:
function(message,handle,emit){ var self = this; var server = new net.Server(); server.listen(handler,function(){ emit(server); }); }
这段还原代码,子进程根据message.type创建对应的TCP服务器对象,然后监听到文件描述符上
。由于底层细节不被应用层感知,所以子进程中,开发者会有一种服务器对象就是从父进程中直接传递过来的错觉。
Node进程之间只有消息传递,不会真正的传递对象,这种错觉是抽象封装的结果。目前Node只支持我前面提到的几种句柄,并非任意类型的句柄都能在进程之间传递,除非它有完整的发送和还原的过程。
我们自己实现一个多进程架构守护Demo
编写主进程
master.js 主要处理以下逻辑:
// master.js const fork = require('child_process').fork; const cpus = require('os').cpus(); const server = require('net').createServer(); server.listen(3000); process.title = 'node-master' const workers = {}; const createWorker = () => { const worker = fork('worker.js') worker.on('message', function (message) { if (message.act === 'suicide') { createWorker(); } }) worker.on('exit', function(code, signal) { console.log('worker process exited, code: %s signal: %s', code, signal); delete workers[worker.pid]; }); worker.send('server', server); workers[worker.pid] = worker; console.log('worker process created, pid: %s ppid: %s', worker.pid, process.pid); } for (let i=0; i<cpus.length; i++) { createWorker(); } process.once('SIGINT', close.bind(this, 'SIGINT')); // kill(2) Ctrl-C process.once('SIGQUIT', close.bind(this, 'SIGQUIT')); // kill(3) Ctrl-\ process.once('SIGTERM', close.bind(this, 'SIGTERM')); // kill(15) default process.once('exit', close.bind(this)); function close (code) { console.log('进程退出!', code); if (code !== 0) { for (let pid in workers) { console.log('master process exited, kill worker pid: ', pid); workers[pid].kill('SIGINT'); } } process.exit(0); }
工作进程
worker.js 子进程处理逻辑如下:
// worker.js const http = require('http'); const server = http.createServer((req, res) => { res.writeHead(200, { 'Content-Type': 'text/plan' }); res.end('I am worker, pid: ' + process.pid + ', ppid: ' + process.ppid); throw new Error('worker process exception!'); // 测试异常进程退出、重启 }); let worker; process.title = 'node-worker' process.on('message', function (message, sendHandle) { if (message === 'server') { worker = sendHandle; worker.on('connection', function(socket) { server.emit('connection', socket); }); } }); process.on('uncaughtException', function (err) { console.log(err); process.send({act: 'suicide'}); worker.close(function () { process.exit(1); }) })
每次启动 Node.js 程序都需要在命令窗口输入命令 node app.js
才能启动,但如果把命令窗口关闭则Node.js 程序服务就会立刻断掉。除此之外,当我们这个 Node.js 服务意外崩溃了就不能自动重启进程了。这些现象都不是我们想要看到的,所以需要通过某些方式来守护这个开启的进程,执行 node app.js 开启一个服务进程之后,我还可以在这个终端上做些别的事情,且不会相互影响。,当出现问题可以自动重启。
这里我只说一些第三方的进程守护框架,pm2 和 forever ,它们都可以实现进程守护,底层也都是通过上面讲的 child_process 模块和 cluster 模块 实现的,这里就不再提它们的原理。
pm2 指定生产环境启动一个名为 test 的 node 服务
pm2 start app.js --env production --name test
pm2常用api
pm2 stop Name/processID
停止某个服务,通过服务名称或者服务进程ID
pm2 delete Name/processID
删除某个服务,通过服务名称或者服务进程ID
pm2 logs [Name]
查看日志,如果添加服务名称,则指定查看某个服务的日志,不加则查看所有日志
pm2 start app.js -i 4
集群,-i 参数用来告诉PM2以cluster_mode的形式运行你的app(对应的叫fork_mode),后面的数字表示要启动的工作线程的数量。如果给定的数字为0,PM2则会根据你CPU核心的数量来生成对应的工作线程。注意一般在生产环境使用cluster_mode模式,测试或者本地环境一般使用fork模式,方便测试到错误。
pm2 reload Name pm2 restart Name
应用程序代码有更新,可以用重载来加载新代码,也可以用重启来完成,reload可以做到0秒宕机加载新的代码,restart则是重新启动,生产环境中多用reload来完成代码更新!
pm2 show Name
查看服务详情
pm2 list
查看pm2中所有项目
pm2 monit
用monit可以打开实时监视器去查看资源占用情况
pm2 官网地址:
forever 就不特殊说明了,官网地址
注意:二者更推荐pm2,看一下二者对比就知道我为什么更推荐使用pm2了。www.jianshu.com/p/fdc12d82b…
查找与进程相关的PID号
ps aux | grep server
说明:
root 20158 0.0 5.0 1251592 95396 ? Sl 5月17 1:19 node /srv/mini-program-api/launch_pm2.js
上面是执行命令后在linux中显示的结果,第二个参数就是进程对应的PID
以优雅的方式结束进程
kill -l PID
-l选项告诉kill命令用好像启动进程的用户已注销的方式结束进程。 当使用该选项时,kill命令也试图杀死所留下的子进程。 但这个命令也不是总能成功--或许仍然需要先手工杀死子进程,然后再杀死父进程。
kill 命令用于终止进程
例如: `kill -9 [PID]`
-9 表示强迫进程立即停止
这个强大和危险的命令迫使进程在运行时突然终止,进程在结束后不能自我清理。 危害是导致系统资源无法正常释放,一般不推荐使用,除非其他办法都无效。 当使用此命令时,一定要通过ps -ef确认没有剩下任何僵尸进程。 只能通过终止父进程来消除僵尸进程。如果僵尸进程被init收养,问题就比较严重了。 杀死init进程意味着关闭系统。 如果系统中有僵尸进程,并且其父进程是init, 而且僵尸进程占用了大量的系统资源,那么就需要在某个时候重启机器以清除进程表了。
killall命令
杀死同一进程组内的所有进程。其允许指定要终止的进程的名称,而非PID。
killall httpd
const http = require('http'); const server = http.createServer(); server.listen(3000,()=>{ process.title='程序员成长指北测试进程'; console.log('进程id',process.pid) })
仍然看本文第一段代码,创建了http服务,开启了一个进程,都说了Node.js是单线程,所以 Node 启动后线程数应该为 1,但是为什么会开启7个线程呢?难道Javascript不是单线程不知道小伙伴们有没有这个疑问?
解释一下这个原因:
Node 中最核心的是 v8 引擎,在 Node 启动后,会创建 v8 的实例,这个实例是多线程的。
所以大家常说的 Node 是单线程的指的是 JavaScript 的执行是单线程的(开发者编写的代码运行在单线程环境中),但 Javascript 的宿主环境,无论是 Node 还是浏览器都是多线程的因为libuv中有线程池的概念存在的,libuv会通过类似线程池的实现来模拟不同操作系统的异步调用,这对开发者来说是不可见的。
还是上面那个例子,我们在定时器执行的同时,去读一个文件:
const fs = require('fs') setInterval(() => { console.log(new Date().getTime()) }, 3000) fs.readFile('./index.html', () => {})
线程数量变成了 11 个,这是因为在 Node 中有一些 IO 操作(DNS,FS)和一些 CPU 密集计算(Zlib,Crypto)会启用 Node 的线程池,而线程池默认大小为 4,因为线程数变成了 11。 我们可以手动更改线程池默认大小:
process.env.UV_THREADPOOL_SIZE = 64
一行代码轻松把线程变成 71。
Libuv 是一个跨平台的异步IO库,它结合了UNIX下的libev和Windows下的IOCP的特性,最早由Node的作者开发,专门为Node提供多平台下的异步IO支持。Libuv本身是由C++语言实现的,Node中的非苏塞IO以及事件循环的底层机制都是由libuv实现的。
libuv架构图
在Window环境下,libuv直接使用Windows的IOCP来实现异步IO。在非Windows环境下,libuv使用多线程来模拟异步IO。
注意下面我要说的话,Node的异步调用是由libuv来支持的,以上面的读取文件的例子,读文件实质的系统调用是由libuv来完成的,Node只是负责调用libuv的接口,等数据返回后再执行对应的回调方法。
直到 Node 10.5.0 的发布,官方才给出了一个实验性质的模块 worker_threads 给 Node 提供真正的多线程能力。
先看下简单的 demo:
const { isMainThread, parentPort, workerData, threadId, MessageChannel, MessagePort, Worker } = require('worker_threads'); function mainThread() { for (let i = 0; i { console.log(`main: worker stopped with exit code ${code}`); }); worker.on('message', msg => { console.log(`main: receive ${msg}`); worker.postMessage(msg + 1); }); } } function workerThread() { console.log(`worker: workerDate ${workerData}`); parentPort.on('message', msg => { console.log(`worker: receive ${msg}`); }), parentPort.postMessage(workerData); } if (isMainThread) { mainThread(); } else { workerThread(); }
上述代码在主线程中开启五个子线程,并且主线程向子线程发送简单的消息。
由于 worker_thread 目前仍然处于实验阶段,所以启动时需要增加 --experimental-worker flag,运行后观察活动监视器,开启了5个子线程
worker_thread 核心代码(地址https://github.com/nodejs/node/blob/master/lib/worker_threads.js) worker_thread 模块中有 4 个对象和 2 个类,可以自己去看上面的源码。
多进程 vs 多线程
对比一下多线程与多进程:
属性 | 多进程 | 多线程 | 比较 |
---|---|---|---|
数据 | 数据共享复杂,需要用IPC;数据是分开的,同步简单 | 因为共享进程数据,数据共享简单,同步复杂 | 各有千秋 |
CPU、内存 | 占用内存多,切换复杂,CPU利用率低 | 占用内存少,切换简单,CPU利用率高 | 多线程更好 |
销毁、切换 | 创建销毁、切换复杂,速度慢 | 创建销毁、切换简单,速度很快 | 多线程更好 |
coding | 编码简单、调试方便 | 编码、调试复杂 | 编码、调试复杂 |
可靠性 | 进程独立运行,不会相互影响 | 线程同呼吸共命运 | 多进程更好 |
分布式 | 可用于多机多核分布式,易于扩展 | 只能用于多核分布式 | 多进程更好 |
Weitere Kenntnisse zum Thema Programmierung finden Sie unter: Einführung in die Programmierung! !
Das obige ist der detaillierte Inhalt vonEine eingehende Analyse der Prozesse und Threads in Node.js. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!