node.js使用cluster实现多进程

nodeJS 是一门单线程!异步!非阻塞语言!
nodeJS 是一门单线程!异步!非阻塞语言!
nodeJS 是一门单线程!异步!非阻塞语言!

重要的事情说3遍。 因为nodeJS天生自带buff, 所以从一出生就受到 万千 粉丝的追捧(俺,也是它的死忠). 但是,傻逼php 竟然嘲笑 我大NodeJS 的性能。 说不稳定,不可靠,只能利用单核CPU。 辣鸡 nodeJS.

艹!艹!艹!
搞mo shi~

但,大哥就是大哥,nodeJS在v0.8 的时候就已经加入了cluster的模块。 完全打脸php. 虽然,现在php 也开始抄袭nodeJS, 退出php7, 但是,渣渣,你就只会抄...
233333
对不起啊,上面是我自已意淫的一段~ 以上内容,纯属调侃,如果雷同,纯属巧合。

Ok~ 我们来正式介绍一下nodeJS的多进程吧~

cluster的前世今生

以前,由于cluster 本身的不完善,可能由于多方面原因吧,实现性能不好。 结果是,pm2 包的 崛起。 轻松使用一个pm2 就可以开启多进程,实现负载均衡的效果。

pm2 start app.js

pm2的内部和cluster内部实现其实是一个道理,都是封装了一层child_process--fork. 而child_process--fork 则是封装了unix 系统的fork 方法。 既然,都到这了,我们来看看官方给出的解释吧。

fork() creates a new process by duplicating the calling process. The new process is referred to as the child process. The calling process is referred to as the parent process. The child process and the parent process run in separate memory spaces. At the time of fork() both memory spaces have the same content. Memory writes, file mappings (mmap(2)), and unmappings (munmap(2)) performed by one of the processes do not affect the other.

俺来翻译一下,fork其实就是创建子进程的方法,新创建的进程被认为是子进程,而调用fork的进程则是父进程。 子进程和父进程本来是在独立的内存空间中的。但当你使用了fork之后,两者就处在同一个作用域内了。 但是,内存的读写,文件的map,都不会影响对方。

上面那段的意思就是,你创建的进程其实可以相互通信,并且被master进程 管理。

看图~~~

node.js使用cluster实现多进程

其实就是这个意思。

Ok~ 这只是系统创建子进程的模型。那么在NodeJs中是怎样实现进程之间的交互的呢?
很简单监听端口呗。。。

但是,实现通信不是很难,关键在于如果分配请求,这一点nodeJS 踩的坑确实很大。

nodeJS 实现进程分配的黑历史

long time ago

nodeJS的master 开始并不是上帝, 他只是一个小小的太监,每次请求(妃子)来的时候,他只会默默的看着几个worker小皇帝相互争夺,如果某个worker胜出,则其他的worker也就草草了事,等下一个请求过来。所以说,每来一次请求,都会引起一场腥风血雨。而,我们体会最深的就是惊群现象,即,CPU爆表.

借用TJ大神的一幅图,说明一下。

node.js使用cluster实现多进程


这里,master只是绑定端口,而不会对来的请求做任何处理。 通过将socket的fd给fork出来的进程。造成的结果就是4个人男人(worker)抢一个妃子(request). 那场面别提有多血腥了。

前面说过,cluster其实就是对child_process的一层封装,那我们继续往底层走一点。实现cluster多进程。 首先,我们需要了解,这几个模块的基本用法。net,child_process.

child_process

这个应该是nodeJS 进程最核心的模块。 基本的方法,有几个,不过我这里,只介绍比较核心的:spawn ,fork ,exec。如果大家有兴趣,可以去child_process参考.

child_process.spawn(command, args)

该方法用来运行指定的程序。比如: node app.js.他是异步的命令,但不支持callback, 不过我们可以使用process.on来监听结果。 他自带3个参数.

command: 执行命令
args[Array]: 命令所带的参数
options[Object]: 环境变量对象

OK~ 我们举个一个简单的demo: 试一试运行 touch apawn.js

const spawn = require('child_process').spawn; const touch = spawn('touch',['spawn.js']); touch.stdout.on('data', (data) => { console.log(`stdout: ${data}`); }); touch.stderr.on('data', (data) => { console.log(`stderr: ${data}`); }); touch.on('close', (code) => { console.log(`child process exited with code $[code]`); });

如果,正确的话,应该会输
出child process exited with code 0. 然后运行目录会生成pawn.js文件。 当然,如果你需要运行多参数的命令的话这就有点蛋疼了。
所以,nodeJS 使用了exec对其进行很好的封装,而且他支持回调函数,这比较能够让我们理解。

child_process.exec(order,cb(err[,stdout,stderr]));

order: 就是你执行的命令. 比如: rm spawn.js
cb: 就是命令执行成功后的回调函数。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/wgyjdf.html