《深入浅出Node.js》-玩转进程

原创

wx60d4764eb475e 2022-01-12 17:00:01 ©著作权

文章标签 node.js 服务器 javascript 子进程句柄 文章分类 代码人生

©著作权归作者所有：来自51CTO博客作者wx60d4764eb475e的原创作品，请联系作者获取转载授权，否则将追究法律责任

Node 基于 V8 引擎构建，采用单线程模型，所有的 JavaScript 将会运行在单个进程的单个线程上，它带来的好处是：没有多线程中常见的锁以及线程同步的问题，操作系统在调度时也能减少上下文切换，提高 CPU 使用率。但是如今 CPU 基本均是多核的，真正的服务器往往还有多个 CPU，一个 Node 进程只能利用一个核，这带来硬件资源的浪费。另外，Node 运行在单线程之上，一个单线程抛出异常而没有被捕获，将会导致进程的崩溃。

严格来说，Node 并非真正的单线程，Node 自身中还有 I/O 线程存在，这些 I/O 线程由底层 libuv 处理，这部分线程对于 JavaScript 而言是透明的，只有 C++ 扩展时才会关注到，JavaScript 代码运行在 V8 上，是单线程的。

服务器变迁

同步：最早服务器是同步模型，一次只能处理一个请求，其它请求都需要等待当前请求处理完毕。假如每次响应耗时为 N 秒，这类服务的 QPS 为 1/N。
复制进程：每一个连接使用一个进程来服务，采用进程的复制实现，代价非常昂贵。假如进程数上限为 M，这类服务的 QPS 为 M/N。
多线程：一个线程处理一个请求，线程相对进程开销要小很多，线程直接可以共享数据，利用线程池减少创建和销毁线程的开销。假如线程占用的资源为进程的 1/L，它的 QPS 为 M*L/N。
事件驱动：Node 和 Nginx 采用事件驱动的方式实现，避免了不必要的内存开销和上下文切换。事件驱动模型存在的主要问题是 CPU 利用率不高和程序健壮性不能保证。
协程：基于协程实现的服务器，比如 Golang 目前也非常流行，协程是用户级别线程，它对于内核透明，完全由用户自己进行程序之间的调用。详细内容可以参考我这篇文章Python 协程。

多进程架构

Node 提供 child_process 模块来实现多核 CPU 的利用。child_process.fork() 函数来实现进程的复制。

worker.js 代码如下：

var http = require('http')
http.createServer(function(req, res) {
  res.writeHead(200, { 'Content-Type': 'text/plain' })
  res.end('Hello World\n')
}).listen(Math.round((1 + Math.random()) * 1000), '127.0.0.1')

通过 node worker.js 启动它，会监听 1000 到 2000 之间的一个随机端口。

master.js 代码如下：

var fork = require('child_process').fork
var cpus = require('os').cpus()
for (var i = 0; i < cpus.length; i++) {
  fork('./worker.js')
}

这段代码根据 CPU 数量复制出对应的 Node 进程数，Linux 系统下通过 ps aux | grep worker.js 查看进程的数量。

$ ps aux | grep worker.js
lizhen 1475 0.0 0.0 2432768 600 s003 S+ 3:27AM 0:00.00 grep worker.js
lizhen 1440 0.0 0.2 3022452 12680 s003 S 3:25AM 0:00.14 /usr/local/bin/node ./worker.js
lizhen 1439 0.0 0.2 3023476 12716 s003 S 3:25AM 0:00.14 /usr/local/bin/node ./worker.js
lizhen 1438 0.0 0.2 3022452 12704 s003 S 3:25AM 0:00.14 /usr/local/bin/node ./worker.js
lizhen 1437 0.0 0.2 3031668 12696 s003 S 3:25AM 0:00.15 /usr/local/bin/node ./worker.js

这种通过 Master 启多个 Worker 的模式就是主从模式，进程被分为主进程和工作进程。主进程不负责具体的业务，而是负责调度和管理工作进程，它是趋于稳定的。

通过 fork() 复制的进程都是独立的进程，这个进程中有着独立的 V8 实例，它需要至少 30ms 的启动时间和至少 10MB 的内存。因此 fork 依然是昂贵的。

创建子进程

child_process 模块给予 Node 可以随意创建子进程的能力

spawn() 启动一个子进程执行命令。
exec() 启动子进程执行命令，通过回调函数获取子进程状态。
execFile() 启动一个子进程执行可执行文件。
fork() 通过制定需要执行的 JavaScript 文件创建 Node 子进程。

var cp = require('child_process')
cp.spawn('node', ['worker.js'])
cp.exec('node worker.js', function (err, stdout, stderr) {
 // some code
})
cp.execFile('worker.js', function (err, stdout, stderr) {
 // some code
})
cp.fork('./worker.js')

进程之间的通信

首先来看一个示例：

parent.js

var cp = require('child_process')
var n = cp.fork(__dirname + '/sub.js')
n.on('message', function (m) {
  console.log('PARENT got message:', m)
})
n.send({hello: 'world'})
sub.js

process.on('message', function (m) {
  console.log('CHILD got message:', m)
})
process.send({foo: 'bar'})

通过 fork() 或者其它 API，创建子进程之后，为了实父子程之间的通信，父进程与子进程之间会创建 IPC 通道。通过过 IPC 通道，父子进程之间才能通过 message 和 send() 传递信息。

进程间通信原理： IPC 全称是 Inter-Process Communication，即进程间通信，Node 实现 IPC 使用管道(pipe)技术，具体实现细节由 libuv 提供。在 Windows 下由命名管道（named pipe）实现，Linux 下采用 Unix Domain Socket 实现。表现在应用层上的进程间通信只有简单的 message 事件和 send() 方法。父进程在实际创建子进程之前，会创建 IPC 通道并监听它，然后才真正创建出子进程，并且通过环境变量 NODE_CHANNEL_FD 告诉子进程这个 IPC 通道的文件描述符。子进程通过这个文件描述符去连接这个已存在的 IPC 通道，从而完成父子进程之间的连接。

《深入浅出Node.js》-玩转进程_node.js

由于 IPC 管道是用命名管道或者 Domain Socket 创建的，与网络 socket 比较类似，属于双向通行。不同的是它们在系统内核中就完成了进程间的通信，而不是通过网络层，非常高效。

句柄传递

通常我们启用多个 Node 进程的时候，假如每个进程都监听 80 端口，会导致 EADDRINUSE 异常，解决方案是让每个进程监听不同的端口，其中主进程监听 80，对外接收所有的网络请求，再将这些请求代理到不同的端口的进程上。

通过代理不仅能解决端口重复监听的问题，还能适当的做负载均衡。由于进程每接收一个连接都会用掉一个文件描述符，因此代理方案中客户端连接到代理进程，代理进程连接到工作进程的过程需要用掉两个文件描述符，操作系统的文件描述符是有限的，代理方式需要一倍数量的文件描述符影响了系统的扩展能力。

为了解决上述问题，Node 引入了进程间传递句柄的功能。

child.send(message, [sendHandle])

句柄是一种可以用来标识资源的引用，比如句柄可以标识一个服务器端的 socket 对象，一个客户端的 socket 对象，一个 UDP scoket，一个管道等。

发送句柄意味着主进程接收到 socket 请求后，直接将 socket 发送给工作进程，而不是重新与工作进程之间建立新的 socket 连接来转发数据。

主进程 parent.js：

var child = require('child_process').fork('child.js')
// Open up the server object and send the handle
var server = require('net').createServer()
server.on('connection', function(socket) {
  socket.end('handled by parent\n')
})
server.listen(1337, function() {
  child.send('server', server)
})
子进程 child.js：

process.on('message', function(m, server) {
  if (m === 'server') {
    server.on('connection', function(socket) {
      socket.end('handled by child\n')
    })
  }
})

通过 node 启动查看效果：

// 先启动服务器
$ node parent.js
// 使用 curl 工具
$ curl "http://127.0.0.1:1337"
handled by parent
$ curl "http://127.0.0.1:1337"
handled by child
$ curl "http://127.0.0.1:1337"
handled by child
$ curl "http://127.0.0.1:1337"
handled by parent

可以看出父子进程都有可能处理客户端请求。

尝试将服务发送给多个子进程。

// parent.js
var cp = require('child_process')
var child1 = cp.fork('child.js')
var child2 = cp.fork('child.js')
// Open up the server object and send the handle
var server = require('net').createServer()
server.on('connection', function(socket) {
  socket.end('handled by parent\n')
})
server.listen(1337, function() {
  child1.send('server', server)
  child2.send('server', server)
})

子进程将进程 ID 打印出来。

// child.js
process.on('message', function(m, server) {
  if (m === 'server') {
    server.on('connection', function(socket) {
      socket.end('handled by child, pid is ' + process.pid + '\n')
    })
  }
})

通过 curl 测试依然是相同的结果，请求可能被父进程处理，也可能被不同的子进程处理。并且这些都是在 TCP 层面完成的事情。我们尝试将其改成 HTTP 层来处理。

// parent.js
var cp = require('child_process')
var child1 = cp.fork('child.js')
var child2 = cp.fork('child.js')
// Open up the server object and send the handle
var server = require('net').createServer()
server.listen(1337, function() {
  child1.send('server', server)
  child2.send('server', server)
  // 关闭
  server.close()
})

对子进程进行改动

// child.js

var http = require('http')
var server = http.createServer(function(req, res) {
  res.writeHead(200, { 'Content-Type': 'text/plain' })
  res.end('handled by child, pid is ' + process.pid + '\n')
})
process.on('message', function(m, tcp) {
  if (m === 'server') {
    tcp.on('connection', function(socket) {
      server.emit('connection', socket)
    })
  }
})

重新启动 parent.js 后，再次测试，所有的请求都是由子进程处理了。整个过程中，服务的过程发生了一次改变：

主进程发送完句柄并且关闭监听之后，成了下图的结构：