网络IO模型之多路复用器

原创

苦行僧dh 2024-07-06 20:30:33 ©著作权

文章标签 多路复用应用程序数据 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者苦行僧dh的原创作品，请联系作者获取转载授权，否则将追究法律责任

多路复用是什么？怎么理解？

本文主要涉及为

程序中处理网络IO时的模型，对于系统内核而言网络IO模型。这里只做普及使用

前置知识，什么是IO？怎么理解IO

IO其实就是In和Out。中文翻译是输入和输出，只要涉及到输入和输出的，我们都可以称之为IO。

例如你在磁盘中读取文件，读取文件为In，输出到其他地方为Out。

例如你Windows系统在网络通信时，读取客户端的输入数据包，这叫In，系统将数据包输出给我们编写的应用程序，这叫Out。

当然，我们如果成自身程序的角度去看网络通信的话，我们根据系统内核给予的文件描述符去获取TCP连接数据时，这就叫In，将数据输出到其他位置，这叫Out。

所以，我们可以总结，IO其实就是输入输出，它是对输入输出这个动作的统称，并不仅限于磁盘、网络等。

当然，IO相关的设备有很多，比如鼠标、触摸屏、NFC等

对于系统而言，处理IO有什么模型？

这里的系统，指的是Windows内核程序、Linux内核程序。

我们要知道，一个TCP连接到达服务器后，该连接是由系统内核程序进行管控的，它维护这条连接和上层应用与之交互的过程。

回到正题，我们今天说的是系统内核层面的IO模型情况，至于应用程序层的IO模型我会一笔带过。

同步模型

画个图更好理解：

网络IO模型之多路复用器_多路复用

这张图中，注意我们的业务程序中线程是需要不停的读取TCP连接通道中的数据，我们可以称之为为read操作。而本质上业务程序一直不停的主动读取数据的这种情况，本质上就是一个同步模型，因为始终是应用程序主动来读取的。

此时如果我们的线程，read数据没有的话，一直等待读取到数据的这个操作，对于我们业务程序而言，就是阻塞模型。而业务程序如果读取read后发现没有数据，直接跳过，这个就是非阻塞模型。至于业务程序读取到数据后，自身如何去操作，其实就是业务层面的同步和异步模型。

说到这里，你应该也明白了，系统内核层面的IO模型和我们业务程序层面的IO模型是可以完全不相关的。举个例子，我们先不谈系统内核层面，只说应用程序，应用程序读取到数据后，读取数据的线程用来处理业务，那就是同步模型；而应用程序读取数据的线程不参与业务处理，只处理网络连接的事情，当其他业务处理线程执行完业务逻辑后再让处理连接的线程响应数据，这就是异步模型。

那么此时你会有疑问，每次都要应用程序主动去读取，这太浪费资源了，应用程序能不能等数据来，而不是主动去找内核要，那么就代表着系统内核级别上有没有异步模型的存在？

实际上是有的，我们马上来描述。