文章目录
- 一、名词解释
- 二、多进程 multiprocessing
- 三、多线程 Threading
- 四、多协程 asyncio
- 参考
一、名词解释
随着python使用的深入,任务量越来越大,普通的notebook或python程序运行需要越来越多的时间。
此时Python 并发编程也逐渐重要起来。
现有三种主流Python并发编程方式:
- 多进程 multiprocessing
- 多线程 Threading
- 多协程 asyncio
有些同学可能分不太清线程进程,这里提供一种记忆方式:首先,很简单,一根线就是一个线程,闭上眼想象一捆线绑在一起组成了一捆更粗的线集,这就是一个进程;而协程,则是一根线里分化出的许多子应用。 因此一个进程中可以启动N个线程,一个线程中可以启动N个协程。
OK,知道了这几种并发方式,那我们该在什么时候选择什么样的方式,他们各自又有什么特点呢?直接看下表。
多进程、多线程、多协程的对比
类型 | 优点 | 缺点 | 适用 |
多进程 | 可以利用多核CPU并行运算 | 占用资源最多、可启动数目比线程少 | CPU密集型计算 |
多线程 | 相比进程,更轻量级、占用资源少 | 相比进程:多线程只能并发执行,不能利用多CPU (GIL ) 相比协程:启动数目有限制,占用内存资源,有线程切换开销 | IO密集型计算、同时运行的任务数目要求不多 |
多协程 | 内存开销最少、启动协程数量最多 | 支持的库有限制(aiohttp VS requests)、代码实现复杂 | IO密集型计算、需要超多任务运行、但有现成库支持的场景 |
针对上面的CPU密集型 (CPU-bound) 计算、IO密集型 (I/O bound) 计算,解释如下:
名称 | 解释 | 举例 |
CPU密集型 | CPU密集型也叫计算密集型,是指I/O在很短的时间就可以完成,CPU需要大量的计算和处理,特点是CPU占用率相当高 | 压缩解压缩、加密解密、正则表达式搜索 |
IO密集型 | IO密集型指的是系统运作大部分的状况是CPU在等I/O (硬盘/内存)的读/写操作,CPU占用率仍然较低。 | 文件处理程序、网络爬虫程序、读写数据库程序 |
二、多进程 multiprocessing
三、多线程 Threading
四、多协程 asyncio