目录
- 一、GIL锁是什么?
- 二、CPython对线程安全的内存管理机制
- 三、解决GIL问题的方案:
- 四、线程释放GIL
- 五、多线程利用多核的优势
- 总结
一、GIL锁是什么?
定义:
GIL:又叫全局解释器锁,是一个互斥锁,每个线程在执行的过程中都需要先获取GIL,保证同一时刻只有一个线程在运行。
原因:
它并不是python语言的特性,仅仅是由于历史的原因在CPython解释器中难以移除,因为python语言运行环境大部分默认在CPython解释器中。
目的:
解决多线程同时竞争程序中的全局变量而出现的线程安全问题。
总结:
1、GIL 不是 Python 的特点,而是 CPython 解释器的特点;
2、GIL 锁是加在 CPython 解释器上的,是保证解释器级别的数据的安全;
3、GIL 锁会导致同一个进程下多个线程的不能同时执行;
4、不同的数据除了 GIL 锁,还需要一把互斥锁,来保证数据处理不会错乱。
每个线程在调用 cpython 解释器 在运行之前,需要先抢到 GIL 锁,然后才能运行。
编译型语言就不会存在 GIL 锁,编译型语言会直接编译所有代码,就不会出现这种问题。
二、CPython对线程安全的内存管理机制
Python使用引用计数来进行内存管理,在Python中创建的对象都会有引用计数,来记录有多少个指针指向它。当引用计数的值为0时,就会自动释放内存。
缺陷:
如果有2个python线程同时引用同一个对象,那么2个线程都会尝试对其进行数据操作,多个线程同时对一个数据进行增加或减少的操作,如果发生这种情况,则可能导致内存泄漏。
三、解决GIL问题的方案:
1.使用其它语言,例如C,Java
2.使用其它解释器,如java的解释器jython
3.使用多进程
线程1在CPU1上运行,线程2在CPU2上运行。GIL是全局的,CPU2上的线程2需要等待CPU1上的线程1让出GIL锁,才有可能执行。如果在多次竞争中,线程1都胜出,线程2没有得到GIL锁,意味着CPU2一直是闲置的,无法发挥多核的优势。
四、线程释放GIL
1.在IO操作等可能会引起阻塞的system call之前,可以暂时释放GIL,但在执行完毕后,必须重新获取GIL。
2.Python 3.x使用计时器Time Tick(执行时间达到阈值后,当前线程释放GIL)或Python 2.x,tickets计数达到100。
五、多线程利用多核的优势
计算密集型
假如一个计算密集型的任务需要 10s 的执行时间,总共有4个这样的任务。
在4核及以上 的情况下:
多进程: 需要开启 4 个进程,但是 4 个 CPU 并行,最终只需要消耗 10s 多一点的时间。
多线程: 只需要开1 个进程,这个进程开启 4 个线程,开启线程所消耗的资源很少,但是由于最终执行是只有一个 CPU 可以工作,所以最终消耗 40s 多的时间。
IO 密集型
假如是多个 IO密集型 的任务 CPU 大多数时间是处于闲置状态,频繁的切换
多进程: 进程进行切换需要消耗大量资源
多线程: 线程进行切换并不需要消耗大量资源
总结
开发的软件大多是 IO 密集型,所以即使存在 GIL 锁,开启多线程也是有优势的并且,可以同时开启多进程与多线程,同时兼并二者的优点。