GIL

转载

mob604756f5c18e 2021-10-21 08:15:00

文章标签 python 多线程解析器单线程多任务处理 文章分类 代码人生

1>什么是GIL？

GIL 是最流程的 CPython 解释器（平常称为 Python）中的一个技术术语，中文译为全局解释器锁，其本质上类似操作系统的 Mutex。

GIL 的功能是：在 CPython 解释器中执行的每一个 Python 线程，都会先锁住自己，以阻止别的线程执行。

2：GIL的影响？

GIL无疑就是一把全局排他锁。毫无疑问全局锁的存在会对多线程的效率有不小影响。甚至就几乎等于Python是个单线程的程序。

python在多线程的情况下居然比单线程整整慢了45%。

GIL的影响

GIL遵循的原则：“一个线程运行 Python ，而其他 N 个睡眠或者等待 I/O.”（即保证同一时刻只有一个线程对共享资源进行存取）。

之前看到一直以为有GIL全局锁的的存在，那在多线程中为什么要自己再加锁呢，后来发现想错了，怎么可能会等一个线程结束了才会执行另一个线程呢，那多线程就没有了存在的必要。

# 有了GIL全局锁，线程间访问全局变量还是需要同步
total = 0
def add():
    global total
    for i in range(1000000):
        total += 1

def desc():
    global total
    for i in range(1000000):
        total -= 1

import threading
thread1 = threading.Thread(target=add)
thread2 = threading.Thread(target=desc)

thread1.start()
thread2.start()

thread1.join()
thread2.join()

print(total)

这个例子中，两个线程分别对一个全局变量total进行加和减1000000次，但是结果并不是0！而是每次运行结果都不相同。

造成这个结果的原因是GIL事实上是会释放的，python中有两种多任务处理：

1. 协同式多任务处理：一个线程无论何时开始睡眠或等待网络 I/O，就会释放GIL锁

2. 抢占式多任务处理：如果一个线程不间断地在 Python 2 中运行 1000 字节码指令，或者不间断地在 Python 3 运行15 毫秒，那么它便会放弃 GIL，而其他线程可以运行

这样解释之后感觉GIL没啥影响啊，反正会切换的嘛，那为什么都说由于GIL的存在，导致python的多线程比单线程还慢，按我的理解，在单核CPU下没什么不一样（也有可能有性能损失），但是在多核CPU下问题就大了，不同核心上的线程同一时刻也只能执行一个，所以不能够利用多核CPU的优势，反而在不同核心间切换时会造成资源浪费，反而比单核CPU更慢。

解决办法

1. 多线程比较低效时，可用multiprocess库替代Thread库，即使用多进程而不是多线程，每个进程有自己的独立的GIL，因此也不会出现进程之间的GIL争抢。但这样的话也会带来很多其他问题，比如进程间数据通讯和同步的困难。

2. 多线程也不是这么一无是处，在IO密集型操作时，用多线程还是有效果的，不会比多进程差，甚至会更好。

3. 用其他解析器。像JPython和IronPython这样的解析器由于实现语言的特性，他们不需要GIL的帮助。然而由于用了Java/C#用于解析器实现，他们也失去了利用社区众多C语言模块有用特性的机会。所以这些解析器也因此一直都比较小众。毕竟功能和性能大家在初期都会选择前者。

4. 等待GIL的改进。python社区也在非常努力的不断改进GIL，甚至是尝试去除GIL。并在各个小版本中有了不少的进步。

总结

由于GIL涉及到底层实现，比较复杂，想要完全搞明白还是很困难的。但是只要记住2点：

1. 在IO密集型型操作下，多线程还是可以的。比如在网络通信，time.sleep()延时的时候。

2. 在CPU密集型操作下，多线程性能反而不如单线程，此时只能用多进程。