为什么Python的多线程是假的

原创

mob649e8156b567 2024-09-11 07:23:23 ©著作权

文章标签 多线程 Python 斐波那契数 文章分类 Python 后端开发

©著作权归作者所有：来自51CTO博客作者mob649e8156b567的原创作品，请联系作者获取转载授权，否则将追究法律责任

为什么Python的多线程是假的

在现代编程中，多线程是一种常见的并发处理方式，能够在多个线程中同时执行任务。但在Python中，由于全局解释器锁(Global Interpreter Lock, GIL)的存在，许多人认为Python的多线程并不能真正实现并行。这导致了“Python的多线程是假的”这一说法。本文将详细探讨这一话题，并且通过代码示例和序列图来帮助理解。

1. 什么是GIL？

GIL是Python解释器的一部分，它确保在同一时间只有一个线程能够执行Python字节码。尽管线程可以在不同的CPU核心上切换，但由于GIL的存在，实际上它们是串行执行的。这意味着如果你的程序中有CPU密集型的任务，多线程并不会提高性能，反而会因为上下文切换的开销而导致效率降低。

表格一：GIL对比

语言	是否存在GIL	并发方式
Python	是	线程
Java	否	多线程
C++	否	多线程、进程
Go	否	协程

2. Python的多线程并不能真正并行

本节将通过示例代码来解释为什么在Python中，多线程无法实现真正的并行。

示例代码1：计算斐波那契数

下面的代码展示了如何使用多线程来计算斐波那契数：

import threading
import time

def fibonacci(n):
    if n <= 1:
        return n
    else:
        return fibonacci(n-1) + fibonacci(n-2)

def threaded_fibonacci(n):
    print(f"Starting calculation for fib({n})")
    result = fibonacci(n)
    print(f"Result for fib({n}) is {result}")

if __name__ == "__main__":
    threads = []
    start_time = time.time()

    for i in range(10, 15):
        thread = threading.Thread(target=threaded_fibonacci, args=(i,))
        threads.append(thread)
        thread.start()

    for thread in threads:
        thread.join()

    end_time = time.time()
    print(f"Total time taken: {end_time - start_time:.4f} seconds")

在这个示例中，虽然我们创建了多个线程来计算斐波那契数，但实际上，由于GIL的存在，线程间并没有实现真正的并行处理。你会发现程序的执行速度并没有显著加快，甚至可能更慢。

3. CPU密集型和I/O密集型

在Python中，需要区分CPU密集型和I/O密集型任务。对于CPU密集型任务，由于GIL的限制，多线程无法发挥优势。而对于I/O密集型任务，例如网络请求或文件操作，多线程可以提高性能，因为I/O操作可以释放GIL，从而允许其他线程运行。

示例代码2：I/O密集型任务

下面的代码展示了一个使用线程进行I/O操作的示例：

import threading
import time
import requests

def download_url(url):
    print(f"Starting download from {url}")
    response = requests.get(url)
    print(f"Finished downloading {url} with status code {response.status_code}")

if __name__ == "__main__":
    urls = [
        "
        "
        "
    ]
    
    threads = []
    start_time = time.time()

    for url in urls:
        thread = threading.Thread(target=download_url, args=(url,))
        threads.append(thread)
        thread.start()

    for thread in threads:
        thread.join()

    end_time = time.time()
    print(f"Total time taken: {end_time - start_time:.4f} seconds")

在这个示例中，我们使用多线程来并行下载多个网页。由于网络操作是I/O密集型，无需在每次请求时持有GIL，因此这种情况下多线程能够提高效率，显著缩短总下载时间。

4. 如何真正实现并行？

为了在Python中实现真正的并行处理，通常推荐使用多进程（multiprocessing模块）或其他并行库，例如concurrent.futures。这些方法可以绕过GIL的限制，使得在多个核心上同时执行任务成为可能。

示例代码3：使用多进程

以下是使用多进程来计算斐波那契数的示例：

import multiprocessing
import time

def fibonacci(n):
    if n <= 1:
        return n
    else:
        return fibonacci(n-1) + fibonacci(n-2)

def worker(n):
    print(f"Starting calculation for fib({n})")
    result = fibonacci(n)
    print(f"Result for fib({n}) is {result}")

if __name__ == "__main__":
    with multiprocessing.Pool(processes=4) as pool:
        start_time = time.time()
        results = pool.map(worker, range(10, 15))
        
    end_time = time.time()
    print(f"Total time taken: {end_time - start_time:.4f} seconds")

这里我们使用multiprocessing.Pool来创建进程池，每个进程都能在不同的CPU核心上并行运行。这种方式能显著改善计算速度，尤其是对于CPU密集型任务。

5. 序列图：多线程与多进程的对比

为了更好地理解多线程与多进程之间的区别，我们可以使用序列图进行可视化。

sequenceDiagram
    participant T1 as 线程1
    participant T2 as 线程2
    participant P1 as 进程1
    participant P2 as 进程2

    T1->>T2: 创建线程
    T1->>T1: 执行任务1
    T2->>T2: 执行任务2
    T1->>T2: 完成任务

    P1->>P1: 执行任务1
    P2->>P2: 执行任务2
    P1->>P2: 完成任务

在图中，我们可以看到多线程之间的任务是交替进行的，而多进程可以真正并行地执行。这进一步证实了我们在前面提到的关于GIL的影响。

结论

综上所述，Python的多线程由于GIL的存在，无法实现真正的并行处理。虽然在I/O密集型任务中可能会有所提高，但对于CPU密集型的任务，多线程的效果往往不如使用多进程或者其他并行处理方式。对程序员来说，了解并选择合适的并发模式是提升Python应用性能的关键。在实际项目中，根据任务的特性谨慎选择使用多线程、多进程或异步编程，能使程序更高效。

上一篇：Java 加密后的入参格式

下一篇：python 显示三位整数

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯