python 多线程是伪

原创

mob64ca12e86bd4 2024-10-02 06:49:43 ©著作权

©著作权归作者所有：来自51CTO博客作者mob64ca12e86bd4的原创作品，请联系作者获取转载授权，否则将追究法律责任

Python 多线程是伪？——深入探索 Python 中的多线程

在编程中，我们常常需要处理多个任务以提高效率和性能。大多数编程语言都提供了多线程的支持，而 Python 也不例外。然而，许多开发者对此存在疑问：Python 的多线程真的有效吗？在这篇文章中，我们将探讨 Python 中的多线程模型，了解它的局限性，以及如何使用它。

什么是多线程？

多线程是一种实现并发的技术，允许多个线程在同一进程中运行。每个线程可以在其自己的栈空间中执行任务，并且能够共享进程的内存和资源。

在很多语言中，多线程可以显著提高程序的响应性和性能，但在 Python 中，由于其特殊的设计和实现，这种期望并不总是能够实现。

GIL：全局解释锁（Global Interpreter Lock）

要了解 Python 的多线程为何被称为“伪”，我们首先需要了解 GIL，即全局解释锁。GIL 是 CPython 实现中的一个机制，确保同一时间只有一个线程执行 Python 字节码。这意味着，即使在多核处理器上，Python 线程也无法充分利用多个 CPU 核心。

引文：“因为 GIL 的存在，CPU 密集型任务的多线程并不会带来性能提升。”

Python 的线程模块示例

尽管 GIL 的存在会限制多线程的性能，但这并不意味着我们不能使用它。对于 I/O 密集型任务，比如网络请求或文件操作，多线程仍然可以发挥作用。

以下是一个简单的多线程示例，演示如何使用 Python 的 threading 模块来下载多个网页：

import threading
import requests

# 下载网页的函数
def download_url(url):
    response = requests.get(url)
    print(f'Downloaded {url} with length {len(response.content)} bytes')

# 网页列表
urls = [
    '
    '
    '
]

# 创建线程
threads = []
for url in urls:
    thread = threading.Thread(target=download_url, args=(url,))
    threads.append(thread)
    thread.start()

# 等待所有线程完成
for thread in threads:
    thread.join()

print('All downloads completed!')

代码分析

定义线程任务：我们定义了一个 download_url 函数来下载并打印网页内容。
创建线程：我们用 threading.Thread 创建每个线程，传入下载函数和参数。
启动与等待：使用 start() 方法启动每个线程，最后用 join() 等待所有线程完成。

性能影响：I/O 密集型 vs CPU 密集型

在实际应用中，Python 的多线程主要适用于 I/O 密集型的工作。例如，处理网络请求或文件操作时，线程会在等待数据时释放 GIL，允许其他线程运行。然而，对于 CPU 密集型任务，比如计算密集型算法，多线程可能不会带来性能提升。

import time

def cpu_heavy_computation():
    sum = 0
    for i in range(10**7):
        sum += i
    print(f'Sum: {sum}')

# 创建多个线程来进行 CPU 密集型计算
threads = []
for _ in range(4):
    thread = threading.Thread(target=cpu_heavy_computation)
    threads.append(thread)
    thread.start()

for thread in threads:
    thread.join()

性能分析

在上面的代码中，即使我们创建了多个线程，所有的计算依然会受到 GIL 的限制，最终性能表现可能并不会比单线程好了太多。

选择其他并发模型

由于 GIL 的限制，Python 开发者通常会选择其他并发模式，比如使用多进程（multiprocessing 模块）或异步编程（asyncio 模块）。多进程可以在多个 CPU 核心上并行运行，不受 GIL 的影响，而异步编程则适用于大量的 I/O 操作。

以下是使用 multiprocessing 模块的示例：

from multiprocessing import Pool

def cpu_heavy_computation(n):
    sum = 0
    for i in range(n):
        sum += i
    return sum

if __name__ == '__main__':
    with Pool(processes=4) as pool:
        results = pool.map(cpu_heavy_computation, [10**7]*4)
    print(f'Sums: {results}')

代码分析

使用 Pool 创建进程池。
利用 map 方法在多个进程中并行计算。

序列图：多线程与多进程的对比

以下是一个简单的序列图，展示了多线程与多进程模型的比较：

sequenceDiagram
    participant Main
    participant Thread1 as Thread 1
    participant Thread2 as Thread 2
    participant Process1 as Process 1
    participant Process2 as Process 2

    Main->>Thread1: Start Thread 1
    Main->>Thread2: Start Thread 2
    Thread1->>Thread2: Waiting for I/O
    Thread2->>Thread1: Waiting for I/O

    Main->>Process1: Start Process 1
    Main->>Process2: Start Process 2
    Process1->>Process2: Running concurrently
    Process2->>Process1: Running concurrently

结尾

在 Python 中，多线程技术虽然由于 GIL 的存在受到了限制，但它仍然可以有效处理 I/O 密集型任务。为了充分利用计算资源，开发者可以选择多进程或异步编程模型。虽然 Python 的多线程是“伪”，但合理使用它，仍然能够在某些场景中带来好处。

希望这篇文章能帮助你更好地理解 Python 中的多线程，如果你有任何问题或建议，欢迎在评论区留言！

上一篇：python超级鹰识别极验

下一篇：python 字符串保存 json

提问和评论都可以，用心的回复会被更多人看到评论

发布评论

相关文章

官方博客	全部文章	热门标签	班级博客
了解我们	网站地图	意见反馈

鸿蒙开发者社区	51CTO学堂
51CTO	软考资讯

python 多线程 是伪

python 多线程 是伪

Python 多线程是伪？——深入探索 Python 中的多线程

什么是多线程？

GIL：全局解释锁（Global Interpreter Lock）

Python 的线程模块示例

代码分析

性能影响：I/O 密集型 vs CPU 密集型

性能分析

选择其他并发模型

代码分析

序列图：多线程与多进程的对比

结尾

51CTO博客

python 多线程是伪

python 多线程是伪