在了解多线程前先给大家介绍下并发和并行:
并发:多个任务一起执行 在多任务之间快速切换处理 任务数量大于cpu核数
并行:一个cpu核处理一个任务,多个cpu核同时处理多个任务 任务数量等于或者小于cpu核数
再介绍下同步和异步 :
同步:指线程在访问某一资源时,获得了资源的返回结果之后才会执行其他操作(先做某件事,再做某件事)
异步: 与同步相对,是指线程在访问某一资源时,无论是否取得返回结果,都进行下一步操作;当有了资源返回结果时 系统自会通知线程
在Python中,使用threading库来创建多线程
import threading
def func1():
for i in range(6):
time.sleep(1)
def func2():
for i in range(5):
time.sleep(1)
# 创建线程对象
t2 = threading.Thread(target=func2) # target = 方法名
t1 = threading.Thread(target=func1, name='线程1') # 可以设置线程名字
# start 启动线程活动
# join([time]) 设置主线程会等待time秒后再往下执行,time默认为子线程结束,多个子线程之间设置的值会增加
# isAlive 返回线程是否活动的
# getName() 返回线程名
# setName() 设置线程名
a = time.time()
t2.start() # 开始执行线程2
t1.start() # 开始执行线程1
# 让主线程等待子线程执行完后再继续往下执行 同步的概念
t2.join()
t1.join()
b = time.time()
c = b - a
print(c)
threading.currentThread() # 返回当前执行的线程
threading.enumerate() # 返回正在运行的所有线程(list) 正在运行指:启动后、结束前,不包括了启动前和终止后的线程
threading.activeCount() # 返回正在运行的线程数量
在threading库中调用start方法后,start方法调用了他内部的run()方法,我们可以通过继承threading重写run()方法来批量创建线程,代码如下
import threading
import requests
import time
# 通过继承 threading 类来创建线程 重写run方法 因为start方法调用的就是run 重写run
class MyClass(threading.Thread):
def __init__(self, url):
self.url = url
super().__init__() # 如果要传入参数重写init方法时,一定要调用父类的init方法
# 发送requests请求
def run(self):
res = requests.get(self.url)
print('线程{},返回{}'.format(threading.current_thread(), res.status_code))
t1 = time.time()
for i in range(5):
t = MyClass('https://www.baidu.com')
t.start()
t.join()
t2 = time.time()
print(t2 - t1)
可以通过直接实例化类来创建线程对象,如果要传入参数,在重写init方法时要注意在最后调用父类的init方法,具体原因可以去查看thrreading库是如何实现的,在init方法中有很多其他的代码需要执行。
多线程共享全局变量:
在python中是使用单核来处理线程的,也就是并发并非并行,代码示例如下:
import threading
a = 100
def func1():
for i in range(100000):
global a
a += 1
print(a)
def func2():
for i in range(100000):
global a
a += 1
print(a)
t1 = threading.Thread(target=func1)
t2 = threading.Thread(target=func2)
t1.start()
t2.start()
当执行func1()方法时,获取全局变量为100,此时暂停切换到func2()方法,获取全局变量a为100,并进入for循环,当a循环到20000时(举例),又切换到func1()方法中开始执行for循环,此时在func1()中a的值为100,循环1次后把a的值又更新为101,造成数据不准确。
解决这个问题会用到互斥锁、同步、队列,在下一篇会给大家讲到