在了解多线程前先给大家介绍下并发和并行:

   并发:多个任务一起执行 在多任务之间快速切换处理 任务数量大于cpu核数

   并行:一个cpu核处理一个任务,多个cpu核同时处理多个任务 任务数量等于或者小于cpu核数 

再介绍下同步和异步 :

  同步:指线程在访问某一资源时,获得了资源的返回结果之后才会执行其他操作(先做某件事,再做某件事) 

  异步: 与同步相对,是指线程在访问某一资源时,无论是否取得返回结果,都进行下一步操作;当有了资源返回结果时 系统自会通知线程

在Python中,使用threading库来创建多线程

import threading


def func1():
    for i in range(6):
        time.sleep(1)


def func2():
    for i in range(5):
        time.sleep(1)


# 创建线程对象
t2 = threading.Thread(target=func2)  # target = 方法名
t1 = threading.Thread(target=func1, name='线程1')  # 可以设置线程名字
# start 启动线程活动
# join([time]) 设置主线程会等待time秒后再往下执行,time默认为子线程结束,多个子线程之间设置的值会增加
# isAlive 返回线程是否活动的
# getName() 返回线程名
# setName() 设置线程名

a = time.time()
t2.start()  # 开始执行线程2
t1.start()  # 开始执行线程1
# 让主线程等待子线程执行完后再继续往下执行 同步的概念
t2.join()
t1.join()
b = time.time()
c = b - a
print(c)

threading.currentThread()  # 返回当前执行的线程
threading.enumerate()  # 返回正在运行的所有线程(list) 正在运行指:启动后、结束前,不包括了启动前和终止后的线程
threading.activeCount()  # 返回正在运行的线程数量

在threading库中调用start方法后,start方法调用了他内部的run()方法,我们可以通过继承threading重写run()方法来批量创建线程,代码如下

import threading
import requests
import time


# 通过继承 threading 类来创建线程 重写run方法  因为start方法调用的就是run 重写run
class MyClass(threading.Thread):
    def __init__(self, url):
        self.url = url
        super().__init__()  # 如果要传入参数重写init方法时,一定要调用父类的init方法

    # 发送requests请求

    def run(self):
        res = requests.get(self.url)
        print('线程{},返回{}'.format(threading.current_thread(), res.status_code))


t1 = time.time()
for i in range(5):
    t = MyClass('https://www.baidu.com')
    t.start()
t.join()
t2 = time.time()
print(t2 - t1)

可以通过直接实例化类来创建线程对象,如果要传入参数,在重写init方法时要注意在最后调用父类的init方法,具体原因可以去查看thrreading库是如何实现的,在init方法中有很多其他的代码需要执行。

多线程共享全局变量:

在python中是使用单核来处理线程的,也就是并发并非并行,代码示例如下:

import threading

a = 100


def func1():
    for i in range(100000):
        global a
        a += 1
    print(a)


def func2():
    for i in range(100000):
        global a
        a += 1
    print(a)


t1 = threading.Thread(target=func1)
t2 = threading.Thread(target=func2) 
t1.start() 
t2.start()

当执行func1()方法时,获取全局变量为100,此时暂停切换到func2()方法,获取全局变量a为100,并进入for循环,当a循环到20000时(举例),又切换到func1()方法中开始执行for循环,此时在func1()中a的值为100,循环1次后把a的值又更新为101,造成数据不准确。

解决这个问题会用到互斥锁、同步、队列,在下一篇会给大家讲到