1. 多任务

在计算机中,操作系统可以同时运行多个任务,这就是多任务。那么如何解决多个任务同时运行呢,那就需要用到多线程。多任务可以通过并发和并行来完成,那么什么是并发和并行呢?

  • 并发:指的是任务数多于cpu核数,通过操作系统的各种任务调度算法,实现用多个任务“一起”执行(实际上总有一些任务不在执行,因为切换任务的速度相当快,看上去一起执行而已),在实际开发中,并发是最常用的。
  • 并行:当任务数小于或者等于cpu核数时,每一个任务都有对应的cpu来处理执行,即任务真的是一起执行的。

2. 多任务的实现-多线程

实现多任务需要用到多线程,那么什么是线程呢?下面是对它的理解:

  • 一个程序运行起来至少有一个进程,一个进程至少有一个线程
  • 处理器cpu分配给线程,即cpu真正运行的是线程中的代码
  • 分配cpu给线程时,是通过时间片轮训方式进行的
  • 进程是操作系统分配程序执行资源的单位,而线程是进程的一个实体,是CPU调度和分配的单位。
实现多线程的2种方式:

python的thread模块是比较底层的模块,python的threading模块是对thread做了一些包装的,可以更加方便的被使用,通过threading模块可以创建线程

2.1 引入threading线程模块
import    threading,time 

def    download_music():

'''模拟下载歌曲,需要5秒钟下载完成'''

    for    i    in    range(5):

     time.sleep(1)# 休眠1秒

    print("---正在下载歌曲%d---"% i)

def    main():

    # 创建线程对象t1 ,target: 指向新开启的线程要执行的代码

    t1 = threading.Thread(target=download_music) 

    t1.start()# 启动线程,即线程开始执行

if__name__ =='__main__': 

     main()
2.2 继承Thread类,创建一个新的class,将要执行的代码 写到run函数里面
import    threading,time

# 自定义类,继承threading.Thread

class    MyThread(threading.Thread):

    def    run(self):

        for    i    in    range(5):

             time.sleep(1)

            # name属性中保存的是当前线程的名字

            msg ="I'm "+ self.name +' @ '+ str(i) 

             print(msg)

if__name__ =='__main__':

# 通过MyThread创建线程对象

    t1 = MyThread()

    # 开始执行线程

    t1.start()

3. 多线程的注意点

  • 子线程何时开启,何时运行
    当调用thread.start()时 开启线程,再运行线程的代码
  • 子线程何时结束
    子线程把target指向的函数中的语句执行完毕后,或者线程中的run函数代码执行完毕后,立即结束当前子线程
  • 查看当前线程数量
    通过threading.enumerate()可枚举当前运行的所有线程
  • 主线程何时结束
    所有子线程执行完毕后,主线程才结束
  • 线程的执行顺序
    多线程的创建与执行都是无序的。
  • 总结
  • 每个线程默认有一个名字,尽管上面的例子中没有指定线程对象的name,但是python会自动为线程指定一个名字。
  • 当线程的run()方法结束时该线程完成。
  • 无法控制线程调度程序,但可以通过别的方式来影响线程调度的方式。

4. 共享全局变量

先来看一段代码:

from    threading    import    Thread

import    time

g_nums = [11,22,33]

def    main():

    def    work1(nums):

        nums.append(44) 

         print("----in work1---",nums)

    def    work2(nums):

        #延时一会,保证t1线程中的事情做完

        time.sleep(1) 

         print("----in work2---",nums)

if    __name__ == '__main__':

    t1 = Thread(target=work1, args=(g_nums,))

    t1.start()

    t2 = Thread(target=work2, args=(g_nums,))

    t2.start()

运行结果:

----inwork1--- [11,22,33,44]

----inwork2--- [11,22,33,44]

总结:

在一个进程内的所有线程共享全局变量,很方便在多个线程间共享数据

缺点就是,多线程对全局变量随意遂改可能造成全局变量的混乱(即线程非安全)

5. 多线程开发可能遇到的问题

假设两个线程t1和t2都要对全局变量g_num(默认是0)进行加1运算,t1和t2都各对g_num加10次,g_num的最终的结果应该为20。

但是由于是多线程同时操作,有可能出现下面情况:

    在g_num=0时,t1取得g_num=0。此时系统把t1调度为”sleeping”状态,把t2转换为”running”状态,t2也获得g_num=0

    然后t2对得到的值进行加1并赋给g_num,使得g_num=1

    然后系统又把t2调度为”sleeping”,把t1转为”running”。线程t1又把它之前得到的0加1后赋值给g_num。

    这样导致虽然t1和t2都对g_num加1,但结果仍然是g_num=1。

所以,如果多个线程同时对同一个全局变量操作,会出现资源竞争问题,从而数据结果会不正确,即会遇到线程安全问题

6. 使用同步机制解决线程安全问题-互斥锁

同步就是协同步调,按预定的先后次序进行运行。如:你说完,我再说。

“同”字从字面上容易理解为一起动作,其实不是,”同”字应是指协同、协助、互相配合。

如进程、线程同步,可理解为进程或线程A和B一块配合,A执行到一定程度时要依靠B的某个结果,于是停下来,示意B运行;B执行,再将结果给A;A再继续操作。

在多线程编程里面,一些敏感数据不允许被多个线程同时访问,此时就使用同步访问技术,保证数据在任何时刻,最多有一个线程访问,以保证数据的正确性。

互斥锁:

当多个线程几乎同时修改某一个共享数据的时候,需要进行同步控制

线程同步能够保证多个线程安全访问竞争资源,最简单的同步机制是引入互斥锁。

互斥锁为资源引入一个状态:锁定/非锁定

某个线程要更改共享数据时,先将其锁定,此时资源的状态为“锁定”,其他线程不能更改;直到该线程释放资源,将资源的状态变成“非锁定”,其他的线程才能再次锁定该资源。互斥锁保证了每次只有一个线程进行写入操作,从而保证了多线程情况下数据的正确性。

threading模块中定义了Lock类,可以方便的处理锁定:

# 1.创建锁

mutex = threading.Lock()

#2. 锁定

mutex.acquire()

#3. 释放

mutex.release()

注意:

如果这个锁之前是没有上锁的,那么acquire不会堵塞

如果在调用acquire对这个锁上锁之前 它已经被 其他线程上了锁,那么此时acquire会堵塞,直到这个锁被解锁为止

示例:使用互斥锁完成2个线程对同一个全局变量各加100万次的操作

import    threading,time

g_num =0

def    test1(num):

    global    g_num

    for    i    in    range(num):

        mutex.acquire()# 上锁

        g_num +=1

        mutex.release()# 解锁

    print("---test1---g_num=%d"%g_num)

def    test2(num):

    global    g_num

    for    i    in    range(num): 

        mutex.acquire()# 上锁

        g_num +=1

        mutex.release()# 解锁

    print("---test2---g_num=%d"%g_num)

# 创建一个互斥锁,默认是未上锁的状态

mutex = threading.Lock()

# 创建2个线程,让他们各自对g_num加1000000次

p1 = threading.Thread(target=test1, args=(1000000,))

p1.start()

p2 = threading.Thread(target=test2, args=(1000000,))

p2.start()

# 等待计算完成

while    len(threading.enumerate()) !=1: 

     time.sleep(1)

print("2个线程对同一个全局变量操作之后的最终结果是:%s"% g_num)

运行结果:

---test1---g_num=1909909

---test2---g_num=2000000

2个线程对同一个全局变量操作之后的最终结果是:2000000

可以看到最后的结果,加入互斥锁后,其结果与预期相符。

上锁解锁过程:

当一个线程调用锁的acquire()方法获得锁时,锁就进入“locked”状态。

每次只有一个线程可以获得锁。如果此时另一个线程试图获得这个锁,该线程就会变为“blocked”状态,称为“阻塞”,直到拥有锁的线程调用锁的release()方法释放锁之后,锁进入“unlocked”状态。

线程调度程序从处于同步阻塞状态的线程中选择一个来获得锁,并使得该线程进入运行(running)状态。

7. 死锁

在线程间共享多个资源的时候,如果两个线程分别占有一部分资源并且同时等待对方的资源,就会造成死锁。

尽管死锁很少发生,但一旦发生就会造成应用的停止响应。下面看一个死锁的例子

import    threading ,time   

printer_mutex = threading.Lock()# 打印机锁

paper_mutext = threading.Lock()# 纸张锁

class    ResumeThread(threading.Thread):

"""编写个人简历任务的线程"""

    def    run(self):

        print("ResumeThread:编写个人简历任务")

        # 使用打印机资源,先对打印机加锁

        printer_mutex.acquire() 

         print("--ResumeThread:正在使用打印机资源--") 

         time.sleep(1)# 休眠1秒

        # 使用纸张耗材,先对纸张耗材加锁

        paper_mutext.acquire() 

        print("--正在使用纸张资源--") 

         time.sleep(1) 

         paper_mutext.release()# 释放纸张锁

        # 释放打印机锁

        printer_mutex.release()

class    PaperListThread(threading.Thread):

"""盘点纸张耗材任务的线程"""

    def    run(self):

        print("PaperListThread:盘点纸张耗材任务")

        # 使用纸张耗材,先对纸张耗材加锁

        paper_mutext.acquire() 

         print("--PaperListThread:正在盘点纸张耗材--")

         time.sleep(1)# 休眠1秒

        # 使用打印机资源,打印清单

        printer_mutex.acquire()

         print("--正在使用打印机资源--")

         time.sleep(1) 

         printer_mutex.release()# 释放打印机锁

        # 释放纸张耗材锁

        paper_mutext.release()

if__name__ =='__main__':

     t1 = ResumeThread()

     t2 = PaperListThread()

     t1.start() 

     t2.start()

从运行结果可以看出,两个线程都在等待对方释放资源,造成了死锁。

避免死锁的方式:

1.程序设计时要尽量避免

2.添加超时时间等