多任务
进程
- 在
Python
程序中,想要实现多任务可以使用进程完成,进程是实现多任务的一种方式。 - 概念:一个正在运行的程序或者软件就是一个进程,他是操作系统进行资源分配的基本单位(最小单位(内存、时间片等)),也就是说每启动一个进程,操作系统都会给其分配一定的运行资源(内存资源)保证进程的运行。
- 进程与线程的区别:现实生活中的公司可以理解成是一个进程,公司提供办公资源(电脑、办公桌椅等),真正干活的是员工,员工可以理解成线程。
- 说明:多进程可以完成多任务,每个进程就好比一家独立的公司,每个公司都各自运营,每个进程也各自在运行、执行各自的任务。
进程的5种状态
多进程的使用
Process
进程类的说明
Process([group [, target [, name [, args [, kwargs]]]]])
# group:指定进程组,目前只能使用None
# target:执行的目标任务名
# name:进程名字
# args:以元组方式给执行任务传参
# kwargs:以字典方式给执行任务传参
Process
创建实例对象的常用方法
process.start() # 启动子进程实例(创建子进程)
process.join() # 等待子进程执行结束
process.terminate() # 不管任务是否完成,立即终止子进程
Process
创建实例对象的常用属性
-
name
:当前进程的别名,默认未Process-N
,N
为从1开始递增的整数。
多进程案例步骤:
- ①导入
multiprocessing
多进程模块
import os # 获取进程id
import time # 手动让进程的时间片执行完毕
import multiprocessing # 导入多进程模块
- ②创建进程
process = multiprocessing.Process(target=要调用的进程, args=(,))
# 注意args,即便一个参数也要加()和,因为让传入元组
# 具体可以看“Python基础学习笔记”种的“元组”
- ③启动进程
process.start()
- ④其他方法
# 获取进程id
os.getid()
# 获取当前进程父进程的id
os.getppid()
os.kill(进程id, 信号)
# 获取当前进程对象
multiprocessing.current_process()
完整代码
import os
import time
# 第一步:导如多进程模块
import multiprocessing
# 唱歌函数
def sing(singer, song):
for i in range(5):
print(f"{singer}正在唱《{song}》,进程的ID{os.getpid()},"
f"进程的父进程的ID{os.getppid()},"
f"进程的信息{multiprocessing.current_process()}")
if i == 3:
# 杀死进程,第一参数是进程id,第二个参数是信号,9代表杀死进程
# (这里输入随便一个信号好像都能杀死进程)
os.kill(os.getpid(), 9)
time.sleep(0.1)
# 跳舞函数
def dance(dancer, dance_song):
for i in range(5):
print(f'{dancer}正在跳{dance_song}的舞曲,进程IDP{os.getpid()},'
f'父进程的ID{os.getppid()},'
f'进程信息{multiprocessing.current_process()}')
time.sleep(0.1)
# 主函数
if __name__ == '__main__':
# 第二步:创建进程
sing_process = multiprocessing.Process(target=sing, args=('杨幂', '爱的供养'))
dance_process = multiprocessing.Process(target=dance, kwargs={'dancer': '刘恺威', 'dance_song': '分手快乐'})
# 第三步:启动进程
sing_process.start()
dance_process.start()
# 主程序信息
print(f"主程序ID:{os.getpid()},父进程的ID{os.getppid()},"
f"主程序信息{multiprocessing.current_process()}")
程序执行过程分析图
进程注意点(2条)
①进程之间不共享全局变量
- 我们常把进程比作公司,不同进程就是不同的公司,他们怎么可能共享自己资源呢。
- 老师的解释:创建子进程会对主进程资源进行拷贝,也就是说子进程是主进程的一个副本,好比是一对双胞胎,之所以进程之间不共享全局变量,是因为操作的不是同一个进程里面的全局变量,只不过不同进程里面的全局变量名字相同而已。
进程对象.join()
- 表示阻塞等待进程执行完毕。参数
timeout
表示当进程执行了多少秒后还没执行完就放出资源。
- 阻塞等待谁?
join在哪儿执行(写在哪儿:下面程序阻塞的是主进程),哪个进程就阻塞。 - 等待哪个进程完成?
哪个进程调用的,就等待哪个进程执行完毕。
import time
# 第一步:导入多线程模块
import multiprocessing
# 全局变量
g_list = []
# 向全局变量种追加数字的函数
def add_num():
for i in range(5):
g_list.append(i)
print(f'“{i}”添加成功')
# 手动让他失去时间片
time.sleep(0.1)
print('添加数字的进程执行的全局变量:', g_list)
# 读取全局变量的函数
def read_list():
print("读取全局变量的进程:", g_list)
if __name__ == '__main__':
# 创建进程
add_num_process = multiprocessing.Process(target=add_num)
read_list_process = multiprocessing.Process(target=read_list)
# 启动进程
add_num_process.start()
# 添加数字的进程执行完毕
add_num_process.join()
read_list_process.start()
# 主进程的全局
print("主进程的全局变量:", g_list)
②主进程会等待所有子进程执行结束再结束
- 不做任何设置让程序自由发挥会发现,如上图所示:主进程会等待所有子进程执行结束再结束。
- 两种方式设置当主进程结束的时候子进程也结束:
- 方式一:设置子进程的
deamon
属性为True
(守护主进程)
- 1.1在创建进程的时候设置
deamon
参数为True
- 1.2在启动进程之前设置进程对象的
deamon
属性为True
- 方式二:主进程结束时,调用子进程对象的
terminate
方法使之结束
import time
import multiprocessing
g_list = []
def add_num_to_g_list():
for i in range(5):
g_list.append(i)
print(f'“{i}”添加到全局变量成功!')
time.sleep(0.1)
print("添加数据进程最终的全局变量:", g_list)
if __name__ == '__main__':
# 方式一:1.1创建进程时设置参数
process = multiprocessing.Process(target=add_num_to_g_list,
daemon=True)
# 方式一:1.2在启动之前设置为守护进程
# process.daemon = True
process.start()
time.sleep(0.1)
print('主进程到此执行结束')
# 方式二:主进程结束的时候,手动调用terminate使进程结束
# process.terminate()