Python中多进程深入解析

进程:正在进行的一个过程或者说一个任务,而负责执行任务的是CPU。

进程和程序的区别

程序仅仅是一堆代码而已,而进程指的是程序的运行过程。

举例

想象以为有着一手好厨艺的科学家肖亚飞正在为自己的女儿烘焙蛋糕,他有着做生日蛋糕的食谱,厨房里有所需要的原料:面粉、鸡蛋、韭菜、蒜泥等。

在这个比喻中

做蛋糕的食谱就是程序(即用适当形式描述的算法)

计算机科学家就是处理器(CPU)

而做蛋糕的各种原料就是输入数据

进程就是厨师阅读食谱、取来各种原料以及烘焙蛋糕等一系列动作的总和

现在假设科学家的儿子哭着跑了进来,说:我的头被蜇伤了

科学家想了想,处理儿子蜇伤的任务比给女儿烘焙蛋糕的任务更重要,于是

科学家就记录下了他照着食谱做到哪儿了(保存进程的当前状态),然后拿出一本急救手册,按照其中的指示处理蜇伤。这里,我们看到处理机从一个进程(做蛋糕)切换到另一个高优先级(实施医疗救治),每个进程拥有各自的程序(食谱和急救手册)。当蜇伤处理完之后,这位科学家又回来做蛋糕,从他离开时的那一步继续做下去。

需要强调的是:同一个程序执行两次,那也是两个进程,比如打开暴风影音,虽然都是一个软件,但是一个可以播放走火,一个可以播放爱国者。

并发和并行

无论是并发还是并行,在用户看来都是‘同时’运行的,不管是进程还是线程,都只是一个任务而已,真实干活的是CPU,CPU做这些任务,而一个CPU同一时刻只能执行一个任务。

并发:是伪并行,即看起来是同时运行。单个CPU+多道技术就可以实现并发


举例:(单核+多道,实现多个进程的并发执行)

我在一个时间段内有很多事情要做:王者荣耀上分、看《爱国者》、交女朋友,但是我在同一时刻只能做一个任务(CPU在同一时间只能干一个活),如何才能玩出多个任务并发执行的效果呢?

就是我先打两局王者荣耀,然后看一会电视剧,再去和女朋友聊聊天......这样就保证了每个任务都在进行中。

并行:同时运行,只有具备多个CPU才能实现并行


单核下,可以利用多道技术,多个核,每个核也都可以利用多道技术(多道技术是针对单核而言的)

有4个核,有6个任务,这样同一时间有4个任务就被分配了,假设分别分配给了cpu1、cpu2、cpu3、cpu4,一旦在任务1中遇到I/O堵塞就被迫中断执行,此时任务5就拿到cpu1的时间片去执行,这就是单核下的多道技术。

而一旦任务1的I/O结束了,操作系统会重新调用它(需要知道进程的调度、分配给哪个cpu运行,由操作系统说了算),可能会分配给4个cpu的任意一个去执行

进程的创建

但凡是硬件,都需要有操作系统去管理,只要有操作系统,就有进程的概念,就需要有创建进程的方式,一些操作系统只为了一个应用程序设计,比如微波炉中的控制器,一旦启动微波炉,所有的进程都已经存在。

而对于通用系统(跑很多应用程序),需要有系统运行过程中创建或者撤销进程的能力,主要分为4种形式创建新的进程:

1.系统初始化(查看进程linux中用ps命令,windows中要用任务管理器,前台进程负责与用户交互,后台运行的程序与用户无关,运行在后台并且只在需要时被唤醒的进程,称为守护进程,如:电子邮件、web界面、打印)
2.一个进程在运行过程中开启了子进程(如:nginx开启多进程,os.fork,subprocess.Popen等)
3.用户的交互式请求,而创建了一个新的进程(如:用户双击暴风影音)
4.一个批处理作业的初始化(只在大型机的批处理系统中应用)

无论哪一种,新进程的创建都是由一个已经存在的进程执行了一个用于创建进程的系统调用而创建的:

1.在UNIX系统中,该系统调用的是fork,fork会创建一个与父进程一模一样的副本,二者拥有相同的存储映像、同样的环境字符串和同样的打开文件(在shell解释器进程中,执行一个命令就会创建一个子进程)

2.在windows中该系统调用的是CreateProcess,CreateProcess既处理进程的创建,也负责把正确的程序装入新进程

关于创建子进程,unix和windows的相同点和不同点

相同点:进程创建后,父进程和子进程有各自不同的地址空间(多道技术要求物理层面实现进程之间内存的隔离),任何一个进程的在其地址空间中的修改都不会影响到另外一个进程

不同点:在UNIX中,子进程的初始地址空间是父进程的一个副本,提示:子进程和父进程是可以有只读的共享内存区的。但是在windows中,从一开始父进程和子进程的地址空间就是不同的。

进程的状态

运行态:应用程序正在被CPU执行中

阻塞态:当前进程突然要做I/O操作,然后CPU去执行其他的程序

就绪态:时刻准备着能够被执行

好了,讲了这么多理论知识,现在就让我们看看如何开启进程的吧?

开启进程的两种方式

# 开启进程的第一种方式

from multiprocessing import Process
import time

def task(name):
    print('%s is running'%name)
    time.sleep(2)
    print('%s is done'%name)

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/942b8ff73ff4d41252705a0d573d82eb.html