一,multiprocessing模块结束
python中的多线程无法利用多核优势,如果想要充分地使用多核CPU的资源(os.cpu_count()查看),在python中大部分情况需要使用多进程。Python提供了multiprocessing。
multiprocessing模块用来开启子进程,并在子进程中执行我们定制的任务(比如函数),该模块与多线程模块threading的编程接口类似。multiprocessing模块的功能众多:支持子进程、通信和共享数据、执行不同形式的同步,提供了Process、Queue、Pipe、Lock等组件。
需要再次强调的一点是:与线程不同,进程没有任何共享状态,进程修改的数据,改动仅限于该进程内。
二,Process类的介绍
p=Process(target=task,args=('子进程',))
#由该类实例化得到的对象,表示一个子进程中的任务(尚未启动)
强调:
1,args指定的为传给target函数的位置参数,是一个元祖形式,如果只有一个参数的话,一定记住加逗号。
2.target表示调用对象,即子进程要执行的任务。
3.args表示调用对象的位置参数元祖。
4 . p.start() 只是在向操作系统发送一个开启子进程的信号。
三,创建并开启子进程的两种方式:
方式一:(用默认类的方式)
# from multiprocessing import Process # import time # # def task(x): # print('%s is running' %x) # time.sleep(3) # print('%s is done' %x) # # if __name__ == '__main__': # # Process(target=task,kwargs={'x':'子进程'}) # p=Process(target=task,args=('子进程',)) # 如果args=(),括号内只有一个参数,一定记住加逗号 # p.start() # 只是在操作系统发送一个开启子进程的信号 # # print('主') 方式二:(自定义类的方式)
# from multiprocessing import Process # import time # # class Myprocess(Process): #自定义类 # def __init__(self,x): # super().__init__() # self.name=x # # def run(self): #把子进程想执行的任务放到run下面的函数体代码 # print('%s is running' %self.name) #self是p # time.sleep(3) # print('%s is done' %self.name) # # if __name__ == '__main__': # p=Myprocess('子进程1') # p.start() #等于是自动调用 p.run() # print('主')
补充: 僵尸进程和孤儿进程
一:僵尸进程(有害) 僵尸进程:一个进程使用fork创建子进程,如果子进程退出,而父进程并没有调用wait或waitpid获取子进程的状态信息,那么子进程的进程描述符仍然保存在系统中。这种进程称之为僵死进程。
父进程代码运行完毕后,等待子进程代码运行完进入僵尸状态(保留PID,其他都没了,就叫僵尸状态),最后父进程统一发起回收 子进程僵尸的操作。
二:孤儿进程(无害) 孤儿进程:一个父进程退出,而它的一个或多个子进程还在运行,那么那些子进程将成为孤儿进程。孤儿进程将被init进程(进程号为1)所收养,并由init进程对它们完成状态收集工作。 四,进程内存空间彼此隔离
from multiprocessing import Processn=100 #在windows系统中应该把全局变量定义在if __name__ == '__main__'之上就可以了def work(): global n n=0 print('子进程内: ',n)if __name__ == '__main__': p=Process(target=work) p.start() print('主进程内: ',n) 用以上方法来证明,内存空间是彼此隔离的。 在子进程中用global声明了全局变量,且把n=100改为0,当主进程进行打印的时候,n=100没变,说明内存空间是隔离的。 五,进程对象的方法或属性详解。 join方法 join方法,是父进程在原地等,等到子进程运行完毕后,才执行下一行代码
#1、join # from multiprocessing import Process # import time # # def task(name): # print('%s is running ' %name) # time.sleep(3) # print('%s is done ' % name) # # # if __name__ == '__main__': # p=Process(target=task,args=('子进程1',)) # p.start() # p.join() # 让父进程在原地等待,等到子进程运行完毕后,才执行下一行代码 # print('主')
启动进程与join进程可以简写为:
# from multiprocessing import Process # import time # # def task(name,n): # print('%s is running ' %name) # time.sleep(n) # print('%s is done ' % name) # # # if __name__ == '__main__': # # p_l=[] # start=time.time() # for i in range(1,4): # p=Process(target=task,args=('子进程%s' %i,i)) # p_l.append(p) # p.start() # # # print(p_l) # for p in p_l: # p.join() # # stop=time.time() # # print('主',(stop-start))
PID方法: 是进程的ID号 p1子进程是在父进程中造出来的。在父进程中查看子进程的ID,用p1.pid 如果在子进程中看自己的ID,用 os.getpid() 一,父进程内查看子PID的方式:
# pid # from multiprocessing import Process # import time # import os # # def task(n): # print('%s is running ' %os.getpid()) # time.sleep(n) # print('%s is done ' % os.getpid()) # # # if __name__ == '__main__': # p1=Process(target=task,args=(10,)) # # print(p1.pid) # p1.start() # print(p1.pid) # 父进程内查看子pid的方式 # print('主') 二,查看父进程自己的PID(用 os.getppid())
from multiprocessing import Process import time import os def task(): print('自己的id:%s 父进程的id:%s ' %(os.getpid(),os.getppid())) time.sleep(200) if __name__ == '__main__': p1=Process(target=task) p1.start() print('主',os.getpid(),os.getppid()) # 爹=》主--》儿子