2、进程的使用

2.1 多进程完成多任务

2.1.1 导入进程模块

import multiprocessing
from multiprocessing import Process
2.1.2 Process进程类的语法结构如下：
Process([group [, target [, name [, args [, kwargs]]]]])
	group：指定进程组，目前只能使用None
	target：执行的目标任务名
	name：进程名字
	args：以元组方式给执行任务传参
	kwargs：以字典方式给执行任务传参
Process创建的实例对象的常用方法：
start()：启动子进程实例（创建子进程）
join([timeout])：是否等待子进程执行结束，或等待多少秒
terminate()：不管任务是否完成，立即终止子进程
Process创建的实例对象的常用属性：
name：当前进程的别名，默认为Process-N，N为从1开始递增的整数
pid：当前进程的pid（进程号）
2.1.3 多进程完成多任务代码
import multiprocessing
import time
def run_proc():
    """子进程要执行的代码"""
    while True:
        print("----2----")
        time.sleep(1)
if __name__=='__main__':
    # 创建子进程
    sub_process = multiprocessing.Process(target=run_proc)
    # 启动子进程
    sub_process.start()
    while True:
        print("----1----")
        time.sleep(1)
执行结果:
----1----
----2----
----1----
----2----
----1----
----2----
2.1.4 获取进程pid
import multiprocessing
import time
import os
def work():
    # 查看当前进程
    current_process = multiprocessing.current_process()
    print("work:", current_process)
    # 获取当前进程的编号
    print("work进程编号:", current_process.pid, os.getpid())
    # 获取父进程的编号
    print("work父进程的编号:", os.getppid())
    for i in range(10):
        print("工作中....")
        time.sleep(0.2)
        # 扩展： 根据进程编号杀死对应的进程
        os.kill(os.getpid(), 9)
if __name__ == '__main__':
    # 查看当前进程
    current_process = multiprocessing.current_process()
    print("main:", current_process)
    # 获取当前进程的编号
    print("main进程的编号:", current_process.pid)
    # 创建子进程
    sub_process = multiprocessing.Process(target=work)
    # 启动进程
    sub_process.start()
    # 主进程执行打印信息操作
    for i in range(20):
        print("我在主进程中执行...")
        time.sleep(0.2)
执行结果:
main: <_MainProcess(MainProcess, started)>
main进程的编号: 9552
我在主进程中执行...
我在主进程中执行...
我在主进程中执行...
我在主进程中执行...
work: <Process(Process-1, started)>
work进程编号: 5056 5056
work父进程的编号: 9552
工作中....
我在主进程中执行...
我在主进程中执行...
我在主进程中执行...
我在主进程中执行...
3、进程注意点
3.1 进程之间不共享全局变量
import multiprocessing
import time
# 定义全局变量
my_list = list()
# 写入数据
def write_data():
    for i in range(5):
        my_list.append(i)
        time.sleep(0.2)
    print("write_data:", my_list)
# 读取数据
def read_data():
    print(my_list)
if __name__ == '__main__':
    # 创建写入数据的进程
    write_process = multiprocessing.Process(target=write_data)
    read_process = multiprocessing.Process(target=read_data)
    write_process.start()
    # 主进程等待写入进程执行完成以后代码 再继续往下执行
    write_process.join()
    read_process.start()
执行结果:
write_data: [0, 1, 2, 3, 4]
read_data: []
注意:创建子进程其实是对主进程进行拷贝，进程之间相互独立，访问的全局变量不是同一个，所以进程之间不共享全局变量
3.2 主进程会等待所有的子进程执行完成程序再退出
import multiprocessing
import time
# 测试子进程是否执行完成以后主进程才能退出
def work():
    for i in range(10):
        print("工作中...")
        time.sleep(0.2)
if __name__ == '__main__':
    # 创建子进程
    work_process = multiprocessing.Process(target=work)
    work_process.start()
    # 让主进程等待1秒钟
    time.sleep(1)
    print("主进程执行完成了啦")
    # 总结： 主进程会等待所有的子进程执行完成以后程序再退出
执行结果:
工作中...
工作中...
工作中...
工作中...
工作中...
主进程执行完成了啦
工作中...
工作中...
工作中...
工作中...
工作中...
3.2.1 销毁子进程的代码
import multiprocessing
import time
# 测试子进程是否执行完成以后主进程才能退出
def work():
    for i in range(10):
        print("工作中...")
        time.sleep(0.2)
if __name__ == '__main__':
    # 创建子进程
    work_process = multiprocessing.Process(target=work)
    # 设置守护主进程，主进程退出后子进程直接销毁，不再执行子进程中的代码
    # work_process.daemon = True
    work_process.start()
    # 让主进程等待1秒钟
    time.sleep(1)
    print("主进程执行完成了啦")
    # 让子进程直接销毁，表示终止执行， 主进程退出之前，把所有的子进程直接销毁就可以了
    work_process.terminate()
    # 总结： 主进程会等待所有的子进程执行完成以后程序再退出
执行结果:
工作中...
工作中...
工作中...
工作中...
工作中...
主进程执行完成了啦
进程之间不共享全局变量
主进程会等待所有的子进程执行完成程序再退出
4、进程间通信-Queue
知道消息队列queue的放入值和获取值得操作
4.1 Queue的使用
可以使用multiprocessing模块的Queue实现多进程之间的数据传递，Queue本身是一个消息列队程序，首先用一个小实例来演示一下Queue的工作原理：
import multiprocessing
import time
if __name__ == '__main__':
    # 创建消息队列, 3:表示队列中最大消息个数
    queue = multiprocessing.Queue(3)
    # 放入数据
    queue.put(1)
    queue.put("hello")
    queue.put([3,5])
    # 总结: 队列可以放入任意数据类型
    # 提示： 如果队列满了，需要等待队列有空闲位置才能放入数据，否则一直等待
    # queue.put((5,6))
    # 提示： 如果队列满了，不等待队列有空闲位置，如果放入不成功直接崩溃
    # queue.put_nowait((5,6))
    # 建议： 向队列放入数据统一使用put
    # 查看队列是否满了
    # print(queue.full())
    # 注意点：queue.empty()判断队列是否空了不可靠
    # 查看队列是否空了
    # print(queue.empty())
    # 解决办法: 1. 加延时操作 2. 使用判断队列的个数,不使用empty
    # time.sleep(0.01)
    if queue.qsize() == 0:
        print("队列为空")
    else:
        print("队列不为空")
    # 获取队列的个数
    size = queue.qsize()
    print(size)
    # 获取数据
    value = queue.get()
    print(value)
    # 获取队列的个数
    size = queue.qsize()
    print(size)
    # 获取数据
    value = queue.get()
    print(value)
    # 获取数据
    value = queue.get()
    print(value)
    # 获取队列的个数
    size = queue.qsize()
    print(size)
    # 提示：如果队列空了，再取值需要等待，只有队列有值以后才能获取队列中数据
    # value = queue.get()
    # print(value)
    # 提示： 如果队列空了 ，不需要等待队列有值，但是如果取值的时候发现队列空了直接崩溃
    # 建议大家: 向队列取值使用get
    # value = queue.get_nowait()
    # print(value)
运行结果:
队列不为空
hello
[3, 5]
初始化Queue()对象时（例如：q=Queue()），若括号中没有指定最大可接收的消息数量，或数量为负值，那么就代表可接受的消息数量没有上限（直到内存的尽头）；
Queue.qsize()：返回当前队列包含的消息数量；
Queue.empty()：如果队列为空，返回True，反之False , 注意这个操作是不可靠的。
Queue.full()：如果队列满了，返回True,反之False；
Queue.get([block[, timeout]])：获取队列中的一条消息，然后将其从列队中移除，block默认值为True；
1）如果block使用默认值，且没有设置timeout（单位秒），消息列队如果为空，此时程序将被阻塞（停在读取状态），直到从消息列队读到消息为止，如果设置了timeout，则会等待timeout秒，若还没读取到任何消息，则抛出"Queue.Empty"异常；
2）如果block值为False，消息列队如果为空，则会立刻抛出"Queue.Empty"异常；
Queue.get_nowait()：相当Queue.get(False)；
Queue.put(item,[block[, timeout]])：将item消息写入队列，block默认值为True；
1）如果block使用默认值，且没有设置timeout（单位秒），消息列队如果已经没有空间可写入，此时程序将被阻塞（停在写入状态），直到从消息列队腾出空间为止，如果设置了timeout，则会等待timeout秒，若还没空间，则抛出"Queue.Full"异常；
2）如果block值为False，消息列队如果没有空间可写入，则会立刻抛出"Queue.Full"异常；
Queue.put_nowait(item)：相当Queue.put(item, False)；
4.2 消息队列Queue完成进程间通信的演练
我们以Queue为例，在父进程中创建两个子进程，一个往Queue里写数据，一个从Queue里读数据：
import multiprocessing
import time
# 写入数据
def write_data(queue):
    for i in range(10):
        if queue.full():
            print("队列满了")
            break
        queue.put(i)
        time.sleep(0.2)
        print(i)
# 读取数据
def read_data(queue):
    while True:
        # 加入数据从队列取完了，那么跳出循环
        if queue.qsize() == 0:
            print("队列空了")
            break
        value = queue.get()
        print(value)
if __name__ == '__main__':
    # 创建消息队列
    queue = multiprocessing.Queue(5)
    # 创建写入数据的进程
    write_process = multiprocessing.Process(target=write_data, args=(queue,))
    # 创建读取数据的进程
    read_process = multiprocessing.Process(target=read_data, args=(queue,))
    # 启动进程
    write_process.start()
    # 主进程等待写入进程执行完成以后代码再继续往下执行
    write_process.join()
    read_process.start()
运行结果：
从队列取值使用get方法，向队列放入值使用put方法
消息队列判断队列是否为空不可靠，可以使用延时和根据个数进行判断
5、进程池Pool
使用进程池完成多任务
5.1 进程池的概念
池子里面放的是进程，进程池会根据任务执行情况自动创建进程，而且尽量少创建进程，合理利用进程池中的进程完成多任务
当需要创建的子进程数量不多时，可以直接利用multiprocessing中的Process动态成生多个进程，但如果是上百甚至上千个目标，手动的去创建进程的工作量巨大，此时就可以用到multiprocessing模块提供的Pool方法。
初始化Pool时，可以指定一个最大进程数，当有新的请求提交到Pool中时，如果池还没有满，那么就会创建一个新的进程用来执行该请求；但如果池中的进程数已经达到指定的最大值，那么该请求就会等待，直到池中有进程结束，才会用之前的进程来执行新的任务.
5.2 进程池同步执行任务
进程池同步执行任务表示进程池中的进程在执行任务的时候一个执行完成另外一个才能执行，如果没有执行完会等待上一个进程执行
进程池同步实例代码
import multiprocessing
import time
# 拷贝任务
def work():
    print("复制中...", multiprocessing.current_process().pid)
    time.sleep(0.5)
if __name__ == '__main__':
    # 创建进程池
    # 3:进程池中进程的最大个数
    pool = multiprocessing.Pool(3)
    # 模拟大批量的任务，让进程池去执行
    for i in range(5):
        # 循环让进程池执行对应的work任务
        # 同步执行任务，一个任务执行完成以后另外一个任务才能执行
        pool.apply(work)
运行结果:
复制中... 100512
复制中... 68128
复制中... 98924
复制中... 100512
复制中... 68128
5.3 进程池异步执行任务
进程池异步执行任务表示进程池中的进程同时执行任务，进程之间不会等待
进程池异步实例代码
# 进程池:池子里面放的进程，进程池会根据任务执行情况自动创建进程，而且尽量少创建进程，合理利用进程池中的进程完成多任务




    

import multiprocessing
import time
# 拷贝任务
def work():
    print("复制中...", multiprocessing.current_process().pid)
    # 获取当前进程的守护状态
    # 提示：使用进程池创建的进程是守护主进程的状态，默认自己通过Process创建的进程是不是守住主进程的状态
    # print(multiprocessing.current_process().daemon)
    time.sleep(0.5)
if __name__ == '__main__':
    # 创建进程池
    # 3:进程池中进程的最大个数
    pool = multiprocessing.Pool(3)
    # 模拟大批量的任务，让进程池去执行
    for i in range(5):
        # 循环让进程池执行对应的work任务
        # 同步执行任务，一个任务执行完成以后另外一个任务才能执行
        # pool.apply(work)
        # 异步执行，任务执行不会等待，多个任务一起执行
        pool.apply_async(work)
    # 关闭进程池，意思告诉主进程以后不会有新的任务添加进来
    pool.close()
    # 主进程等待进程池执行完成以后程序再退出
    pool.join()
执行结果:
复制中... 122872
复制中... 61772
复制中... 114636
复制中... 122872
复制中... 114636
multiprocessing.Pool常用函数解析：
apply(func[, args[, kwds]]): 阻塞方式调用函数，args表示以元组方式给函数传参，kwds表示以字典方式给函数传参
apply_async(func[, args[, kwds]]) ：使用非阻塞方式调用函数，args表示以元组方式给函数传参，kwds表示以字典方式给函数传参
close()：关闭Pool，使其不再接受新的任务；
terminate()：不管任务是否完成，立即终止；
join()：主进程阻塞，等待子进程的退出， 必须在close或terminate之后使用；
6、进程、线程对比
知道进程和线程关系及优缺点
6.1 功能对比
进程，能够完成多任务，比如 在一台电脑上能够同时运行多个QQ
线程，能够完成多任务，比如 一个QQ中的多个聊天窗口
6.2 定义对比
进程是系统进行资源分配基本单位，每启动一个进程操作系统都需要为其分配运行资源。
线程是运行程序中的一个执行分支，是CPU调度基本单位。
总结:进程是操作系统资源分配的基本单位，线程是CPU调度的基本单位
6.3 关系对比
线程是依附在进程里面的，没有进程就没有线程
一个进程默认提供一条线程，进程可以创建多个线程
6.4 区别
进程之间不共享全局变量
线程之间共享全局变量，但是要注意资源竞争的问题，解决办法: 互斥锁或者线程同步
创建进程的资源开销要比创建线程的资源开销要大
进程是操作系统资源分配的基本单位，线程是CPU调度的基本单位
线程不能够独立执行，必须依存在进程中
多进程开发比单进程多线程开发稳定性要强
优点：可以用多核
缺点：资源开销大
优点：资源开销小
缺点：不能使用多核
文章篇幅较长，给看到这里的小伙伴点个大大的赞!由于作者水平有限，文章中难免会有错误之处，欢迎小伙伴们反馈指正。
如果觉得文章对你有帮助,麻烦 点赞、评论、收藏
你的支持是我最大的动力！！！
  分类：
 后端
 
 
   相关推荐
   
        Python
      
    python协程（超详细）
 -.-文章篇幅较长，主要对python协程的详细介绍，以及协程的主要使用方式。码字不易，如果本文对你有所帮助麻烦：给我一给三连-.-
  5853
 
 
        Django
      
    08Django基础中间件--django请求生命周期、自定义中间件、中间件登录认证白名单
 本文篇幅较长，主要对：django请求生命周期 创建中间件 5个方法，4个特征 执行时间 执行顺序 参数 返回值 process_request proces
  1597
 
 
        Python
      
    django数据库操作-执行原生 SQL 查询
 Django 允许你用两种方式执行原生 SQL 查询： 你可以使用 Manager.raw() 来 执行原生查询并返回模型实例。 或者完全不用模型层 直接执行自定义 SQL。
  1117
 
 
        Django
      
    django静态动态路由
 1、include路由分发 1.1 在app下重新创建一个urls.py 1.2 改原本项目下的urls.py里 2、url的命名和反向解析 其实就是和as一样 设置一个别名 ...
  1031
 




    
 
        Django
      
    django数据库操作-数据库事务
 Django 提供多种方式控制数据库事务。 在调用试图方法前，Django 先生成一个事务。如果响应能正常生成，Django 会提交该事务。而如果视图出现异常，Django 则会回滚该事务...
  751
 
 
        Python
      
    Python基础之 *args 和 **kwargs（超详细）｜Python 主题月
 让我们通过以下5步来理解： 1. 通过一个函数调用来理解’*’的作用 2. 通过一个函数的定义来理解’*args’的含义 3. 通过一个函数的调用来理解’**’的作用 4. 通过一个函数的定义来解’
  746
 
 
        MySQL
      
    02MYSQL基础语法(超详细)
 第三章 数据库的三大范式 第四章 SQL的四种连接查询 第五章 mysql事务read uncommitted(A事务对数据进行操作，在操 第六章 操作数据表记录
  885
 
 
        Python
      
    UDP网络(只出干货)
 网络传输方式-UDP,文章篇幅较长，给看到这里的小伙伴点个大大的赞!由于作者水平有限，文章中难免会有错误之处，欢迎小伙伴们反馈指正。 如果觉得文章对你有帮助,麻烦 点赞、评论、收藏
  864
 
 
        Django
        Python
      
    django虚拟环境(virtualenv)｜8月更文挑战
 在一台电脑上，想开发多个不同的项目， 需要用到同一个包的不同版本， 如果使用上面的命令， 在同一个目录下安装或者更新， 新版本会覆盖以前的版本， 其它的项目就无法运行了。
  841




    
 
 
        Python
      
    Python基础之 生成器｜Python 主题月
 首先让我们了解迭代器。迭代器是一个对象，它使程序员能够遍历容器，尤其是列表。但是，迭代器执行遍历并访问容器中的数据元素，但不执行迭代。你可能会感到困惑，所以让我们慢慢分析。分为三个部分。。。
  678
 
 
        Python
      
    函数的高级使用
 文章篇幅较长，如果本文对你有所帮助的话，麻烦：一键三连 1.1 函数概念理引用 1.2 闭包 1.3 看一个闭包的实际例子： 这个例子中，函数line与变量a,b构成闭
  714
 
 
        Python
      
    TCP网络(超详细)
 网络传输方式-TCP 文章篇幅较长，给看到这里的小伙伴点个大大的赞!由于作者水平有限，文章中难免会有错误之处，欢迎小伙伴们反馈指正。 如果觉得文章对你有帮助,麻烦 点赞、评论、收藏
  657
 
 
      
    01 Python爬虫--爬虫的基本介绍
 一、爬虫的基本介绍 这是我参与更文挑战的第3天，活动详情查看： 更文挑战 1. 什么是爬虫？ 爬虫的开发实例：1.百度新闻 2.拼多多 3.招聘网站 4.视频网站，音乐网站，小说网站，文库网站 2. 
  720
 
 
        Django
      
    django文件上传




    
 在保存上传的文件之前，数据需要保存到某处。 默认情况下，如果上传的文件小于2.5兆，Django 将把文件的所有内容保存到内存里。这意味着保存文件只涉及从内存中读取和写入磁盘，因此这很快...
  699
 
 
      
    网站布局的几种方式
 盒模型的真实大小固定不变，增加内边距，改变的是内容区 - 内容区，定义的高度和宽度 - 边框，边框的粗细 边框的颜色 边框的类型 border - 内边距...
  617
 
 
        Python
      
    线程、进程和协程的实战
 文章篇幅较长，主要是对线程、进程和协程实战的爬虫例题。码字不易，如果本文对你有所帮助的话麻烦：一键三连-.-
  563
 
 
      
    02 Python爬虫--基本库的使用requests
 一、基本库的使用requests 这是我参与更文挑战的第3天，活动详情查看： 更文挑战 1.下载 2.requests中的属性 3. get请求和post请求 3.1. get请求 实例 但是如果要在
  568
 
 
        Django
      
    RESF framework框架-权限源码流程解析
 我们一般在定义用户模型类的时候会定义一个用户类型，权限就是按照用户类型来大致实现 写权限类，通过获取数据库的用户类型返回True,False(True表示可以访问)..
  558
 
 
      
    REST framework restful规范(9种)
 感激相遇 你好 我是y大壮。restful规范(9种)，路径又称"终点"（endpoint），表示API的具体网址，每个网址代表一种资源（resource）。。。
  448
 
 
        Django
      
    django模型类-管理器
 `Manager` 是一种接口，它赋予了 Django 模型操作数据库的能力。Django 应用中每个模型拥有至少一个 `Manager`。
  558
 
 
          
 
 
  
 
 友情链接：
 
        Python开发 @ 无