详解python之多进程和进程池(Processing库)

2023-12-16Python编程
23

详解Python之多进程和进程池

一、多进程概念

进程是系统资源分配的最小单位,一个进程可以有多个线程,这些线程共享进程的内存空间和系统资源。在Python中,可以通过multiprocessing模块实现多进程的功能。

二、多进程的好处

  1. 充分利用多核CPU,提升程序运行效率;
  2. 进程之间独立,一个进程挂掉不会影响其他进程的运行;
  3. 可以利用操作系统的进程管理机制,避免出现死锁现象。

三、多进程的实现方式

3.1 普通多进程

使用multiprocessing模块的Process类可以实现简单的多进程,示例代码如下:

from multiprocessing import Process

def func():
    print('子进程执行')

if __name__ == '__main__':
    p = Process(target=func)
    p.start()
    p.join()
    print('主进程执行')

代码解析:

  1. 通过multiprocessing模块的Process类创建子进程,并指定执行函数为func()
  2. 子进程通过调用指定的函数进行任务处理;
  3. 主进程通过p.join()方法等待子进程执行完毕,再执行后续代码。

3.2 进程池

使用进程池可以避免频繁创建和销毁进程,从而提高程序的执行效率。使用multiprocessing模块的Pool类可以实现进程池,示例代码如下:

from multiprocessing import Pool
import os
import time

def func(n):
    print(f'子进程{os.getpid()}执行{n}')
    time.sleep(1)
    return n

if __name__ == '__main__':
    p = Pool(3)
    results = p.map(func, range(10))
    print(results)

代码解析:

  1. 通过multiprocessing模块的Pool类创建进程池,并指定最大进程数为3,即同时运行3个子进程;
  2. 子进程通过调用指定的函数进行任务处理,这里模拟了任务处理需要一定时间的情况;
  3. 主进程通过p.map()方法向进程池中添加任务,并等待任务执行完毕;
  4. p.map()方法返回一个结果集,结果集的元素按照任务添加的顺序排列。

四、总结

多进程和进程池是Python中实现并行计算的重要方式,能够充分利用多核CPU提高程序运行效率。multiprocessing模块是Python标准库中提供的多进程处理模块,使用简单,功能强大,值得掌握和使用。

五、示例

5.1 利用进程池进行网络爬虫

利用Python的并行计算,可以有效提升网络爬虫的效率。下面是一个简单的示例:

import requests
from bs4 import BeautifulSoup
from multiprocessing import Pool

def get_url(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.content)
    title = soup.select_one('title').text
    return title

if __name__ == '__main__':
    urls = ['https://www.baidu.com', 'https://www.google.com', 'https://www.bing.com']
    p = Pool(len(urls))
    results = p.map(get_url, urls)
    print(results)

代码解析:

  1. get_url()函数中通过requestsBeautifulSoup模块获取网页标题;
  2. 在主程序中创建进程池,并向进程池中添加子进程任务;
  3. p.map()方法返回所有子进程处理的结果。

5.2 利用多进程进行图片下载

多进程能够大大提高图片的下载效率,下面是一个简单的示例:

import requests
from multiprocessing import Process

def download(image_url, path):
    response = requests.get(image_url)
    with open(path, 'wb') as f:
        f.write(response.content)

if __name__ == '__main__':
    urls = [
        ('https://www.google.com/images/branding/googlelogo/1x/googlelogo_color_272x92dp.png', 'google.png'),
        ('https://www.baidu.com/img/bd_logo1.png', 'baidu.png')
    ]
    processes = [Process(target=download, args=(url[0], url[1])) for url in urls]
    for process in processes:
        process.start()
    for process in processes:
        process.join()

代码解析:

  1. download()函数中通过requests模块下载图片,并保存到指定路径;
  2. 在主程序中创建多个子进程,并将每个子进程的任务指定为下载指定的图片;
  3. 通过循环遍历所有子进程,并对其进行启动和等待。
The End

相关推荐

解析Python中的eval()、exec()及其相关函数
Python中有三个内置函数eval()、exec()和compile()来执行动态代码。这些函数能够从字符串参数中读取Python代码并在运行时执行该代码。但是,使用这些函数时必须小心,因为它们的不当使用可能会导致安全漏洞。...
2023-12-18 Python编程
117

Python下载网络文本数据到本地内存的四种实现方法示例
在Python中,下载网络文本数据到本地内存是常见的操作之一。本文将介绍四种常见的下载网络文本数据到本地内存的实现方法,并提供示例说明。...
2023-12-18 Python编程
101

Python 二进制字节流数据的读取操作(bytes与bitstring)
来给你详细讲解下Python 二进制字节流数据的读取操作(bytes与bitstring)。...
2023-12-18 Python编程
120

Python3.0与2.X版本的区别实例分析
Python 3.x 是 Python 2.x 的下一个重大版本,其中有一些值得注意的区别。 Python 3.0中包含了许多不兼容的变化,这意味着在迁移到3.0之前,必须进行代码更改和测试。本文将介绍主要的差异,并给出一些实例来说明不同点。...
2023-12-18 Python编程
34

python如何在终端里面显示一张图片
要在终端里显示图片,需要使用一些Python库。其中一种流行的库是Pillow,它有一个子库PIL.Image可以加载和处理图像文件。要在终端中显示图像,可以使用如下的步骤:...
2023-12-18 Python编程
91

Python图像处理实现两幅图像合成一幅图像的方法【测试可用】
在Python中,我们可以使用Pillow库来进行图像处理。具体实现两幅图像合成一幅图像的方法如下:...
2023-12-18 Python编程
103