Python从使用线程到使用async/await的深入讲解

2023-12-16Python编程
82

Python从使用线程到使用async/await的深入讲解

1. 线程

1.1 什么是线程?

线程是程序执行流的最小单元,是进程的一个执行单元。线程通过共享运行时环境,可以提高程序的并发性,线程有轻量级、及时性等特点。

1.2 Python的线程模块

Python的标准库threading提供了线程相关的模块,使用起来非常简单。

import threading

def worker():
    print('Thread %s is working' % threading.current_thread().getName())

t = threading.Thread(target=worker)
t.start()

上述代码中,使用threading.Thread类创建线程对象,使用start方法启动线程,使用current_thread方法获取当前线程对象,使用getName方法获取线程名。

1.3 线程的并发问题

虽然Python的线程机制非常易用,但是Python的线程是基于操作系统底层线程的,而不是真正的并发线程。因为Python的Global Interpreter Lock (GIL)机制,同一时刻只能有一个线程在执行Python代码,其他线程只能在等待GIL。所以使用线程并不能真正充分利用多核CPU,也无法真正实现多线程并发。因此,使用线程可能带来线程切换的开销而降低程序性能。

2. 协程

2.1 什么是协程?

协程是一种用户态的轻量级线程,也称为纤程 (Fiber),协程可以看作特殊的迭代器,可以由程序员控制运行状态,支持用户态调度,无线程切换开销。

2.2 Python的协程模块

Python 3.5开始加入async/await语法实现原生协程。使用协程需要用到Python的asyncio模块。

下面是一个使用async/await语法的协程示例:

import asyncio

async def worker():
    print('Coroutine is working')
    await asyncio.sleep(1)
    print('Coroutine is finished')

loop = asyncio.get_event_loop()
loop.run_until_complete(worker())

上述代码中,使用asyncawait定义协程,使用asyncio.sleep模拟协程执行任务,使用get_event_loop方法获取事件循环对象,使用run_until_complete方法运行协程。

2.3 协程和线程的区别

线程和协程都是并发机制,但是线程是基于操作系统底层线程的,因此他们的并发模型在底层上有很大的区别。协程通过用户态调度,对于大量I/O密集型操作的场景非常适用,但是对于CPU密集型操作的场景则不一定有优势,因为无法利用多核CPU。

3. 示例说明

3.1 线程示例

下面是一个使用线程池的示例,实现并发下载多张图片:

import requests
import threading
from concurrent.futures import ThreadPoolExecutor

def download(url, filename):
    print('Thread %s is downloading image: %s' % (threading.current_thread().getName(), url))
    resp = requests.get(url)
    with open(filename, 'wb') as f:
        f.write(resp.content)

urls = ['https://picsum.photos/200/200/?image=%d' % i for i in range(10)]
pool = ThreadPoolExecutor(max_workers=5)
for i, url in enumerate(urls):
    filename = 'image_%d.jpg' % i
    pool.submit(download, url, filename)

在该示例中,使用requests发送网络请求下载多张图片,使用ThreadPoolExecutor创建线程池,并通过submit方法向线程池中提交任务。由于线程是基于操作系统底层线程的,所以程序在执行过程中会有线程切换的开销。

3.2 协程示例

下面是一个使用协程的示例,实现并发下载多张图片:

import aiohttp
import asyncio

async def download(url, filename):
    print('Coroutine is downloading image: %s' % url)
    async with aiohttp.ClientSession() as session:
        async with session.get(url) as resp:
            with open(filename, 'wb') as f:
                f.write(await resp.content.read())

urls = ['https://picsum.photos/200/200/?image=%d' % i for i in range(10)]
tasks = [download(url, 'image_%d.jpg' % i) for i, url in enumerate(urls)]
loop = asyncio.get_event_loop()
loop.run_until_complete(asyncio.gather(*tasks))

在该示例中,使用aiohttp发送异步网络请求下载多张图片,使用asyncio异步执行协程任务。由于协程是用户态调度,不需要线程切换的开销,可以提高程序的性能。

4. 总结

线程和协程都是并发编程的重要方式,但是在线程和协程之间需要根据实际需求进行选择。在大量I/O密集型操作的场景下,协程可以取得很好的效果,而在大量CPU密集型操作的场景下,则需要考虑使用多进程或大规模并行计算。

The End

相关推荐

解析Python中的eval()、exec()及其相关函数
Python中有三个内置函数eval()、exec()和compile()来执行动态代码。这些函数能够从字符串参数中读取Python代码并在运行时执行该代码。但是,使用这些函数时必须小心,因为它们的不当使用可能会导致安全漏洞。...
2023-12-18 Python编程
117

Python下载网络文本数据到本地内存的四种实现方法示例
在Python中,下载网络文本数据到本地内存是常见的操作之一。本文将介绍四种常见的下载网络文本数据到本地内存的实现方法,并提供示例说明。...
2023-12-18 Python编程
101

Python 二进制字节流数据的读取操作(bytes与bitstring)
来给你详细讲解下Python 二进制字节流数据的读取操作(bytes与bitstring)。...
2023-12-18 Python编程
120

Python3.0与2.X版本的区别实例分析
Python 3.x 是 Python 2.x 的下一个重大版本,其中有一些值得注意的区别。 Python 3.0中包含了许多不兼容的变化,这意味着在迁移到3.0之前,必须进行代码更改和测试。本文将介绍主要的差异,并给出一些实例来说明不同点。...
2023-12-18 Python编程
34

python如何在终端里面显示一张图片
要在终端里显示图片,需要使用一些Python库。其中一种流行的库是Pillow,它有一个子库PIL.Image可以加载和处理图像文件。要在终端中显示图像,可以使用如下的步骤:...
2023-12-18 Python编程
91

Python图像处理实现两幅图像合成一幅图像的方法【测试可用】
在Python中,我们可以使用Pillow库来进行图像处理。具体实现两幅图像合成一幅图像的方法如下:...
2023-12-18 Python编程
103