Pytorch中transforms.Resize()的简单使用

2023-12-16Python编程
437

下面是关于PyTorch中transforms.Resize()函数的详细讲解。

1. transforms.Resize()函数概述

transforms.Resize()函数是PyTorch中transforms模块提供的一个图像处理函数,它可以对图像进行缩放操作。具体来说,这个函数可以将输入图像的尺寸调整为给定的目标尺寸。

该函数的输入参数包括目标尺寸(target_size)、插值方法(interpolation)和调整后图像的长宽比(aspect_ratio)等。通过这些参数的设定,可以灵活地进行图像缩放操作,并且能够对输入图像进行等比例或非等比例缩放。

2. transforms.Resize()函数的常用参数及用法

下面是PyTorch中transforms.Resize()函数常用的参数及用法:

(1) 目标尺寸(target_size)

目标尺寸(target_size)指定了调整后图像的高度和宽度。可以将目标尺寸设置为一个整数,此时函数将会把图像调整为指定的大小。例如,将目标尺寸设置为256x256,则函数将会把输入图像按照长宽比例缩放至高为256、宽为256的图像。

import torchvision.transforms as transforms

resize = transforms.Resize((256,256)) 

(2) 插值方法(interpolation)

插值方法(interpolation)指定了缩放过程中的差值方法。常见的插值方法有NEAREST、BILINEAR和BICUBIC等。

NEAREST方法是最近邻插值法,该方法在缩放图像时将采用离目标像素点最近的像素点作为结果像素点的值。

BILINEAR方法是双线性插值法,该方法在缩放图像时将采用目标像素点周围的四个像素点的加权平均值作为结果像素点的值。

BICUBIC方法是双三次插值法,该方法对目标像素点周围的16个像素点进行双三次插值处理,最后得到结果像素点的值。这种插值方法可以得到较为平滑的图像。

resize_bilinear = transforms.Resize((256,256),interpolation=transforms.InterpolationMode.BILINEAR)
resize_bicubic = transforms.Resize((256,256),interpolation=transforms.InterpolationMode.BICUBIC) 

(3) 长宽比(aspect_ratio)

长宽比(aspect_ratio)是指调整后图像的长宽比。如果将长宽比设置为0,则函数会保持原始图像的长宽比不变。如果将长宽比设置为非0值,则函数将会按照设定的长宽比对图像进行缩放操作。例如,将长宽比设置为2,则函数将会按照原始图像的高度为基准,计算出宽度为原始图像高度的2倍,然后对图像进行缩放。

resize_aspect_ratio = transforms.Resize((256,512),aspect_ratio=2) 

3. transforms.Resize()函数的示例说明

下面是两个使用transforms.Resize()函数的示例:

示例1:将图像缩放为256x256的大小

import torchvision.transforms as transforms
from PIL import Image

img = Image.open('test.jpg')

resize = transforms.Resize((256,256))

img_resized = resize(img)

img_resized.show()

上面的代码将一个名为test.jpg的图像读入,并使用transforms.Resize()函数将图像缩放为256x256的大小,然后将缩放后的图像显示出来。

示例2:批量缩放图像

import torchvision.transforms as transforms
from PIL import Image

img1 = Image.open('test1.jpg')
img2 = Image.open('test2.jpg')
img3 = Image.open('test3.jpg')

resize = transforms.Resize((256,256))

img1_resized = resize(img1)
img2_resized = resize(img2)
img3_resized = resize(img3)

img_resized_list = [img1_resized, img2_resized, img3_resized]

batch = transforms.ToTensor()(img_resized_list)

print(batch.shape)

上面的代码将三张名为test1.jpg、test2.jpg和test3.jpg的图像读入,并使用transforms.Resize()函数将它们缩放为256x256的大小。然后将缩放后的三张图像存储到一个列表中,并将它们转化为一个3x256x256的张量。最后,打印出该张量的维度信息。

The End

相关推荐

解析Python中的eval()、exec()及其相关函数
Python中有三个内置函数eval()、exec()和compile()来执行动态代码。这些函数能够从字符串参数中读取Python代码并在运行时执行该代码。但是,使用这些函数时必须小心,因为它们的不当使用可能会导致安全漏洞。...
2023-12-18 Python编程
117

Python下载网络文本数据到本地内存的四种实现方法示例
在Python中,下载网络文本数据到本地内存是常见的操作之一。本文将介绍四种常见的下载网络文本数据到本地内存的实现方法,并提供示例说明。...
2023-12-18 Python编程
101

Python 二进制字节流数据的读取操作(bytes与bitstring)
来给你详细讲解下Python 二进制字节流数据的读取操作(bytes与bitstring)。...
2023-12-18 Python编程
120

Python3.0与2.X版本的区别实例分析
Python 3.x 是 Python 2.x 的下一个重大版本,其中有一些值得注意的区别。 Python 3.0中包含了许多不兼容的变化,这意味着在迁移到3.0之前,必须进行代码更改和测试。本文将介绍主要的差异,并给出一些实例来说明不同点。...
2023-12-18 Python编程
34

python如何在终端里面显示一张图片
要在终端里显示图片,需要使用一些Python库。其中一种流行的库是Pillow,它有一个子库PIL.Image可以加载和处理图像文件。要在终端中显示图像,可以使用如下的步骤:...
2023-12-18 Python编程
91

Python图像处理实现两幅图像合成一幅图像的方法【测试可用】
在Python中,我们可以使用Pillow库来进行图像处理。具体实现两幅图像合成一幅图像的方法如下:...
2023-12-18 Python编程
103