和上一篇《python 图像处理类库 PIL (一)》一样,本文依然以图片 dog.jpeg 为例,演示 PIL Image 模块的实例接口。
1. 导入 Image 模块,打开 dog.jpeg 图片
from PIL import Image
image = Image.open("dog.jpeg")
2. 读取图片属性
2.1 宽高尺寸(像素)
width, height = image.size
print("width: {} pixels\nheight: {} pixels".format(width, height))
复制代码
width: 320 pixels
height: 320 pixels
2.2 色彩模式
mode = image.mode
print("color mode: ", mode)
复制代码
color mode: RGB
2.3 存储格式
format = image.format
print("image format: ", format)
复制代码
image format: JPEG
2.4 元信息
image.info
复制代码
{'dpi': (72, 72),
'exif': b'Exif\x00\x00MM\x00*\x00\x00\x00\x08\x00\x05\x01\x12\x00\x03\x00\x00\x00\x01\x00\x01\x00\x00\x01\x1a\x00\x05\x00\x00\x00\x01\x00\x00\x00J\x01\x1b\x00\x05\x00\x00\x00\x01\x00\x00\x00R\x01(\x00\x03\x00\x00\x00\x01\x00\x02\x00\x00\x87i\x00\x04\x00\x00\x00\x01\x00\x00\x00Z\x00\x00\x00\x00\x00\x00\x00H\x00\x00\x00\x01\x00\x00\x00H\x00\x00\x00\x01\x00\x03\xa0\x01\x00\x03\x00\x00\x00\x01\x00\x01\x00\x00\xa0\x02\x00\x04\x00\x00\x00\x01\x00\x00\x01@\xa0\x03\x00\x04\x00\x00\x00\x01\x00\x00\x01@\x00\x00\x00\x00',
'jfif': 257,
'jfif_density': (72, 72),
'jfif_unit': 0,
'jfif_version': (1, 1),
'parsed_exif': {274: 1,
282: (72, 1),
283: (72, 1),
296: 2,
34665: 90,
40961: 1,
40962: 320,
40963: 320},
'photoshop': {1028: b'',
1061: b'\xd4\x1d\x8c\xd9\x8f\x00\xb2\x04\xe9\x80\t\x98\xec\xf8B~'}}
3. 读取图片数据
3.1 load()
返回一个像素访问对象。像素访问对象的行为很像一个二维数组,可以通过下标 [x, y] 的方法,访问和修改像素值。通常情况下,我们不需要调用此方法,Image 类会在第一次访问图片数据时,自动调用此方法。
ps: Image.open() 是一个懒操作,在调用 load() 或其他数据访问方法前,并未读取图片数据,而仅仅读取图片的属性信息。
pix = image.load()
x = image.size[0]
y = image.size[1]
pixdata = pix[x, y]
print("pixel at ({},{}) is {}.".format(x, y, pixdata))
复制代码
pixel at (160,160) is (184, 171, 155).
3.2 getdata()
返回一个图像数据的序列化对象。与 load() 方法不同的是,返回序列化对象行为像一个一维数组。也就说图像的第一行后紧跟着第二行数据。可以通过 list(image.getdata())
将其转换为普通列表。
image_data = image.getdata()
if len(image_data) == image.size[0] * image.size[1]:
print("length of image.getdata() is equal to the total number of pixels.")
print("pixel data from 318 to 322 is ", list(image_data)[318:322])
复制代码
length of image.getdata() is equal to the total number of pixels.
pixel data from 318 to 322 is [(144, 90, 44), (144, 90, 44), (130, 78, 38), (130, 78, 38)]
很多情况,我们希望得到关于图片数据是一个二维数组的形式,这就需要我们自己动手将 getdata() 返回的序列化对象,转化成二维数组或列表。
以下提供三种方法,同时,为了便于比较各方法的执行效率,分别打印输出了转化过程所花时间。
3.2.1 直接遍历序列化对象生成二维列表
from time import time
w, h = image.size
start_time = time()
image_data_2d_1 = []
row = 0
for i, pixdata in enumerate(image_data):
if i % w == 0:
image_data_2d_1.append([])
row = i // w
image_data_2d_1[row].append(pixdata)
print("cost time: {} ms".format((time()-start_time)*1000))
复制代码
cost time: 47.84393310546875 ms
3.2.2 使用列表切片生成二维列表
getdata() 返回的序列化对象只支持整数下标,不支持切片方式访问元素,因此需要使用 list() 转换为列表。
start_time = time()
image_data_list = list(image_data)
image_data_2d_2 = [image_data_list[w*i:w*(i+1)] for i in range(h)]
print("cost time: {} ms".format((time()-start_time)*1000))
复制代码
cost time: 18.110036849975586 ms
3.2.3 使用 numpy.array() 生成二维数组
numpy.array() 可以直接对 PIL 图片对象进行转化,无需调用 getdata() 方法。
import numpy as np
start_time = time()
image_data_2d_3 = np.array(image)
print("cost time: {} ms".format((time()-start_time)*1000))
复制代码
cost time: 0.6780624389648438 ms
通过比较,三种转化方法所用时间 直接遍历 > 列表切片 > numpy。因此,使用 numpy
转化的效率是最高。在不导入 numpy
情况,首选使用列表切片的方式进行二维列表的转化。
3 split(): 分离颜色通道
返回一个 Image 对象元组。元组的元素为各颜色通道分离出来的单通道图片。例如,RGB 图片,返回的就是图片 R,G,B 三个颜色通过对应的灰度图。
R, G, B = image.split()
R.show()
G.show()
B.show()
复制代码
传送门
上一篇 python 图像处理类库 PIL (一)
坚持写专栏不易,如果觉得本文对你有帮助,记得点个赞。感谢支持!
个人网站: kenblog.top
github 站点: kenblikylee.github.io
微信扫描二维码 获取最新技术原创