和上一篇《python 图像处理类库 PIL (一)》一样,本文依然以图片 dog.jpeg 为例,演示 PIL Image 模块的实例接口。

1. 导入 Image 模块,打开 dog.jpeg 图片

from PIL import Image
image = Image.open("dog.jpeg")

2. 读取图片属性

2.1 宽高尺寸(像素)

width, height = image.size
print("width: {} pixels\nheight: {} pixels".format(width, height))
复制代码
width: 320 pixels
height: 320 pixels

2.2 色彩模式

mode = image.mode
print("color mode: ", mode)
复制代码
color mode:  RGB

2.3 存储格式

format = image.format
print("image format: ", format)
复制代码
image format:  JPEG

2.4 元信息

image.info
复制代码
{'dpi': (72, 72),
 'exif': b'Exif\x00\x00MM\x00*\x00\x00\x00\x08\x00\x05\x01\x12\x00\x03\x00\x00\x00\x01\x00\x01\x00\x00\x01\x1a\x00\x05\x00\x00\x00\x01\x00\x00\x00J\x01\x1b\x00\x05\x00\x00\x00\x01\x00\x00\x00R\x01(\x00\x03\x00\x00\x00\x01\x00\x02\x00\x00\x87i\x00\x04\x00\x00\x00\x01\x00\x00\x00Z\x00\x00\x00\x00\x00\x00\x00H\x00\x00\x00\x01\x00\x00\x00H\x00\x00\x00\x01\x00\x03\xa0\x01\x00\x03\x00\x00\x00\x01\x00\x01\x00\x00\xa0\x02\x00\x04\x00\x00\x00\x01\x00\x00\x01@\xa0\x03\x00\x04\x00\x00\x00\x01\x00\x00\x01@\x00\x00\x00\x00',
 'jfif': 257,
 'jfif_density': (72, 72),
 'jfif_unit': 0,
 'jfif_version': (1, 1),
 'parsed_exif': {274: 1,
  282: (72, 1),
  283: (72, 1),
  296: 2,
  34665: 90,
  40961: 1,
  40962: 320,
  40963: 320},
 'photoshop': {1028: b'',
  1061: b'\xd4\x1d\x8c\xd9\x8f\x00\xb2\x04\xe9\x80\t\x98\xec\xf8B~'}}

3. 读取图片数据

3.1 load()

返回一个像素访问对象。像素访问对象的行为很像一个二维数组,可以通过下标 [x, y] 的方法,访问和修改像素值。通常情况下,我们不需要调用此方法,Image 类会在第一次访问图片数据时,自动调用此方法。

ps: Image.open() 是一个懒操作,在调用 load() 或其他数据访问方法前,并未读取图片数据,而仅仅读取图片的属性信息。

pix = image.load()
x = image.size[0] // 2
y = image.size[1] // 2
pixdata = pix[x, y]
print("pixel at ({},{}) is {}.".format(x, y, pixdata))
复制代码
pixel at (160,160) is (184, 171, 155).

3.2 getdata()

返回一个图像数据的序列化对象。与 load() 方法不同的是,返回序列化对象行为像一个一维数组。也就说图像的第一行后紧跟着第二行数据。可以通过 list(image.getdata()) 将其转换为普通列表。

image_data = image.getdata()
if len(image_data) == image.size[0] * image.size[1]:
    print("length of image.getdata() is equal to the total number of pixels.")
print("pixel data from 318 to 322 is ", list(image_data)[318:322])
复制代码
length of image.getdata() is equal to the total number of pixels.
pixel data from 318 to 322 is  [(144, 90, 44), (144, 90, 44), (130, 78, 38), (130, 78, 38)]

很多情况,我们希望得到关于图片数据是一个二维数组的形式,这就需要我们自己动手将 getdata() 返回的序列化对象,转化成二维数组或列表。

以下提供三种方法,同时,为了便于比较各方法的执行效率,分别打印输出了转化过程所花时间。

3.2.1 直接遍历序列化对象生成二维列表

from time import time
w, h = image.size
start_time = time()
image_data_2d_1 = []
row = 0
for i, pixdata in enumerate(image_data):
    if i % w == 0:
        image_data_2d_1.append([])
        row = i // w
    image_data_2d_1[row].append(pixdata)
print("cost time: {} ms".format((time()-start_time)*1000))
复制代码
cost time: 47.84393310546875 ms

3.2.2 使用列表切片生成二维列表

getdata() 返回的序列化对象只支持整数下标,不支持切片方式访问元素,因此需要使用 list() 转换为列表。

start_time = time()
image_data_list = list(image_data)
image_data_2d_2 = [image_data_list[w*i:w*(i+1)] for i in range(h)]
print("cost time: {} ms".format((time()-start_time)*1000))
复制代码
cost time: 18.110036849975586 ms

3.2.3 使用 numpy.array() 生成二维数组

numpy.array() 可以直接对 PIL 图片对象进行转化,无需调用 getdata() 方法。

import numpy as np
start_time = time()
image_data_2d_3 = np.array(image)
print("cost time: {} ms".format((time()-start_time)*1000))
复制代码
cost time: 0.6780624389648438 ms

通过比较,三种转化方法所用时间 直接遍历 > 列表切片 > numpy。因此,使用 numpy 转化的效率是最高。在不导入 numpy 情况,首选使用列表切片的方式进行二维列表的转化。

3 split(): 分离颜色通道

返回一个 Image 对象元组。元组的元素为各颜色通道分离出来的单通道图片。例如,RGB 图片,返回的就是图片 R,G,B 三个颜色通过对应的灰度图。

R, G, B = image.split()
R.show()
G.show()
B.show()
复制代码

传送门

  • 上一篇 python 图像处理类库 PIL (一)
  • 坚持写专栏不易,如果觉得本文对你有帮助,记得点个赞。感谢支持!

  • 个人网站: kenblog.top
  • github 站点: kenblikylee.github.io
  • 微信扫描二维码 获取最新技术原创

    分类:
    人工智能
    标签: