+关注继续查看

2 OpenCV基本操作

2.1 IO操作

图像的本质是什么?实际上,图像就是矩阵,而是几维矩阵视具体而定。如灰度值图片就是单通道,图片是一个二维矩阵;而对于彩色图片,其拥有三个通道,也就是说,一个图片是三个矩阵堆叠而成。如图所示:

image-20220315153933122

其中矩阵中的每个值我们叫做像素点,每个像素点取值0~255,0是最暗的,即黑色,往上递增越来越亮。如在R通道上,取值211,即红色越来越亮。

我们来导入一张图片试试,我用的是这张,你们可以和我不一样。

image-20220315154806230

cv2.imread(filename,flags)

  • 读取图片
  • filename:字符串类型,用于指定路径
  • flags:整数类型,用于指定图片的加载形式,1为cv.IMREAD_COLOR,表明其以彩色模式加载图像,任何图像的透明度都将被忽略,这是默认参数;0为cv.IMREAD _GRAYSCALE,表明其以灰度模式加载图像;-1为cv.IMREAD_UNCHANGED,表明alpha通道的加载图像模式

cv2.imshow(winname,mat)

  • 用于显示图片
  • winname:显示图片的窗口名称
  • mat:要加载的图片
import cv2
# 读取图像
img = cv2.imread(r'C:\Users\13966\Desktop\Test01.jpg', 1)
cv2.imshow("image", img)
cv2.waitKey(0)
cv2.destroyAllWindows()
如果不用cv2.waitKey()方法,图片会一闪而过。该方法可以传入整型参数,传入的参数为毫秒,如果传入0,则表示按任意键终止显示图像。cv.destroyAllWindows()方法用于销毁窗口。在平时开发中,我们可以把以上的操作封装为一个函数。

用cv2包读取的RGB图片一般会变成BGR格式,这是需要注意的。

在通常做完操作后我们如何保存一张图片呢?

cv2.imwrite('filename',img)

  • 用于保存图片
  • filename:用于填写图片地址
  • img:图片对象
import cv2
# 读取图像
def load_cv_img():
    img = cv2.imread(r'C:\Users\13966\Desktop\Test01.jpg', 1)
    cv2.imshow("image", img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    cv2.imwrite(r'C:\Users\13966\Desktop\Test02.jpg', img)
load_cv_img()

2.2 图像基本操作

2.2.1 图像绘制

2.2.1.1 绘制直线

cv.line(img,start,end,color,thickness)

  • img:要绘制的参数
  • Start,end:直线的起点和终点
  • color:线条的颜色
  • Thickness:线条宽度

2.2.1.2 绘制圆形

cv.circle(img,centerpoint,r,color,thickness)

  • img:要绘制圆形的图像
  • Centerpoint,r:圆心和半径
  • color:线条的颜色
  • Thickness:线条宽度,为-1时生成闭合图案并添加文字

2.2.1.3 绘制矩形

cv.rectangle(img,leftupper,rightdown,color,thickness)

  • img:要绘制矩形的图像
  • Leftupper,rightdown:矩形的左上角和右下角坐标
  • color:线条的颜色
  • Thickness:线条宽度

2.2.1.4 添加文字

cv.putText(img,text,org,font,fontsize,thickness,cv.LINE_AA)

  • img:图像
  • text:要写入的文本数据
  • org:文本的放置位置
  • font:字体
  • Fontsize:字体大小

2.2.1.5 试手

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1 创建图像
img = np.zeros((512, 512, 3), np.uint8)
# 2 绘制图像
cv.line(img, (0, 0), (512, 512), (255, 0, 0), 5)
cv.circle(img, (244, 244), 20, (0, 255, 0), 4)
cv.rectangle(img, (122, 122), (400, 400), (0, 0, 255), 4)
cv.putText(img, "OpenCV", (50, 100), cv.FONT_ITALIC, 3, (144, 144, 0))
# 3 显示结果
cv.imshow("image", img)
cv.waitKey(0)
cv.imwrite(r"C:\Users\13966\Desktop\Test03.jpg", img)

out:

image-20220316094548346

在控制颜色这一块,通常是输入BGR值以元组的形式传入;对于字体这一块,通常有多种选择,常用的有:FONT_HERSHEY_SIMPLEX、FONT_HERSHRY_PLAIN等。

2.2.2 获取/修改图像的像素点

这个没什么好说的,因为对于cv读取图像来说,按照前面所讲,其本质上是一个多维数组,所以按照数组的索引方式修改即可。

import cv2 as cv
# 读取图片
img = cv.imread(r"C:\Users\13966\Desktop\Test01.jpg")
# 获取部分像素点
cv.imshow("image", img[0:50, :, :])
cv.waitKey(0)

out:

image-20220316162802525

2.2.3 获取图像属性

图像无非就是n维矩阵。所以属性自然也就是大小、数据类型、形状那几个。

属性 API
形状 img.shape
图像大小 img.size
数据类型 img.dtype
import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1 创建图像
img = np.zeros((512, 512, 3), np.uint8)
# 2 绘制图像
cv.line(img, (0, 0), (512, 512), (255, 0, 0), 5)
cv.circle(img, (244, 244), 20, (0, 255, 0), 4)
cv.rectangle(img, (122, 122), (400, 400), (0, 0, 255), 4)
cv.putText(img, "OpenCV", (50, 100), cv.FONT_ITALIC, 3, (144, 144, 0))
print(f"图像大小{img.size}")
print(f"图像的形状{img.shape}")
print(f"图像的数据类型{img.dtype}")

2.2.4 图像通道拆分/合并

有时候需要在cv读取的BGR图像中进行单通道工作,这个时候我们需要使用split方法,而如果想要把处理好的各个通道合并,可以使用merge方法。

import cv2 as cv
img = cv.imread(r"C:\Users\13966\Desktop\Test01.jpg")
grayImg = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
cv.imshow("image", grayImg)

out:

image-20220316110423656

2.2.5 色彩空间改变

OpenCV中有150多种颜色空间的转换方法,这些方法你可以这么记忆:如果你想从A->B,那么可以调用cv.A2B。如BGR转Gray,则调用包里的BGR2GRAY。

import cv2 as cv
# 1 创建图像
img = cv.imread(r"C:\Users\13966\Desktop\Test01.jpg")
# 2 通道拆分
b, g, r = cv.split(img)
cv.imshow("b_image", b)
cv.waitKey(0)
cv.destroyAllWindows()

out:

image-20220316110454121

2.2.6 边界填充

cv.copyMakeBorder(src,top,bottom,left,right,BorderType)

  • 用于边界填充
  • src:填充图像
  • BorderType:填充类型

    • BORDER_REPLICATE:赋值法,复制最边缘的像素填充
    • BORDER_REFLECF:反射法,对感兴趣的图像中的像素在两边进行复制
    • BORDER_REFLECT_101:反射法,也就是以最边缘像素为轴
    • BORDER_WRAP:外包装法,如cdefgh[abcdefgh]abcdefg
    • BORDER_CONSTANT:常数法,用常数值填充,所以要指定value
import cv2 as cv
import matplotlib.pyplot as plt
# 读取图片
img = cv.imread(r"C:\Users\13966\Desktop\Test01.jpg")
# 指定填充位置
top_size, bottom_size, left_size, right_size = (50, 50, 50, 50)
# 填充边界
replicate = cv.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv.BORDER_REPLICATE)
reflect = cv.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv.BORDER_REFLECT)
reflect101 = cv.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv.BORDER_REFLECT101)
wrap = cv.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv.BORDER_WRAP)
constant = cv.copyMakeBorder(img, top_size, bottom_size, left_size, right_size, cv.BORDER_CONSTANT, value=0)
# 显示图片
plt.subplot(231)
plt.imshow(img, 'gray')
plt.title('ORIGINAL')
plt.subplot(232)
plt.imshow(replicate, 'gray')
plt.title('REPLICATE')
plt.subplot(233)
plt.imshow(reflect, 'gray')
plt.title('REFLECT')
plt.subplot(234)
plt.imshow(reflect101, 'gray')
plt.title('REFLECT101')
plt.subplot(235)
plt.imshow(wrap, 'gray')
plt.title('WRAP')
plt.subplot(236)
plt.imshow(constant, 'gray')
plt.title('CONSTANT')
plt.show()

out:

image-20220316165351702

2.3图像算数操作

2.3.1 图像加法

我们可以使用OpenCV中的cv.add()函数将两个图片相加,或者可以简单通过numpy操作添加两个图像,如res = img1+img2,两个图像应该具有相同的大小和类型,或者第二个图像可以是标量值。

需要注意的是,OpenCV和Numpy加法之间存在差异,OpenCV的加法是饱和操作,如果两个图片是一样的,并且做加法,那么图片会变得饱和度非常高;而Numpy添加是模运算,其做出来的效果不是很好。

import cv2 as cv
img = cv.imread(r"C:\Users\13966\Desktop\Test01.jpg")
img2 = cv.imread(r"C:\Users\13966\Desktop\Test01.jpg")
mulImg = cv.add(img, img2)
cv.imshow("image", mulImg)
cv.waitKey(0)
print(img)
print(img2)

out:

image-20220316111811929

我们试着将两张不同的图片做加法。

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1 创建图像
img = cv.imread(r"C:\Users\13966\Desktop\Test01.jpg")
img2 = cv.imread(r"C:\Users\13966\Desktop\Test02.jpg")
mulImg = cv.add(img, img2)
cv.imshow("image", mulImg)
cv.waitKey(0)

另一张图片是这个(合并前必须保证两图片大小相同且通道数相同):

image-20220316112312664

out:

image-20220316112406229

2.3.2 图像混合

图像混合实际上等于加强版的图像加法,它可以控制两图片的透明度比例。换而言之,图像混合可以控制合成图片中原先各图片的占比。

想要使用图像混合,只需要使用addWeighted()方法即可。

混合公式为:$g(x) = a·img1+b·img2+\gamma$。

import cv2 as cv
# 1 创建图像
img = cv.imread(r"C:\Users\13966\Desktop\Test01.jpg")
img2 = cv.imread(r"C:\Users\13966\Desktop\Test02.jpg")
mulImg = cv.addWeighted(img, 0.2, img2, 0.8, 0)
cv.imshow("image", mulImg)
cv.waitKey(0)

out:

image-20220316113239926

实验一 熟悉OpenCV环境和基本操作 熟悉OpenCV运行环境,了解图像的基本操作及直方图均衡化。 利用OpenCV产生一幅图像,尺寸为200*240,三通道,其中某一块为红色,其它皆为黑色,示例图如下。 对一副图像进行直方图均衡化处理。要求自行编写直方图均衡化函数,实现图像灰度均衡的算法步骤如下: (1) 统计直方图数组,用一个数组p记录p[i]; (2) i从1开始,令S[i]=S[i-1]+p[i],S[0]=p[0]; (3) 一个数组L记录新的S索引值,即令L[i]=S[i]*(256-1);
OpenCV学习(5) Mat的基本操作(2)
本章我们学习一下Mat中的常用操作,因为在后面其它的教程中,我们经常要对图像进行各种处理,也要使用这些操作。 一、 Mat的复制,就是从一个矩阵A,生成相关的另一个矩阵B。 (1)使用赋值的方法,比如通过构造函数生成矩阵N,通过复制生成矩阵P cv::Mat N(M); ...
OpenCV学习(4) Mat的基本操作(1)
图像在OpenCV中都是通过Mat类来存储的,Mat可以用来表示N维矩阵,当然用的最多的还是二维矩阵。       Mat类有两部分组成:第一部分是头信息,这些信息主要用来描述矩阵,比如矩阵维数ndims,rows,cols(这两个成员变量主要用于二维矩阵,用来表示行数和列数),size,sizes, type,step等等;第二部分是data信息,这是一个指针,指向Mat中存储的数据。
学习Opencv库(一)——基本读写函数的介绍!
OpenCV是一个开源的计算机视觉库,里面封装了很多图像处理方面的优秀算法:例如图片轮廓边缘检测,特征点提取…,可以在Windows,Linux,Mac等平台使用;虽然OpenCv是用 C++ 编写的,并且现在主要接口也是 C++ 语言的但,现在该库也同时提供大量面向 python、matlab以及Java。
带你读《OpenCV 4计算机视觉项目实战 (原书第2版)》之三:学习图形用户界面
本书首先介绍OpenCV的入门知识及安装,然后介绍OpenCV的基础知识,包括用户界面、矩阵运算、滤波器和直方图等,之后介绍复杂的计算机视觉算法,包括对象分割和分类、视频监控、对象跟踪等,后探讨对象跟踪、文本识别、机器学习和人脸检测等高级技术。阅读本书之后,你将掌握常用和新的计算机视觉技术,并学会从零开始构建各类OpenCV项目。