关于深度学习:恒源云CV领域之几何变化

文章起源 | 恒源云社区

原文地址 | 几何变动

原文作者 | instter

缩放是对图像的大小进行调整，即便图像放大或放大。
API

cv2.resize(src,dsize,fx=0,fy=0,interpolation=cv2.INTER_LINEAR)

参数：

src : 输出图像
dsize: 相对尺寸，间接指定调整后图像的大小
fx,fy: 绝对尺寸，将 dsize 设置为 None，而后将 fx 和 fy 设置为比例因子即可
interpolation：插值办法

示例

import cv2 as cv
# 1. 读取图片
img1 = cv.imread("./image/dog.jpeg")
# 2. 图像缩放
# 2.1 相对尺寸
rows,cols = img1.shape[:2]
res = cv.resize(img1,(2*cols,2*rows),interpolation=cv.INTER_CUBIC)

# 2.2 绝对尺寸
res1 = cv.resize(img1,None,fx=0.5,fy=0.5)

# 3 图像显示
# 3.1 应用 opencv 显示图像(不举荐)
cv.imshow("orignal",img1)
cv.imshow("enlarge",res)
cv.imshow("shrink）",res1)
cv.waitKey(0)

# 3.2 应用 matplotlib 显示图像
fig,axes=plt.subplots(nrows=1,ncols=3,figsize=(10,8),dpi=100)
axes[0].imshow(res[:,:,::-1])
axes[0].set_title("相对尺度（放大）")
axes[1].imshow(img1[:,:,::-1])
axes[1].set_title("原图")
axes[2].imshow(res1[:,:,::-1])
axes[2].set_title("绝对尺度（放大）")
plt.show()

图像平移将图像依照指定方向和间隔，挪动到相应的地位。

API

cv.warpAffine(img,M,dsize)

参数：

img: 输出图像
M：2*∗3 挪动矩阵

对于 (x,y) 处的像素点，要把它挪动到处时，M 矩阵应如下设置：

留神：将 M 设置为 np.float32 类型的 Numpy 数组。

dsize: 输入图像的大小

留神：输入图像的大小，它应该是 (宽度，高度) 的模式。请记住,width= 列数，height= 行数。

示例
需要是将图像的像素点挪动 (50,100) 的间隔：

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1. 读取图像
img1 = cv.imread("./image/image2.jpg")

# 2. 图像平移
rows,cols = img1.shape[:2]
M = M = np.float32([[1,0,100],[0,1,50]])# 平移矩阵
dst = cv.warpAffine(img1,M,(cols,rows))

# 3. 图像显示
fig,axes=plt.subplots(nrows=1,ncols=2,figsize=(10,8),dpi=100)
axes[0].imshow(img1[:,:,::-1])
axes[0].set_title("原图")
axes[1].imshow(dst[:,:,::-1])
axes[1].set_title("平移后后果")
plt.show()

图像旋转是指图像依照某个地位转动肯定角度的过程，旋转中图像仍放弃这原始尺寸。图像旋转后图像的程度对称轴、垂直对称轴及核心坐标原点都可能会产生变换，因而须要对图像旋转中的坐标进行相应转换。
那图像是怎么进行旋转的呢？如下图所示：

假如图像逆时针旋转 θ\thetaθ，则依据坐标转换可得旋转转换为:

其中：

带入下面的公式中，有：

也能够写成：

同时咱们要修改原点的地位，因为原图像中的坐标原点在图像的左上角，通过旋转后图像的大小会有所变动，原点也须要修改。

假如在旋转的时候是以旋转核心为坐标原点的，旋转完结后还须要将坐标原点移到图像左上角，也就是还要进行一次变换。

在 OpenCV 中图像旋转首先依据旋转角度和旋转核心获取旋转矩阵，而后依据旋转矩阵进行变换，即可实现任意角度和任意核心的旋转成果。
API

cv2.getRotationMatrix2D(center, angle, scale)

参数：

center：旋转核心
angle：旋转角度
scale：缩放比例

M：旋转矩阵

调用 cv.warpAffine 实现图像的旋转
示例:

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1 读取图像
img = cv.imread("./image/image2.jpg")

# 2 图像旋转
rows,cols = img.shape[:2]
# 2.1 生成旋转矩阵
M = cv.getRotationMatrix2D((cols/2,rows/2),90,1)
# 2.2 进行旋转变换
dst = cv.warpAffine(img,M,(cols,rows))

# 3 图像展现
fig,axes=plt.subplots(nrows=1,ncols=2,figsize=(10,8),dpi=100)
axes[0].imshow(img1[:,:,::-1])
axes[0].set_title("原图")
axes[1].imshow(dst[:,:,::-1])
axes[1].set_title("旋转后后果")
plt.show()

图像的仿射变换波及到图像的形态地位角度的变动，是深度学习预处理中常到的性能, 仿射变换次要是对图像的缩放，旋转，翻转和平移等操作的组合。

那什么是图像的仿射变换，如下图所示，图 1 中的点 1, 2 和 3 与图二中三个点一一映射, 依然造成三角形, 但形态曾经大大扭转，通过这样两组三点（感兴趣点）求出仿射变换，接下来咱们就能把仿射变换利用到图像中所有的点中，就实现了图像的仿射变换。

在 OpenCV 中，仿射变换的矩阵是一个 2×3 的矩阵,

其中右边的 2×2 子矩阵 A 是线性变换矩阵，左边的 2×1 子矩阵 B 是平移项：

对于图像上的任一地位(x,y)，仿射变换执行的是如下的操作：

须要留神的是，对于图像而言，宽度方向是 x，高度方向是 y，坐标的程序和图像像素对应下标统一。所以原点的地位不是左下角而是右上角，y 的方向也不是向上，而是向下。

在仿射变换中，原图中所有的平行线在后果图像中同样平行。为了创立这个矩阵咱们须要从原图像中找到三个点以及他们在输入图像中的地位。而后 cv2.getAﬃneTransform 会创立一个 2×3 的矩阵，最初这个矩阵会被传给函数 cv2.warpAﬃne。
示例

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1 图像读取
img = cv.imread("./image/image2.jpg")

# 2 仿射变换
rows,cols = img.shape[:2]
# 2.1 创立变换矩阵
pts1 = np.float32([[50,50],[200,50],[50,200]])
pts2 = np.float32([[100,100],[200,50],[100,250]])
M = cv.getAffineTransform(pts1,pts2)
# 2.2 实现仿射变换
dst = cv.warpAffine(img,M,(cols,rows))

# 3 图像显示
fig,axes=plt.subplots(nrows=1,ncols=2,figsize=(10,8),dpi=100)
axes[0].imshow(img[:,:,::-1])
axes[0].set_title("原图")
axes[1].imshow(dst[:,:,::-1])
axes[1].set_title("仿射后后果")
plt.show()

透射变换是视角变动的后果，是指利用透视核心、像点、指标点三点共线的条件，按透视旋转定律使承影面（透视面）绕迹线（透视轴）旋转某一角度，毁坏原有的投影光线束，仍能放弃承影面上投影几何图形不变的变换。

它的实质将图像投影到一个新的视立体，其通用变换公式为：

其中，(u,v)是原始的图像像素坐标，w 取值为 1，(x=x’/z’,y=y’/z’)是透射变换后的后果。前面的矩阵称为透视变换矩阵，个别状况下，咱们将其分为三局部：

其中：T1示意对图像进行线性变换，T2对图像进行平移，T3示意对图像进行投射变换，个别设为 1.

在 opencv 中，咱们要找到四个点，其中任意三个不共线，而后获取变换矩阵 T，再进行透射变换。通过函数 cv.getPerspectiveTransform 找到变换矩阵，将 cv.warpPerspective 利用于此 3x3 变换矩阵。
示例

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1 读取图像
img = cv.imread("./image/image2.jpg")
# 2 透射变换
rows,cols = img.shape[:2]
# 2.1 创立变换矩阵
pts1 = np.float32([[56,65],[368,52],[28,387],[389,390]])
pts2 = np.float32([[100,145],[300,100],[80,290],[310,300]])

T = cv.getPerspectiveTransform(pts1,pts2)
# 2.2 进行变换
dst = cv.warpPerspective(img,T,(cols,rows))

# 3 图像显示
fig,axes=plt.subplots(nrows=1,ncols=2,figsize=(10,8),dpi=100)
axes[0].imshow(img[:,:,::-1])
axes[0].set_title("原图")
axes[1].imshow(dst[:,:,::-1])
axes[1].set_title("透射后后果")
plt.show()

图像金字塔是图像多尺度表白的一种，最次要用于图像的宰割，是一种以多分辨率来解释图像的无效但概念简略的构造。

图像金字塔用于机器视觉和图像压缩，一幅图像的金字塔是一系列以金字塔形态排列的分辨率逐渐升高，且来源于同一张原始图的图像汇合。其通过梯次向下采样取得，直到达到某个终止条件才进行采样。

金字塔的底部是待处理图像的高分辨率示意，而顶部是低分辨率的近似，层级越高，图像越小，分辨率越低。

API

cv.pyrUp(img)       #对图像进行上采样
cv.pyrDown(img)        #对图像进行下采样

示例

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt
# 1 图像读取
img = cv.imread("./image/image2.jpg")
# 2 进行图像采样
up_img = cv.pyrUp(img)  # 上采样操作
img_1 = cv.pyrDown(img)  # 下采样操作
# 3 图像显示
cv.imshow('enlarge', up_img)
cv.imshow('original', img)
cv.imshow('shrink', img_1)
cv.waitKey(0)
cv.destroyAllWindows()

关于深度学习:恒源云CV领域之几何变化

1 图像缩放

2 图像平移

3 图像旋转

4 仿射变换

5 透射变换

6 图像金字塔