【计算机视觉】OpenCV篇(3) - 图像几何变换(仿射变换/透视变换)
圖像的幾何變換從原理上看主要包括兩種:基于2×3矩陣的仿射變換(平移、縮放、旋轉(zhuǎn)和翻轉(zhuǎn)等)、基于3×3矩陣的透視變換。
- ?仿射變換
基本的圖像變換就是二維坐標(biāo)的變換:從一種二維坐標(biāo)(x,y)到另一種二維坐標(biāo)(u,v)的線性變換:
如果寫成矩陣的形式,那就是:
作如下定義:
矩陣T(2×3)就稱為仿射變換的變換矩陣,R為線性變換矩陣,t為平移矩陣,簡單來說,仿射變換就是線性變換+平移。變換后直線依然是直線,平行線依然是平行線,直線間的相對(duì)位置關(guān)系不變,因此非共線的三個(gè)對(duì)應(yīng)點(diǎn)便可確定唯一的一個(gè)仿射變換,線性變換4個(gè)自由度+平移2個(gè)自由度→仿射變換自由度為6。
仿射變換在OpenCV中的實(shí)現(xiàn)如下:
import cv2 import numpy as np import matplotlib.pyplot as pltimg = cv2.imread('drawing.jpg') rows, cols = img.shape[:2]# 變換前的三個(gè)點(diǎn) pts1 = np.float32([[50, 65], [150, 65], [210, 210]]) # 變換后的三個(gè)點(diǎn) pts2 = np.float32([[50, 100], [150, 65], [100, 250]])# 生成變換矩陣,維數(shù):2*3 M = cv2.getAffineTransform(pts1, pts2) dst = cv2.warpAffine(img, M, (cols, rows))plt.subplot(121), plt.imshow(img), plt.title('input') plt.subplot(122), plt.imshow(dst), plt.title('output') plt.show()?運(yùn)行結(jié)果:
其實(shí)平移、旋轉(zhuǎn)、縮放和翻轉(zhuǎn)等變換就是對(duì)應(yīng)了不同的仿射變換矩陣,下面分別來看:
(1)平移
平移就是x和y方向上的直接移動(dòng),可以上下/左右移動(dòng),自由度為2,變換矩陣可以表示為:
# 平移圖片 import numpy as nprows, cols = img.shape[:2]# 定義平移矩陣,需要是numpy的float32類型 # x軸平移100,y軸平移50 M = np.float32([[1, 0, 100], [0, 1, 50]]) dst = cv2.warpAffine(img, M, (cols, rows))cv2.imshow('shift', dst) cv2.waitKey(0)?
?
?
(1)通過比例進(jìn)行縮放
import cv2 as cv import numpy as np# 圖片縮放 img = cv.imread('images/animal.jpg', flags=1) # flags=1讀取為彩色,flags=0讀取為灰度 cv.imshow('i', img) h, w, channel = img.shape # 以行列形式存儲(chǔ), 第幾行到第幾行為圖像高度 dst_h = int(h*0.5) dst_w = int(w*0.5) # 最近鄰域差值 雙線性插值 像素關(guān)系重采樣 立方差值 dst = cv.resize(img, (dst_w, dst_h)) # 默認(rèn)雙線性差值 cv.imshow('img', dst) cv.waitKey(0)OpenCV提供了resize函數(shù)來改變圖像的大小,C++中的函數(shù)原型如下:
void resize(InputArray src, OutputArray dst, Size dsize, double fx=0, double fy=0, int interpolation=INTER_LINEAR );函數(shù)參數(shù)說明:
src:輸入,原圖像,即待改變大小的圖像;
dst:輸出,改變大小之后的圖像,這個(gè)圖像和原圖像具有相同的內(nèi)容,只是大小和原圖像不一樣而已;
dsize:輸出圖像的大小。如果這個(gè)參數(shù)不為0,那么就代表將原圖像縮放到這個(gè)Size(width,height)指定的大小;如果這個(gè)參數(shù)為0,那么原圖像縮放之后的大小就要通過下面的公式來計(jì)算:
dsize = Size(round(fx*src.cols), round(fy*src.rows))
其中,fx和fy就是下面要說的兩個(gè)參數(shù),是圖像width方向和height方向的縮放比例。
fx:width方向的縮放比例,如果它是0,那么它就會(huì)按照(double)dsize.width/src.cols來計(jì)算;
fy:height方向的縮放比例,如果它是0,那么它就會(huì)按照(double)dsize.height/src.rows來計(jì)算;
interpolation:這個(gè)是指定插值的方式,圖像縮放之后,肯定像素要進(jìn)行重新計(jì)算的,就靠這個(gè)參數(shù)來指定重新計(jì)算像素的方式,有以下幾種:
- INTER_NEAREST?- 最鄰近插值
- INTER_LINEAR?- 雙線性插值,如果最后一個(gè)參數(shù)你不指定,默認(rèn)使用這種方法
- INTER_AREA?- resampling using pixel area relation. It may be a preferred method for image decimation, as it gives moire’-free results. But when the image is zoomed, it is similar to the?INTER_NEAREST?method.
- INTER_CUBIC?-?4x4像素鄰域內(nèi)的雙立方插值
- INTER_LANCZOS4?-?8x8像素鄰域內(nèi)的Lanczos插值
函數(shù)使用說明:
?
(2)通過矩陣變換進(jìn)行縮放
import cv2 as cv import numpy as np# 圖片縮放 img = cv.imread('../images/moon.jpg', flags=1) # flags=1讀取為彩色,flags=0讀取為灰度 h, w = img.shape[:2] mat_shift = np.float32([[0.5, 0, 0], [0, 0.5, 0]]) # 縮放矩陣 dst = cv.warpAffine(img, mat_shift, (int(w/2), int(h/2))) cv.imshow('img1', img) cv.imshow('img2', dst) cv.waitKey(0)?
轉(zhuǎn)載于:https://www.cnblogs.com/carsonzhu/p/10763438.html
總結(jié)
以上是生活随笔為你收集整理的【计算机视觉】OpenCV篇(3) - 图像几何变换(仿射变换/透视变换)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 阿里云mysql 日志_mysql日志-
- 下一篇: 最新招聘公司网站 以及学校的宣讲会