计算机知识浩瀚,计算机视觉基础
高低頻高頻和低頻就是信號變化的頻率
圖像的頻率:灰度值變化劇烈程度的指標,是灰度在平面空間上的梯度
對于聲音來說其變化是一維的,是時域信號即信號大小隨著時間的變化而變化
對于圖像來說其變化是二維的,是空域信號即信號隨著空間坐標的變化而變化
所謂高頻,是指一個信號的變化速度較快,這是一個相對概念。
在圖像上來說,就是一片圖像的亮度變化較多且明顯;
在音頻領域,是指一個震蕩頻率較低的聲波;
在電學領域,是指可以被電感嚴重阻礙的交變電流。
換句話說,某一/某些事物將其某一可以量化的性質,按照時間或者不同事物有序列排列為橫軸,該性質的數值為縱軸,這樣所形成的圖像看上去相對變化較大的,就是高頻信號。低頻正好相反。
空域的高頻可以理解為細節信號,比如當一幅大圖縮小n倍后,圖像的細節就看不到了,我們就可以理解為高頻信號被濾掉了,而剩下的圖像部分就可理解為低頻了。
圖像的高低頻是對圖像各個位置之間強度變化的一種度量方法.
低頻分量:主要對整幅圖像的強度的綜合度量,描述大范圍的信息
高頻分量:主要是對圖像邊緣和輪廓的度量,描述具體的細節
如果一副圖像的各個位置的強度大小相等,則圖像只存在低頻分量,從圖像的頻譜圖上看,只有一個主峰,且位于頻率為零的位置。
如果一副圖像的各個位置的強度變化劇烈,則圖像不僅存在低頻分量,同時也存在多種高頻分量,從圖像的頻譜上看,不僅有一個主峰,同時也存在多個旁峰。
在灰度圖像中,亮度變化小的區域主要是低頻成分,而亮度變化劇烈的區域(比如物體的邊緣)主要是高頻成分。
簡言之,就是圖像中像素灰度值變化快的就是高頻部分,變化慢的就是低頻部分。
另外噪聲(即噪點)也是這樣,在一個像素所在的位置,之所以是噪點,就是因為它與正常的點顏色不一樣了,也就是說該像素點灰度值明顯不一樣了,,也就是灰度有快速地變化了,所以是高頻部分,因此有噪聲在高頻這么一說
濾波圖像其實是一種波,可以用波的算法處理圖像。
這是一張 400 x 400 的圖片,一共包含了 16 萬個像素點。
如果把每一行所有像素(上例是400個)的紅、綠、藍的值,依次畫成三條曲線,就得到了下面的圖形。
可以看到,每條曲線都在不停的上下波動。有些區域的波動比較小,有些區域突然出現了大幅波動(比如 54 和 324 這兩點)。
對比一下圖像就能發現,曲線波動較大的地方,也是圖像出現突變的地方。
這說明波動與圖像是緊密關聯的。圖像本質上就是各種色彩波的疊加。
低通濾波
低通濾波器(lowpass):減弱或阻隔高頻信號,保留低頻信號
藍線是原始的波形,綠線是低通濾波lowpass后的波形。可以看到,綠線的波動比藍線小很多,非常平滑
高通濾波
高通濾波器(highpass):減弱或阻隔低頻信號,保留高頻信號
黃線是原始的波形,藍線是高通濾波highpass后的波形。可以看到,黃線的三個波峰和兩個波谷(低頻波動),在藍線上都消失了,而黃線上那些密集的小幅波動(高頻波動),則是全部被藍線保留
上圖有三根曲線,黃線是高頻波動,紅線是低頻波動。它們可以合成為一根曲線,就是綠線
上圖中,綠線進行低通濾波和高通濾波后,得到兩根黑色的曲線,它們的波形跟原始的黃線和紅線是完全一致的
對圖像進行濾波
lowpass 使得圖像的高頻區域變成低頻,即色彩變化劇烈的區域變得平滑,也就是出現模糊效果
上圖中,紅線是原始的色彩曲線,藍線是低通濾波后的曲線
highpass 正好相反,過濾了低頻,只保留那些變化最快速最劇烈的區域,也就是圖像里面的物體邊緣,所以常用于邊緣識別
紅線是原始的色彩曲線,藍線是高通濾波后的曲線
下面這個網址,可以將濾波器拖到圖像上,產生過濾后的效果。
高斯濾波
高斯濾波器是一種線性平滑濾波器,能夠有效的抑制噪聲,平滑圖像。
其作用原理和均值濾波器類似,都是取濾波器窗口內的像素的均值作為輸出。其窗口模板的系數和均值濾波器不同,均值濾波器的模板系數都是相同的為1;而高斯濾波器的模板系數,則隨著距離模板中心的增大而系數減小。所以,高斯濾波器相比于均值濾波器對圖像個模糊程度較小
離散化窗口滑窗卷積的時,主要利用的是高斯核,高斯核一般是一個奇數的大小的高斯模板
一個二維的高斯函數如下:
$$G(x,y)={\frac{1}{2\pi\sigma^2}}e^{-{\frac {x^2+y^2}{2\sigma^2}}}$$
其中 \((x,y)\) 為點坐標,在圖像處理中可認為是整數; \(σ\) 是標準差
標準差越小,二維高斯圖像越窄小,平滑效果不明顯;標準差越大,而為高斯圖像越矮寬,濾波效果比較明顯
要想得到一個高斯濾波器的模板,可以對高斯函數進行離散化,得到的高斯函數值作為模板的系數。
例如:要產生一個 \(3×3\) 的高斯濾波器模板,以模板的中心位置為坐標原點進行取樣。模板在各個位置的坐標,如下所示( \(x\) 軸水平向右, \(y\) 軸豎直向下)
最后得到高斯模板:
左側是常用的3*3的高斯模板,右側是常用的5*5高斯模板
歸一化處理
為了盡可能的模擬高斯函數的相關性質,計算高斯模板的時候,計算出來的高斯模板中各個數值其和必須為1
另外一種解釋是:歸一化之后,通過卷積計算出來的模板中心像素被限制到了0-255的灰度區間中。假若某一鄰域內所有像素的灰度值為255,利用該模板進行卷積之后,求得的模板中心像素灰度值仍然為255;假若計算出來的高斯模板參數之和小于1,那么通過該模板進行卷積之后,模板中心像素的灰度值將小于255,偏離了實際的灰度值,產生了誤差。
高斯濾波性質
高斯函數具有五個重要的性質,這些性質使得它在早期圖像處理中特別有用.這些性質表明,高斯平滑濾波器無論在空間域還是在頻率域都是十分有效的低通濾波器,且在實際圖像處理中得到了工程人員的有效使用.高斯函數具有五個十分重要的性質,它們是:
二維高斯函數具有旋轉對稱性,即濾波器在各個方向上的平滑程度是相同的.一般來說,一幅圖像的邊緣方向是事先不知道的,因此,在濾波前是無法確定一個方向上比另一方向上需要更多的平滑.旋轉對稱性意味著高斯平滑濾波器在后續邊緣檢測中不會偏向任一方向.
高斯函數是單值函數.這表明,高斯濾波器用像素鄰域的加權均值來代替該點的像素值,而每一鄰域像素點權值是隨該點與中心點的距離單調增減的.這一性質是很重要的,因為邊緣是一種圖像局部特征,如果平滑運算對離算子中心很遠的像素點仍然有很大作用,則平滑運算會使圖像失真.
高斯函數本身這一事實的直接推論.圖像常被不希望的高頻信號所污染(噪聲和細紋理).而所希望的圖像特征(如邊緣),既含有低頻分量,又含有高頻分量.高斯函數付立葉變換的單瓣意味著平滑圖像不會被不需要的高頻信號所污染,同時保留了大部分所需信號.
高斯濾波器寬度(決定著平滑程度)是由參數σ表征的,而且σ和平滑程度的關系是非常簡單的.σ越大,高斯濾波器的頻帶就越寬,平滑程度就越好.通過調節平滑程度參數σ,可在圖像特征過分模糊(過平滑)與平滑圖像中由于噪聲和細紋理所引起的過多的不希望突變量(欠平滑)之間取得折衷.
由于高斯函數的可分離性,較大尺寸的高斯濾波器可以得以有效地實現.二維高斯函數卷積可以分兩步來進行,首先將圖像與一維高斯函數進行卷積,然后將卷積結果與方向垂直的相同一維高斯函數卷積.因此,二維高斯濾波的計算量隨濾波模板寬度成線性增長而不是成平方增長.
SIFT
圖像尺度空間 高斯卷積
尺度空間表達指的是不同高斯核所平滑后的圖片的不同表達
平時生活中,用人眼去看一張照片時,隨著觀測距離的增加,圖像會逐漸變得模糊。
那么計算機在“看”一張照片時,會從不同的“尺度”去觀測照片,尺度越大,圖像越模糊。
“尺度空間表達”指的是不同高斯核所平滑后的圖片的不同表達,
意思就是:原始照片的分辨率,和經過不同高斯核平滑后的照片的分辨率是一樣的。但是,對于計算機來說,不同模糊程度,照片“看”上去的樣子就不一樣了。高斯核越大,圖片“看”上去就越模糊。
那么,圖片的模糊與找特征點有關系嗎?
計算機沒有主觀意識去識別哪里是特征點,它能做的,只是分辨出變化率最快的點。彩色圖是三通道的,不好檢測突變點。需要將RGB圖轉換為灰度圖,此時灰度圖為單通道,灰度值在0~255之間分布。
高斯卷積之后,圖像雖然變模糊了。但是整體的像素沒有變,依然可以找到灰度值突變的點。而這些點,就可以作為候選特征點了,后期再進一步減少點的數量,提高準確率即可。
金字塔多分辨率表達——降采樣
圖像金字塔化:先進行圖像平滑,再進行降采樣,根據降采樣率不同,所得到一系列尺寸逐漸減小的圖像
若對一張圖片進行降采樣,其像素點就會減少,圖片尺寸也會隨之變小。那么給人的感覺就好比一個金字塔。
LOG(Laplassian of Gaussian)
前面提出的那種表達,各有各的優勢:
“尺度空間表達”在所有尺度上具有相同分辨率,而“圖像金字塔化”在每層的表達上分辨率都會減少固定比率。
“圖像金字塔化”處理速度快,占用存儲空間小,而“尺度空間表達”剛好相反。
那么將兩者融合起來的話,就得到了LOG圖像,高斯拉普拉斯變換圖像
其步驟是:
先將照片降采樣,得到了不同分辨率下的圖像金字塔。
再對每層圖像進行高斯卷積。這樣一來,原本的圖像金字塔每層只有一張圖像,而卷積后,每層又增加了多張不同模糊程度下的照片。
然而,LOG圖像還不是我們想要的,我們做那么多就是為了更好地獲取特征點,所以還需要對LOG圖像再進一步地優化。所以,DOG圖像橫空出世!!
DOG(Difference of Gaussian)
DOG即高斯差分
構造高斯差分圖像的步驟是:在獲得LOG圖像后,用其相鄰的圖像進行相減,得到所有圖像重新構造的金字塔就是DOG金字塔
左圖是LOG圖像,右圖是DOG圖像
1) 尋找極值點
當得到DOG金字塔后,我們接下來要做的是尋找DOG極值點。每個像素點與其周圍的像素點比較,當其大于或者小于所有相鄰點時,即為極值點。
以黃點為檢測點,那么其周圍的點,除了同層所包圍的8個綠點外,還有上一層的9個點與下一層的9個點
2) 去除邊緣影響
有些極值點不是我們想要的,當中就有一大部分是邊緣區域產生的極值點。因為物體的邊緣輪廓在灰度圖中,存在著灰度值的突變,這樣的點在計算中就被“誤以為”是特征值
邊緣區域在縱向上灰度值突變很大
我們想到了Hessian矩陣,海塞矩陣是用來求曲率的,可以以函數的二階偏導為元素,構成一個2x2的矩陣H
3) 方向賦值
當我們精確定位關鍵點后,需要找到該特征點對應的尺度值 σ,根據這一尺度值,將對應的高斯圖像的關鍵點進行有限差分,以3×1.5σ為半徑的區域內圖像梯度的幅角和幅值。
然后利用直方圖統計領域內像素對應的梯度和幅值:梯度方向角為橫軸刻度,取45度為一個單位,那么橫軸就有8個刻度;縱軸是對應梯度的幅值累加值。
取幅值最高的方向為主方向。有的時候,會出現第二峰值,因為有較多的關鍵點是多方向的。如果直接把它忽略掉不加以考慮的話,最后對匹配精度的影響還是蠻大的。
所以,為了匹配的穩定性,我們將超過峰值能量的百分之80的方向,稱為輔方向。
4) 關鍵點描述
到了這里,我們就已經得到賦值后的SIFT特征點了,其包含了位置,尺度,方向的信息。
接下來的要做的是:關鍵點的描述,即用一組向量將關鍵點描述出來。
確定描述子采樣區域
生成描述子
生成特征匹配點
對特征向量進行歸一化處理,去除光照變化的影響
圖像相似性
當兩幅圖像的 SIFT 特征向量生成以后,下一步就可以采用關鍵點特征向量的歐式距離來作為兩幅圖像中關鍵點的相似性判定度量。
轉載與參考
總結
以上是生活随笔為你收集整理的计算机知识浩瀚,计算机视觉基础的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: vba调用计算机,如何实现跨工作表自动引
- 下一篇: 计算机网络期中考试总结反思,期中考试总结