数字图像处理(第二章)
第二章 數(shù)字圖像處理基礎
2.1人眼的結構
?(一般考試不會考,只是簡單了解即可)
眼睛中的光接收器主要是視覺細胞,它包括視錐細胞和視桿細胞。
視錐細胞(白晝視覺/亮視覺):
- 數(shù)量:600 ~ 700萬
- 形狀:錐狀體細胞。
- 作用:對顏色高度敏感,可以充分分辨圖像細節(jié)。
- 分部區(qū)域:主要在視網(wǎng)膜的中央凹區(qū)域,在這部分的分布密度大約為150000個/mm方。
補充:人類一般有三類視錐細胞, 分別對應三種不同顏色的感應(黃綠、綠、藍紫),這也是RGB三原色的由來
視桿細胞(暗視覺/微光視覺):
- 數(shù)量:7500 ~ 15000萬
- 形狀:桿狀體細胞。
- 作用:分辨率較低,沒有色彩感覺,不感覺顏色,對低照明敏感。
- 分部區(qū)域:分部在視網(wǎng)膜中心向外偏離視軸大約20°,密度先增大后減少。
2.2 亮度適應和辨別
??人的視覺系統(tǒng)能夠適應的光強度級別范圍很寬——從暗閾值到強閃光約有1010個量級。實驗數(shù)據(jù)指出,主觀亮度(即由人的視覺系統(tǒng)感知的亮度)是進入人眼的光強的對數(shù)函數(shù)。
?
? ? ? ? 圖中畫出的光強度與主觀亮度的關系曲線說明了這一特性。人眼視覺系統(tǒng)對亮度的對比度敏感而非對亮度本身敏感。?
? ? ? 另外兩種現(xiàn)象清楚地表明感知亮度不是強度的簡單函數(shù)。第一種現(xiàn)象基于這樣一個事實,即視覺系統(tǒng)往往會在不同強度區(qū)域的邊界處出現(xiàn)“下沖”或“上沖”現(xiàn)象,即馬赫帶效應,厄恩斯特·馬赫于1865年首次描述了這一現(xiàn)象。(馬赫帶現(xiàn)象要記住它的專業(yè)性描述)
? ? ? ?第二種現(xiàn)象叫同時對比,即感知區(qū)域的亮度并不簡單地取決于其強度,如圖所示,所有的中心方塊都有完全相同地強度。然而,隨著背景變得更亮,它們在眼睛里會變得更暗。
?
? ? ? ?人類感知現(xiàn)象的另一些例子就是錯覺,在錯覺中,眼睛填充了不存在的信息或錯誤地感知了物體的集合特點。如圖所示,正方形的輪廓看起來很清楚,盡管圖像中并沒有定義這樣的一個圖形的直線。其它三幅圖也類似。
2.2圖像的數(shù)字化及表達
? ? ? ?圖像有單色與彩色、平面與立體、靜止與動態(tài)、自發(fā)光與反射(透射)等區(qū)別,任一幅圖像,根據(jù)它的光強度(亮度、密度或灰度)的空間分布,均可以用下面的函數(shù)形式來表達:
(x,y,z為空間坐標,t,為時間,?為波長)
?對靜態(tài)圖像,t為常數(shù),對于單色圖像為常數(shù),對于平面圖像,z為常數(shù)。
則對于靜態(tài)平面單色圖像數(shù)學表達式為:
2.3圖像的采樣和量化
(1)采樣(空間坐標的離散化)
將空間中連續(xù)的圖像變換成離散點的操作成為采樣。若橫向的像素數(shù)(列數(shù))為M ,縱向的像素數(shù)(行數(shù))為N,則圖像總像素數(shù)為M*N個像素。
采樣間隔越大,所得圖像像素數(shù)越少,空間分辨率低,質量差,嚴重時出現(xiàn)馬賽克效應;
采樣間隔越小,所得圖像像素數(shù)越多,空間分辨率高,圖像質量好,但數(shù)據(jù)量大。
在灰度級變化尖銳的區(qū)域,用細膩的采樣,在灰度級比較平滑的區(qū)域,用粗糙的采樣。
(2)量化(灰度的離散化)
圖像采樣后分割成離散的像素,但是其灰度值是連續(xù)的,計算機不能處理,將像素灰度轉換成離散的數(shù)值的過程稱為量化。
量化等級越多,所得圖像層次越豐富,灰度分辨率高,圖像質量好,但數(shù)據(jù)量大;
量化等級越少,圖像層次欠豐富,灰度分辨率低,會出現(xiàn)假輪廓現(xiàn)象,圖像質量變差,但數(shù)據(jù)量小.
?
2.4空間分辨率和灰度分辨率
空間分辨率是圖像中最小可辯別細節(jié)的測度。也就是數(shù)字圖像的采樣分辨率。在數(shù)量上,空間分辨率可以有很多方法表示。其中每單位距離線對數(shù)和每單位距離點數(shù)(像素數(shù))是最通用的度量。每單位距離點數(shù)是印刷和出版業(yè)中最常用的圖像分辨率的度量。
灰度分辨率是指在灰度級中可分辨的最小變化。也就是數(shù)字圖像的量化分辨率。基于硬件的考慮,正如前一節(jié)中提到的那樣,灰度級數(shù)通常是2的整數(shù)次冪。最通用的數(shù)是8比特,在某些特殊的圖像增強應用中,用16比特也是必要的。
2.5內插法
內插通常在圖像放大、縮小、旋轉和幾何校正等任務中使用。
最近鄰內插:將原圖像中最近鄰的灰度賦給了每個新位置,方法簡單但是會有嚴重失真。
雙線性內插:用到4個最近鄰點,構建4個方程:v(x,y)=ax+by+cxy+d,求解出系數(shù):a、b、c、d,代入所求位置的x、y,即可求解出該點灰度值v(x,y)。
雙三次內插:包括16個最近鄰點,考試一般不要求計算,所以只需知道有該內插法即可。
2.6像素間的基本關系
2.6.1鄰域:
假設坐標(x,y)處的像素p有4個與其水平和垂直的相鄰像素,坐標分別為:
(x+1,y)、(x-1,y)、(x,y+1)、(x,y-1)
則這組像素稱為p的4鄰域(自然是不包括p的),用N4(p)表示(如下圖的橙色點)。每個像素距(x,y)一個單位距離,如果(x,y)位于圖像的邊界上,則p的某些相鄰像素位于數(shù)字圖像的外部。
p的4個對角相鄰像素的坐標為:
(x+1,y+1)、(x+1,y-1)、(x-1,y+1)、(x-1,y-1)
并用ND(p)表示(如下圖的藍色點)。
N4(p)和ND(p)合起來稱為p的8鄰域,用N8(p)表示。同樣,這些相鄰像素點是可能落在圖像外邊的(如下圖的第三個圖,橙色和藍色兩個部分的點均為N8(p)中的點)。
以上內容可圖解為:
?注:以上概念為鄰域,不是像素鄰接。(對于某個點是領域,對于多個像素點是像素鄰接)
2.6.2鄰接性、連通性、區(qū)域和邊界
令V(V是一個規(guī)則,例如也可V={|A-B|<=2})是用于定義鄰接性的灰度值集合(鄰接性不光在于是否位于其鄰接域,還在于是否符合這個灰度值集合)。在二值圖像中,如果把具有1值的像素歸諸于鄰接像素,則V={1}。在灰度圖像中,概念是一樣的,但是集合V一般包含有更多的元素。
此時則有
4鄰接:像素p和 q的灰度值屬于集合V,像素q在N_4 (p)中。
8鄰接:像素p和 q的灰度值屬于集合V,像素q在N_8 (p)中。
m鄰接:像素p q的灰度值屬于集合V,像素q在N_4 (p)中或者像素q在ND (p)中,且集合N_4 (p)∩N_4 (q)沒有來自V中數(shù)值的像素(注意是集合部分,非集合部分不算)。
? ? ? m鄰接是8鄰接的改進。m鄰接的引入是為了消除采用8鄰接時產(chǎn)生的二義性。例如考慮下圖中V={1}的像素排列,第二張圖所示產(chǎn)生了多重二義性8鄰接,第三張圖所示可以通過m鄰接消除這種二義性。(也就是說如果8鄰接的話,這兩個鄰接像素之間的通路就不具備唯一性,有兩條。關于通路下面有解釋。)
%通路及其長度:
從具有坐標(x,y)的像素p到具有坐標(s,t)的像素q的通路(或曲線)是特定的像素序列,其坐標為
(x0,y0)、(x1,y1)、…(xn,yn)
其中(x0,y0)=(x,y)且(xn,yn)=(s,t),且像素(xi,yi)和(xi-1,yi-1)對于1≤i≤n是鄰接的。在這種情況下,n是通路的長度。如果(x0,y0)=(xn,yn),則通路是閉合通路。(由此可以看出通路是隔了不止一個點的)
然后根據(jù)幾鄰接來區(qū)分幾通路,若是4鄰接就是4通路,8鄰接就是8通路,m鄰接就是m通路。(那么一種通路上面肯定只有一種鄰接類型)
%連通,連通分量:
令S是圖像中的一個像素子集。如果S中的兩個像素p和q之間存在一個通路,那么說兩個像素p和q在S中是連通的。
對于S中的任何像素p,S中連通到該像素的像素集(注意不要重復)稱為S的連通分量(S中存在的通路條數(shù)+單個不能與其他像素組成通路的和)。舉一個更具體的例子:假設在S中有5個像素p1、p2、p3、p4、p5。然后p1-p2-p3連通、p4,p5。那么這就是三個連通分量。
如果S僅有一個連通分量,則集合S稱為連通集。
令R是圖像中的一個像素子集。如果R是連通集,則稱R為一個區(qū)域。兩個區(qū)域Ri和Rj,如果它們聯(lián)合形成一個連通集,則區(qū)域Ri和Rj稱為鄰接區(qū)域。不鄰接的區(qū)域稱為不鄰接區(qū)域。
不過在討論是否為鄰接區(qū)域的時候,只能考慮兩個區(qū)域邊界的像素是否構成4鄰接和8鄰接,而不考慮m鄰接。在定義區(qū)域鄰接的時候,必須指定鄰接類型(區(qū)域之間幾鄰接需與區(qū)域內部幾鄰接一致,即:如果兩個鄰接區(qū)域的并集需要為一個連通集則整個大區(qū)域需只能存在一種鄰接)。(當然這些區(qū)域之間肯定不允許出現(xiàn)有交集的情況)
%前景和背景:
假設一幅圖像包含有K個不相交的區(qū)域Rk,k=1,2,3…,K。且它們都不與圖像邊界相接(進行這種假設的目的在于方便進行圖像處理。如果一個或多個區(qū)域接觸到圖像的邊界,我們可簡單地使用1像素寬的背景值邊界來填充圖像)。
令Ru代表所有K個區(qū)域的并集,并令(Ru)c代表其補集。我們稱Ru中的所有點為圖像的前景,而稱(Ru)c中所有點為圖像的背景。
%邊界:
區(qū)域R的邊界(也稱為邊框或輪廓)是R中與R的補集中的像素相鄰的一組像素。換一種方式說,一個區(qū)域的邊界是該區(qū)域中至少有一個背景鄰點的像素集。這里再強調一下,我們必須指定用于定義鄰接的連通性(即是幾連通的)。
僅當區(qū)域和背景之間采用8鄰接時,加圈的點才位于像素值為1的邊界上
前述定義有時稱為區(qū)域的內邊界,以便于其外邊界相區(qū)分,外邊界對應于背景邊界。在開發(fā)追蹤邊界的算法時這一區(qū)別很重要。這種算法為了保證結果形成一個閉合通路,通常是沿外邊界確立的。
? ? ? ?如果R恰巧是整幅圖像(我們假設這幅圖像是像素的方形集合),則邊界由圖像第一行、第一列和最后一行、最后一列的像素集合來定義。
2.7算術運算:
兩幅圖像f(x,y)和g(x,y)之間的算術運算表示為:
s(x,y)= f(x,y)+g(x,y)
d(x,y)= f(x,y)-g(x,y)
p(x,y)= f(x,y)*g(x,y)
v(x,y)= f(x,y)÷g(x,y)
這些運算都是對應像素運算。
應用:
圖像相加(平均)降低噪聲(例如:很多的星球圖像相加,然后求平均值從而得出清晰的星球圖像)
使用圖像相減比較圖像(圖像相減用于增強圖像的差)
使用圖像相乘/相除矯正陰影和模板(比如一幅圖像拍攝的時候,一個角落特別暗,其他地方特別亮,那通過計算得出陰影的模式,就可將其陰影模式的倒數(shù)乘以原圖像,從而消除光線分布不均勻而對圖像產(chǎn)生的影響。)
?
2.8空間運算
空間運算分為三類:(1)單像素運算;(2)鄰域運算;(3)幾何空間變換
2.8.1 單像素運算
? ? ? ?是用一個變換函數(shù)T改變圖像中各個像素的灰度。
s=T(z)
? ? ? 第3章具體討論。
2.8.2 鄰域運算
? ? ? 后續(xù)章節(jié)會討論關于算子對鄰域運算處理進行討論
2.8.3 幾何變換
? ? ? 改變圖像中像素的空間排列,這些變換通常稱為橡皮膜變換(根據(jù)預定義的一組規(guī)則來拉伸或收縮橡皮膜),數(shù)字圖像的幾何變換由兩種基本運算組成:
? ? ?考點主要是仿射變換,包括:縮放變換、平移變換、旋轉變換和剪切變換。
? ? ? 上面這個式子可以看成以下變化的通式。
? ? ? 以下式子或者矩陣需要進行理解記憶,縮放和平移都很好理解,旋轉的部分可以自己畫坐標軸然后推導,以加深理解。
注:若考試中或者不同書本中出現(xiàn)式子的某些值不一樣,可以考慮時不時該書籍或者是題目選取的坐標系不同,坐標系有直角坐標系(笛卡爾坐標系)和矩陣坐標系兩種,下圖采用的是矩陣坐標系。
?
2.9圖像的分類
位圖:位圖是靜止圖像的一種。位圖是通過許多像素點表示一幅圖像,每個像素具有顏色屬性和位置屬性。
? ? ? ?圖像的分類很好理解,這里就只是簡單的列出來,其中索引圖像可以當成你在尋找字體的顏色時,系統(tǒng)已經(jīng)給你設定好了就那么多顏色,只能從中選出你最心儀的一種,而沒有全彩的可以自己選定R、G、B各自的值為多少。
總結
以上是生活随笔為你收集整理的数字图像处理(第二章)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机键盘指示灯不亮也不启动不了机,电脑
- 下一篇: uniappd的web-view组件无法