数字图像处理(冈萨雷斯)学习 第二章 数字图像基础
引言
2.1 人類視覺(jué)系統(tǒng)的機(jī)理,包括眼中圖像的形成及對(duì)亮度的適應(yīng)和鑒別能力。
2.2 討論光、電磁波譜的其他分量及它們的成像特點(diǎn)
2.3 討論成像傳感器及怎么使用它們產(chǎn)生數(shù)字圖像
2.4 介紹均勻圖像取樣及灰度量化的概念。還有數(shù)字圖像表示、圖像中取樣數(shù)和灰度級(jí)變化的影響、空間和灰度分辨率的概念,以及圖像內(nèi)插的原理
2.5 處理像素間的各種基本關(guān)系
2.6 介紹本書用到的主要數(shù)學(xué)工具。該節(jié)的第二個(gè)目的是幫助您開(kāi)始積累一些在各種基本圖像處理任務(wù)中如何運(yùn)用這些工具的感覺(jué)
2.1 視覺(jué)感知要素
僅涉及人類視覺(jué)的最基本方面
2.1.1 人眼的結(jié)構(gòu)
有三層薄膜包圍著眼睛:角膜與鞏膜外殼、脈絡(luò)膜和視網(wǎng)膜
角膜是一種硬而透明的組織,覆蓋著眼睛的前表面。
與角膜相連的鞏膜是一層包圍著眼球其余部分的不透明的膜
2.2 光與電磁波譜
電磁波譜可用波長(zhǎng)、頻率獲能量來(lái)描述,波長(zhǎng)×頻率=光速,電磁波譜各個(gè)分量的能量=普朗克常數(shù)×波長(zhǎng)
2.3 圖像感知和獲取
我們感興趣的多數(shù)圖像都是由“照射”源和形成圖像的“場(chǎng)景”元素對(duì)光能的反射或吸收而產(chǎn)生的。比我們所熟悉的一個(gè)可見(jiàn)光源每天照射普通的三維場(chǎng)景情況更一般。
通過(guò)將輸入電能和對(duì)特殊類型檢測(cè)能源敏感的傳感器材料相結(jié)合,把輸入能源轉(zhuǎn)化為電壓。輸出電壓波形是傳感器的響應(yīng),通過(guò)把傳感器響應(yīng)數(shù)字化,從每一個(gè)傳感器得到的一個(gè)數(shù)字量。
2.3.1 使用單個(gè)傳感器獲取圖像
2.3.2 使用條帶傳感器獲取圖像
2.3.3 使用傳感器陣列獲取圖像
2.3.4 簡(jiǎn)單的圖像形成模型
2.4 圖像取樣和量化
2.4.1 取樣和量化的基本概念
2.4.2 數(shù)字圖像表示
2.4.3 空間和灰度分辨率
2.4.4 圖像內(nèi)插
內(nèi)插并用它調(diào)整圖像的大小,這是基本的圖像取樣方法
從根本上看,內(nèi)插是用已知數(shù)據(jù)來(lái)估計(jì)未知位置的數(shù)值的處理
最鄰近內(nèi)插法,把原圖像中最近鄰的灰度賦給了每個(gè)新位置,但是有產(chǎn)生不希望的人為缺陷的傾向,如某些直邊緣的嚴(yán)重失真。
更實(shí)用的方法是雙線性內(nèi)插,我們用4個(gè)最鄰近去估計(jì)給定位置的灰度。令(x,y)為我們想要賦以灰度值的位置的坐標(biāo),v(x,y)=ax+by+cxy+d
雙線性內(nèi)插給出了比最近鄰近內(nèi)插好得多的結(jié)果,但隨之而來(lái)的是計(jì)算量的增加
更復(fù)雜的是雙三次內(nèi)插,他包括16個(gè)最近緊鄰點(diǎn),是商業(yè)圖像編輯程序的標(biāo)準(zhǔn)內(nèi)插方法
2.5 像素間的一些基本關(guān)系
2.5.1 相鄰像素
位于坐標(biāo)(x,y)處的像素p有4個(gè)水平和垂直的相鄰像素,這組像素成為p的4鄰域,用N4(p)N_4(p)N4?(p)表示
也有4個(gè)對(duì)角相鄰像素,用ND(p)N_D(p)ND?(p)表示。這些點(diǎn)與4個(gè)鄰點(diǎn)一起成為p的8鄰域,用于N8(p)N_8(p)N8?(p)表示。
2.5.2 鄰接陣、連通性、區(qū)域和邊界
令V是用于定義鄰接性的灰度值集合。
在二值圖像中,如果把具有1值的像素歸諸于鄰接像素,則V = {1}。
在灰度圖像中,V一般包含有更多的元素。例如具有可能的灰度值范圍為0到255的鄰接像素中,集合V可能是這256個(gè)值的任何一個(gè)子集。
- 4鄰接。如果q在集合N4(p)N_4(p)N4?(p)中,則具有V中數(shù)值的兩個(gè)像素p和q是4鄰接的。
- 8鄰接。如果q在集合N8(p)N_8(p)N8?(p)中,則具有V中數(shù)值的兩個(gè)像素p和q是8鄰接的。
- m鄰接。如何(i)q在N4(p)N_4(p)N4?(p)中,或(ii)q在Nd(p)N_d(p)Nd?(p)中,且集合N4(p)∩N4(q)N_4(p) \cap N_4(q)N4?(p)∩N4?(q)中沒(méi)有來(lái)自V中數(shù)值的像素,則具有V中數(shù)值的兩個(gè)像素p和q是m鄰接的。
混合鄰接是8鄰接的改進(jìn)?;旌相徑拥囊胧菫榱讼捎?鄰接時(shí)產(chǎn)生的二義性。
令S是圖像中的一個(gè)像素子集。如果S的全部像素之間存在一個(gè)通路,則可以說(shuō)兩個(gè)像素p和q在S中是連通的。對(duì)于S中的任何像素p,S中聯(lián)通到該像素的像素集稱為S的連通分量。如果S僅有一個(gè)連通分量,則集合S稱為連通集。
令R是圖像中的一個(gè)像素子集。如果R是連通集,則稱R為一個(gè)區(qū)域。兩個(gè)區(qū)域,如果它們聯(lián)合形成一個(gè)連通集,則區(qū)域RiR_iRi?和RjR_jRj?稱為鄰接區(qū)域。不鄰接的區(qū)域稱為不連接區(qū)域。在談到區(qū)域時(shí),我們考慮的時(shí)4鄰接和8鄰接。為了使我們的定義有意義,必須指定鄰接的類型。
假設(shè)一幅圖像包含有KKK個(gè)不連接的區(qū)域,即Rk,k=1,2,...,KR_k, k = 1,2,...,KRk?,k=1,2,...,K,且它們都不接觸圖像邊界(這種假設(shè)的目的是在于避免處理特殊情形。這樣做不會(huì)喪失一般性,因?yàn)槿绻粋€(gè)或多個(gè)區(qū)域接觸到圖像的邊界,我們可以簡(jiǎn)單地使用1像素寬的背景值來(lái)填充圖像。) 令RuR_uRu?代表所有KKK個(gè)區(qū)域的并集,其所有點(diǎn)為圖像的前景,而其補(bǔ)集中的所有點(diǎn)為圖像的背景。
區(qū)域R的邊界是這樣的點(diǎn)的集合,這些點(diǎn)與R的補(bǔ)集中的點(diǎn)鄰近。換一種方式說(shuō),一個(gè)區(qū)域的邊界是該區(qū)域中至少有一個(gè)背景鄰點(diǎn)的像素集合。這里必須指定用于定義鄰接的連通性。
前述定義有時(shí)稱為區(qū)域的內(nèi)邊界,以便與其外邊界相區(qū)分,外邊界對(duì)應(yīng)于背景邊界。在開(kāi)發(fā)追蹤邊界的算法時(shí)這個(gè)區(qū)別很重要。這種算法為了保證結(jié)果形成一個(gè)閉合通路,通常是沿外邊界確立的。
如果R恰巧是整幅圖像(我們假設(shè)這副圖像是像素的方形集合),則邊界由圖像第一行、第一列和最后一行、最后一列的像素集合來(lái)定義。這個(gè)附加定義是需要的,因?yàn)橐桓眻D像超過(guò)邊界范圍之外沒(méi)有鄰點(diǎn)。正常情況下,當(dāng)我們提到一個(gè)區(qū)域時(shí),指的是一副圖像的子集,并且區(qū)域邊界種任何與圖像邊緣吻合的像素都作為區(qū)域邊界的一部分全部包含在其中。
一個(gè)有限區(qū)域的邊界形成一條閉合通路,并且是“整體”概念。邊緣是由具有某些超過(guò)預(yù)先設(shè)定的閾值的導(dǎo)數(shù)值的像素形成的。這樣邊緣的概念就是基于在進(jìn)行灰度級(jí)度量時(shí)不連續(xù)點(diǎn)的"局部“概念。把邊緣點(diǎn)連成邊緣線段是可能的,并且有時(shí)以與邊界對(duì)應(yīng)的方法連接線段。邊緣和邊界吻合的一個(gè)例外是二值圖像的情況,從二值區(qū)域提取邊緣與區(qū)域邊界是一樣的,這很直觀。
5.5.3 距離度量
距離度量滿足非負(fù)性,互換性,三角不等式
歐式距離 (圓形)
城市街區(qū)距離(菱形)
棋盤距離(正方形)
2.6 數(shù)字圖像處理所用數(shù)字工具的介紹
2.6.1 陣列與矩陣操作
2.6.2 線性操作與非線性操作
線性算子
非線性算子
2.6.3 算術(shù)操作
圖像間的算術(shù)操作是陣列操作,其意思是算術(shù)操作在相應(yīng)的像素對(duì)之間進(jìn)行。
例2.5 針對(duì)降噪的帶噪圖像相加(平均)
例2.6 增強(qiáng)差別的圖像相減
例2.7 使用圖像相乘和相除來(lái)校正陰影
2.6.4 集合和邏輯操作
一個(gè)灰度圖像的補(bǔ)集是255-灰度圖像像素
兩個(gè)灰度集合的并集是一個(gè)由空間相應(yīng)元素的最大灰度形成的陣列
模糊集合
2.6.5 空間操作
空間操作直接在給定圖像的像素上執(zhí)行。
我們把空間操作分為三大類:單像素操作,鄰域操作,幾何空間變換
單像素操作
鄰域操作
幾何空間變換和圖像配準(zhǔn)
在數(shù)字圖像處理中,幾何變換由兩個(gè)基本操作組成:
(1)坐標(biāo)的空間變換 (2)灰度內(nèi)插,即對(duì)空間變換后的像素賦灰度值
例2.9 圖像旋轉(zhuǎn)與灰度內(nèi)插
用仿射變換說(shuō)明圖像旋轉(zhuǎn)。
圖像配準(zhǔn)是數(shù)字圖像處理的一種重要應(yīng)用。
主要方法之一是使用約束點(diǎn),這些點(diǎn)是在輸入圖像和參考圖像中其位置恰好已知的相應(yīng)點(diǎn).這些點(diǎn)是在輸入圖像和參考圖像中其位置恰好已知的相應(yīng)點(diǎn).
估計(jì)變換函數(shù)問(wèn)題是建模問(wèn)題之一
例2.10 圖像配準(zhǔn)
2.6.6 向量與矩陣操作
2.6.7 圖像變換
通過(guò)變換輸入圖像來(lái)表達(dá)圖像處理任務(wù),在變換域執(zhí)行指定的任務(wù),之后再用反變換返回到空間域會(huì)更好.該過(guò)程從空間域到變換域,然后返回到空間域.
例2.11 變換域圖像處理
2.6.8 概率方法
總結(jié)
以上是生活随笔為你收集整理的数字图像处理(冈萨雷斯)学习 第二章 数字图像基础的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: Java学习需要多长时间?
- 下一篇: 百安居监控设计方案