當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

数字图像处理(冈萨雷斯)学习第二章数字图像基础

發(fā)布時(shí)間：2024/8/1 编程问答 80 豆豆

生活随笔收集整理的這篇文章主要介紹了数字图像处理(冈萨雷斯)学习第二章数字图像基础小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

引言

2.1 人類視覺(jué)系統(tǒng)的機(jī)理，包括眼中圖像的形成及對(duì)亮度的適應(yīng)和鑒別能力。
2.2 討論光、電磁波譜的其他分量及它們的成像特點(diǎn)
2.3 討論成像傳感器及怎么使用它們產(chǎn)生數(shù)字圖像
2.4 介紹均勻圖像取樣及灰度量化的概念。還有數(shù)字圖像表示、圖像中取樣數(shù)和灰度級(jí)變化的影響、空間和灰度分辨率的概念，以及圖像內(nèi)插的原理
2.5 處理像素間的各種基本關(guān)系
2.6 介紹本書用到的主要數(shù)學(xué)工具。該節(jié)的第二個(gè)目的是幫助您開(kāi)始積累一些在各種基本圖像處理任務(wù)中如何運(yùn)用這些工具的感覺(jué)

2.1 視覺(jué)感知要素

僅涉及人類視覺(jué)的最基本方面

2.1.1 人眼的結(jié)構(gòu)

有三層薄膜包圍著眼睛:角膜與鞏膜外殼、脈絡(luò)膜和視網(wǎng)膜
角膜是一種硬而透明的組織，覆蓋著眼睛的前表面。
與角膜相連的鞏膜是一層包圍著眼球其余部分的不透明的膜

2.2 光與電磁波譜

電磁波譜可用波長(zhǎng)、頻率獲能量來(lái)描述，波長(zhǎng)×頻率=光速，電磁波譜各個(gè)分量的能量=普朗克常數(shù)×波長(zhǎng)

2.3 圖像感知和獲取

我們感興趣的多數(shù)圖像都是由“照射”源和形成圖像的“場(chǎng)景”元素對(duì)光能的反射或吸收而產(chǎn)生的。比我們所熟悉的一個(gè)可見(jiàn)光源每天照射普通的三維場(chǎng)景情況更一般。
通過(guò)將輸入電能和對(duì)特殊類型檢測(cè)能源敏感的傳感器材料相結(jié)合，把輸入能源轉(zhuǎn)化為電壓。輸出電壓波形是傳感器的響應(yīng)，通過(guò)把傳感器響應(yīng)數(shù)字化，從每一個(gè)傳感器得到的一個(gè)數(shù)字量。

2.3.1 使用單個(gè)傳感器獲取圖像

2.3.2 使用條帶傳感器獲取圖像

2.3.3 使用傳感器陣列獲取圖像

2.3.4 簡(jiǎn)單的圖像形成模型

2.4 圖像取樣和量化

2.4.1 取樣和量化的基本概念

2.4.2 數(shù)字圖像表示

2.4.3 空間和灰度分辨率

2.4.4 圖像內(nèi)插

內(nèi)插并用它調(diào)整圖像的大小，這是基本的圖像取樣方法
從根本上看，內(nèi)插是用已知數(shù)據(jù)來(lái)估計(jì)未知位置的數(shù)值的處理
最鄰近內(nèi)插法，把原圖像中最近鄰的灰度賦給了每個(gè)新位置，但是有產(chǎn)生不希望的人為缺陷的傾向，如某些直邊緣的嚴(yán)重失真。
更實(shí)用的方法是雙線性內(nèi)插，我們用4個(gè)最鄰近去估計(jì)給定位置的灰度。令(x,y)為我們想要賦以灰度值的位置的坐標(biāo)，v(x,y)=ax+by+cxy+d
雙線性內(nèi)插給出了比最近鄰近內(nèi)插好得多的結(jié)果，但隨之而來(lái)的是計(jì)算量的增加
更復(fù)雜的是雙三次內(nèi)插，他包括16個(gè)最近緊鄰點(diǎn)，是商業(yè)圖像編輯程序的標(biāo)準(zhǔn)內(nèi)插方法

2.5 像素間的一些基本關(guān)系

2.5.1 相鄰像素

位于坐標(biāo)(x,y)處的像素p有4個(gè)水平和垂直的相鄰像素，這組像素成為p的4鄰域，用 $N_4(p)$ 表示
也有4個(gè)對(duì)角相鄰像素，用 $N_D(p)$ 表示。這些點(diǎn)與4個(gè)鄰點(diǎn)一起成為p的8鄰域，用于 $N_8(p)$ 表示。

2.5.2 鄰接陣、連通性、區(qū)域和邊界

令V是用于定義鄰接性的灰度值集合。
在二值圖像中，如果把具有1值的像素歸諸于鄰接像素，則V = {1}。
在灰度圖像中，V一般包含有更多的元素。例如具有可能的灰度值范圍為0到255的鄰接像素中，集合V可能是這256個(gè)值的任何一個(gè)子集。

4鄰接。如果q在集合 $N_4(p)$ 中，則具有V中數(shù)值的兩個(gè)像素p和q是4鄰接的。
8鄰接。如果q在集合 $N_8(p)$ 中，則具有V中數(shù)值的兩個(gè)像素p和q是8鄰接的。
m鄰接。如何(i)q在 $N_4(p)$ 中，或(ii)q在 $N_d(p)$ 中，且集合 $N4(p)∩N4(q)N_4(p) \cap N_4(q)$ 中沒(méi)有來(lái)自V中數(shù)值的像素，則具有V中數(shù)值的兩個(gè)像素p和q是m鄰接的。

混合鄰接是8鄰接的改進(jìn)?；旌相徑拥囊胧菫榱讼捎?鄰接時(shí)產(chǎn)生的二義性。
令S是圖像中的一個(gè)像素子集。如果S的全部像素之間存在一個(gè)通路，則可以說(shuō)兩個(gè)像素p和q在S中是連通的。對(duì)于S中的任何像素p，S中聯(lián)通到該像素的像素集稱為S的連通分量。如果S僅有一個(gè)連通分量，則集合S稱為連通集。
令R是圖像中的一個(gè)像素子集。如果R是連通集，則稱R為一個(gè)區(qū)域。兩個(gè)區(qū)域，如果它們聯(lián)合形成一個(gè)連通集，則區(qū)域 $R_i$ 和 $R_j$ 稱為鄰接區(qū)域。不鄰接的區(qū)域稱為不連接區(qū)域。在談到區(qū)域時(shí)，我們考慮的時(shí)4鄰接和8鄰接。為了使我們的定義有意義，必須指定鄰接的類型。

假設(shè)一幅圖像包含有 $K$ 個(gè)不連接的區(qū)域，即 $R_k, k = 1,2,...,K$ ,且它們都不接觸圖像邊界(這種假設(shè)的目的是在于避免處理特殊情形。這樣做不會(huì)喪失一般性，因?yàn)槿绻粋€(gè)或多個(gè)區(qū)域接觸到圖像的邊界，我們可以簡(jiǎn)單地使用1像素寬的背景值來(lái)填充圖像。) 令 $R_u$ 代表所有 $K$ 個(gè)區(qū)域的并集，其所有點(diǎn)為圖像的前景，而其補(bǔ)集中的所有點(diǎn)為圖像的背景。

區(qū)域R的邊界是這樣的點(diǎn)的集合，這些點(diǎn)與R的補(bǔ)集中的點(diǎn)鄰近。換一種方式說(shuō)，一個(gè)區(qū)域的邊界是該區(qū)域中至少有一個(gè)背景鄰點(diǎn)的像素集合。這里必須指定用于定義鄰接的連通性。

前述定義有時(shí)稱為區(qū)域的內(nèi)邊界，以便與其外邊界相區(qū)分，外邊界對(duì)應(yīng)于背景邊界。在開(kāi)發(fā)追蹤邊界的算法時(shí)這個(gè)區(qū)別很重要。這種算法為了保證結(jié)果形成一個(gè)閉合通路，通常是沿外邊界確立的。
如果R恰巧是整幅圖像(我們假設(shè)這副圖像是像素的方形集合)，則邊界由圖像第一行、第一列和最后一行、最后一列的像素集合來(lái)定義。這個(gè)附加定義是需要的，因?yàn)橐桓眻D像超過(guò)邊界范圍之外沒(méi)有鄰點(diǎn)。正常情況下，當(dāng)我們提到一個(gè)區(qū)域時(shí)，指的是一副圖像的子集，并且區(qū)域邊界種任何與圖像邊緣吻合的像素都作為區(qū)域邊界的一部分全部包含在其中。

一個(gè)有限區(qū)域的邊界形成一條閉合通路，并且是“整體”概念。邊緣是由具有某些超過(guò)預(yù)先設(shè)定的閾值的導(dǎo)數(shù)值的像素形成的。這樣邊緣的概念就是基于在進(jìn)行灰度級(jí)度量時(shí)不連續(xù)點(diǎn)的"局部“概念。把邊緣點(diǎn)連成邊緣線段是可能的，并且有時(shí)以與邊界對(duì)應(yīng)的方法連接線段。邊緣和邊界吻合的一個(gè)例外是二值圖像的情況，從二值區(qū)域提取邊緣與區(qū)域邊界是一樣的，這很直觀。

5.5.3 距離度量

距離度量滿足非負(fù)性，互換性，三角不等式

歐式距離（圓形）
城市街區(qū)距離（菱形）
棋盤距離（正方形）

2.6 數(shù)字圖像處理所用數(shù)字工具的介紹

2.6.1 陣列與矩陣操作

2.6.2 線性操作與非線性操作

線性算子
非線性算子

2.6.3 算術(shù)操作

圖像間的算術(shù)操作是陣列操作，其意思是算術(shù)操作在相應(yīng)的像素對(duì)之間進(jìn)行。
例2.5 針對(duì)降噪的帶噪圖像相加(平均)
例2.6 增強(qiáng)差別的圖像相減
例2.7 使用圖像相乘和相除來(lái)校正陰影

2.6.4 集合和邏輯操作

一個(gè)灰度圖像的補(bǔ)集是255-灰度圖像像素
兩個(gè)灰度集合的并集是一個(gè)由空間相應(yīng)元素的最大灰度形成的陣列

模糊集合

2.6.5 空間操作

空間操作直接在給定圖像的像素上執(zhí)行。
我們把空間操作分為三大類:單像素操作，鄰域操作，幾何空間變換
單像素操作
鄰域操作
幾何空間變換和圖像配準(zhǔn)
在數(shù)字圖像處理中，幾何變換由兩個(gè)基本操作組成:
(1)坐標(biāo)的空間變換（2)灰度內(nèi)插，即對(duì)空間變換后的像素賦灰度值
例2.9 圖像旋轉(zhuǎn)與灰度內(nèi)插
用仿射變換說(shuō)明圖像旋轉(zhuǎn)。
圖像配準(zhǔn)是數(shù)字圖像處理的一種重要應(yīng)用。
主要方法之一是使用約束點(diǎn),這些點(diǎn)是在輸入圖像和參考圖像中其位置恰好已知的相應(yīng)點(diǎn).這些點(diǎn)是在輸入圖像和參考圖像中其位置恰好已知的相應(yīng)點(diǎn).
估計(jì)變換函數(shù)問(wèn)題是建模問(wèn)題之一
例2.10 圖像配準(zhǔn)

2.6.6 向量與矩陣操作

2.6.7 圖像變換

通過(guò)變換輸入圖像來(lái)表達(dá)圖像處理任務(wù),在變換域執(zhí)行指定的任務(wù),之后再用反變換返回到空間域會(huì)更好.該過(guò)程從空間域到變換域,然后返回到空間域.
例2.11 變換域圖像處理

2.6.8 概率方法

總結(jié)

以上是生活随笔為你收集整理的数字图像处理(冈萨雷斯)学习第二章数字图像基础的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。