数字图像处理:第一章 概述
第一章 概述
數(shù)字圖象處理是一門關(guān)于如何用計算機(jī)對圖象進(jìn)行處理的學(xué)科,本課程主要講解基本原理和方法,針對計算機(jī)系的學(xué)生,強(qiáng)調(diào)編程實踐和建立圖象處理應(yīng)用系統(tǒng)的方法。推薦的教材與圖象編程參考書包括:
?
最近出版的新書:
目錄
作業(yè)
1.?什么是數(shù)字圖象?
數(shù)字圖象是指由被稱作象素的小塊區(qū)域組成的二維矩陣。對于單色即灰度圖象而言,每個象素的亮度用一個數(shù)值來表示,通常數(shù)值范圍在0到255之間,即可用一個字節(jié)來表示,0表示黑、255表示白,而其它表示灰度。如下圖所示:
? ?
圖1.1?灰度圖象(128x128)及其對應(yīng)的數(shù)值矩陣(僅列出一部分(26x31))
彩色圖象可以用紅、綠、藍(lán)三元組的二維矩陣來表示。通常,三元組的每個數(shù)值也是在0到255之間,0表示相應(yīng)的基色在該象素中沒有,而255則代表相應(yīng)的基色在該象素中取得最大值,這種情況下每個象素可用三個字節(jié)來表示。
? ?
圖1.2?彩色圖象(128x128)及其對應(yīng)的數(shù)值矩陣(僅列出一部分(25x31))
????數(shù)字圖象是對二維連續(xù)光函數(shù)進(jìn)行等距離矩形網(wǎng)格采樣,再對幅度進(jìn)行等間隔量化得到的二維數(shù)據(jù)矩陣。采樣是測量每個象素值而量化是將該值數(shù)字化的過程。
數(shù)字圖象在本質(zhì)上是二維信號,因此信號處理(以一維信號為對象展開的課程)中的基本技術(shù)(如FFT)可以用在數(shù)字圖象處理中。但是,由于數(shù)字圖象只是一種非常特殊的二維信號,反映場景的視覺屬性,只是二維連續(xù)信號的非常稀疏的采樣,希望從單個或少量采樣中獲得有意義的描述或特征,無法照搬一維信號處理的方法,需要專門的技術(shù)。實際上數(shù)字圖象處理更多地依賴于具體應(yīng)用問題,是一系列的特殊技術(shù)的匯集,缺乏貫穿始終的嚴(yán)格的理論體系。
數(shù)字圖象處理是一個多學(xué)科交叉的領(lǐng)域,涉及光學(xué)、電子學(xué)、數(shù)學(xué)、攝影技術(shù)、計算機(jī)技術(shù)等眾多學(xué)科,是一個高度綜合的技術(shù)學(xué)科。
解釋:
數(shù)字圖象處理是一門計算機(jī)的技術(shù)課程,而且是一種非常特殊的專業(yè)課程,而非有系統(tǒng)理論體系的基礎(chǔ)課程。
本課程只講述基本原理和一般方法,不涉及具體領(lǐng)域中的特殊方法,如醫(yī)學(xué)圖象處理已經(jīng)成為一個專門的研究領(lǐng)域,有許多特殊的處理方法。
學(xué)生在學(xué)習(xí)時的感覺是內(nèi)容的系統(tǒng)性不強(qiáng),涉及的知識面寬但不很深(高級部分除外,如小波變換等),需要出色的綜合能力。而在技術(shù)上需要很強(qiáng)的程序設(shè)計能力,可以說圖象處理是門對學(xué)生的技術(shù)能力即動手能力要求很高的課程。
圖象在計算機(jī)中表現(xiàn)為二維數(shù)據(jù)矩陣,難點是矩陣所涉及的各種變換與其在信號原理中的對應(yīng)關(guān)系。圖象處理涉及很多變化參數(shù),為了達(dá)到好的圖象處理效果,參數(shù)的選擇是關(guān)鍵。為了實現(xiàn)好的圖象處理功能,方便的交互手段包括調(diào)整參數(shù)、圖象的顯示、存儲等是很重要的。
相關(guān)資料:數(shù)字圖象(圖象處理基礎(chǔ)在線講義:http://www.ph.tn.tudelft.nl/Courses/FIP)
2.數(shù)字圖象處理系統(tǒng)的基本組成結(jié)構(gòu)
數(shù)字圖象處理系統(tǒng)由圖象數(shù)字化設(shè)備、圖象處理計算機(jī)和圖象輸出設(shè)備組成,如下圖所示:
圖1.3?數(shù)字圖象處理系統(tǒng)
圖象數(shù)字化設(shè)備:掃描儀、數(shù)碼相機(jī)、攝象機(jī)與圖象采集卡等
圖象處理計算機(jī):PC、工作站等
圖象輸出設(shè)備:打印機(jī)等
3.?數(shù)字圖象處理的應(yīng)用
隨著微電子與計算機(jī)技術(shù)的高速發(fā)展,圖象數(shù)字化設(shè)備如CCD攝象機(jī)、掃描儀、數(shù)碼相機(jī)、圖象采集卡的成本大大降低,普通的微機(jī)已經(jīng)可以勝任部分圖象處理任務(wù),使得圖象處理的應(yīng)用越來越廣泛,可以預(yù)見在不久的將來,圖象及視頻處理的應(yīng)用將與目前語音處理的應(yīng)用一樣變得日益普及和重要。
圖象處理的重要應(yīng)用包括:
遙感
視覺監(jiān)視、保安
工業(yè)檢測與測量
宇宙探險、軍事偵察、高精度制導(dǎo)
醫(yī)療診斷
通訊
影視業(yè)、娛樂、公眾服務(wù)
解釋:
????數(shù)字圖象處理是與模式識別與計算機(jī)視覺等學(xué)科緊密相關(guān)的學(xué)科方向。數(shù)字圖象處理通常作為模式識別或計算機(jī)視覺系統(tǒng)的預(yù)處理部分,用于圖象采集、變換、特征提取等前期工作,如圖象增強(qiáng)、幾何矯正、邊緣提取、輪廓跟蹤等;而模式識別則重點在于抽取有效特征,分類和識別物體,如指紋識別、簽字驗證等;計算機(jī)視覺的核心任務(wù)是景物理解,追求人工的視覺功能,如立體信息的獲取,運(yùn)動分析等。
4.數(shù)字圖象處理中的數(shù)據(jù)結(jié)構(gòu)
數(shù)字圖象處理中常用的數(shù)據(jù)結(jié)構(gòu)包括矩陣、鏈碼、屬性圖等;此外還常用分層表示的數(shù)據(jù)結(jié)構(gòu),如金字塔和四叉樹(pyramids and?quadtrees)結(jié)構(gòu)。
數(shù)據(jù)結(jié)構(gòu)是指數(shù)據(jù)的組織方式,對算法的選擇和其實現(xiàn)的容易程度有明顯的影響。數(shù)據(jù)結(jié)構(gòu)的選擇在程序設(shè)計中是關(guān)鍵性的步驟。
算法?+?數(shù)據(jù)結(jié)構(gòu)?=?程序 (Algorithm + Data Structure = Program)
邏輯?+?控制?=?算法??(Logic + Control = Algorithm)
本節(jié)是如下資料的摘譯:Milan Sonka, Chapter 3, Data Structures in Image Analysis?(..\..\download_IPCVPR\DIP of Milan Sonka\datastructureinimageprocessing.htm)。建議讀者閱讀原文。
4.1?圖象數(shù)據(jù)的表示層次
??????圖象數(shù)據(jù)的表示層次反映圖象處理的不同階段,表達(dá)圖象數(shù)據(jù)的不同抽象程度。總的來說有如下幾個逐級升高的表示層次。
???象素層圖象:由原始數(shù)據(jù)組成,是象素亮度的整數(shù)矩陣;
???分割圖象:圖象被分割為可能屬于同一物體的區(qū)域;
???幾何表示:2D和3D?形狀信息;
???關(guān)系模型: 數(shù)據(jù)更高層次的抽象,使使用數(shù)據(jù)更為有效。
4.2?規(guī)范的圖象數(shù)據(jù)結(jié)構(gòu)
規(guī)范的圖象數(shù)據(jù)結(jié)構(gòu)有矩陣、鏈碼、圖、物體屬性表、關(guān)系數(shù)據(jù)庫 等(matrices,chains, graphs, lists of object properties, relational databases, etc.)。它們不僅用于圖象信息的直接表示,而且還是更復(fù)雜的圖象分層表示方法的基礎(chǔ),如金字塔和四叉樹(pyramids and?quadtrees)結(jié)構(gòu)。
???矩陣:低層圖象表示的最普通的數(shù)據(jù)結(jié)構(gòu),矩陣元素是整型數(shù)值;這類圖象數(shù)據(jù)通常是圖象獲取設(shè)備(攝象機(jī)、掃描儀等)的直接輸出。
???鏈碼:描述物體的邊界,鏈碼中的符號一般對應(yīng)于圖象基元的鄰接關(guān)系。如下圖所示。鏈碼可以用靜態(tài)數(shù)據(jù)結(jié)構(gòu)來表示,如1維數(shù)組,取其大小為鏈碼的最大可能長度;也可以用動態(tài)數(shù)據(jù)結(jié)構(gòu)來表示,且這樣在節(jié)省存儲空間方面更合適。
???行程編碼:通常用于圖象矩陣中符號串的表示。例如?,傳真機(jī)就使用這種方式。在二值圖象中,行程編碼僅記錄圖象中屬于物體的區(qū)域,該區(qū)域表示成以表為元素的表。圖象的每行表示成一個子表,它的第一個元素為行號,然后是兩個縱坐標(biāo)構(gòu)成的項,第一個為行程的開始的縱坐標(biāo)(列號),第二個為行程的結(jié)束的縱坐標(biāo)。一行中可以有若干個這樣的序列項。如下圖所示:
行程編碼也可用于含有多個亮度層次圖象的表示,這時子表中必須記錄序列的亮度值。
???拓?fù)鋽?shù)據(jù)結(jié)構(gòu):圖象描述成一組元素及其相互關(guān)系的圖結(jié)構(gòu)。例如,賦值的屬性圖,區(qū)域鄰接圖。區(qū)域鄰接圖例子如下:
???關(guān)系結(jié)構(gòu):信息集中在語義上重要的圖象組成部分(它們是圖象分割的結(jié)果)即物體之間的關(guān)系上,適合用于高層次的圖象理解工作。例如,使用關(guān)系結(jié)構(gòu)描述自然場景的示意圖(物體及其關(guān)系屬性表)如下:
4.3分層數(shù)據(jù)結(jié)構(gòu)
分層數(shù)據(jù)結(jié)構(gòu)將圖象描述成若干不同粒度的層次,使算法可以根據(jù)需要將處理控制在較小的數(shù)據(jù)量上;只有必要時,處理才會在最細(xì)的數(shù)據(jù)分辨率上進(jìn)行。兩種典型的分層表示數(shù)據(jù)結(jié)構(gòu)是金字塔和四叉樹(pyramids and?quadtrees)結(jié)構(gòu)。
??金字塔(pyramids)
?????圖象的M-pyramid金字塔結(jié)構(gòu)是一個圖象序列{ML, ML-1, ..., M0}?,其中ML?是具有原圖象分辨率的圖象,即原圖象本身,然后依次降低一倍分辨率得到該圖象序列。當(dāng)原圖象的分辨率是2的整數(shù)冪時,M0?則僅對應(yīng)于一個象素。當(dāng)需要對圖象的不同分辨率同時進(jìn)行處理時,可以采用這種數(shù)據(jù)結(jié)構(gòu)。分辨率每降低一層,數(shù)據(jù)量則減少4倍,因而處理速度差不多提高4倍。
M-pyramid金字塔結(jié)構(gòu)存儲所有圖象矩陣需要的象素個數(shù)為:
???一般而言,同時使用幾個分辨率層次比僅使用單個層次優(yōu)越。這些圖象可以表示成樹狀金字塔結(jié)構(gòu):?T-pyramid.?T-pyramid是樹結(jié)構(gòu),每個結(jié)點有4個子結(jié)點,如下圖所示:
????T-pyramid金字塔結(jié)構(gòu)的存儲表示與T-pyramid相似,樹的弧不必存儲,這是因為由于其結(jié)構(gòu)的規(guī)范性樹的子結(jié)點和父結(jié)點的地址都很容易計算出來。
??四叉樹(Quadtrees)
????四叉樹是對T-pyramids的改進(jìn),除葉子結(jié)點外每個結(jié)點有4個子結(jié)點(西北NW: north-western,?東北NE: north-eastern,?西南SW: south-western,?西南SE: south-eastern).與T-pyramids一樣,在每個層次圖象被分解4個象限,但無須保留所有的葉結(jié)點。如果父結(jié)點有4個與它的值(如,亮度)一樣的子結(jié)點,則無須保留這些子結(jié)點。如下圖所示。
分層圖象表示的缺欠是:
??依賴于物體的位置、方向和相對大小;
?兩個僅有微小差別的相似圖象可能會具有非常不同的金字塔結(jié)構(gòu)或四叉樹結(jié)構(gòu);
?甚至當(dāng)兩個圖象描述的是完全相同而只是略微移動了的景物時,可能會產(chǎn)生完全不同的表示。
說明:有關(guān)鏈接參考資料的自學(xué)問題
課件中涉及相當(dāng)多的通過鏈接方式訪問的參考資料(如htm/html網(wǎng)頁、pdf或word文檔,等等。),主要的目的是提供豐富的素材,便于不同程度的讀者自由學(xué)習(xí),不是基本要求,感興趣的讀者可以參考。這種內(nèi)容是傳統(tǒng)教材無法實現(xiàn)的,是電子課件的主要特點之一。學(xué)生如果能夠充分發(fā)揮主觀能動性,將會突破課件自身內(nèi)容局限性,對課程的學(xué)習(xí)十分有益。??
參考文獻(xiàn)
Milan Sonka, Chapter 3, Data Structures in Image Analysis?(..\..\download_IPCVPR\DIP of Milan Sonka\datastructureinimageprocessing.htm)。
--------------------------------------------------------------------------------
作業(yè)
1.????編制讀入并顯示bmp格式的程序,用鼠標(biāo)選擇區(qū)域,將其象素數(shù)據(jù)寫入數(shù)組,并以文本文件txt輸出。
(有關(guān)位圖(bmp)的格式請參考:第一章,Windows位圖和調(diào)色板,“數(shù)字圖象處理編程入門”,呂風(fēng)軍,清華大學(xué)出版社,1999.9:位圖格式說明..\Readings\chapter01\bitmapformat.doc
返回主目錄?返回本章目錄
清華大學(xué)計算機(jī)系?艾海舟
最近修改時間:2000年1月10日
出處:http://media.cs.tsinghua.edu.cn/~ahz/digitalimageprocess/chapter01/chapt01_ahz.htm
總結(jié)
以上是生活随笔為你收集整理的数字图像处理:第一章 概述的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python基础教程(十三):JSON、
- 下一篇: 数字图像处理:第二章 图象获取、显示、表