数字空间中的二值形态学
數(shù)字空間中的二值形態(tài)學(xué)
Binary Morphology in Digital Space
Herry
Herry
?
?
?
?
摘要:數(shù)學(xué)形態(tài)學(xué)作為圖象處理與分析的基本理論和方法在視覺檢測(cè)、生物醫(yī)學(xué)圖象分析、機(jī)器人視覺、圖象壓縮編碼、紋理分析等諸多領(lǐng)域,都取得了非常成功的應(yīng)用,創(chuàng)造了巨大的經(jīng)濟(jì)效益。同時(shí),從近年來大量涌現(xiàn)的研究期刊和會(huì)議論文可以看到,數(shù)學(xué)形態(tài)學(xué)已經(jīng)發(fā)展成為圖象處理的一個(gè)主要研究領(lǐng)域。本文作為數(shù)字圖象處理課程的結(jié)業(yè)報(bào)告,以介紹數(shù)學(xué)形態(tài)學(xué)的沿革、基本運(yùn)算、形態(tài)學(xué)在數(shù)字空間中的畸變和灰值形態(tài)學(xué)為主,同時(shí)結(jié)合作者所掌握的知識(shí),闡述了自己的一些認(rèn)識(shí)和看法。最后,筆者就圖象處理中的一般方法,談了一些務(wù)虛的想法。
關(guān)鍵字:形態(tài)學(xué);數(shù)字空間;圖象處理
?
?
Abstract:Mathematical morphology has developed greatly in both research field and application field. Applications of morphology in vision detection, biological and medical image analysis, robot vision, image compressing coding, pattern analysis, etc. all have gained surprising success. On the other hand, there appear more and more research journals and conference papers, proving that mathematical morphology has been becoming a main research field of image processing. This paper is a course completing report of Digital Image Processing, whose emphasis is on the introduction of the history of mathematical morphology, fundamental operations, aberrance of morphology in digital space, and grayscale morphology. Meanwhile, I state my understanding and opinion along with them. At the end, there is my thinking about the general methods in image processing without any supporting resources.
Key words:Morphology;Digital space;Image processing
?
?
一、?????? 數(shù)學(xué)形態(tài)學(xué)的沿革
數(shù)學(xué)形態(tài)學(xué)誕生于1964年。當(dāng)時(shí)法國(guó)巴黎礦業(yè)學(xué)院的J.Serra在G.Matheron
的指導(dǎo)下從事博士論文的研究工作,內(nèi)容是對(duì)法國(guó)洛林地區(qū)的鐵礦核作定量巖相分析,從而預(yù)測(cè)起開采特性。Serra用計(jì)算礦核切片的多形態(tài)圖的方法取代了剛體力學(xué)方法。他意識(shí)到方差、弦長(zhǎng)分布、周長(zhǎng)測(cè)量及顆粒計(jì)數(shù)等都是某個(gè)獨(dú)特概念的特殊情況。Serra將其稱為擊中擊不中變換(Hit-Miss Transform)。
? ??與此同時(shí),在一個(gè)更為理論的層面上,Matheron承擔(dān)了多孔介質(zhì)滲透性與其幾何(或紋理)之間關(guān)系的研究工作。第一次引入了形態(tài)學(xué)開的表達(dá)式,并在此基礎(chǔ)上利用凸結(jié)構(gòu)元素建立了顆粒分析方法。
??? 60年代的工作從理論和實(shí)踐兩個(gè)方面初步奠定了數(shù)學(xué)形態(tài)學(xué)的基礎(chǔ),產(chǎn)生了擊中擊不中變換,開運(yùn)算,閉運(yùn)算和布爾模型的理論描述,以及第一個(gè)紋理分析器原型。
??? 70年代是數(shù)學(xué)形態(tài)學(xué)的充實(shí)和發(fā)展期。擊中擊不中變換很快得到了一連串成功的應(yīng)用。而在理論方面,以Matheron的工作為主要標(biāo)志:拓?fù)鋵W(xué)基礎(chǔ),隨機(jī)集,遞增映射,凸性分析,隨機(jī)集的若干模型等。
? ??80年代是數(shù)學(xué)形態(tài)學(xué)的成熟和對(duì)外開放期。數(shù)學(xué)形態(tài)學(xué)走向了世界,尤其是美國(guó);在格論基礎(chǔ)上建立了數(shù)學(xué)形態(tài)學(xué)的數(shù)學(xué)框架;隨機(jī)處理方法得到進(jìn)一步的更新。所有這些都標(biāo)志著數(shù)學(xué)形態(tài)學(xué)即將進(jìn)入一個(gè)快速發(fā)展期。
??? 80年代的另一個(gè)特點(diǎn),是在格論數(shù)學(xué)框架上建立了形態(tài)學(xué)方法的基礎(chǔ)。各種各樣的實(shí)際應(yīng)用問題,迫使人們回到基礎(chǔ)理論方面尋找解決問題的出路和方法。數(shù)學(xué)形態(tài)學(xué)最初的算子是面向集合的,要將它們拓寬到其他領(lǐng)域,如對(duì)(網(wǎng)格)圖的、數(shù)值函數(shù)的形態(tài)學(xué)處理,在這種情況下,平移或旋轉(zhuǎn)會(huì)影響到處理過程,甚至使處理過程無效。一些概念,如連通性、測(cè)地等需要新的符號(hào)來描述。為了使形態(tài)學(xué)的基本理論具有更廣泛的適用性,更統(tǒng)一的形式和便于新算法的研究,數(shù)學(xué)形態(tài)學(xué)基本定理的核心最終被簡(jiǎn)化到備格結(jié)構(gòu)。
??? 90年代至今,是數(shù)學(xué)形態(tài)學(xué)的持續(xù)發(fā)展、擴(kuò)展期,取得了一系列重大應(yīng)用和理論成果。
??? 縱觀數(shù)學(xué)形態(tài)學(xué)的發(fā)展史,不難發(fā)現(xiàn),其沿革歷程和其他學(xué)科大同小異,都是呈螺旋式發(fā)展的形式。后期的應(yīng)用和發(fā)展,總是促使人們回到起始點(diǎn),回到理論層面,對(duì)其根基進(jìn)行不斷的填充。圖1.1是數(shù)學(xué)形態(tài)學(xué)發(fā)展的一個(gè)簡(jiǎn)化模型。它幾乎和其他學(xué)科的發(fā)展模型一致。
零星思想 |
零星思想 |
零星思想 |
第一次系統(tǒng)概括 |
理論填充 |
應(yīng)用發(fā)展 |
由此可見,一個(gè)新理論的誕生和成熟,是經(jīng)過長(zhǎng)期的,反復(fù)的錘煉而來的。
?
?
二、?????? 數(shù)學(xué)形態(tài)學(xué)的基本運(yùn)算
形態(tài)學(xué)的運(yùn)算具有高度的統(tǒng)一性。擊中擊不中變換在數(shù)學(xué)形態(tài)學(xué)中起著核心作用。它的基本思想至少來源于(或拓廣到)五個(gè)方面:第一,這種變換擴(kuò)展了對(duì)隨機(jī)函數(shù)空間定律的表達(dá)方式;第二,這種變換曾用來對(duì)格式塔心理學(xué)的一些思想作數(shù)學(xué)上的形式化描述;第三,這種變換來源于(或完成于)實(shí)驗(yàn)及紋理分析;第四,擊中擊不中變換為腐蝕和膨脹兩個(gè)重要的形態(tài)學(xué)運(yùn)算奠定了邏輯上的前期條件;第五,擊中擊不中變換簡(jiǎn)潔的表達(dá)方式可以在所有已應(yīng)用于實(shí)踐中的數(shù)學(xué)形態(tài)學(xué)算法中可窺見一斑。
??? 圖2.1說明了這種統(tǒng)一性。
HMT |
腐蝕(膨脹) |
細(xì)化 |
開(閉) |
同倫骨架 |
特殊細(xì)化 |
各向同性腐蝕 |
各向異性腐蝕 |
隨機(jī)集 |
SKIZ |
?
?
三、?????? 數(shù)字空間中的畸變
3.1數(shù)字空間的概念和性質(zhì)
3.1.1數(shù)字空間的概念
??? 在圖象處理中用到的數(shù)字空間有兩種,一種是正方形網(wǎng)格空間,記為Q2;另一種是正六邊形網(wǎng)格空間,記為H2。它們都是歐氏空間R2的子集。在歐氏空間中通常使用的坐標(biāo)系下,命u1(k) = (0, k),u2(k) = (k, 0),v1(k) = (0, k),v2(k) = (k/2, root(3)k/2),其中k為一個(gè)正實(shí)數(shù),那么Q2和H2可定義為:
Q2 = {x1u1(k) + x2u2(k) | x1, x2均為整數(shù)}
H2 = {x1v1(k) + x2v2(k) | x1, x2均為整數(shù)}
因此,Q2和H2實(shí)際上是在不同坐標(biāo)系統(tǒng)下的具有整數(shù)坐標(biāo)的點(diǎn)(稱為格點(diǎn))的集合。K稱為網(wǎng)格空間的密度,它刻畫了網(wǎng)格點(diǎn)的密度。
3.1.2數(shù)字空間中的拓?fù)涠x性
??? 首先引入以下定義:
??? 1、對(duì)于Q2中的點(diǎn)x,它的四鄰域定義為點(diǎn)集N4(x) = {x, x + u1, x + u2, x – u1, x – u2},而N8(x) = {x, x + u1, x + u1 + u2, x + u2, x + u2 – u1, x – u1, x – u1 – u2, x – u2, x + u1 – u2}稱為x的八鄰域。N4(x) – {x}中的點(diǎn)稱為x的直接鄰接點(diǎn),而N8(x) – N4(x) – {x}中的點(diǎn)稱為x的間接鄰接點(diǎn)。
??? 2、對(duì)H2中的點(diǎn)x,它的六鄰域定義為點(diǎn)集N6(x) = {x, x + v1, x + v2, x – v1, x – v1 + v2, x – v2, x + v1 – v2}。N6(x) – {x}中的點(diǎn)稱為x的鄰接點(diǎn)。
??? 3、如果一個(gè)Q2中的點(diǎn)列x0,x1,……,xn滿足xk∈N4(xk-1)(k = 1, 2, ……,n),則稱為一條由x0到xn的四連通路徑。如果它們滿足xk∈N8(xk-1)(k = 1, 2, ……,n),則稱為一條由x0到xn的八連通路徑。
??? 4、如果一個(gè)H2中的點(diǎn)列x0,x1,……,xn滿足xk∈N6(xk-1)(k = 1, 2, ……,n),則稱為一條由x0到xn的四連通路徑。
??? 5、給定Q2中一個(gè)集合X,對(duì)x,y∈X,如果存在一條X中的由x到y的八連通路徑,則稱為x,y在X中是八連通的。如果存在一條X中的由x到y的四連通路徑,則稱為x,y在X中四連通。
??? 6、給定H2中一個(gè)集合X,對(duì)x,y∈X,若存在一條X中的x到y的連通路徑,則稱為x,y在X中是連通的。
??? 7、對(duì)數(shù)字空間(Q2或H2)中的一個(gè)集合X和一個(gè)有意義的連通定義,如果X中的任意兩點(diǎn)均在X中是連通的,則X是一個(gè)連通集合。
??? 在連續(xù)空間R2中,一條簡(jiǎn)單的封閉曲線L的內(nèi)部A和外部B均是簡(jiǎn)單的連通集合,且它們彼此不連通,或者說由A中任意一點(diǎn)x到B中任意一點(diǎn)y的連通路徑必然與所給封閉曲線L相交。這就是R2中的Jordan定理。如圖3.1所示。
B |
y |
A |
x |
??? 現(xiàn)在考察圖3.2中的正方形網(wǎng)格空間。
假如我們使用八連通定義,則細(xì)十字點(diǎn)集形成一條簡(jiǎn)單封閉曲線L,其內(nèi)點(diǎn)集A由粗十字和方塊組成,外部點(diǎn)集B由圓圈組成。顯然A、B是彼此八連通的,我們可以構(gòu)造出從A到B的八連通路徑且使之與L不相交(圖中虛線所示)。因此八連通定義不滿足Jordan定理。如果我們使用四連通定義,圖中細(xì)十字和粗十字形成一條簡(jiǎn)單四連通封閉曲線L,其內(nèi)部A由方塊組成,外部B由圓圈組成。顯然A不是一個(gè)四連通集合,因此仍然不滿足Jordan定理。這就是正方形網(wǎng)格空間中一個(gè)經(jīng)典的拓?fù)淦娈惉F(xiàn)象。
??? 解決這一問題的最常用方法是對(duì)前景和背景使用不同的連通性定義。例如若對(duì)曲線使用四連通定義,那么曲線的補(bǔ)集就使用八連通定義。這就是拓?fù)涞亩x性。
??? 對(duì)于六邊形網(wǎng)格空間H2,只有一種連通性定義,而且這一連通性定義下,Jordan定理成立。因此H2中不存在拓?fù)淦娈愋?#xff0c;也就沒有拓?fù)涠x性。正是由于這個(gè)原因,近年來六邊形網(wǎng)格較受推崇。不過六邊形網(wǎng)格采樣技術(shù)比較復(fù)雜,而且從形態(tài)學(xué)角度看,它的幾何也不如正方形網(wǎng)格空間豐富,因此應(yīng)用仍然不廣泛。
3.1.3數(shù)字空間中的幾何意義
??? 數(shù)字空間中的幾何概念可以由連續(xù)空間中的對(duì)應(yīng)概念的網(wǎng)格空間采樣得到。這是最自然,最穩(wěn)妥的方法,而由連續(xù)空間中的定義直接類推通常是危險(xiǎn)的。
??? 例如,連續(xù)空間中集合A以λ為相似因子的相似集合λA定義為{λa| a∈A}。但對(duì)數(shù)字空間來說,這個(gè)定義不能使用。原因有兩個(gè):1、λa(a∈Z2)可能不是一個(gè)網(wǎng)格點(diǎn);2、這樣的λA會(huì)遺失很多點(diǎn)而導(dǎo)致與A完全不同的結(jié)構(gòu)。
??? 正確的定義應(yīng)該是:A*是A對(duì)應(yīng)的連續(xù)集合(A*∩Z2 = A),則A以λ為相似因子的相似集合為λA* ∩Z2。
3.1.4數(shù)字凸集和連續(xù)凸集的區(qū)別
??? 數(shù)字凸集雖然與連續(xù)凸集有很多相似的性質(zhì),但同時(shí)在一些相當(dāng)重要的特征上也有明顯的不同。例如,連續(xù)凸集一定是連通集合,但數(shù)字凸集未必是連通的。如圖3.3所示。
3.2數(shù)字空間中的畸變
3.2.1數(shù)字圖象處理的預(yù)期目標(biāo)及其現(xiàn)實(shí)情況
??? 在圖象處理的實(shí)際環(huán)境中,數(shù)字空間是一切處理和操作的載體。而進(jìn)行這些數(shù)字空間中的處理的目的則是為了分析和理解連續(xù)空間中的客觀世界。換句話說,是為了實(shí)現(xiàn)連續(xù)空間中一個(gè)期望的,理想的,假定的處理和操作。因此,一個(gè)自然的要求就是所完成的數(shù)字空間中的運(yùn)算與所期望的連續(xù)空間中的運(yùn)算應(yīng)該有良好的對(duì)應(yīng)關(guān)系。假定一個(gè)連續(xù)空間的集合運(yùn)算£*,其相應(yīng)的數(shù)字空間中的集合運(yùn)算為£,那么在理想情況下,它們應(yīng)滿足下述關(guān)系:
£*(X) ∩ Z2 = £(X ∩ Z2)
采樣過程通常會(huì)有信息損失,因而實(shí)際中上式常常無法滿足。不過在采樣密度適當(dāng)高的條件下,采樣所損失的信息可以很少。因而應(yīng)力爭(zhēng)使上式近似得以滿足。
??? 這里的近似性至少有兩個(gè)方面的含義:1、等式兩邊的集合在某種意義上是相近的;2、這兩個(gè)集合具有同樣的幾何和拓?fù)浣Y(jié)構(gòu)。
??? 簡(jiǎn)單地將連續(xù)空間中的運(yùn)算類推移植到數(shù)字空間中,不一定滿足這種近似性。一個(gè)經(jīng)典的例子就是圖象的骨架抽取算法。在連續(xù)空間中圖象的骨架變換在很弱的條件下就能給出連通的骨架,而將這一變換類推到數(shù)字空間中后,所求得的骨架通常是不連通的。
3.2.2形態(tài)學(xué)運(yùn)算畸變示例
??? 圖3.4展示一個(gè)八連通凸集膨脹運(yùn)算的畸變。(a):數(shù)字空間中的畸變;(b):(a)中凸集對(duì)應(yīng)的連續(xù)凸集的膨脹運(yùn)算結(jié)果。
3.2.3數(shù)字空間中的幾何貧乏性
??? 數(shù)字空間是離散的點(diǎn)集,與連續(xù)空間相比,它的結(jié)構(gòu)簡(jiǎn)單得多,稀疏得多,這就以為著數(shù)字空間中的幾何對(duì)象在幾何性質(zhì)、形狀結(jié)構(gòu)等諸多方面都將被制約,靈活性要小的多。在經(jīng)典的圖象處理方法中,由于它們通常不顯式地關(guān)聯(lián)圖象的幾何性質(zhì),因此這一制約所引起的問題顯得不那么突出。對(duì)于形態(tài)學(xué)方法來講,它更關(guān)注于數(shù)字空間的幾何特點(diǎn),同時(shí)對(duì)數(shù)字空間內(nèi)在的幾何制約要敏感的多。
??? 數(shù)字空間中的幾何貧乏性表現(xiàn)之一是集合的大小和形狀不能連續(xù)變化。數(shù)字空間中的一個(gè)圓盤事實(shí)上是一個(gè)有限邊數(shù)的多邊形,它遠(yuǎn)沒有連續(xù)圓盤那么平滑。當(dāng)它的半徑縮小時(shí),只能按定長(zhǎng)遞減。另一個(gè)表現(xiàn)是,小尺寸的連續(xù)集合的采樣過程會(huì)產(chǎn)生巨大的相對(duì)變形,從而可能破壞一切幾何特征。如圖3.5所示。
??????????????
3.3結(jié)論
??? 數(shù)字空間中形態(tài)學(xué)運(yùn)算的畸變是一個(gè)相當(dāng)本質(zhì)的問題,即使在圖象和結(jié)構(gòu)元素均有良好性質(zhì)(即連通性)時(shí),它仍有可能發(fā)生。因此,畸變發(fā)生的條件和畸變類型的研究和分析就顯得十分重要。我們必須對(duì)這些問題給出一個(gè)令人滿意的答案,從而尋求出避免或修正畸變的有效方法,以證實(shí)在數(shù)字空間中形態(tài)學(xué)方法的可用性,并保證數(shù)字空間形態(tài)學(xué)運(yùn)算應(yīng)用的可靠性和合理性。
?
?
四、?????? 灰值形態(tài)學(xué)簡(jiǎn)介
在這里,作者并不想對(duì)灰值形態(tài)學(xué)的理論和方法做過多的闡述,只是對(duì)灰值
形態(tài)學(xué)的運(yùn)算形式和分析數(shù)學(xué)中的卷積定理做一個(gè)簡(jiǎn)單的對(duì)比。
??? 首先做如下定義:
??? f代表一個(gè)圖象;g代表一個(gè)結(jié)構(gòu)函數(shù);U(f)代表函數(shù)f的陰影集;G(U)代表陰影集U的表面函數(shù);⊙代表一個(gè)灰值形態(tài)學(xué)運(yùn)算,?代表二值形態(tài)學(xué)運(yùn)算。那么,灰值形態(tài)學(xué)運(yùn)算的一般形式為:
f⊙g = G[U(f)?U(g)]
這個(gè)形式和分析數(shù)學(xué)中的卷積定理有著驚人的相似:
??? 定義:£(f)代表函數(shù)f的傅立葉變換,£~(f)代表函數(shù)f的傅立葉逆變換;⊙代表卷積運(yùn)算,則卷積定理的一般形式為:
f⊙h = £~[£(f)£(h)]
??? 這兩個(gè)一般形式中,有著某種對(duì)應(yīng)性(如表4.1所示):
灰值形態(tài)學(xué)運(yùn)算 | 卷積 |
陰影集(U) | 傅立葉變換(£) |
表面函數(shù)(G) | 傅立葉逆變換(£~) |
二值形態(tài)學(xué)運(yùn)算(?) | 頻率域乘法 |
表4.1灰值形態(tài)學(xué)運(yùn)算和卷積定理之間的對(duì)應(yīng)關(guān)系
這種對(duì)應(yīng)性和高度一致性突出了它們的一個(gè)共同性質(zhì):它們都將某一個(gè)域的運(yùn)算,變換為另外一個(gè)域的運(yùn)算。這種變換具有一個(gè)重要性質(zhì),即可逆性。從而可以使得在某一個(gè)域中不可能完成的任務(wù),或很難完成的任務(wù),在另外一個(gè)域中得以順利完成。
??? 筆者認(rèn)為,把握以上這種對(duì)應(yīng)性和一致性,對(duì)于深入理解變換存在的目的和意義具有很大的幫助。
?
?
五、?????? 圖象處理中的一般方法
本節(jié)所要闡述的內(nèi)容是筆者一些務(wù)虛的想法。表5.1列出了筆者至今所接觸
到的圖象處理所使用的一般方法,數(shù)學(xué)背景,以及它們對(duì)圖象本質(zhì)的認(rèn)識(shí):
一般方法 | 形態(tài)學(xué) | 分析方法 | 統(tǒng)計(jì)方法 |
數(shù)學(xué)背景 | 集合論 | 分析數(shù)學(xué) | 概率數(shù)學(xué) |
對(duì)圖象的認(rèn)識(shí) | 點(diǎn)集 | 波 | 點(diǎn)集 |
表5.1圖象處理中的一般方法
??? 這太巧合了!人們對(duì)圖象的認(rèn)識(shí),和人們對(duì)光的認(rèn)識(shí)具有驚人的相似性。人們對(duì)于光的認(rèn)識(shí)可以統(tǒng)一到波粒二相性上來,那么對(duì)于圖象的認(rèn)識(shí)是否也可以統(tǒng)一起來呢?這是很多專家學(xué)者所反對(duì)的觀點(diǎn)。自始至終圖象處理都是一個(gè)面向問題的學(xué)科,在可以預(yù)見的將來都無法找到一種超級(jí)理論,來包羅圖象處理中的所有理論。
??? 筆者對(duì)于統(tǒng)一論有一定的偏執(zhí)和愛好,但并不對(duì)圖象處理統(tǒng)一論的觀點(diǎn)有半點(diǎn)樂觀。世界上有些巧合確實(shí)蘊(yùn)涵著統(tǒng)一論的玄機(jī),但有些巧合,最終也只是巧合而已。
??? 然而筆者認(rèn)為,一個(gè)統(tǒng)一的理論,并意味著一定有一個(gè)包羅一切的超級(jí)定理來支撐。它有可能是某種認(rèn)識(shí)上的統(tǒng)一。就圖象而言,是否有一種理論來指導(dǎo)我們?cè)谑裁礃拥膱?chǎng)合使用什么的本質(zhì)來解釋圖象——正如人們?cè)诤暧^上利用光的波動(dòng)性,在微觀上利用光的粒子性一樣。筆者深信,這種認(rèn)識(shí)上的統(tǒng)一論是存在的。
?
?
致謝
??? 非常感謝劉怡光老師半年來對(duì)我的教誨和指導(dǎo)。本文得以完成得益于參閱了互聯(lián)網(wǎng)上的大量信息,在此對(duì)那些無私奉獻(xiàn)的網(wǎng)友表示誠(chéng)摯的謝意。
?
?
參考文獻(xiàn)
[1]崔屹。《圖象處理與分析——數(shù)學(xué)形態(tài)學(xué)方法及應(yīng)用》。北京:科學(xué)出版社,2000
[2]龔煒,石青云,程民德。《數(shù)字空間中的數(shù)學(xué)形態(tài)學(xué)——理論及應(yīng)用》。北京:
科學(xué)出版社,1997
[3]J.Serra. Introduction to mathematical morphology, CVGIP, Vol.35, 283—305, 1986
[4]Henk Heijmans. Mathematical Morphology and Image Processing, ERCIM
News No.37 - April 1999
總結(jié)
以上是生活随笔為你收集整理的数字空间中的二值形态学的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机网络体系结构 - 网络安全
- 下一篇: 12.1 草根的追求——《逆袭大学》连载