脉冲耦合神经网络(PCNN)阅读笔记
摘要
本文采用高級視覺模型來描述靈長類視覺系統(tǒng)中的信息傳遞和連接。信息鏈接方案,如狀態(tài)相關(guān)模塊化和時(shí)間同步,被視為視覺系統(tǒng)使用期望組合信息的方法,以填充缺失信息和刪除不需要的信息。研究了使用基于生理學(xué)理論模型的鏈接方法結(jié)合當(dāng)前圖像處理技術(shù)進(jìn)行模式識(shí)別的可能性。這些圖像處理技術(shù)是變換,例如(但不限于)小波濾波器、命中或未命中濾波器、形態(tài)濾波器和高斯差分濾波器。選擇這些特殊的過濾器是因?yàn)樗鼈兡M靈長類視覺系統(tǒng)中執(zhí)行的功能。為了實(shí)現(xiàn)生理激勵(lì)的連接方法,選擇脈沖耦合神經(jīng)網(wǎng)絡(luò)(PCNN)作為視覺模型的基本構(gòu)建塊,在神經(jīng)元脈沖水平上執(zhí)行連接。最后,描述了一種基于PCNN的融合信息網(wǎng)絡(luò),并給出了初步結(jié)果。
介紹
基于計(jì)算機(jī)的數(shù)字濾波通常用于乳腺癌檢測和自動(dòng)目標(biāo)識(shí)別等應(yīng)用中的目標(biāo)檢測。過濾通常用于從圖像中刪除不需要的信息,希望剩余的信息將允許模式識(shí)別過程識(shí)別所需的對象。數(shù)字濾波器設(shè)計(jì)為對對象中包含的特定頻率組或模式具有選擇性。一般來說,沒有一個(gè)過濾器可以對對象中的所有模式進(jìn)行選擇,并且仍然能夠很好地去除不需要的信息。通常,使用多個(gè)過濾器并將結(jié)果合并。為了組合結(jié)果,使用簡單的線性數(shù)學(xué)運(yùn)算符(如AND運(yùn)算符)或更復(fù)雜的方案(如圖像金字塔法)。
人類視覺系統(tǒng)過濾不需要的信息,并以一種允許我們識(shí)別周圍物體的方式組合結(jié)果。它結(jié)合了多種視覺信息來構(gòu)建我們對外部世界的看法。形狀、運(yùn)動(dòng)、顏色和紋理都經(jīng)過過濾和組合,使我們能夠?qū)W習(xí)和識(shí)別物體。每天都有新的事物被學(xué)習(xí),新的記憶被形成。隨著每一個(gè)新記憶的形成,我們的識(shí)別過程都會(huì)發(fā)生變化,以融入這種記憶。識(shí)別不僅僅是記憶與視覺系統(tǒng)產(chǎn)生的形式、運(yùn)動(dòng)、顏色和紋理的簡單匹配。簡單的實(shí)驗(yàn)將表明,記憶可以增強(qiáng)或抑制現(xiàn)有的視覺信息,同時(shí)填充預(yù)期但實(shí)際場景中不存在的信息。這種期望驅(qū)動(dòng)的識(shí)別是視覺識(shí)別中一個(gè)重要但鮮為人知的部分。
背景
盡管靈長類大腦皮層視覺系統(tǒng)極其復(fù)雜,但研究表明,它可以由兩種基本的層次性通路來建模,即小細(xì)胞通路和大細(xì)胞通路[10]。第一條路徑主要處理顏色信息,其他路徑處理形狀和運(yùn)動(dòng)。
靈長類視覺系統(tǒng)的模型
圖1顯示了這兩種途徑的模型。圖像進(jìn)入模型的入口點(diǎn)是視網(wǎng)膜。生物視網(wǎng)膜具有亮度和顏色檢測器,用于解釋光圖像,并在將圖像轉(zhuǎn)發(fā)給其他視覺系統(tǒng)之前對圖像進(jìn)行預(yù)處理。區(qū)域標(biāo)記的LGN模擬生物外側(cè)膝狀體核。在人類視覺皮層中,模型區(qū)域標(biāo)有以字母V開頭的名稱,模型特定區(qū)域。這些區(qū)域中的每一個(gè)都被認(rèn)為保持著一個(gè)或多個(gè)經(jīng)過處理但在地形上正確的落在視網(wǎng)膜上的光模式圖像。本文稍后將討論應(yīng)用于圖像的處理。第六區(qū)代表紋狀體視覺皮層。區(qū)域V3、V4和V5被稱為專業(yè)區(qū)域,因?yàn)槿藗冋J(rèn)為它們僅分別處理形狀、顏色和運(yùn)動(dòng)等選擇性信息。此后,由每個(gè)視覺皮層區(qū)域維持的視覺圖像將被稱為視覺地圖,或簡稱為地圖。
?圖1中LGN、Vi和V2框中的名稱表示該區(qū)域功能不同的部分。早期的研究人員使用細(xì)小、巨大、斑點(diǎn)、中間、薄條紋、粗條紋和中間成熟等術(shù)語來描述這些視覺區(qū)域的生物學(xué)上不同的部分。這些術(shù)語至今仍在使用,用于將視覺模型與生物視覺系統(tǒng)聯(lián)系起來。每個(gè)方框代表一個(gè)獨(dú)特的視覺地圖,該地圖被認(rèn)為保存在視覺區(qū)域的相應(yīng)部分[11178]。橢圓表示每個(gè)地圖中包含的特定類型的信息。可視區(qū)域幾乎完全連接,圖中未顯示。為清楚起見,該圖僅顯示與模型相關(guān)的更強(qiáng)連接。
信息反饋
圖2顯示了用于將信息傳輸回相關(guān)區(qū)域地圖的可重入連接。這些可重入連接的一個(gè)功能是提供信息,以解決較低級別中可能存在的任何沖突[12]。如圖2所示,來自可視區(qū)域的可重入連接不限于提供其輸入的區(qū)域。這些額外的聯(lián)系對于解決具有不同能力但對相同刺激作出反應(yīng)的地區(qū)之間的沖突至關(guān)重要[11,330]。
?圖3顯示了將每個(gè)可視區(qū)域的輸出反饋(重入)到先前層次級別的區(qū)域地圖中。每個(gè)圖中顯示的實(shí)心黑色橢圓表示在特定圖上操作的處理單元的感受野大小。在每個(gè)連續(xù)的層級上,感受野變大,每個(gè)層級將其輸出信息重新輸入到較低的層級,以解決可能存在的任何沖突[11]。需要注意的是,許多區(qū)域接收的信息不是該區(qū)域通常處理的類型。例如,區(qū)域Vi的第4B層包含主要具有方向選擇性的單元單元。這些處理單元既不是波長選擇性的,也不是方向選擇性的,但仍然從區(qū)域V4和V5接收此類信息。該信息不會(huì)被忽略,而是與方向信息相結(jié)合(鏈接),以消除任何歧義或沖突。
?
?
神經(jīng)元處理單元濾波器
本文觀察到這樣一個(gè)假設(shè):神經(jīng)元處理單元最好被描述為沿著多個(gè)刺激方向選擇性的過濾器[9]。表2給出了可用于近似每個(gè)可視區(qū)域的可能過濾器列表。表中包括引用這些過濾器的參考。
???????
感知、認(rèn)知和期望
期望可以通過將識(shí)別過程的結(jié)果映射回視覺系統(tǒng)來建模。這種重新進(jìn)入將導(dǎo)致部分識(shí)別來填充圖像缺失的細(xì)節(jié)。正如本文后面討論的,這些期望可以強(qiáng)調(diào)感興趣的對象,同時(shí)抑制不必要的信息。
生理性連接
脈沖耦合神經(jīng)網(wǎng)絡(luò)
一個(gè)生理激勵(lì)的人工神經(jīng)網(wǎng)絡(luò),脈沖耦合神經(jīng)網(wǎng)絡(luò)(PCNN),可以連接起來創(chuàng)建一個(gè)高度靈活的生理濾波器。PCNN對靈長類視覺皮層中觀察到的脈沖高度、持續(xù)時(shí)間、重復(fù)頻率和神經(jīng)間聯(lián)系進(jìn)行建模。該模型不僅能滿足我們視覺模型的濾波要求,還能產(chǎn)生所需的連接和脈沖,以模擬依賴于狀態(tài)的調(diào)制和時(shí)間同步。圖4顯示了PCNN中單個(gè)神經(jīng)元的框圖。
有關(guān)PCNN的更多討論,請參見參考文獻(xiàn)[3]和[5]。表2顯示了實(shí)現(xiàn)離散時(shí)間PCNN所需的方程式。
在該模型中,PCNN神經(jīng)元接收來自前一層次結(jié)構(gòu)層的饋電輸入(X2),并接收來自其自身和其他層的鏈接輸入(Y)。可重入輸入將被視為鏈接輸入。圖5顯示了樣本PCNN中單個(gè)神經(jīng)元的饋電和連接。
PCNN濾波器
單個(gè)PCNN神經(jīng)元的濾波特性由饋電輸入的模式和應(yīng)用于這些輸入的權(quán)重決定。濾光片的感受野由前一層饋電輸入連接的形狀決定。濾波特性由應(yīng)用于進(jìn)給輸入的權(quán)重確定。例如,一個(gè)具有高斯(橢圓形)感受野的神經(jīng)元將具有以橢圓形模式連接到前一層的饋電輸入。在該橢圓模式中,應(yīng)用于進(jìn)給輸入的權(quán)重(M2)在中心處為單位,并隨著朝向橢圓邊緣的高斯曲線而減小。
?pcnn用于目標(biāo)分割
PCNN的特征提取和對象分割特性來自神經(jīng)元的脈沖頻率。具有相關(guān)進(jìn)食輸入特征(顏色、強(qiáng)度等)的神經(jīng)元具有相似的脈沖率。連接連接導(dǎo)致神經(jīng)元緊密接近,相關(guān)特征一致脈沖(同步)。連接模式、權(quán)重(Wf)和連接系數(shù)(i:3)決定了連接輸入影響神經(jīng)元輸出的接近度和程度。較大的鏈接字段往往會(huì)對圖像產(chǎn)生平滑效果。較大的權(quán)重和連接系數(shù)(假設(shè)標(biāo)準(zhǔn)化,接近1)往往會(huì)導(dǎo)致相關(guān)特征較少的神經(jīng)元同步。PCNN神經(jīng)元(無連接)的脈沖重復(fù)率由饋電輸入的大小決定。輸入較大的神經(jīng)元比輸入較小的神經(jīng)元脈沖頻率更高。缺乏連接輸入將導(dǎo)致具有相同饋電輸入強(qiáng)度的神經(jīng)元一致脈沖。對象分割高度依賴于鏈接系數(shù)8的值。
pcnn用于圖像處理
以下PCNN配置已成功用于圖像平滑和分割[7]。PCNN中的神經(jīng)元數(shù)量等于輸入圖像中的像素?cái)?shù)量。神經(jīng)元被排列成一個(gè)具有橫向連接的單層網(wǎng)絡(luò)。每個(gè)神經(jīng)元接收R半徑內(nèi)所有相鄰神經(jīng)元的鏈接輸入。每個(gè)神經(jīng)元只接收一個(gè)饋電輸入,即輸入圖像中對應(yīng)像素的強(qiáng)度。饋電輸入上沒有泄漏積分器。所有權(quán)重都設(shè)置為統(tǒng)一。
時(shí)間同步
1987年,在猩猩和貓的初級視覺皮層中發(fā)現(xiàn)了刺激相關(guān)的神經(jīng)振蕩。這些發(fā)現(xiàn)和理論建議(例如Grossberg 1983;Reitboek 1983,1989;von der Malsburg 1985;Damasio 1989)支持同步可能是將局部視覺特征連接到連貫的全局感知的機(jī)制的假設(shè)。兩種類型的同步已經(jīng)被理論化,刺激強(qiáng)迫同步和刺激誘導(dǎo)同步。第一類是輸入刺激的直接結(jié)果。它不是振蕩的,而是跟隨刺激瞬變的時(shí)間過程。這種同步被認(rèn)為在視覺皮層的所有區(qū)域都起著重要作用。第二類,刺激誘導(dǎo)的同步被認(rèn)為是通過相互連接的局部神經(jīng)振蕩之間的自組織過程產(chǎn)生的。據(jù)認(rèn)為,刺激誘導(dǎo)的同步主要支持更復(fù)雜的“注意知覺”的形成,這需要不同加工水平和記憶之間的迭代交互。[4]
PCNN支持本節(jié)討論的兩種類型的同步。饋電輸入產(chǎn)生刺激強(qiáng)制同步,連接輸入產(chǎn)生刺激誘導(dǎo)同步。前者表現(xiàn)為多個(gè)神經(jīng)元之間的共同脈沖重復(fù)頻率,后者表現(xiàn)為多個(gè)神經(jīng)元之間單個(gè)脈沖的同步。圖6顯示了單個(gè)PCNN神經(jīng)元的內(nèi)部活動(dòng),該神經(jīng)元在時(shí)間0時(shí)受到刺激,在時(shí)間250時(shí)被移除。每當(dāng)內(nèi)部神經(jīng)元電位達(dá)到或超過觸發(fā)閾值時(shí),就會(huì)產(chǎn)生一個(gè)輸出脈沖。
狀態(tài)相關(guān)調(diào)制
視覺系統(tǒng)執(zhí)行的處理包括一個(gè)實(shí)質(zhì)性的編輯過程,該過程強(qiáng)調(diào)無關(guān)信息,并增加對目標(biāo)信息含義的解釋和推斷。即使是早期的處理階段,也不能給予視網(wǎng)膜圖像的所有部分同等的權(quán)重。優(yōu)先考慮觀察者關(guān)注的那些元素。當(dāng)刺激成為注意的目標(biāo)時(shí),許多神經(jīng)元的反應(yīng)會(huì)加倍。狀態(tài)依賴信號(hào)被認(rèn)為是導(dǎo)致這種優(yōu)惠待遇的刺激。這些信號(hào)來自視網(wǎng)膜以外的其他來源。許多信號(hào)來自頂葉和顳葉的高級處理區(qū)。這些信號(hào)調(diào)節(jié)神經(jīng)元對其感受野內(nèi)刺激的反應(yīng)。這些調(diào)制被認(rèn)為可以過濾掉不相關(guān)的信號(hào),并添加關(guān)于被記憶或推斷存在的物體的信息。狀態(tài)相關(guān)調(diào)制是一種處理層將其發(fā)現(xiàn)或期望疊加到另一個(gè)處理區(qū)域的方法。[6]
如表2中的方程式所示,PCNN的連接輸入調(diào)制饋電輸入。此過程模擬在視覺系統(tǒng)中觀察到的狀態(tài)相關(guān)調(diào)制。通過這種機(jī)制,發(fā)現(xiàn)、期望和記憶可以在處理區(qū)域之間以迭代的方式進(jìn)行傳遞,直到所有的結(jié)果、期望和記憶都被整合到處理層次結(jié)構(gòu)的每個(gè)層次。
結(jié)果
對乳腺癌圖像的多個(gè)視圖進(jìn)行處理,以研究使用PCNN進(jìn)行圖像融合的可行性。圖7顯示了用于融合乳腺癌圖像的PCNN的連接架構(gòu)。原始圖像的過濾版本使用PCNN鏈接輸入鏈接到原始圖像。這些圖像代表了融合過程的預(yù)期結(jié)果。PCNN的鏈接機(jī)制使用時(shí)間同步和狀態(tài)相關(guān)調(diào)制來增強(qiáng)濾波圖像所表示的感興趣對象。圖7a顯示了每個(gè)PCNN中使用的連接和饋電連接。圖Th顯示了用于融合每個(gè)PCNN產(chǎn)生的基于脈沖的信息的連接結(jié)構(gòu)。
?
圖8顯示了融合過程的輸入圖像和結(jié)果圖像。圖8a、8b和8c是用作融合網(wǎng)絡(luò)輸入的圖像。融合結(jié)果如圖8d和8e所示。使用1的饋電和連接半徑來產(chǎn)生每個(gè)結(jié)果,圖8d的神經(jīng)元放電閾值低于圖8e。
???????
?
結(jié)論
PCNN參數(shù)高度可調(diào),可以提供融合結(jié)果,這是對任何一種圖像濾波過程的改進(jìn)。在PCNN融合研究中,利用PCNN進(jìn)行生理學(xué)上的圖像融合是可行和有利的。
總結(jié)
以上是生活随笔為你收集整理的脉冲耦合神经网络(PCNN)阅读笔记的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 钉钉云课堂sign计算方式
- 下一篇: 汽车诊断之UDS入门-0x19 0x06