虹膜识别-DeepIrisNet_1
hello,這是鑫鑫鑫的論文分享站,今天分享的文章是DeepIrisNet: DEEP IRIS REPRESENTATION WITH APPLICATIONS IN IRIS RECOGNITION AND CROSS-SENSOR IRIS RECOGNITION ,一篇關(guān)于虹膜識別的論文,一起來看看吧~
摘要:
在本文中,我們提出了一種基于深度學(xué)習(xí)的虹膜表示方法,稱為DeepIrisNet。提出的方法基于非常深的架構(gòu)和最近成功的cnn的各種技巧。實驗分析表明,所提出的DeepIrisNet可以非常有效地模擬虹膜的微觀結(jié)構(gòu),并提供魯棒、鑒別、緊湊和非常容易實現(xiàn)的虹膜表示,并獲得最高的精度。此外,我們用CROSS-SENSOR IRIS 算法評估我們的虹膜。實驗結(jié)果表明,DeepIrisNet模型在跨傳感器識別精度上也有顯著提高。
1.INTRODUCTION
2. DeepIris- Net的架構(gòu)細節(jié)。
3.實驗和數(shù)據(jù)集
4.結(jié)論
1. INTRODUCTION
1993年,Daugman[1]提出了第一個完整的自動虹膜識別系統(tǒng)。雖然在高度改進的紅外技術(shù)的開發(fā)方面取得了很大進展,但在實際應(yīng)用中,紅外技術(shù)仍面臨一些挑戰(zhàn),特別是在圖像采集不受限制的情況下[5,7]。
- 非理想的虹膜圖像,在較少的約束條件下捕獲,通常會降低紅外性能,因為虹膜分割不當(dāng)或虹膜紋理質(zhì)量低[5,9]。
- 大規(guī)模IR(j虹膜識別)部署的另一個挑戰(zhàn)性問題是,很多時候注冊是由一個傳感器完成的,而身份驗證是使用不同的傳感器執(zhí)行的。由于存儲的模板使用時間較長,且系統(tǒng)需要支持傳感器升級,因此在大規(guī)模IR中也需要實現(xiàn)互操作性。
- 在一些研究中,發(fā)現(xiàn)交叉?zhèn)鞲衅骱缒てヅ鋾?dǎo)致紅外性能下降[25,28]。很少有研究者對此問題進行研究并提出一些解決方案[24,26,27]。許多正在進行的IR研究都旨在獲得有效的特征表征,以減少個體內(nèi)的差異,同時最大化個體間的差異。以往虹膜表示的大部分工作都是基于手工制作的特征[1,3,6,10]。雖然一些基于學(xué)習(xí)的方法[11-14]也被探索過,但它們基于淺層架構(gòu)。
深度學(xué)習(xí)方面的發(fā)展:
基于深度神經(jīng)網(wǎng)絡(luò)在其他領(lǐng)域的成功應(yīng)用,本文提出了一種能夠處理復(fù)雜分布的大規(guī)模虹膜數(shù)據(jù)的高效的深CNN結(jié)構(gòu)——DeepIrisNet。虹膜生物識別中基于深度學(xué)習(xí)的方法,最近在一些著作中進行了探索[4,30,31],但是它們的優(yōu)化目標與虹膜的身份沒有直接關(guān)系,而且如果能不那么深的話,其對象是設(shè)計的。據(jù)我們所知,這是第一次使用基于DCNN的方法來進行虹膜的表示和識別。 為了更好地利用計算資源和最佳的虹膜表示,DeepIrisNet經(jīng)過精心設(shè)計。
它集成了最近比較成功的cnn中最流行的組件,如dropout learning[20],較小的filter size[19],非常深的架構(gòu)[16,18,19],整流線性非線性[21],批量標準化[23]等。因此,我們提出了更加精確的DCNN結(jié)構(gòu),不僅達到了最新的紅外精度,而且很好地適用于不同的虹膜數(shù)據(jù)集。此外,實驗也證明了使用所提出的DeepIrisNet網(wǎng)絡(luò)的深度學(xué)習(xí)虹膜模式(DLIP)對傳感器互操作性、小分割和轉(zhuǎn)換變化具有良好的魯棒性。(也就是說深度學(xué)習(xí)可以避免虹膜來自不同傳感器獲得的圖像之間的差異,正常來說不同的虹膜庫,其采集的虹膜圖像設(shè)備不一樣,要是同一個傳統(tǒng)的特征提取算法,很可能不那么容易都適應(yīng)數(shù)據(jù)。而深度學(xué)習(xí)是以數(shù)據(jù)data為驅(qū)動力的,只有喂很多數(shù)據(jù)就能減小這種不同設(shè)備的差異。)
2. DeepIrisNet架構(gòu)
-
我們將提供兩個性能最好的:DeepIrisnet-A和Deep IrisNet-B。
-
DeepIrisNet-A基于標準卷積層[17],DeepIrisNet-B利用inception層[18]的疊加。
-
相對于可用于訓(xùn)練的數(shù)據(jù),非常淺的架構(gòu)和過深的架構(gòu)分別會導(dǎo)致欠擬合和過擬合。受到[16,18,19]中提出的非常深的架構(gòu)的啟發(fā),我們的DeepIrisNets也非常深;由大量的卷積/inception層組成。
-
DeepIrisNet -A包含8個卷積層(conv1到conv8),每個層后跟[23]批處理歸一化。有4個池化層,池化在每兩個卷積層之后執(zhí)行(中間有批處理規(guī)范化)。A的網(wǎng)絡(luò)結(jié)構(gòu)如下:
-
DeepIrisNet-B網(wǎng)絡(luò)的設(shè)計首先是疊加卷積層(conv1到conv5),然后是兩個起始層(Inception6和Inception7)。前兩個池操作(pool1和pool2)在每兩個卷積層之后應(yīng)用,而在conv5之后直接應(yīng)用池操作(pool3)。B的網(wǎng)絡(luò)結(jié)構(gòu)如下:
-
在這兩種配置中,我們通常使用非常小的卷積核,即大小為3×3的卷積核(stride為1,padding為0),我們還在DeepIrisNet-A的第一層和DeepIrisNetB的inception層中使用大小為5x5的過濾器。在這兩個網(wǎng)絡(luò)中,最大池是在一個2×2像素的窗口上使用stride 2執(zhí)行的。最上面的三層是完全連接的,即每個輸出神經(jīng)元都連接到所有的輸入。在所有網(wǎng)絡(luò)中,完全連接(FC)層的配置是相同的。最后一個完全連接的層的輸出是饋給一個C-way softmax(其中C是類的數(shù)量),它產(chǎn)生一個分布在類標簽。為了進行正則化,權(quán)值衰減設(shè)置為0.0005,第一層和第二層全連接層之后使用dropout,速率為0.5。卷積層的最大寬度為512。該網(wǎng)絡(luò)中濾波器的權(quán)值以0均值高斯分布,標準差為0.01進行初始化。偏差被初始化為零。所有網(wǎng)絡(luò)的學(xué)習(xí)率被設(shè)置為0.01,當(dāng)驗證錯誤率err停止提高時,學(xué)習(xí)率降低10倍。我們在所有的隱層中使用(ReLU)激活函數(shù)。
在訓(xùn)練過程中,采用隨機梯度下降(SGD)進行優(yōu)化,并將動量設(shè)置為0.9。梯度是通過反向傳播計算的。超參數(shù)的選擇使用ND-0405[2]數(shù)據(jù)庫,并且在所有實驗中都是固定的。我們的DeepIrisNet的輸入是一幅128×128大小的灰色虹膜圖像(圖1),無需任何預(yù)處理。只使用單一尺度訓(xùn)練網(wǎng)絡(luò),不進行數(shù)據(jù)擴充。在每個訓(xùn)練歷元之后,我們觀察驗證數(shù)據(jù)集上的誤差,并選擇驗證誤差最小的模型。(圖一這樣操作??這虹膜信息不就是相當(dāng)于拉伸變形了嗎?)
在測試過程中,softmax分類器層被刪除,DeepIrisNet的其余部分被用作固定的特征提取器。我們使用網(wǎng)絡(luò)中第二全連接層輸出的實值向量作為虹膜表示特征向量(4096-D)。相似度得分的計算使用歐氏距離。(先把softmax層去掉,先測試經(jīng)過全連接層的特征向量的歐式距離。)
3. EXPERIMENTS AND RESULTS
-
利用兩個公開的虹膜數(shù)據(jù)庫,ND-iris-0405 [2], ND-CrossSensor- Iris-2013[2]。ND-iris-0405包含來自356名受試者的64,980張圖像。圖像采集采用LG2200虹膜圖像攝像機。在CrossSensor-Iris-2013數(shù)據(jù)庫中,有29,986個來自LG4000和116,564張來自LG2200的圖片,為676個不同的測試者(交叉數(shù)據(jù)集)。交叉?zhèn)鞲衅鲾?shù)據(jù)庫中的ND-0405和LG2200子集中的大部分對象是不同的。這些數(shù)據(jù)庫是最大的公開虹膜數(shù)據(jù)庫,并被使用在我們的實驗中,由于它們適合于本文所關(guān)注的研究問題。
-
3.1. Dataset Splits (Forming Training and Testing sets) 數(shù)據(jù)集分割(形成訓(xùn)練和測試集)
數(shù)據(jù)集:如表3所示。
為了準備實驗數(shù)據(jù)集,首先在所有數(shù)據(jù)庫中分別對虹膜左右圖像進行分類標注。接下來,數(shù)據(jù)庫被劃分為2部分:第1部分和第2部分,使用不相交的類標簽。第1部分用于生成用于模型選擇的訓(xùn)練和驗證集,第2部分用于創(chuàng)建測試集,即用于性能報告。數(shù)據(jù)庫中不同受試者的圖像數(shù)量分布不均勻,有的受試者圖像數(shù)量多,有的受試者虹膜數(shù)量少。我們按照圖像的數(shù)量對標識進行排序,包含較多圖像的標識分配給第一部分,包含較少圖像的標識分配給第2部分。第2部分進一步分為兩個部分:查詢和目標。目標集中的圖像表示系統(tǒng)已知的圖像,查詢集中的圖像表示未知的圖像,供系統(tǒng)識別。為了支持看不見的對匹配問題,查詢集中約有50%的標識與目標集不同(唯一)。
此外,為了評估跨傳感器匹配,我們設(shè)計了Exp4和Exp5,(Exp4咋和Exp2一樣啊。。Exp5就是混合了Exp4和Exp3)為了評估擴大的訓(xùn)練集上的性能,我們創(chuàng)建了Exp6和Exp7。
對于績效評估,使用ROC和驗證率(VR)來報告準確性。利用在各自實驗中創(chuàng)建的查詢集和目標集計算精度。 -
3.2 Iris segmentation and normalization
對于虹膜分割,我們使用了一個免費的系統(tǒng)Osiris v4.1[6]。利用Daugman’s rubber sheet model[1]將虹膜區(qū)域歸一化到極坐標(映射到矩形區(qū)域),如圖1所示。 -
3.3. Baseline Iris Recognition Algorithm 基線虹膜識別算法
為了進行性能比較分析,我們采用了一種著名的基于Gabor的IR管道作為基線方法。該方法采用Osiris系統(tǒng)對虹膜紋理進行分割和采用Daugman的橡膠板模型[1]進行歸一化處理,將所有虹膜歸一化為64x256像素的矩形。特征提取使用1- DLog - Gabor濾波,相似度評分使用移動(-8°到+8°)的模板[1]之間的漢明距離計算。 -
3.4 Performance Evaluation
實驗123位單一傳感器結(jié)果
實驗45為交叉?zhèn)鞲衅鹘Y(jié)果
3.4.1 Single Sensor Matching
實驗與基線方法進行了比較。精度結(jié)果如圖2所示。
使用所提出的方法,在準確度上有顯著的提高。
Deepirisnet - B和Deepirisnet - A類似的精度。
3.4.2 Cross-Sensor Matching
我們評估了DeepIrisNet-A在交叉?zhèn)鞲衅鞣矫娴男阅?/strong>。
應(yīng)用于Exp4的DeepIrisNet-A的精度遠優(yōu)于交叉?zhèn)鞲衅鞯幕€方法。
我們假設(shè),當(dāng)傳感器從LG2200(舊的)升級到LG4000(新的)時,LG4000中少數(shù)物體的圖像是可用的。使用這個小集合(Exp5),我們微調(diào)了預(yù)訓(xùn)練(Exp4)網(wǎng)絡(luò)的權(quán)值。精細調(diào)諧網(wǎng)絡(luò)得到的精度如圖2所示,可以看到精度有了明顯的提高。
-
3.5 Robustness Analysis 魯棒性分析
基于IrisCode的方法對虹膜像素進行編碼,并按照序列進行排列。兩個虹膜編碼之間的匹配分數(shù)在很大程度上依賴于虹膜分割,即使是很小的分割變化也會產(chǎn)生很大的相似度評分[22]差異。在實際應(yīng)用中,在拍攝虹膜時,頭部相對于相機的位置可能不一致。這將導(dǎo)致虹膜圖形的旋轉(zhuǎn)以及其他問題,如平移,縮放等。大多數(shù)紅外系統(tǒng)都是通過將虹膜圖像歸一化成固定尺寸的矩形來解決縮放問題。但這也不能解決問題因此,對于非理想虹膜圖像,魯棒分割一直是一個非常有趣的話題,也是一個開放的挑戰(zhàn)。平面內(nèi)旋轉(zhuǎn)一般是將測試虹膜模板左右方向旋轉(zhuǎn)。在非線性變換的情況下,通過左移和右移來匹配虹膜的整個過程是非常耗時的,并且可能不是很有效。
提出的DeepIrisNet對這種變換變化具有不變性。這種不變性通常來自DeepIrisNet管道中的最大池步驟。為了研究這個問題,我們進行了各種實驗。
3.5.1. Invariance to Segmentation Variations 分割變量的不變性
為了評估DeepIrisNet對小的分割變化的魯棒性,我們使用了4種不同的眾所周知的分割方法;包括[3],WAHET [15], Osiris[6]和IFFP[7]。驗證精度(目前=0.1%)用Exp1計算,如表4所示。可以清楚地看到,當(dāng)分割方法發(fā)生變化時,DeepIrisNet-A相對于基線來說更加穩(wěn)健。
3.5.2. Invariance to Alignment/Rotation 校準/旋轉(zhuǎn)不變性
為了研究DeepIrisNet對旋轉(zhuǎn)的不變性,我們使用了Exp1中的數(shù)據(jù)集,圖像大小為128×128。使用未旋轉(zhuǎn)的圖像進行訓(xùn)練,在測試時,將查詢圖像(在特征提取前)以p次平移像素的方式旋轉(zhuǎn)到步長為2像素的+p次平移像素。在基線方法中,移動像素的位置,在IrisCode中移動2個位置。表5給出了不同像素位移的驗證精度(目前為0.1%),可以推斷DeepIrisNet允許在可能范圍內(nèi)對旋轉(zhuǎn)變化進行顯著補償。 -
3.6. Analysis of other Network Parameters 其他網(wǎng)絡(luò)參數(shù)分析
輸入虹膜大小影響:表6,從80->128有明顯的提升,120->160,提升不明顯
訓(xùn)練數(shù)據(jù)的大小影響:表7,有增加,不明顯
網(wǎng)絡(luò)規(guī)模影響:表8,移除某些層,略微降低性能
3.6.1 Effect of Input iris Size 輸入虹膜大小的影響
使用我們的網(wǎng)絡(luò),我們評估了3種不同設(shè)置下輸入圖像大小的影響:i) 80x80, ii) 128x128,和iii) 160x160。表6使用Exp1的設(shè)置報告了驗證率(目前為0.1%)。從結(jié)果中可以看出,與128x128輸入圖像相比,在80x80圖像大小的情況下,準確率有很大的下降,但在160x160圖像中,變化不大。
3.6.2 Effect of Training Size
訓(xùn)練數(shù)據(jù)的大小對性能有顯著影響。為了分析它,我們合并了LG2200和ND-0405數(shù)據(jù)集,并創(chuàng)建了一個更大的數(shù)據(jù)集(唯一的iriss -2023,總共180359張128x128大小的圖像)。我們使用Exp6和Exp7的設(shè)置來評估DeepIrisNet-A的性能,其中的測試分別與Exp1和Exp2相同。結(jié)果如表7所示,隨著訓(xùn)練數(shù)據(jù)的增加,準確率也有所提高。,
3.6.3 Effect of Network Size
為了考察網(wǎng)絡(luò)規(guī)模對精度的影響,各種調(diào)整及其影響如表8所示。在每一種情況下,模型都是從頭開始訓(xùn)練與修訂體系結(jié)構(gòu)。移除中間層(3,4)或更高的高層卷積層(7,8)或FC層(9,11)的大小變化會略微降低精度。這說明網(wǎng)絡(luò)的深度和寬度對于獲得良好的性能是很重要的。
備注:FAR錯誤接受率,VR驗證率
4. CONCLUSION
我們引入了一種新的深度網(wǎng)絡(luò),名為DeepIrisNet用于虹膜表示。為了研究DeepIrisNet的有效性,我們使用大型數(shù)據(jù)庫設(shè)計了各種實驗,遵循看不見的配對模式。經(jīng)驗證明,DeepIrisNet的性能顯著優(yōu)于基于描述符的強基線,并能很好地推廣到新的數(shù)據(jù)集。我們還證明了我們的模型對交叉?zhèn)鞲衅髯R別和常見的分割和轉(zhuǎn)換變化是魯棒的。然后,通過使用新傳感器的圖像子集對預(yù)訓(xùn)練模型(DeepIrisNet在舊傳感器上訓(xùn)練)進行微調(diào),提出了一種改進的交叉?zhèn)鞲衅髌ヅ淠P?/strong>。然后我們分析了各種參數(shù)對我們的模型性能的影響,例如;訓(xùn)練數(shù)據(jù)的大小,輸入圖像的大小,架構(gòu)的變化等。在未來的工作中,我們將探索DeepIrisNet中從其他層提取的特征的貢獻。
總結(jié):
提出了兩個網(wǎng)絡(luò)架構(gòu),自己組的網(wǎng)絡(luò)。然后測試不同虹膜庫,也有組的虹膜庫。傳統(tǒng)的算法很可能出現(xiàn),單一算法適合單一數(shù)據(jù)庫。深度學(xué)習(xí)以數(shù)據(jù)驅(qū)動的,可以避免這個不同采集儀器采集的虹膜不一樣的情況。
總結(jié)
以上是生活随笔為你收集整理的虹膜识别-DeepIrisNet_1的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机软件网络工程报名,网络工程师如何报
- 下一篇: 写好英文简历