DeepHSV:号称可以商用的计算机笔迹鉴别算法
點(diǎn)擊上方“AI搞事情”關(guān)注我們
?
「論文名稱」:《DeepHSV: User-Independent Offline Signature Verification Using Two-Channel CNN》
「開(kāi)源代碼」:https://github.com/dlutkaka/DeepHSV
介紹
堪稱是世界上第一個(gè)可以在GPDS手寫簽名數(shù)據(jù)庫(kù)(世界最新、最大的手寫簽名數(shù)據(jù)庫(kù),也是鑒定最為困難的數(shù)據(jù)庫(kù))上鑒定準(zhǔn)確率達(dá)到“可用”級(jí)別的算法。
簽字識(shí)別:分為在線簽字識(shí)別,和離線簽字識(shí)別,本文針對(duì)離線的靜態(tài)圖像進(jìn)行筆跡識(shí)別。
用戶依賴:分為依賴于用戶和不依賴用戶,本文對(duì)簽字?jǐn)?shù)據(jù)集訓(xùn)練用戶無(wú)關(guān)的識(shí)別模型,可以對(duì)新用戶簽字進(jìn)行字跡鑒別。
主要?jiǎng)?chuàng)新在于將2-ChannelCNN(雙通道卷積神經(jīng)網(wǎng)絡(luò))模型引入到筆跡對(duì)比中,比原來(lái)的CNN-Siamese(孿生卷積網(wǎng)絡(luò))模型在EER(等錯(cuò)率)從22.24%降到了9.95%,推斷速度提高了2倍,訓(xùn)練效率提高了4倍,且具有更好的魯棒性。
2-ChannelCNN(左) ?CNN-Siamese(右)基礎(chǔ)模型
「孿生網(wǎng)絡(luò)」:度量學(xué)習(xí)方式,包含兩個(gè)特征提取的分支,分支共享一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)與權(quán)重,兩個(gè)分支的輸出用來(lái)衡量?jī)蓚€(gè)輸入的相似度,通常用距離進(jìn)行度量,比如歐式距離,訓(xùn)練損失采用對(duì)比損失(Contrastive Loss)。
「雙通道網(wǎng)絡(luò)」:兩個(gè)輸入被合并為一個(gè)雙通道圖像,作為一個(gè)單網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)一開(kāi)始就學(xué)習(xí)兩個(gè)輸入的相似度,而不是通過(guò)最后進(jìn)行特征相似度比較。同時(shí),達(dá)到了減少參數(shù)搜索空間,提升收斂速度的效果。傳統(tǒng)雙通道網(wǎng)絡(luò)經(jīng)過(guò)全局平均池化,只輸出兩個(gè)輸入數(shù)據(jù)的相似度得分。運(yùn)用以下的損失函數(shù)進(jìn)行訓(xùn)練模型權(quán)重。第一項(xiàng)為正則項(xiàng),第二項(xiàng)是label(匹配為1、不匹配為-1),為網(wǎng)絡(luò)輸出。
本文模型
「2-Channel-2-Logit Network」:基于雙通道網(wǎng)絡(luò),作者提出了輸出兩個(gè)logit的雙通道雙logit網(wǎng)絡(luò),將兩個(gè)輸出的距離作為兩個(gè)輸入圖像的相似度。
采用常用的softmax損失對(duì)距離進(jìn)行監(jiān)督學(xué)習(xí):
主干網(wǎng)絡(luò)采用「Inception-V3」結(jié)構(gòu)(整個(gè)網(wǎng)絡(luò)就是一個(gè)Inception-V3),為避免過(guò)擬合,增加了3個(gè)dropout層,網(wǎng)絡(luò)結(jié)構(gòu)如下:
網(wǎng)絡(luò)結(jié)構(gòu)「預(yù)處理」:考慮一般簽字圖像的比例與書寫方向,利用雙線性插值將圖像縮放到高度為155,寬度為220的固定大小。未做裁剪、對(duì)齊,像素反轉(zhuǎn),背景去除,二值化等預(yù)處理操作。
「模型訓(xùn)練」:在簽名數(shù)據(jù)集中存在樣本不均衡問(wèn)題,同一個(gè)用戶的仿寫數(shù)據(jù)對(duì)數(shù)量遠(yuǎn)大于真實(shí)數(shù)據(jù)對(duì),假設(shè)一個(gè)用戶有M個(gè)真實(shí)簽字樣本,N個(gè)冒寫數(shù)據(jù)樣本,那么真實(shí)簽字樣本有對(duì),
冒寫數(shù)據(jù)對(duì)有個(gè):
作者采用對(duì)冒寫數(shù)據(jù)下采樣的方式,保持正負(fù)樣本對(duì)保持在均衡的狀態(tài)。
「實(shí)驗(yàn)細(xì)節(jié)」:
Tensorflflow 1.7(年代久遠(yuǎn)????),優(yōu)化器:AdamOptimizer,未使用BN,Xavier方法進(jìn)行權(quán)重初始化,batch size:192,初始學(xué)習(xí)率:1e-4,衰減系數(shù)decay:0.9。
「實(shí)驗(yàn)數(shù)據(jù)」:
CEDAR: ?55個(gè)人,24次真實(shí)簽字,24次專業(yè)仿寫簽字,掃描為PNG圖像格式
BHSig260: ?100人孟加拉語(yǔ),160人印度語(yǔ),20次真實(shí)簽字,30次專業(yè)仿寫數(shù)據(jù),TIFF圖像格式
GPDS-Synthetic:?4000用戶,每個(gè)人24次真實(shí)簽字,30次仿寫簽字,JPEG圖像格式
實(shí)驗(yàn)結(jié)果總的來(lái)說(shuō),本文借鑒了雙通道做圖像相似度比較的思想(2015年CVPR文章),采用了Inception-V3作為backbone,為防止過(guò)擬合加入了dropout,然后輸出兩個(gè)logit分?jǐn)?shù),并將差值作為距離進(jìn)行監(jiān)督學(xué)習(xí),最后效果很好,據(jù)說(shuō)在中國(guó)金融認(rèn)證中心(CFCA)已經(jīng)投入使用,用于自動(dòng)審核客戶在電子合同中手寫簽字的有效性。
推薦閱讀
CVPR 2019筆跡識(shí)別論文:逆鑒別網(wǎng)絡(luò)+八路Attention
PolarMask:單階段實(shí)例分割框架,FCOS進(jìn)階!
真正意義的Anchor-Free,FCOS目標(biāo)檢測(cè)算法了解一下
論文創(chuàng)新,可以看看這幾篇去雨文章是怎么做的
眨眼算什么,讓蒙娜麗莎像你一樣嘮上嗑才算硬核
抖音同款白眼特效,DeepWarp讓蒙拉麗莎對(duì)你眨眨眼
長(zhǎng)按二維碼關(guān)注我們
有趣的靈魂在等你
總結(jié)
以上是生活随笔為你收集整理的DeepHSV:号称可以商用的计算机笔迹鉴别算法的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【opencv系列08】OpenCV4.
- 下一篇: 利用python分析了下乘风破浪的姐姐