日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) >

DeeoID:Deep learning face representation from predicting 10,000 classes

發(fā)布時(shí)間:2025/7/25 38 豆豆
生活随笔 收集整理的這篇文章主要介紹了 DeeoID:Deep learning face representation from predicting 10,000 classes 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

參考文獻(xiàn):《DeeoID:Deep learning face representation from predicting 10,000 classes》


1 Effective way to learn high-level over-complete features with deep ConvNets.


圖1 箭頭指示傳播的方向。每一層神經(jīng)元數(shù)量的標(biāo)記在multiple deep ConvNets的旁邊。DeepID提取自每一個(gè)ConvNet的最后一個(gè)隱層,and predict a large number of identity classes。沿著特征提取特征數(shù)量繼續(xù)減少級(jí)聯(lián)到DeepID層。 特征的數(shù)量沿著特征提取的級(jí)聯(lián)方向逐漸減少,直到DeepID層.

The ConvNets are learned to classify all the?faces available for training by their identities, with the last?hidden layer neuron activations as features (referred to as Deep hidden IDentity features or DeepID).每一個(gè) ConvNet 的輸入為一個(gè)face patch,在最下面的層提取局部的低級(jí)特征. 沿著特征提取的級(jí)聯(lián)方向提取的特征的數(shù)量會(huì)逐漸減少,但是更多全局的和高級(jí)的特征會(huì)在上面的層提取出來(lái)。最后得到的是一個(gè)160維的DeepID特征,包行rich identity?information,并且可以直接用來(lái)預(yù)測(cè)大數(shù)據(jù)量的身份類(lèi)別分類(lèi)(比如,1000類(lèi)).

同時(shí)分類(lèi)所有的身份類(lèi)別,而不是訓(xùn)練二元分類(lèi)器是基于兩方面的考慮。首先, it is?much more difficult to predict a training sample into one?of many classes than to perform binary classification。這個(gè)具有挑戰(zhàn)性的任務(wù)可以充分利用神經(jīng)網(wǎng)絡(luò)的超級(jí)學(xué)習(xí)能力的提取人臉識(shí)別的有效特征。第二,它隱式地對(duì)ConvNets添加了一個(gè)強(qiáng)正規(guī)化, 這有助于形成共享的隱藏表示, 可以很好的分類(lèi)所有的身份類(lèi)別。所以,這樣學(xué)習(xí)到的高級(jí)特征具有很好的凡或能力并且用小數(shù)據(jù)集做人臉訓(xùn)練不會(huì)導(dǎo)致過(guò)擬合。我們限制DeepID的維數(shù)要顯著少于分類(lèi)的類(lèi)別,這是學(xué)習(xí)得到具有高度緊湊和區(qū)分性的特征的關(guān)鍵。我們進(jìn)一步連接提取自不同人臉區(qū)域的DeepID來(lái)形成復(fù)雜完備的表示。測(cè)試中發(fā)現(xiàn),學(xué)習(xí)得到的特征可以很好的一般化到新(訓(xùn)練中沒(méi)有用到, which are not seen in training)的身份類(lèi)別測(cè)試,并且可以和任何人臉驗(yàn)證的分類(lèi)器(例如,Joint Bayesian)集成。


2 網(wǎng)絡(luò)結(jié)構(gòu)(Deep ConvNets)


 圖2  網(wǎng)絡(luò)中有4個(gè)卷積層的網(wǎng)絡(luò),除了第4個(gè)卷積層,前3個(gè)卷積層后面都連接一個(gè)max-pooling層。DeepID層和第4個(gè)卷積層以及第3個(gè)max-pooling層全連接(這樣做的是因?yàn)榈?層卷積層含有的神經(jīng)元個(gè)數(shù)太少,成為信息傳遞的瓶頸),這做是作者所謂的Multi-scaleConvNets。?第4個(gè)卷積層提取到的特征是比第3個(gè)max-pooling層更加具有全局性的特征。最后,DeepID接一個(gè)softmax進(jìn)行分類(lèi)。這樣提取到的特征是對(duì)類(lèi)間具有很好的判別性的,相當(dāng)于增加了類(lèi)間的距離。(從作者的另外一篇文章DeepID2的得出)。

? ?如圖所示的Deep ConvNet輸入是39x31xk的長(zhǎng)方形面片或者是31x31xk的正方形面片,k=3是RGB三通道彩色面片,k=1是灰度圖面片。如果輸入圖的尺寸發(fā)生變化,則后面的卷積層的尺寸也要相應(yīng)發(fā)生變化。預(yù)測(cè)的類(lèi)別數(shù)目發(fā)生變化,相應(yīng)的softmax層輸出尺寸也發(fā)生變化。DeepID層是固定的160維,不發(fā)生改變。卷積過(guò)程跟普通的卷積神經(jīng)網(wǎng)絡(luò)一樣,每個(gè)卷積后面的相應(yīng)函數(shù)式ReLU, 被實(shí)驗(yàn)證明(在這篇文章中提到)比sigmoid函數(shù)的有更好的擬合能力。


3 特征提取


圖3,  上半部分:中度尺度的10個(gè)人臉區(qū)域。上半部分左側(cè)的5個(gè)是弱對(duì)齊的人臉,右側(cè)的5個(gè),是分別以5個(gè)標(biāo)記點(diǎn)為中心的局部區(qū)域。

   下半部分:其中2個(gè)面片的3中尺度表示。


  對(duì)人臉圖片檢測(cè)5個(gè)標(biāo)記(包括兩個(gè)眼睛的中心,鼻尖,和兩個(gè)嘴角),基于兩個(gè)眼睛的中心點(diǎn)和兩個(gè)嘴角的中點(diǎn)對(duì)人臉進(jìn)行全局對(duì)齊。特征提取出自60個(gè)人臉面片,這60個(gè)面片,包含10個(gè)不同的區(qū)域,3種尺度,RGB或灰度通道。圖3是一組示例。

  論文中訓(xùn)練了60個(gè)ConvNets, 每一個(gè)提取2個(gè)160維的特征(即一個(gè)face patch和該face patch水平翻轉(zhuǎn)后的相對(duì)應(yīng)的face patch). A special case is patches around the ?two eye centers and the two mouth corners, which are not?flipped themselves, but the patches symmetric with them?(for example, the flipped counterpart of the patch centered?on the left eye is derived by flipping the patch centered?on the right eye). The total length of DeepID is 19, 200?(160 × 2 × 60), which is ready for the final face verification.


4 人臉驗(yàn)證


圖 4,用于人臉驗(yàn)證的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。已經(jīng)標(biāo)注了層的類(lèi)型和維數(shù)。

   We use the Joint Bayesian technique for face verification based on the DeepID.

該部分的神經(jīng)網(wǎng)絡(luò)的輸入是60組(前面60個(gè)ConvNets的輸出),每一組640維,(人臉驗(yàn)證,需要輸入兩張人臉圖片,來(lái)判定這兩張人臉圖片是不是來(lái)自同一個(gè)人),每一張face patch包括做側(cè)面和右側(cè)面,320維,故每一組共640維。

face patch學(xué)習(xí)到的是局部特征,將這些face patch組合起來(lái)再訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò),這樣從局部特征中可以學(xué)到一種全局性的特征。

第一個(gè)隱藏層和這60組是局部連接的,目的使該隱藏層能夠?qū)W習(xí)到該局部face patch壓縮的特征表示,然后這個(gè)隱藏層和跟它節(jié)點(diǎn)數(shù)目相同的隱藏層進(jìn)行全連接,以求學(xué)到全局特征。

最后連接一個(gè)二分類(lèi)器,來(lái)判定是否來(lái)自同一個(gè)人。(The hidden neurons are ReLUs and?the output neuron is sigmoid)隱藏層的相應(yīng)也是用的ReLU,并且同時(shí)對(duì)所有隱藏層節(jié)點(diǎn)使用了dropout方式。使用dropout對(duì)于使用梯度法來(lái)訓(xùn)練網(wǎng)絡(luò)是必須的,因?yàn)椴挥?/span>dropout而學(xué)習(xí)高維特征會(huì)帶來(lái)梯度擴(kuò)散(gradientdiffusion)問(wèn)題。


5 配置和實(shí)驗(yàn)數(shù)據(jù)




總結(jié)

以上是生活随笔為你收集整理的DeeoID:Deep learning face representation from predicting 10,000 classes的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。