人脸解锁除了要穿衣服,还有什么秘密?
pledge 堂妹?發(fā)自?澡堂子?
糖寶?報道 | 公眾號 九點澡堂子
前????????????????????????????????段時間看到這則新聞人臉識別的時候,一定要穿上衣服啊!!!
作為一個AI從業(yè)者,深知這篇文章里存在一些誤區(qū),今天這篇文章,希望能夠給還人臉識別技術(shù)一個“公道”。
人臉解鎖
人臉識別大家應(yīng)該都很熟悉了,它是人臉解鎖應(yīng)用里最核心的模塊,也是近年來頗有爭議的話題。
只不過,雖然大家表面都叫"人臉解鎖",“背后”實力懸殊。
網(wǎng)絡(luò)上那些奇奇怪怪的“用別人的臉解開自己的鎖”的新聞,并不是這個技術(shù)本身問題。要怪只怪預(yù)算有限,買了些“劣質(zhì)產(chǎn)品”。
你們猜下面這個炫酷的畫面是什么應(yīng)用場景?
別著急,我們稍后揭曉答案。
數(shù)據(jù)表明,全國每天使用人臉解鎖的人次高達300億。
自從iPhone X上線Face ID后,近幾年各大品牌的手機都逐步上線“人臉解鎖”功能,它也逐步成為手機屆的解鎖“扛把子”。
作為CV落地第一棒,AI技術(shù)除了賦能手機,門鎖"凱迪仕",
車企"凱迪拉克"也都緊跟潮流,成為AI落地的載體。
我們今天就來揭秘一下,"人臉解鎖🔓"后面的技術(shù)鏈條。
人臉解鎖技術(shù)鏈條
如上圖,這是人臉解鎖目前相對較全的pipeline了,接下來我們一個個環(huán)節(jié)剖析。
第一步:人臉檢測校準(zhǔn)
這一模塊可分為兩個步驟:
判斷圖中是否有人臉,若有則給出大致的位置;
對人臉進行精細(xì)位置定位并轉(zhuǎn)正人臉。
這一環(huán)節(jié)主要就是對圖像中的人臉做位置定位,為后續(xù)環(huán)節(jié)提供支持。
比較容易理解,這里我們不展開介紹。
第二步:人臉遮擋判斷
這一模塊用于在人臉信息不完整場景下提高手機解鎖的安全性。
以目前最常見的場景為例,當(dāng)戴著口罩的時候能否解鎖我們的手機?
目前我們測試的結(jié)果如下:
以iPhone12為例,?蘋果手機戴口罩很難解開(不考慮Apple Watch);
以華為mate40為例,華為手機在口罩拉到鼻梁以下可以解開;
以小米11為例,小米手機正常佩戴口罩可以解開。
在解釋上述現(xiàn)象之前,我們先來分析一下為什么需要“遮擋判斷”?
由此可見,“遮擋判斷”是滿足國民“戴口罩解鎖需求”的技術(shù)保證。
在這個模塊中,會對輸入的人臉信息做判斷,當(dāng)遮擋后的剩余信息量滿足后續(xù)模塊最低要求時,即通過該判斷,否則解鎖失敗。
由實驗表明,對于華為手機,最低要求是保留鼻子及以上的信息;
對于小米手機,保留眼睛及以上信息即可解鎖;
對于蘋果手機,大概率是不支持戴口罩解鎖,對于不完整的人臉信息,蘋果直接判定解鎖失敗。
在保證安全和準(zhǔn)確率的前提下,這個最低要求是多“低”,由后面的“人臉識別模塊”算法能力來決定,這也就體現(xiàn)各家公司的研發(fā)能力。
第三步:人眼注視判斷
這一模塊用于避免當(dāng)事人在場但個人不知情的場景下手機被解鎖。
這里面包含兩個細(xì)節(jié):視線朝向和睜閉眼。當(dāng)睜眼且視線朝向手機時,才構(gòu)成解鎖條件。
現(xiàn)在的很多手機中也顯式的暴露了“是否需要注視解鎖”的設(shè)置。
我們用一個經(jīng)典畫面來側(cè)面驗證一下:
這個故事告訴我們,算法沒有人精,喝酒不能貪杯哦~
第四步:? 人臉識別模塊
這是絕大部分人對于AI應(yīng)用的第一印象,作為人臉解鎖產(chǎn)品中最核心的模塊,具有至關(guān)重要的地位。
人臉識別,顧名思義,就是把解鎖時攝像頭獲取的人臉數(shù)據(jù)和手機中已錄入的人臉模板做匹配。
那可能會有人有問,如果一個人有兩副面孔呢?比如碰到“換頭式”化妝術(shù)。
新一代碼農(nóng)們豈能被這種小問題難住??
在此我們給出華為的解決方案“備用面容”,當(dāng)然這也是手機廠商的通用方案。
圖片來源:華為手機宣傳片
第五步,靜默活體檢測
這個模塊用于避免當(dāng)事人不在場的場景下手機被解鎖。
其主要作用是在別有用心之人拿照片、視頻、人皮面具、3D假人頭等非活體樣本攻擊算法企圖解鎖手機時,保證人臉解鎖的安全性。
視頻中的情節(jié)很好展示了:用照片或者錄好的視頻都不能騙過活體檢測模塊,無需擔(dān)心自己的照片被用作解鎖。
當(dāng)然,不同公司的活體檢測算法水平肯定不一樣。
在手機中的這個模塊被稱為“靜默活體”,而在我們金融或者醫(yī)療這種需要實名制的場景,還會引入“交互活體模塊”,也就是大家接觸的“眨眨眼、張張嘴、搖搖頭”。
即使是交互活體的場景,大都是以智能算法的方式進行,極少數(shù)敏感場景下會設(shè)置“人工審核”的步驟來應(yīng)對極端case,這就需要具體產(chǎn)品具體分析。
總結(jié)陳詞
上述的五大步驟,是目前相對完整的人臉解鎖pipeline。
人臉識別只是其中的必要不充分模塊,只有它,雖然人臉解鎖功能可以運轉(zhuǎn),但是安全性得不到保證。
因此加上遮擋判斷、注視判斷、靜默活體檢測之后,人臉識別“如虎添翼”,才能從一個“功能模塊”,變成一款真正經(jīng)受得住市場考驗的“產(chǎn)品”。
那這樣一個完整的算法pipeline,是如何與我們的手機產(chǎn)生聯(lián)系呢?
這就是“部署”的工作了。在本篇文章中,我們先簡單介紹AI算法的部署平臺。具體的硬核部署流程,有緣的話,我們下一篇文章見~
傳說中的“云邊端”
凡提到部署領(lǐng)域,"云邊端"一詞必定出現(xiàn)。
作為AI技術(shù)的實際載體,各家公司窮盡其有在這個環(huán)節(jié)力爭上游。
手機作為“邊”系列的代表產(chǎn)品,凡新品發(fā)布會,“邊上性能”必定會拎出來和競品PK。
圖片來源:華為mate30 發(fā)布會
我們先來看看“云、邊、端”分別代表什么:
云:一般指由公司集中管理的服務(wù)器,比如阿里云,騰訊云;
邊:一般指擁有一定計算功能的私人設(shè)備,如PC、手機;
端:一般指只擁有獲取數(shù)據(jù)能力的設(shè)備,比如攝像頭、麥克風(fēng)。
我們可以從計算能力、數(shù)據(jù)來源、數(shù)據(jù)獲取延時三個維度來簡單區(qū)分:
EFLOPS:10^18;TFLOPS:10^12;GFLOPS:10^9(單位:次浮點運算每秒)
鑒于IO總線傳輸速度遠(yuǎn)大于4G的網(wǎng)絡(luò)傳輸速度,對于人臉解鎖這樣一個要求在1s內(nèi)完成全流程、實時性要求較高的模塊,如果通過網(wǎng)絡(luò)來進行傳輸,4G的傳輸速度是遠(yuǎn)遠(yuǎn)不夠的。
因此,當(dāng)前我們將其直接部署在了“邊”上,利用“邊”上包含自帶數(shù)據(jù)獲取、數(shù)據(jù)計算、數(shù)據(jù)反饋等自形成閉環(huán)操作的特性,完成人臉圖像的獲取到結(jié)果呈現(xiàn)的實時處理流程,既保證的數(shù)據(jù)安全不流失,又保證了用戶體驗。
隨著5G技術(shù)的發(fā)展,其傳輸速度能夠逐漸逼近IO總線傳輸速度,屆時,云+5G是否能創(chuàng)造出的新使用場景,我們拭目以待。
誰主沉浮
解鎖市場風(fēng)起云涌,Face ID 和 Touch ID的PK尚未決出勝負(fù)。
細(xì)數(shù)這些年在歷史潮流中出現(xiàn)過的手機解鎖方式,除了人臉解鎖和指紋解鎖外,還包括最原始的密碼解鎖、風(fēng)靡一時的手勢解鎖、互動性很強的語音解鎖以及帶有未來科技感的虹膜解鎖等等。
當(dāng)然,除了指紋和人臉解鎖外,大家?guī)缀鹾茈y看到第三方案作為手機的第一解鎖方式,而他們退出歷史舞臺的原因各有不同。
虹膜解鎖雖然安全性很強,但是對眼睛的狀態(tài)要求極高,不能帶美瞳,不能帶眼鏡,瞳孔必須嚴(yán)格正對攝像頭才能解鎖。
圖片來源:三星產(chǎn)品宣傳
手勢和密碼解鎖因為安全和便利不可兼得而受人詬病,復(fù)雜設(shè)置安全但繁瑣,簡單設(shè)置又容易被偷窺和復(fù)制。
語音解鎖方案中,聲音的可復(fù)制性和其本身的多變性,帶來負(fù)面的用戶體驗。
大浪淘沙始見金,指紋解鎖和人臉解鎖突破重圍, 成為當(dāng)前最為主流的解鎖方案。
當(dāng)然,兩種方案都有它的不足之處,都沒有做到無懈可擊。
指紋解鎖,對于少部分指紋淺,愛脫皮,愛出手汗的同學(xué),就不是最佳選擇;
人臉解鎖,會有化妝前后差別大,人臉有遮擋等場景解鎖失敗的問題。目前這些問題的都可以通過上文提到的“備用面容”、“遮擋判斷模塊”來應(yīng)對。
在這個技術(shù)洪流的裹挾之中,我們可以“各有所愛”。
最后友情提示:
解鎖時,手機鏡頭面向自己的狀態(tài),是和拿著手機自拍一樣的,大家可以回想一下細(xì)節(jié)。
鏡頭能攝取的內(nèi)容不只是面部,而是能覆蓋的所有視角,千萬別被屏幕上的輔助框誤導(dǎo)。
人臉解鎖雖好,請記得穿衣哦~
參考資料:
https://v.qq.com/x/page/n3137x7mzj9.html
https://v.qq.com/x/page/p0901avad4x.html
https://v-wb.youku.com/v_show/id_XNDg5NjIzNzg2NA==.html
https://baijiahao.baidu.com/s?id=1628033382042831413&wfr=spider&for=pc
點擊下方名片關(guān)注我
你的每一條留言我都會回復(fù)
最后,我建立了各大城市的產(chǎn)品交流群,想進群小伙伴加微信:yw5201a1??我拉你進群。
關(guān)注微信公眾號:產(chǎn)品劉?可領(lǐng)取大禮包一份。
··················END··················
今日研報:京東家電發(fā)布《家電消費趨勢白皮書》,公眾號后臺回復(fù)“?家電消費”,即可下載完整PDF文件。
RECOMMEND
推薦閱讀
公司為什么寧愿花11K月薪招新人,也不愿意花9K的月薪留住老員工?
手把手教你做B端產(chǎn)品經(jīng)理
用Axure制作一個PRD文檔(結(jié)尾分享模板)
B端產(chǎn)品和C端產(chǎn)品的用戶調(diào)研區(qū)別
點擊“閱讀原文”
查看更多干貨
總結(jié)
以上是生活随笔為你收集整理的人脸解锁除了要穿衣服,还有什么秘密?的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 操作系统(十六)调度算法(一)
- 下一篇: 教你使用百度深度学习框架PaddlePa