50张图训练识别山寨货!阿里安全图灵实验室获ECCV 2020挑战赛冠军
賈浩楠發(fā)自凹非寺
量子位報(bào)道公眾號 QbitAI
阿里 AI 最近拿到了一個(gè)“世界第一”:計(jì)算機(jī)視覺領(lǐng)域頂會 ECCV 2020 VIPriors 挑戰(zhàn)賽分類賽道冠軍。
僅用 50 張圖片訓(xùn)練,然后識別特定類別的物體,阿里安全團(tuán)隊(duì)的算法擊敗了所有參賽對手。
阿里的高效分類 AI 模型,可以解決戴口罩的人臉識別問題;還可以打假,識別零售市場的高仿山寨貨。
訓(xùn)練數(shù)據(jù) 50 張圖,堪稱最難分類算法挑戰(zhàn)
ECCV 2020 VIPriors 挑戰(zhàn)賽最困難的一點(diǎn),是 1000 個(gè)數(shù)據(jù)類別中,每個(gè)類別僅有 50 張圖片作為訓(xùn)練數(shù)據(jù)。
參賽者的模型,必須能在這種訓(xùn)練數(shù)據(jù)極少的情況下,實(shí)現(xiàn)對于目標(biāo)高精度識別分類。
這樣的難度,對于傳統(tǒng)的 AI 模型來講,幾乎是不可能的任務(wù)。因?yàn)樗鼈兤毡樾枰A繋?biāo)簽訓(xùn)練數(shù)據(jù)作為基石,才能保證 AI 模型的效果。
但是數(shù)據(jù)的收集和標(biāo)注需要昂貴的人力成本,需要從不同的角度、光照條件和位置拍攝、收集幾千甚至上萬張圖片并進(jìn)行標(biāo)注。
根據(jù)招聘平臺信息,北京地區(qū),數(shù)據(jù)標(biāo)注師的月薪普遍在 5000-8000,有數(shù)據(jù)采集技能的標(biāo)注師月薪往往超過 10000。而數(shù)據(jù)標(biāo)注師的培訓(xùn)講解崗,工資則超過 2 萬。
ECCV 2020 VIPriors 挑戰(zhàn)賽的初衷,就是鼓勵探索能夠高效學(xué)習(xí)的 AI 神經(jīng)網(wǎng)絡(luò),降低神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中的人力標(biāo)注成本和計(jì)算資源消耗,使用極少的訓(xùn)練數(shù)據(jù),一塊 GPU 也可以完成。
在分類賽道上,比賽數(shù)據(jù)基于 ImageNet 抽取,1000 個(gè)類別,每個(gè)類別僅使用 50 張圖像,訓(xùn)練集共 5w 張圖片,規(guī)模僅為 Imagenet 的1/26。
比賽規(guī)定模型只能 train from scratch,不能使用額外的訓(xùn)練數(shù)據(jù),不能使用預(yù)訓(xùn)練模型,不能使用遷移學(xué)習(xí),排名以測試集上的 Top-1 Accuracy 為準(zhǔn)。
戴口罩識別 +AI 零售打假
在比賽中,面對 50 張訓(xùn)練圖片的苛刻要求,阿里安全圖靈實(shí)驗(yàn)室的智能算法團(tuán)隊(duì)從三個(gè)技術(shù)方向進(jìn)行了突破:
利用隨機(jī)抽取的兩張訓(xùn)練圖像,使用數(shù)據(jù)增強(qiáng)并進(jìn)行拼接,最大程度豐富訓(xùn)練樣本資源;
設(shè)計(jì)獨(dú)特的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),加入顯著性特征模塊挖掘樣本的特點(diǎn),提升分類性能;
利用分層語義結(jié)構(gòu),讓 AI 模型更好地挖掘數(shù)據(jù),實(shí)現(xiàn)更好的學(xué)習(xí)效果。
這三點(diǎn)創(chuàng)新方法,同時(shí)與自監(jiān)督有效結(jié)合,在學(xué)習(xí)更好的數(shù)據(jù)表征基礎(chǔ)上,指導(dǎo)模型高效學(xué)習(xí),獲得更好的識別能力。
獲得了冠軍,這項(xiàng)高效 AI 方案有什么實(shí)際應(yīng)用呢?
阿里安全圖靈實(shí)驗(yàn)室資深算法專家薛暉介紹,疫情期間,突發(fā)口罩佩戴問題使得大量人臉門禁失效,很多小區(qū)需要摘下口罩刷臉,帶來不必要的健康風(fēng)險(xiǎn)。
而高效 AI 分類技術(shù)的應(yīng)用大大降低了模型初始化的數(shù)據(jù)需求量,幫助快速訓(xùn)練好模型,解決了戴口罩的人臉識別問題。
此外,這項(xiàng) AI 技術(shù)還能用于打假,識別山寨仿冒商品,并且已經(jīng)投入使用。
對于零售場景,無論是線上還是線下,對于剛剛上新的某種產(chǎn)品,往往是樣本數(shù)量較少,預(yù)訓(xùn)練任務(wù)和目標(biāo)任務(wù)存在差異,預(yù)訓(xùn)練模型可能損害目標(biāo)任務(wù)的準(zhǔn)確率。而高效 AI 方案恰恰能夠解決上述問題。
以某知名品牌運(yùn)動鞋上新為例,一段時(shí)間內(nèi)僅能獲得該產(chǎn)品不同的配色以及商品幾個(gè)不同角度的圖片。
在僅有少量商品展示圖的情況下,通過高效 AI 方案,在新產(chǎn)品問世的極短時(shí)間內(nèi)就能實(shí)現(xiàn)新款商品識別能力的覆蓋,降低新產(chǎn)品被山寨和假冒的風(fēng)險(xiǎn)
對于在網(wǎng)上購物的你我來說,這項(xiàng)技術(shù)使消費(fèi)者大大降低了碰到真假難辨的高仿貨幾率。
不用消費(fèi)者自己動手部署算法去識別商品,阿里安全的高效 AI 方案在平臺端部署,在商品陳列階段就盡量保證真品,避免出現(xiàn)魚龍混雜的情況。
除了零售打假,在其他識別類別多、每個(gè)類別樣本數(shù)量很少的場景,比如知識產(chǎn)權(quán)商標(biāo)識別、通用商品識別和動植物保護(hù)等等,阿里的高效 AI 方案都有用武之地。
目前高效 AI 方案對內(nèi)已應(yīng)用到了阿里多個(gè)業(yè)務(wù)場景,如淘寶視頻、淘寶直播、優(yōu)酷等平臺的知識產(chǎn)權(quán)保護(hù),為數(shù)字基建的安全建設(shè)提供樣本參考,對外則通過綠網(wǎng)直接服務(wù)大中小企業(yè)。
阿里安全圖靈實(shí)驗(yàn)室
阿里安全圖靈實(shí)驗(yàn)室是阿里巴巴從事安全領(lǐng)域機(jī)器學(xué)習(xí)研發(fā)的頂級團(tuán)隊(duì),專注于 CV、NLP 及 ML 領(lǐng)域,團(tuán)隊(duì)所研發(fā)的 AI 技術(shù)被廣泛用于阿里巴巴經(jīng)濟(jì)體的全球業(yè)務(wù)網(wǎng)絡(luò)安全、數(shù)據(jù)安全、知識產(chǎn)權(quán)、新零售安全以及風(fēng)控反作弊等業(yè)務(wù)場景。
今年分類賽道共有來自全球的 56 位選手參與,最終,阿阿里安全的高效 AI 分類技術(shù)超越三星、同濟(jì)大學(xué)等國內(nèi)外多支隊(duì)伍的同類技術(shù),勇奪冠軍。
“A visual inductive priors framework for data-efficient image classification”也已經(jīng)被 ECCV 2020 Workshop VIPriors 接收。
—完—
總結(jié)
以上是生活随笔為你收集整理的50张图训练识别山寨货!阿里安全图灵实验室获ECCV 2020挑战赛冠军的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 刚学会懂事就老了是什么歌呢?
- 下一篇: 《速度与激情》游戏烂爆了 外媒评价其“年