18M 超轻量系统开源
圖像識別作為深度學(xué)習(xí)算法的主流實踐應(yīng)用方向,早已在生活的各個領(lǐng)域發(fā)揮作用,如安全檢查和身份核驗時的人臉識別、無人貨架和智能零售柜中的商品識別,這些任務(wù)背后的關(guān)鍵技術(shù)都在于此。
圖1 PP-ShiTu應(yīng)用于商品識別效果示意(開發(fā)者應(yīng)用展示)
然而實現(xiàn)理想的識別效果并不是一件簡單的事:
-
針對海量數(shù)據(jù)問題而言,如何實現(xiàn)一個通用的方法在不同的數(shù)據(jù)集中都有很好的表征能力?
-
不同物體間的差別可能極其微小,即使是同種物體,也會受到外界干擾呈現(xiàn)不同形態(tài),究竟如何進行有效區(qū)分?
-
識別需求更新頻繁,使用單一的分類或者檢測模型只能不斷增加訓(xùn)練集重訓(xùn)模型,怎樣才能降低開發(fā)成本,快速跟上迭代步伐?
PP-ShiTu核心技術(shù)解讀
針對以上技術(shù)難點,PaddleClas推出的通用圖像識別系統(tǒng)PP-ShiTu均可以完美解決,它不僅有高水平的特征學(xué)習(xí)能力,對新出現(xiàn)的類別也可以在不用重新訓(xùn)練算法的情況下,直接通過配置檢索庫的方式實現(xiàn)識別。
? 項目鏈接 ?
https://github.com/PaddlePaddle/PaddleClas
PaddleClas所有源碼及教程均已開源,歡迎大家使用,并Star鼓勵~
這樣的特殊能力,得益于PP-ShiTu引入目標檢測、度量學(xué)習(xí)、圖像檢索等技術(shù),并將每個模塊性能最大化,才構(gòu)建成了統(tǒng)一、通用的圖像識別系統(tǒng):
圖2 PP-ShiTu架構(gòu)示意圖
-
主體檢測:不同于一般的目標檢測,主體檢測是將目標物體和背景區(qū)分開來,能夠有效減少干擾特征。PP-ShiTu中所采用的是目標檢測模型PP-PicoDet,不僅預(yù)測速度超快,精度上也達到了SOTA,為后續(xù)的準確識別打下堅實基礎(chǔ);
圖3 PP-PicoDet在 COCO2017-val上的 mAP 對比
-
特征提取:作為圖像識別系統(tǒng)的重點工作,PP-ShiTu是采用CPU級輕量化骨干網(wǎng)絡(luò)PP-LCNet,并結(jié)合度量學(xué)習(xí)arcmargin算法,對高相似物體的區(qū)分效果遠超單一模型,不僅準確率超越大模型ResNet50,預(yù)測速度還能快3倍!再加上經(jīng)過18w類數(shù)據(jù)集打磨的預(yù)訓(xùn)練權(quán)重,不用再費心選擇,一個模型就可以實現(xiàn)多場景覆蓋。
圖4 訓(xùn)練數(shù)據(jù)及部分測試數(shù)據(jù)示例
-
向量檢索:不同于單一模型直接輸出類別信息,對于未知類別只有模型重訓(xùn)一個選擇,耗時又耗力。PP-ShiTu引入向量檢索,通過計算目標物體和檢索庫中圖像的相似度來輸出類別信息,一次訓(xùn)練長期使用,高效又便捷。
圖5 端側(cè)新類別建立索引流程(開發(fā)者應(yīng)用展示)
升級版PP-ShiTu歡迎使用
時隔數(shù)月,PaddleClas 新版本v2.3.1為大家?guī)砹烁虞p量化的圖像識別系統(tǒng)PP-ShiTu。核心功能點如下:
-
升級版PP-ShiTu大小僅18M,完美支持移動端需求
-
支持基于C++的服務(wù)化部署,部署效率大幅提升
-
支持移動端Paddle Lite部署教程,手機上也能輕松實現(xiàn)圖像識別
圖6 手機識別效果展示(開發(fā)者應(yīng)用展示)
PP-ShiTu的使用也是十分簡單、方便,在完成環(huán)境配置后只需三步即可完成快速體驗:
第一步:下載 Inference 模型
第二步:構(gòu)建索引
第三步:完成單張/批量圖像識別
詳細文檔,請參考:
https://github.com/PaddlePaddle/PaddleClas/blob/release/2.3/docs/zh_CN/quick_start/quick_start_recognition.md
更有完整流程演示,可參考AI Studio項目:https://aistudio.baidu.com/aistudio/projectdetail/3445604
共建開源生態(tài)
自PP-ShiTu發(fā)布以來,引起了眾多開發(fā)者的廣泛關(guān)注。華東理工大學(xué)的高材生顏鑫,也是飛槳領(lǐng)航團的團長,帶領(lǐng)團隊基于PP-ShiTu開發(fā)了一套智能購物平臺系統(tǒng):通過圖像即可精準識別顧客購買的商品,并返回完整的購物清單及應(yīng)付價格,為智能貨柜提供了非常好的視覺化解決方案。
鏈接指路:
https://github.com/thomas-yanxin/Smart_container
圖7 智能結(jié)算平臺架構(gòu)示意圖
與此同時,我們也力求為開源社區(qū)的繁榮作出貢獻,希望PP-ShiTu的算法本身以及優(yōu)化思路,可以在給業(yè)界開發(fā)者帶來更好網(wǎng)絡(luò)的同時,也帶來更多的算法優(yōu)化啟發(fā),為中國的開源發(fā)展貢獻一份力量。
如果您想詳細了解更多飛槳的相關(guān)內(nèi)容,請參閱以下文檔。
官網(wǎng)地址:
https://www.paddlepaddle.org.cn
PaddleClas項目地址:
GitHub:?
https://github.com/PaddlePaddle/PaddleClas/tree/develop
Gitee:?
https://gitee.com/paddlepaddle/PaddleClas
總結(jié)
以上是生活随笔為你收集整理的18M 超轻量系统开源的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《数智碳中和》白皮书发布以数智技术助力关
- 下一篇: 绿盟数据库审计系统hive_数据库审计系