腾讯数平精准推荐 | 横扫ICDAR 2019,斩获七项冠军
2019年6月,兩年一屆的國際文檔分析與識別競賽(ICDAR)落下帷幕,這是全球文字識別(OCR)領(lǐng)域最頂級賽事。騰訊數(shù)平精準(zhǔn)推薦團隊(Data Platform Precision Recommendation, Tencent-DPPR)在本屆比賽中斬獲7項冠軍,成績遙遙領(lǐng)先其他參賽隊伍。這也是繼2017年團隊勇奪4項官方認證冠軍后再創(chuàng)佳績,同時也標(biāo)志著騰訊OCR技術(shù)穩(wěn)居國際第一流水準(zhǔn)。
? ??
國際文檔分析與識別大會ICDAR(International Conference on Document Analysis and Recognition)自1991年開始,今年為第十五屆。自2003年大會開始設(shè)立技術(shù)競賽,ICDAR競賽因其極高技術(shù)難度和強大實用性,一直是各大科研院校、科技公司的競逐焦點。與賽后非正式刷榜不同,ICDAR官方認證的正式競賽采用全新數(shù)據(jù)集,且賽期內(nèi)不公布參賽團隊信息和成績,限制提交時間和次數(shù),屬于高難度“盲打”,吸引國內(nèi)外眾多隊伍參賽。2019屆競賽巨頭云集,據(jù)賽后不完全統(tǒng)計,本屆共有過百支隊伍角逐,參賽隊伍包括:(1)企業(yè)團隊:騰訊、阿里、百度、華為、聯(lián)想、平安、商湯、曠視、美團點評、科大訊飛、VIVO、北大方正、搜狗、第四范式、合合信息、三星、Line,等;(2)學(xué)校團隊:清華、北大、中科院、華中科大、復(fù)旦、上海交大、中科大、北航、南京大學(xué)、南京航空、華南理工、同濟大學(xué)、哈工大、山東大學(xué)、四川大學(xué)、天津大學(xué)、卡耐基梅隆大學(xué)、澳洲阿德萊德大學(xué)等。
識別圖像和視頻中各類文字(OCR),是計算機視覺、自然語言處理、個性化推薦等AI任務(wù)的基礎(chǔ)技術(shù)。本屆競賽增加了多項中文和多語言識別任務(wù),難度更高。騰訊數(shù)平精準(zhǔn)推薦團隊基于自研算法,共參加了三大項比賽。
LSVT項目(大規(guī)模弱標(biāo)注街景文字識別):包攬全部兩項冠軍
MLT-19項目(多語言自然場景文字識別):包攬全部四項冠軍
ReCTS項目(中文招牌文字識別):端到端文字識別Task獲得冠軍
三大比賽均難度極高,LSVT側(cè)重中英文街景拍攝圖,MLT-19側(cè)重多語言的自然場景和文檔等,ReCTS側(cè)重商戶拍照信息。部分比賽圖片展示如下:
ICDAR 2019競賽示例圖
LSVT(大規(guī)模弱標(biāo)注街景文字識別)競賽由百度公司提供約45萬張街景圖片,街景文字識別可廣泛用于智能交通、地圖信息擴展、自動駕駛等,數(shù)據(jù)覆蓋了透視畸變、弱監(jiān)督、低分辨率、藝術(shù)字、復(fù)雜排版等諸多技術(shù)難點。LSVT競賽包含文本檢測、端到端文字識別任務(wù),騰訊數(shù)平獲得全部冠軍。官方排名如下:
LSVT文本檢測官方排名(Top-10)
LSVT端到端文字識別官方排名(Top-10)
ReCTS(中文招牌文字識別)競賽由美團公司提供2.5萬張業(yè)務(wù)圖片,該場景文字識別可廣泛用于商家推薦、商家信息自動識別等領(lǐng)域,覆蓋了透視畸變、復(fù)雜排版、模糊文字、藝術(shù)字等眾多技術(shù)難點。比賽包含端到端文字識別、單字符識別、文本行識別、文本行檢測等任務(wù)。騰訊數(shù)平在端到端文字識別獲得冠軍。官方排名如下:
ReCTS端到端文字識別官方排名(Top-10)
MLT-19(多語言自然場景文字識別)競賽由多國學(xué)者提供2萬張自然場景圖片,共有7大類語言(10個小類別),多語言文字識別可廣泛應(yīng)用于拍照翻譯、文檔識別、交通信息識別等,數(shù)據(jù)覆蓋了跨語種識別、拍照角度多變、低對比度、復(fù)雜背景、復(fù)雜排版等眾多技術(shù)難點。比賽包含四個任務(wù):多語言文本行檢測、詞條語言鑒別、文本檢測和語言鑒別、端到端多語種文字識別,騰訊數(shù)平獲得全部冠軍,且最多領(lǐng)先第二名達6.65%。官方排名如下:
MLT-19文本檢測官方排名(Top-10)
MLT-19詞條語言鑒別官方排名(Top-10)
MLT-19文本檢測和語言鑒別官方排名(Top-10)
MLT-19端到端多語種文字識別官方排名(Top-10)
數(shù)平精準(zhǔn)推薦團隊(Tencent Data Platform Precision Recommendation, Tencent-DPPR)是騰訊內(nèi)部一支致力于實時精準(zhǔn)推薦、海量大數(shù)據(jù)分析及廣告圖像理解等領(lǐng)域技術(shù)研發(fā)與技術(shù)落地的專業(yè)技術(shù)團隊。團隊在文本識別領(lǐng)域上已經(jīng)深耕細作多年,自研的文本檢測、識別、端到端技術(shù)均處于業(yè)界領(lǐng)先,已在全球最權(quán)威ICDAR競賽中和諸多團隊競技,斬獲11項官方認證冠軍。國際競賽是技術(shù)水平的試金石和騰訊技術(shù)影響力的證明,同樣重要的還有技術(shù)應(yīng)用與落地。數(shù)平精準(zhǔn)推薦的OCR技術(shù),憑借高精準(zhǔn)度、高穩(wěn)定性以及“專業(yè)、服務(wù)、伙伴”的理念,已支持公司內(nèi)多個業(yè)務(wù)場景,如社交廣告、微信業(yè)務(wù)安全、騰訊云、騰訊視頻、信息流產(chǎn)品(手Q看點等)、拍照翻譯等,并獲得廣泛好評。
總結(jié)
以上是生活随笔為你收集整理的腾讯数平精准推荐 | 横扫ICDAR 2019,斩获七项冠军的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ACL 2019 | 图表示解决长文本关
- 下一篇: 数据中心智能安防新突破:腾讯觅踪亮相DC