日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

腾讯数平精准推荐 | 横扫ICDAR 2019,斩获七项冠军

發(fā)布時間:2024/2/28 编程问答 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 腾讯数平精准推荐 | 横扫ICDAR 2019,斩获七项冠军 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.




2019年6月,兩年一屆的國際文檔分析與識別競賽(ICDAR)落下帷幕,這是全球文字識別(OCR)領(lǐng)域最頂級賽事。騰訊數(shù)平精準(zhǔn)推薦團隊(Data Platform Precision Recommendation, Tencent-DPPR)在本屆比賽中斬獲7項冠軍,成績遙遙領(lǐng)先其他參賽隊伍。這也是繼2017年團隊勇奪4項官方認證冠軍后再創(chuàng)佳績,同時也標(biāo)志著騰訊OCR技術(shù)穩(wěn)居國際第一流水準(zhǔn)。

? ??

國際文檔分析與識別大會ICDAR(International Conference on Document Analysis and Recognition)自1991年開始,今年為第十五屆。自2003年大會開始設(shè)立技術(shù)競賽,ICDAR競賽因其極高技術(shù)難度和強大實用性,一直是各大科研院校、科技公司的競逐焦點。與賽后非正式刷榜不同,ICDAR官方認證的正式競賽采用全新數(shù)據(jù)集,且賽期內(nèi)不公布參賽團隊信息和成績,限制提交時間和次數(shù),屬于高難度“盲打”,吸引國內(nèi)外眾多隊伍參賽。2019屆競賽巨頭云集,據(jù)賽后不完全統(tǒng)計,本屆共有過百支隊伍角逐,參賽隊伍包括:(1)企業(yè)團隊:騰訊、阿里、百度、華為、聯(lián)想、平安、商湯、曠視、美團點評、科大訊飛、VIVO、北大方正、搜狗、第四范式、合合信息、三星、Line,等;(2)學(xué)校團隊:清華、北大、中科院、華中科大、復(fù)旦、上海交大、中科大、北航、南京大學(xué)、南京航空、華南理工、同濟大學(xué)、哈工大、山東大學(xué)、四川大學(xué)、天津大學(xué)、卡耐基梅隆大學(xué)、澳洲阿德萊德大學(xué)等。


識別圖像和視頻中各類文字(OCR),是計算機視覺、自然語言處理、個性化推薦等AI任務(wù)的基礎(chǔ)技術(shù)。本屆競賽增加了多項中文和多語言識別任務(wù),難度更高。騰訊數(shù)平精準(zhǔn)推薦團隊基于自研算法,共參加了三大項比賽。


  • LSVT項目(大規(guī)模弱標(biāo)注街景文字識別):包攬全部兩項冠軍

  • MLT-19項目(多語言自然場景文字識別):包攬全部四項冠軍

  • ReCTS項目(中文招牌文字識別):端到端文字識別Task獲得冠軍


三大比賽均難度極高,LSVT側(cè)重中英文街景拍攝圖,MLT-19側(cè)重多語言的自然場景和文檔等,ReCTS側(cè)重商戶拍照信息。部分比賽圖片展示如下:

ICDAR 2019競賽示例圖


LSVT(大規(guī)模弱標(biāo)注街景文字識別)競賽由百度公司提供約45萬張街景圖片,街景文字識別可廣泛用于智能交通、地圖信息擴展、自動駕駛等,數(shù)據(jù)覆蓋了透視畸變、弱監(jiān)督、低分辨率、藝術(shù)字、復(fù)雜排版等諸多技術(shù)難點。LSVT競賽包含文本檢測、端到端文字識別任務(wù),騰訊數(shù)平獲得全部冠軍。官方排名如下:

LSVT文本檢測官方排名(Top-10)


LSVT端到端文字識別官方排名(Top-10)


ReCTS(中文招牌文字識別)競賽由美團公司提供2.5萬張業(yè)務(wù)圖片,該場景文字識別可廣泛用于商家推薦、商家信息自動識別等領(lǐng)域,覆蓋了透視畸變、復(fù)雜排版、模糊文字、藝術(shù)字等眾多技術(shù)難點。比賽包含端到端文字識別、單字符識別、文本行識別、文本行檢測等任務(wù)。騰訊數(shù)平在端到端文字識別獲得冠軍。官方排名如下:

ReCTS端到端文字識別官方排名(Top-10)


MLT-19(多語言自然場景文字識別)競賽由多國學(xué)者提供2萬張自然場景圖片,共有7大類語言(10個小類別),多語言文字識別可廣泛應(yīng)用于拍照翻譯、文檔識別、交通信息識別等,數(shù)據(jù)覆蓋了跨語種識別、拍照角度多變、低對比度、復(fù)雜背景、復(fù)雜排版等眾多技術(shù)難點。比賽包含四個任務(wù):多語言文本行檢測、詞條語言鑒別、文本檢測和語言鑒別、端到端多語種文字識別,騰訊數(shù)平獲得全部冠軍,且最多領(lǐng)先第二名達6.65%。官方排名如下:

MLT-19文本檢測官方排名(Top-10)


MLT-19詞條語言鑒別官方排名(Top-10)


MLT-19文本檢測和語言鑒別官方排名(Top-10)


MLT-19端到端多語種文字識別官方排名(Top-10)


團隊簡介

數(shù)平精準(zhǔn)推薦團隊(Tencent Data Platform Precision Recommendation, Tencent-DPPR)是騰訊內(nèi)部一支致力于實時精準(zhǔn)推薦、海量大數(shù)據(jù)分析及廣告圖像理解等領(lǐng)域技術(shù)研發(fā)與技術(shù)落地的專業(yè)技術(shù)團隊。團隊在文本識別領(lǐng)域上已經(jīng)深耕細作多年,自研的文本檢測、識別、端到端技術(shù)均處于業(yè)界領(lǐng)先,已在全球最權(quán)威ICDAR競賽中和諸多團隊競技,斬獲11項官方認證冠軍。國際競賽是技術(shù)水平的試金石和騰訊技術(shù)影響力的證明,同樣重要的還有技術(shù)應(yīng)用與落地。數(shù)平精準(zhǔn)推薦的OCR技術(shù),憑借高精準(zhǔn)度、高穩(wěn)定性以及“專業(yè)、服務(wù)、伙伴”的理念,已支持公司內(nèi)多個業(yè)務(wù)場景,如社交廣告、微信業(yè)務(wù)安全、騰訊云、騰訊視頻、信息流產(chǎn)品(手Q看點等)、拍照翻譯等,并獲得廣泛好評。


總結(jié)

以上是生活随笔為你收集整理的腾讯数平精准推荐 | 横扫ICDAR 2019,斩获七项冠军的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。