ICDAR 2019国际竞赛召开在即,百度联合学界重奖破局者!
素有文檔圖像識別領(lǐng)域“世界杯”之稱的 ICDAR 2019國際權(quán)威競賽將于3月1日正式開賽。
獎金總計17400美元!
作為 ICDAR 2019 Robust Reading Competition 競賽主要組織者之一,百度聯(lián)合馬來亞大學(xué)、華南理工大學(xué)、西班牙計算機(jī)視覺中心、中國圖象圖形學(xué)學(xué)會共同發(fā)布了兩項極具挑戰(zhàn)的競賽任務(wù):
ICDAR 2019-LSVT(Large-scale Street View Text with Partial Labeling,弱標(biāo)注大規(guī)模街景文字識別競賽)、ICDAR 2019-ArT(Arbitrary-Shaped Text,任意形狀場景文字識別競賽)。
本次競賽獎金總計17400美元,歡迎國內(nèi)外學(xué)術(shù)界、工業(yè)界各大機(jī)構(gòu)華山論劍一較高下。
賽事介紹
ICDAR(International conference on Document Analysis and Recognition)是全球文檔圖像分析識別領(lǐng)域公認(rèn)的權(quán)威學(xué)術(shù)會議,從1991年起每兩年召開一次。
自 2003 年 ICDAR 設(shè)立“Robust Reading Competitions”以來,該競賽就成了評測和檢驗自然場景/網(wǎng)絡(luò)圖片文本自動提取與智能識別最新技術(shù)研究進(jìn)展的重要國際賽事及標(biāo)準(zhǔn),競賽中的諸多方法對 OCR 技術(shù)發(fā)展具有強(qiáng)大推動力。高技術(shù)難度、高實際應(yīng)用性,也使該盛會受到科研院校、科技公司等關(guān)注,至今已有 89 個國家的 3500 多支隊伍參與。
2015-2018期間百度多次在 ICDAR 2013、 ICDAR 2015權(quán)威競賽集合獲得檢測、識別、端到端各項任務(wù)榜單第一,位居業(yè)內(nèi)領(lǐng)先水平。
百度將 OCR 深度學(xué)習(xí)技術(shù)應(yīng)用于多個業(yè)務(wù)場景,打造文檔、翻譯、網(wǎng)圖、街景等多場景通用文字識別能力,支持中、英、日、韓、葡、德、法、意、西、俄十國語言。
針對金融、保險、交通等重點場景構(gòu)建 OCR 產(chǎn)品矩陣和 AI 開放平臺,百度 OCR 打造了領(lǐng)先的證照、票據(jù)識別解決方案。針對終端計算場景,百度 OCR 模型壓縮用于多種嵌入式智能設(shè)備,OCR 終端 SDK 與多家手機(jī)廠商合作,打造領(lǐng)先的視覺終端計算能力。
?ICDAR 2019-LSVT?
?大規(guī)模弱標(biāo)注街景文字識別競賽?
聚焦探索大規(guī)模數(shù)據(jù)場景下深度學(xué)習(xí)模型算法能力極限,推動大規(guī)模弱標(biāo)注數(shù)據(jù)下文字識別新方法創(chuàng)新。
ICDAR2019-LSVT 數(shù)據(jù)集源于百度真實應(yīng)用場景,作為首個提出弱標(biāo)注數(shù)據(jù)的場景文字?jǐn)?shù)據(jù)集,包括5萬張精標(biāo)注街景圖像、40萬張弱標(biāo)注街景圖像,總計45萬張,數(shù)據(jù)量是現(xiàn)有公開數(shù)據(jù)集(ICDAR 2017、ICPR 2018等)的14倍以上。
室外場景文字識別具有廣泛應(yīng)用場景,例如:拍照翻譯、圖像檢索、街景地標(biāo)識別、室外場景理解等。
?
▲精標(biāo)注數(shù)據(jù)示例
▲弱標(biāo)注數(shù)據(jù)示例
?
深度學(xué)習(xí)算法通常需要大量訓(xùn)練數(shù)據(jù)才能在真實應(yīng)用中取得良好效果,滿足實際場景的應(yīng)用需求。由于合成數(shù)據(jù)與真實數(shù)據(jù)仍存在明顯差異,同時大規(guī)模精確數(shù)據(jù)標(biāo)注成本高,探索利用大規(guī)模弱標(biāo)注數(shù)據(jù)提升深度學(xué)習(xí)算法性能具有重要研究意義和實用價值,同時對探索場景文本識別技術(shù)能力邊界具有顯著推動作用。
·?數(shù)據(jù)集
5萬精標(biāo)注+40萬張弱標(biāo)注街景隨拍圖像,大規(guī)模數(shù)據(jù)源于實際應(yīng)用,包含多種復(fù)雜場景
·?兩項競賽任務(wù)
文字檢測、端到端文字識別,獎金?$8,700
?
?ICDAR 2019-ArT?
?任意形狀文字識別競賽?
數(shù)據(jù)集由 Total-Text、SCUT-CTW 1500和百度非規(guī)則文字?jǐn)?shù)據(jù)集組成,累計新增7千張任意形狀數(shù)據(jù),總計10176張,是目前業(yè)界最大的任意形狀場景文字集合。
現(xiàn)有 ICDAR 文字?jǐn)?shù)據(jù)集(ICDAR 2013、ICDAR 2015、ICDAR 2017-MLT,COCO-Text等)只包含水平、四邊形文字框等規(guī)則文字標(biāo)注,如下圖所示,ICDAR2019-ArT 數(shù)據(jù)集中每張圖像至少含有一個非規(guī)則形狀文字(irregular text instances),并采用多邊形多點對任意形狀文字包圍框進(jìn)行精確標(biāo)注。
?
▲任意形狀文字示例
?
真實場景文字識別應(yīng)用中,相比規(guī)則文字識別,現(xiàn)有算法非規(guī)則形狀文字識別檢測、識別更具挑戰(zhàn),因此 ICDAR 2019-ArT 競賽旨在進(jìn)一步推動自然場景下任意形狀文字識別算法與技術(shù)突破。
·?數(shù)據(jù)集
1萬張任意形狀文字圖像標(biāo)注,中英混合,最大非規(guī)則場景文字集合
·?三項競賽任務(wù)
文字檢測、文字識別、端到端識別,獎金?$8,700
?
百度愿與 AI 各界同行一起,推動基礎(chǔ)算法、關(guān)鍵技術(shù)、應(yīng)用效果新突破。競賽頒獎將在 ICDAR 2019國際會議期間(2019年9月)舉行。還在等什么?快來參與這場盛會,贏取大獎吧!
?
賽事組織單位
百度
馬來亞大學(xué)
華南理工大學(xué)
西班牙計算機(jī)視覺中心
中國圖象圖形學(xué)學(xué)會
?
賽事時間
2019年2月21日 - 3月31日:注冊通道開放
2019年3月1日:訓(xùn)練集開放下載
2019年4月9日:提交開始時間
2019年4月30日:提交截止時間
?
聯(lián)系信息
ICDAR-2019@baidu.com
?
競賽注冊通道
ICDAR 2019-LSVT 大規(guī)模弱標(biāo)注街景文字識別競賽:
ICDAR 2019-ArT 任意形狀文字識別競賽:?
?
現(xiàn)在,在「知乎」也能找到我們了
進(jìn)入知乎首頁搜索「PaperWeekly」
點擊「關(guān)注」訂閱我們的專欄吧
關(guān)于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學(xué)術(shù)平臺。如果你研究或從事 AI 領(lǐng)域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
▽ 點擊 |?閱讀原文?| 獲取最新論文推薦
總結(jié)
以上是生活随笔為你收集整理的ICDAR 2019国际竞赛召开在即,百度联合学界重奖破局者!的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: KDD 18 AAAI 19 | 异构
- 下一篇: 初级数据分析师需要哪些必备技能?