日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 人工智能 > ChatGpt >内容正文

ChatGpt

Github Star 11.5K项目再发版:AAAI 2021 顶会论文开源,80+多语言模型全新升级

發(fā)布時(shí)間:2025/3/12 ChatGpt 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Github Star 11.5K项目再发版:AAAI 2021 顶会论文开源,80+多语言模型全新升级 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

一、導(dǎo)讀

OCR方向的工程師,一定需要知道這個(gè)OCR開源項(xiàng)目:PaddleOCR

短短半年時(shí)間,累計(jì)Star數(shù)量已超過(guò)11.5K,

頻頻登上Github Trending和Paperswithcode 日榜月榜第一,

在《Github 2020數(shù)字洞察報(bào)告》中被評(píng)為中國(guó)Github Top20活躍項(xiàng)目。

稱它為 OCR方向目前最火的repo絕對(duì)不為過(guò)。

最近,它又帶來(lái)兩項(xiàng)全新發(fā)布:

  • AAAI 2021 頂會(huì)論文開源:PGNet: Real-time Arbitrarily-Shaped Text Spotting with Point Gathering Network 提出了一種簡(jiǎn)單且有效的任意方向端到端文本識(shí)別模型,在精度可比的基礎(chǔ)上,與先前的SOTA算法相比,經(jīng)過(guò)飛槳預(yù)測(cè)引擎加速和后處理優(yōu)化后,預(yù)測(cè)效率翻倍。

  • 多語(yǔ)言支持種類提升至80+種:基本覆蓋國(guó)際主流語(yǔ)言種類,在開源測(cè)試集MLT2017評(píng)估,中文、韓文、日文、拉丁語(yǔ)系、阿拉伯語(yǔ)系,識(shí)別效果均顯著優(yōu)于EasyOCR,開源SOTA效果。

二、PaddleOCR歷史表現(xiàn)回顧

先看下PaddleOCR自去年6月開源以來(lái),短短幾個(gè)月在GitHub上的表現(xiàn):

  • 2020年6月,8.6M超輕量模型發(fā)布,GitHub Trending 全球趨勢(shì)榜日榜第一。

  • 2020年8月,開源CVPR2020頂會(huì)算法,再上GitHub趨勢(shì)榜單!

  • 2020年10月,發(fā)布PP-OCR算法,開源3.5M超超輕量模型,再下Paperswithcode 趨勢(shì)榜第一

  • 2021年1月,發(fā)布Style-Text文本合成算法,PPOCRLabel數(shù)據(jù)標(biāo)注工具,star數(shù)量突破10000+,截至目前已經(jīng)達(dá)到11.5k,在《Github 2020數(shù)字洞察報(bào)告》中被評(píng)為中國(guó)Github Top20活躍項(xiàng)目。
    這個(gè)含金量,廣大的GitHub開發(fā)者們自然懂

  • 超輕量模型的效果:火車票、表格、金屬銘牌、翻轉(zhuǎn)圖片、外語(yǔ)都是妥妥的,

  • 動(dòng)靜統(tǒng)一的開發(fā)體驗(yàn)

    動(dòng)態(tài)圖和靜態(tài)圖是深度學(xué)習(xí)框架常用的兩種模式。在動(dòng)態(tài)圖模式下,代碼編寫運(yùn)行方式符合Python程序員的習(xí)慣,易于調(diào)試,但在性能方面, Python執(zhí)行開銷較大,與C++有一定差距。

    相比動(dòng)態(tài)圖,靜態(tài)圖在部署方面更具有性能的優(yōu)勢(shì)。靜態(tài)圖程序在編譯執(zhí)行時(shí),預(yù)先搭建好的神經(jīng)網(wǎng)絡(luò)可以脫離Python依賴,在C++端被重新解析執(zhí)行,而且擁有整體網(wǎng)絡(luò)結(jié)構(gòu)也能進(jìn)行一些網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化。

    飛槳?jiǎng)討B(tài)圖中新增了動(dòng)態(tài)圖轉(zhuǎn)靜態(tài)圖的功能,支持用戶使用動(dòng)態(tài)圖編寫組網(wǎng)代碼。預(yù)測(cè)部署時(shí),飛槳會(huì)對(duì)用戶代碼進(jìn)行分析,自動(dòng)轉(zhuǎn)換為靜態(tài)圖網(wǎng)絡(luò)結(jié)構(gòu),兼顧了動(dòng)態(tài)圖易用性和靜態(tài)圖部署性能兩方面優(yōu)勢(shì)。

  • 文本合成工具Style-Text效果:相比于傳統(tǒng)的數(shù)據(jù)合成算法,Style-Text可以實(shí)現(xiàn)特殊背景下的圖片風(fēng)格遷移,只需要少許目標(biāo)場(chǎng)景圖像,就可以合成大量數(shù)據(jù),效果展示如下:

  • 半自動(dòng)標(biāo)注工具PPOCRLabel:通過(guò)內(nèi)置高質(zhì)量的PPOCR中英文超輕量預(yù)訓(xùn)練模型,可以實(shí)現(xiàn)OCR數(shù)據(jù)的高效標(biāo)注。CPU機(jī)器運(yùn)行也是完全沒問(wèn)題的。效果演示如下:用法也是非常的簡(jiǎn)單,標(biāo)注效率提升60%-80%是妥妥的。

    傳送門:

    Github:https://github.com/PaddlePaddle/PaddleOCR

    那么最近的2021年4月份更新,又給大家?guī)?lái)哪些驚喜呢?

三、AAAI 2021 頂會(huì)論文:端到端SOTA算法PGNet開源:

直接先看指標(biāo)評(píng)測(cè)表現(xiàn):PGNet算法在Total-Text數(shù)據(jù)集上的檢測(cè)及端到端性能表現(xiàn),在精度可比的基礎(chǔ)上,與先前的SOTA算法相比,經(jīng)過(guò)飛槳預(yù)測(cè)引擎加速和后處理優(yōu)化后,預(yù)測(cè)效率翻倍。

圖1:PGNet模型的速度與精度性能對(duì)比

詳細(xì)數(shù)據(jù)指標(biāo):

表1:ICDAR2015數(shù)據(jù)集上的檢測(cè)及端到端性能

PGNet提出的方法框架如下圖所示,輸入的圖象經(jīng)過(guò)Backbone網(wǎng)絡(luò)得到1/4下采樣特征圖,通過(guò)多任務(wù)學(xué)習(xí),同時(shí)回歸四個(gè)任務(wù)的內(nèi)容,包括文本邊緣偏移量預(yù)測(cè)(TBO),文本中心線預(yù)測(cè)(TCL),文本方向偏移量預(yù)測(cè)(TDO)以及文本字符分類圖預(yù)測(cè)(TCC)。其中文本行的檢測(cè)結(jié)果由TBO以及TCL經(jīng)過(guò)后處理得到,文本行的識(shí)別結(jié)果由TCL,TDO以及TCC的輸出得到。

圖2 網(wǎng)絡(luò)流程框架

在ICDAR2015以及Total-Text數(shù)據(jù)集上可以看一下模型效果:

圖3?Total-Text及ICDAR2015數(shù)據(jù)集可視化效果圖

PGNet論文地址:?https://www.aaai.org/AAAI21Papers/AAAI-2885.WangP.pdf

【基于頂尖算法,開放拿來(lái)即用的成熟印章識(shí)別能力】同時(shí),基于PGNet研發(fā)的印章識(shí)別能力已經(jīng)在百度AI開放平臺(tái)開放,可以有效檢測(cè)并識(shí)別合同文件或常用票據(jù)中的印章,輸出文字內(nèi)容、印章位置信息以及相關(guān)置信度,已支持圓形章、橢圓形章、方形章等常見印章。提供標(biāo)準(zhǔn)化API接口,快速集成,同時(shí)支持私有化部署至本地,保障業(yè)務(wù)數(shù)據(jù)私密性。開放能力地址:https://ai.baidu.com/tech/ocr/seal

注:此處非模型直接開源,但可以申請(qǐng)免費(fèi)試用。

四、豐富的多語(yǔ)言種類支持,目前已經(jīng)支持全球80+ 語(yǔ)言模型

簡(jiǎn)單對(duì)比一下目前主流OCR方向開源repo的核心能力:

中英文模型性能及功能對(duì)比

其中,部分多語(yǔ)言模型性能及功能(F1-Score)對(duì)比(僅EasyOCR提供)模型效果
值得一提的是,目前已經(jīng)有全球開發(fā)者通過(guò)PR或者issue的方式為PaddleOCR提供多語(yǔ)言的字典和語(yǔ)料,在PaddleOCR上已經(jīng)完成了全球80+ 主流語(yǔ)言的廣泛覆蓋:包括中文簡(jiǎn)體、中文繁體、英文、法文、德文、韓文、日文、意大利文、西班牙文、葡萄牙文、俄羅斯文、阿拉伯文、印地文、維吾爾文、波斯文、烏爾都文、塞爾維亞文(latin)、歐西坦文、馬拉地文、尼泊爾文、塞爾維亞文、保加利亞文、烏克蘭文、白俄羅斯文、泰盧固文、卡納達(dá)文、泰米爾文,也歡迎更多開發(fā)者可以參與共建。

五、良心出品的中英文文檔教程

別的不需要多說(shuō)了,大家訪問(wèn)GitHub點(diǎn)過(guò)star之后自己體驗(yàn)吧:https://github.com/PaddlePaddle/PaddleOCR

六、直播活動(dòng)預(yù)告

4月13日晚19:00-20:00,百度飛槳高級(jí)研發(fā)工程師將為我們帶來(lái)PaddleOCR最新進(jìn)展,快來(lái)報(bào)名吧!

掃描下方二維碼,加入技術(shù)交流群

直播課精彩內(nèi)容搶先看????


官網(wǎng)地址:https://www.paddlepaddle.org.cn

PaddleOCR項(xiàng)目地址:

GitHub: https://github.com/PaddlePaddle/PaddleOCR

Gitee: https://gitee.com/paddlepaddle/PaddleOCR

PGNet論文地址:?https://www.aaai.org/AAAI21Papers/AAAI-2885.WangP.pdf

印章識(shí)別開發(fā)能力:https://ai.baidu.com/tech/ocr/seal

總結(jié)

以上是生活随笔為你收集整理的Github Star 11.5K项目再发版:AAAI 2021 顶会论文开源,80+多语言模型全新升级的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。