深延科技:基于深度学习的智能OCR识别技术大有可为
智能OCR技術(shù)作為人工智能領(lǐng)域的重要原子能力之一,在行業(yè)轉(zhuǎn)型過程中發(fā)揮作用。近年來,移動互聯(lián)、大數(shù)據(jù)等新技術(shù)飛速發(fā)展,倒逼傳統(tǒng)行業(yè)向智能化、移動化的方向轉(zhuǎn)型。這一大趨勢也促使傳統(tǒng)OCR技術(shù)不斷向智能OCR升級,以滿足更復(fù)雜、更高要求的任務(wù)需求。
隨著深度學(xué)習(xí)的融入,實現(xiàn)了OCR對復(fù)雜文本的識別,即智能OCR識別。同時配合其他信息化手段的綜合應(yīng)用,使智能OCR具備移動端適配、多任務(wù)檢測、整行識別、圖像分割定位和分類等功能,應(yīng)用場景更加廣泛,在圖書情報領(lǐng)域中的圖書文本和卡證識別會更高效。
01 傳統(tǒng)OCR識別技術(shù)缺陷漸露
光學(xué)字符識別(Optical Character Recognition,OCR)指自動識別圖像中的文字內(nèi)容,屬于人工智能機(jī)器視覺領(lǐng)域的一個重要的分支,即把文本、卡證等載體上的文字通過光學(xué)等技術(shù)手段轉(zhuǎn)化為計算機(jī)認(rèn)識的電子化數(shù)據(jù)。傳統(tǒng)OCR識別采用統(tǒng)計模式,處理流程較長,包括圖像的預(yù)處理、二值化、連通域分析、版面分析、行切分、字切分、單字符識別和后處理等步驟。典型的傳統(tǒng)OCR識別流程如圖1所示。
圖1 傳統(tǒng)OCR識別技術(shù)流程
傳統(tǒng)OCR識別方法存在諸多弊端,匯總?cè)缦?#xff1a;a)在進(jìn)行版面分析時,使用大量的規(guī)則,導(dǎo)致程序維護(hù)成本很高。b)行業(yè)域分析完全依靠圖像二值化得到的二值圖,對于掃描文檔效果尚可,面對手機(jī)拍攝和高拍儀取圖時,難取得效果良好的二值化圖,造成二值化過程中大量信息的丟失。c)傳統(tǒng)OCR技術(shù)包含8個模塊,如圖1所示,其中任何一個模塊的不完善都會產(chǎn)生誤差,誤差的累積將導(dǎo)致識別率大幅下降。d)傳統(tǒng)OCR識別靈活性差,對于自然場景下拍攝的復(fù)雜樣本基本無法處理,沒有修改提升空間,可用性不高。e)傳統(tǒng)的方法將OCR系統(tǒng)割裂成過多的環(huán)節(jié),倚重人工規(guī)則,需要在每個環(huán)節(jié)上引入人工干預(yù)并根據(jù)場景設(shè)定方法參數(shù),難做到端到端的訓(xùn)練。
而深度學(xué)習(xí)算法可以有效地規(guī)避傳統(tǒng)OCR識別的不足,通過組合低層特征形成更加抽象的高層表示屬性類別或特征,挖掘數(shù)據(jù)的分布式特征表示。借助神經(jīng)網(wǎng)絡(luò)來模擬人腦進(jìn)行分析、學(xué)習(xí)和訓(xùn)練,即模仿人腦機(jī)制來分析圖像、聲音和文本等數(shù)據(jù),被廣泛應(yīng)用于人工智能的模型構(gòu)建和處理中。
02 基于深度學(xué)習(xí)的智能OCR大有可為
基于深度學(xué)習(xí)的智能OCR技術(shù)是一次跨越式的升級,深度學(xué)習(xí)算法實現(xiàn)整行識別,提升了OCR的識別率和識別速度,人工需要幾分鐘才能錄入的文本,智能OCR技術(shù)可以秒速進(jìn)行精準(zhǔn)識別。智能OCR識別技術(shù)對識別流程進(jìn)行了優(yōu)化,優(yōu)化后的識別流程包括檢測、識別和后處理3個主要步驟,如圖2所示。
圖2 智能OCR識別技術(shù)流程
深延科技智能一站式OCR服務(wù)平臺基于深度學(xué)習(xí)的OCR定位與識別,通過卷積神經(jīng)網(wǎng)絡(luò)CNN、循環(huán)神經(jīng)網(wǎng)絡(luò)RNN、長短期記憶網(wǎng)絡(luò)LSTM技術(shù)實現(xiàn),可在灰度圖像上實現(xiàn)文字區(qū)域的自動定位和整行文字的識別,解決了傳統(tǒng)OCR技術(shù)中單字識別無法借助上下文來判斷形似字的問題。
此外,智能OCR識別技術(shù)在低質(zhì)量圖片的容忍能力和識別準(zhǔn)確率方面得到了顯著的提升,可在印刷體低分辨率與模糊字符識別、印刷體復(fù)雜或者非均勻背景識別、印刷體多語言混合識別、印刷體藝術(shù)字體識別、手寫小寫數(shù)字識別、手寫大寫金額識別、手寫通用文本識別等場景下實現(xiàn)高效的識別和分類。
深延科技智能一站式OCR服務(wù)平臺基于深度學(xué)習(xí)的智能OCR識別技術(shù)支持移動設(shè)備拍攝的圖像識別,可適用于對焦不準(zhǔn)、高噪聲、低分辨率、強(qiáng)光影等復(fù)雜背景。
除了在卡證識別、票據(jù)識別、表單識別、文檔識別,智能OCR可應(yīng)用于互聯(lián)網(wǎng)廣告推薦系統(tǒng)、UCG圖片視頻過濾、醫(yī)學(xué)影像識別、街景路牌識別等。智能OCR識別屬于多類分類問題,場景復(fù)雜、挑戰(zhàn)性大;尤其是中文識別,字符集達(dá)到20000類,而英文數(shù)字加字母只有62類。
深延科技智能一站式OCR服務(wù)平臺可提供多場景、多語種、高精度的文字檢測與識別服務(wù),廣泛適用于身份證、戶口本、銀行卡、名片、財稅票據(jù)、文檔、表格、車牌等具體識別對象,全面輔助企業(yè)智能化辦公,實現(xiàn)降本增效。
深延科接智能OCR一站式服務(wù)平臺功能
深延科技智能一站式OCR服務(wù)平臺行業(yè)解決方案
保險
利用OCR技術(shù)全面賦能保費代扣、投保、財產(chǎn)保險等業(yè)務(wù),為保險行業(yè)各細(xì)分領(lǐng)域提供個性化服務(wù)和技術(shù)支持。
- 手機(jī)移動端投保
通過手機(jī)拍攝身份證、駕駛證、行駛證等證件信息,并將姓名、身份證號、車牌號碼、號牌類型、初登日期,使用性質(zhì)、車輛種類等信息分門別類自動錄入。投保更加方便,提升客戶轉(zhuǎn)化率。
- 客戶保費代扣
業(yè)務(wù)員可通過手機(jī)或平板拍攝自動識別客戶的銀行卡對投保人賬戶的銀行卡信息進(jìn)行核實,降低手動輸入的錯誤率,方便操作、節(jié)省時間,提高業(yè)務(wù)效率。
- 車險現(xiàn)場勘查
業(yè)務(wù)員現(xiàn)場采集信息時,使用移動端設(shè)備(手機(jī)、平板電腦等)拍攝,通過部署OCR技術(shù)自動識別錄入當(dāng)事人的身份證、駕駛證、行駛證等信息。節(jié)省業(yè)務(wù)時間,提高客戶滿意度。
銀行
為銀行開戶業(yè)務(wù)、內(nèi)部流程、貸款等業(yè)務(wù)創(chuàng)造全新的服務(wù)生態(tài),降低服務(wù)成本,增強(qiáng)用戶體驗,創(chuàng)造新的收入流。
- 線上開戶
提供ocr線上識別身份證、銀行卡等開戶證件服務(wù),隨時隨地錄入信息,更便捷、高效的滿足用戶需求。
- 貸前企業(yè)背調(diào)
賦能企業(yè)投資、企業(yè)帶貸款等銀行主營業(yè)務(wù),利用ocr技術(shù)識別、錄入企業(yè)三證信息進(jìn)行校驗。
- 內(nèi)部流程優(yōu)化
通過手機(jī)或平板實現(xiàn)企業(yè)年報、各類表單、文檔及工單文本電子化,自動錄入。
證券
協(xié)助證券開戶,賬戶認(rèn)證,移動支付業(yè)務(wù),利用精準(zhǔn)的OCR識別技術(shù),為金融機(jī)構(gòu)提供更加智能化、精準(zhǔn)化和專業(yè)化的服務(wù),用智能變革業(yè)務(wù)模式。
- 線上開戶認(rèn)證
移動端開戶認(rèn)證、Web開戶認(rèn)證。支持身份證識別、人臉識別、銀行卡識別,精準(zhǔn)的OCR識別技術(shù)和生物識別技術(shù),提升金融服務(wù)體驗。
- 實名認(rèn)證
投資理財客戶拍攝身份證,即可自動識別獲得用戶的姓名、身份證號碼、身份證有效期、所在地區(qū)等信息。同時綁定銀行卡時,也可通過拍攝銀行卡識別,進(jìn)行自動識別卡號,輕松完成綁定,操作更漸變。
- 移動支付
結(jié)合OCR證件識別技術(shù)與人臉識別技術(shù),為移動支付身份認(rèn)證的安全性提供保障,避免手機(jī)盜用同時減少流程時間以提高轉(zhuǎn)化率。
供應(yīng)鏈
準(zhǔn)確把握產(chǎn)業(yè)鏈的布局,輔助風(fēng)險管理、營銷拓客或者招商引資,為產(chǎn)業(yè)研究提供強(qiáng)有力的數(shù)據(jù)支撐。利用OCR技術(shù),識別錄入各種運輸流程文件及單據(jù),優(yōu)化流程提高效率。
移動設(shè)備
從移動支付、身份認(rèn)證、車輛認(rèn)證,到37個維度的企業(yè)信用數(shù)據(jù)查詢,給使用帶來新體驗。
- 移動端文檔掃描
利用ocr技術(shù),可使移動端(手機(jī)或平板電腦)設(shè)備成為移動掃描儀,掃描紙質(zhì)文檔、PPT、各類票據(jù),生成PDF或JPG格式文件。
- 銀行卡號等信息識別
手機(jī)拍照即可錄入銀行卡號,在手機(jī)移動支付,銀行卡管理。而且深延OCR識別技術(shù),不僅支持識別卡號,還能同時錄入持卡人姓名、卡片到期日期。
智慧政務(wù)、社區(qū)
運用大數(shù)據(jù),以及OCR技術(shù),推進(jìn)政府和社區(qū)的移動化、信息化,優(yōu)化信息采集管理、訪客登記、證件辦理等流程,形成高效、敏捷、便民的智慧政務(wù)&智慧社區(qū)。
- 政務(wù)移動辦公
企業(yè)OA系統(tǒng),CRM系統(tǒng)等辦公系統(tǒng),利用ocr識別快速錄入人員信息、證件信息、名片信息管理。
- 信息服務(wù)平臺優(yōu)化
利用ocr技術(shù),只需手機(jī)拍照,就能自動識別錄入,完成居民身份認(rèn)證,銀行卡綁定,證件申請、換證等諸多便民服務(wù)。
相比于傳統(tǒng)OCR,基于深度學(xué)習(xí)的智能OCR技術(shù)具有識別準(zhǔn)確率更高、速度更快、無格式依賴、支持私有化快速部署等優(yōu)勢,深度學(xué)習(xí)算法和模型構(gòu)建也是OCR應(yīng)用的關(guān)鍵。隨著智能OCR技術(shù)不斷演進(jìn),深延科技將繼續(xù)細(xì)化業(yè)務(wù)需求,和已有的信息化系統(tǒng)相結(jié)合,打造智能OCR創(chuàng)新服務(wù)模型,解決實際生產(chǎn)中的痛點問題。
|關(guān)于深延科技|
深延科技成立于2018年1月,中關(guān)村高新技術(shù)企業(yè),是擁有全球領(lǐng)先人工智能技術(shù)的企業(yè)AI服務(wù)專家。以計算機(jī)視覺、自然語言處理和數(shù)據(jù)挖掘核心技術(shù)為基礎(chǔ),公司推出四款平臺產(chǎn)品——深延智能數(shù)據(jù)標(biāo)注平臺、深延AI開發(fā)平臺、深延自動化機(jī)器學(xué)習(xí)平臺、深延AI開放平臺,為企業(yè)提供數(shù)據(jù)處理、模型構(gòu)建和訓(xùn)練、隱私計算、行業(yè)算法和解決方案等一站式AI平臺服務(wù)。
總結(jié)
以上是生活随笔為你收集整理的深延科技:基于深度学习的智能OCR识别技术大有可为的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Java面试必看的18个开源项目
- 下一篇: 深度学习“炼丹”难?三分钟带你了解国产丹