OCR算法识别率怎么评估?
生活随笔
收集整理的這篇文章主要介紹了
OCR算法识别率怎么评估?
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
關于OCR算法:http://ocr.space/
ocr api接口的種類:OCR名片識別API接口、OCR文檔識別API接口、OCR車牌識別API接口、OCR證件識別API接口
一、測試方法:
人工檢驗(效率低、需要提升)
二、算法指標:
1、文字識別準確率
字符準確率:單字識別率,就是按單字算,一百個字里錯5個字,識別率95%。
- 字符識別準確率,即識別對的字符數占總識別出來字符數的比例,可以反應識別錯和多識別的情況,但無法反應漏識別的情況
- 字符識別召回率,即識別對的字符數占實際字符數的比例,可以反應識別錯和漏識別的情況,但是沒辦法反應多識別的情況,可以配套字符識別準確率一起使用。
整行準確率:一個字段算一個整體,假如100個字分為20個字段,里面錯了5個字,分布在4個字段里,那么識別率是16/20=80%。
- 平均編輯距離:平均編輯距離越小說明識別率越高。平均編輯距離主要衡量整行或整篇文章的指標,可以同時反應識別錯,漏識別和多識別的情況
- 文本行定位為的準確率和召回率,同字符識別的準確率和召回率。主要反應文本行定位的指標,是ocr算法的重要指標
三、圖片準備
圖片覆蓋范圍:
不同字體(單字體、混合字體、不同語言的字體)
不同語言(單語言、混合語言、混合特殊字符、公式等)
橫排文字、豎排文字
不同圖片格式
復雜排版、圖文混排、插圖中的文字、不同清晰度
總結
以上是生活随笔為你收集整理的OCR算法识别率怎么评估?的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【AI测试】机器学习项目的测试,算法测试
- 下一篇: MAC 安装jenkins