PaddleOCR二次全流程——1. 确定字体
生活随笔
收集整理的這篇文章主要介紹了
PaddleOCR二次全流程——1. 确定字体
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. 數據(待識別內容)
要識別的內容是這樣的,大致模式是:機器拍攝,然后識別屏幕上的表格文字。
2. 字體
確定字體的網站:
- 中文:識字體
- 英文:WhatTheFont
- 英文:FONT IDENTIFIER
不過以上字體基本都需要自己在網站做一些操作,框字體區域,然后會填寫當前框對應的正確字符,再去進行識別。(但是對英文來說,往往在切分字符的時候就錯了,所以這里就不再去尋找字體了)
這里選擇了幾種和上述比較像的字體來進行替代,通過在windows默認的console里切換字體,大致可以確定這種字體是TrueType字體
2.1 第一個圖的字體
暫定的字體:
2.1 第二個圖的字體
2.3 尋找字體文件
由于直接是在Adobe Acrobat里切換字體的,所以直接去軟件里找就好了,除了軟件里帶的,還有就是系統字體。
軟件自帶字體
參考:Adobe用戶指南-PDF 字體
在windows電腦上搜索以下路徑:
- C:\Program Files (x86)\Common Files\Adobe\Fonts
- Acrobat 文件夾中的 /Resource/Font
- /Program Files/Common Files/Adobe/Fonts
- C:\Program Files (x86)\Adobe\Acrobat DC\Resource\Font(最后我是在這個文件夾里找到的,不過這個文件夾里都是.otf字體,opentype類型)
系統字體
位置:
- C:\Windows\Fonts(建議調節成詳細信息顯示視圖,看起來會方便些)
2.4 整理字體文件
當從系統字體復制的時候,可以看到,顯示的是一個,但是實際上有四個,使用的時候一般只需要常規字體,所以其他幾個加粗/斜體可以考慮刪除了。(按需取用)
最后可以找到的字體是:
consola.ttf
Deng.ttf
MSGothic.ttc
SegoeUI.ttf
YuGothR.ttc
其實全都是系統字體,并沒有使用到Adobe Acrobat的字體
總結
以上是生活随笔為你收集整理的PaddleOCR二次全流程——1. 确定字体的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 油猴脚本大全
- 下一篇: 国际通用计算机编码,计算机中的编码知识