日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

教你3行Python代码,识别图片中的任意语言文字

發布時間:2023/12/20 python 31 豆豆
生活随笔 收集整理的這篇文章主要介紹了 教你3行Python代码,识别图片中的任意语言文字 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

大家好

今天給大家介紹一個超級簡單且強大的OCR文本識別工具:easyocr.

這個模塊支持70多種語言的即用型OCR,包括中文,日文,韓文和泰文等。Python學習資料點擊免費領取

?

下面是這個模塊的實戰教程。

1.準備

pip?install?easyocr 復制代碼

它會安裝除了模型文件之外的所有依賴,模型文件則會在運行代碼的時候下載。

對于Windows,如果在安裝 Torch 或 Torchvision 時報錯了,請按照pytorch.org?的官方說明安裝 Torch 和 Torchvision。

如果你想使用顯卡進行計算,你需要搜索下載CUDA,并在Pytorch網站上,確保選擇正確的CUDA版本。如果僅打算在CPU模式下運行,請選擇CUDA = None。

2.實戰教程

這個模塊用起來真的非常簡單,三行代碼完事了:

import?easyocr reader = easyocr.Reader(['ch_sim','en']) result = reader.readtext('test.png') 復制代碼

運行的過程中會安裝所需要的模型文件,像下面這樣:

?

不過它的下載速度非常慢,而且經常會失敗,因此這里給出第二個解決方案:先下載好模型文件,再將其放置到所需要的位置:

文字檢測模型(CRAFT)(必須)

pythondict.com/go/?url=htt…

中文(簡體)模型(識別中文必須)

pythondict.com/go/?url=htt…

中國(傳統)模型

pythondict.com/go/?url=htt…

拉丁模型

pythondict.com/go/?url=htt…

日本模型

pythondict.com/go/?url=htt…

韓文模型

pythondict.com/go/?url=htt…

泰文模型

pythondict.com/go/?url=htt…

阿拉伯文模型

pythondict.com/go/?url=htt…

下載完模型后,將文件放到下面這個位置。

Windows:C:\Users\用戶名.EasyOCR\model Linux:~/ .EasyOCR / model

如下圖所示:

?

重新執行腳本不會再提醒下載模型了:

import?easyocr reader = easyocr.Reader(['ch_sim']) result = reader.readtext('test.png') print(result) 復制代碼

我隨便截了一個直播彈幕的圖片保存在腳本所在的文件夾下,命名為test.png:

?

?結果如下:

?

基本上所有應該識別的文字都識別出來了,效果非常不錯。

另外也可以看到,輸出采用列表格式,每個item分別表示對應文字的邊界框,識別文本結果和置信度。

這個模塊還能識別多語種的情況:

?

我將這張圖片命名為test2.jpg,修改代碼中對應的圖片名稱:

import?easyocr reader = easyocr.Reader(['ch_sim','en']) result = reader.readtext('test2.jpg') print(result) 復制代碼

效果如下:?

?

這張圖片很復雜,而且是中英文混雜在一起的情況,但是可以看到模型除了左上角的水印,圖片中的文字基本都是識別出來了,盡管有部分文字識別錯誤,但還在可以接受的范圍之內。

不過需要注意的是,雖然可以一次性識別許多種語言,但并非所有語言都可以一起用,通常是公共語言和一個特殊語種可以一起識別,相互兼容,比如英語和日語。

如果你的電腦沒有GPU或者顯存不足,可以加一個gpu=false的參數僅使用CPU運行:

reader = easyocr.Reader(['ch_sim','en'], gpu =?False) 復制代碼

另外,這個模塊還支持直接使用命令行運行,相當方便,大家可以試試:

easyocr -l ch_sim en -f test.png --detail=1?--gpu=True 復制代碼

我們的文章到此就結束啦,如果你喜歡今天的Python 實戰教程,給文章點個贊吧👍。

?

?

?

?

?

?

總結

以上是生活随笔為你收集整理的教你3行Python代码,识别图片中的任意语言文字的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。