當前位置：首頁 >

3测试图片显示置信度_告别腾讯百度图片文字识别API调用，OCR图片文字识别就用这条代码...

發布時間：2024/4/13 55 豆豆

生活随笔收集整理的這篇文章主要介紹了 3测试图片显示置信度_告别腾讯百度图片文字识别API调用，OCR图片文字识别就用这条代码... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

上期文章我們分享了tesseract的基本安裝，本期我們來分享一下如何使用python與tesseract進行代碼的編程來實現tesseract的文字識別

在開始本期文章之前，請認真閱讀一下小編前期分享的了tesseract的安裝教程，確保你電腦里面安裝了pytesseract 與tesseract，最好是4.0以上的版本

pytesseract 與python的完美結合

import pytesseract

import cv2

from pytesseract import Outpu

image = cv2.imread('11.png')

rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

results = pytesseract.image_to_data(rgb, output_type=Output.DICT)

首先我們導入pytesseract第三方庫

使用cv2.imread讀取需要檢測的圖片

由于CV2讀取的圖片是在BGR空間，這里需要cv2.cvtColor(image, cv2.COLOR_BGR2RGB)來轉換為RGB空間

然后使用pytesseract.image_to_data來識別，結果保存在results里面

ok ，本期文章到此結束，就這幾條代碼

哈哈，開個玩笑，再怎么也得介紹一下代碼的具體含義

pytesseract一般具有如下功能：

image_to_string將圖像上的Tesseract OCR運行結果返回到字符串

image_to_boxes返回包含已識別字符及其框邊界的結果

image_to_data返回包含框邊界，置信度和其他信息的結果

image_to_osd返回包含有關方向和腳本檢測的信息的結果

這里我們使用image_to_data來獲取檢測到的字符以及置信度與具體的邊界位置，其他功能小伙伴們可以自行測試

image_to_data(image，lang = None，config =''， nice = 0，output_type = Output.STRING)

image Object，PIL Image /由Tesseract處理的圖像的NumPy數組

lang String，Tesseract語言代碼字符串

config String，任何其他配置為字符串

nice Integer，修改Tesseract運行的處理器優先級。Windows不支持。

output_type Class屬性，指定輸出的類型，默認為string

我們這里選擇輸入一個字典，字典里面存放著測到的字符以及置信度與具體的邊界位置

for i in range(0, len(results["text"])):

x = results["left"][i]

y = results["top"][i]

w = results["width"][i]

h = results["height"][i]

text = results["text"][i]

conf = int(results["conf"][i])

我們遍歷整個字典，獲取了檢測字符串的初始位置(x,y),以及字符串的長度與高度(w,h)，這樣我們就可以畫一個box來提示以及檢測到的字符串。

text = results["text"][i]獲取識別到的字符串

conf = int(results["conf"][i])獲取識別到字符串的置信度

if conf > 50:

text = "".join([c if ord(c) < 128 else "" for c in text]).strip()

print(text)

cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)

cv2.imshow("Image", image)

cv2.waitKey(0)

我們選擇置信度大于50%的，把檢測到的字符串全部打印，并顯示到圖片上

檢測到的字符

tesseract 默認只識別英文，你若想識別其它語言，請下載對應的tessdata

https://github.com/tesseract-ocr/tessdata

image_to_data(image，lang = None，config =''， nice = 0，output_type = Output.STRING)

然后修改此處的lang=“chi_sim”或者其他語言

只檢測英文

超強干貨來襲云風專訪：近40年碼齡，通宵達旦的技術人生

總結

以上是生活随笔為你收集整理的3测试图片显示置信度_告别腾讯百度图片文字识别API调用，OCR图片文字识别就用这条代码...的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： goland设置goroot_go环境搭
下一篇：数字电路技术可能出现的简答题_数字电子技

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

3测试图片显示置信度_告别腾讯百度图片文字识别API调用，OCR图片文字识别就用这条代码...

pytesseract 與python的完美結合

總結