日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

3测试图片显示置信度_告别腾讯百度图片文字识别API调用,OCR图片文字识别就用这条代码...

發布時間:2024/4/13 编程问答 49 豆豆
生活随笔 收集整理的這篇文章主要介紹了 3测试图片显示置信度_告别腾讯百度图片文字识别API调用,OCR图片文字识别就用这条代码... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

上期文章我們分享了tesseract的基本安裝,本期我們來分享一下如何使用python與tesseract進行代碼的編程來實現tesseract的文字識別

在開始本期文章之前,請認真閱讀一下小編前期分享的了tesseract的安裝教程,確保你電腦里面安裝了pytesseract 與tesseract,最好是4.0以上的版本

pytesseract 與python的完美結合

import pytesseract

import cv2

from pytesseract import Outpu

image = cv2.imread('11.png')

rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)

results = pytesseract.image_to_data(rgb, output_type=Output.DICT)

首先我們導入pytesseract第三方庫

使用cv2.imread讀取需要檢測的圖片

由于CV2讀取的圖片是在BGR空間,這里需要cv2.cvtColor(image, cv2.COLOR_BGR2RGB)來轉換為RGB空間

然后使用pytesseract.image_to_data來識別,結果保存在results里面

ok ,本期文章到此結束,就這幾條代碼

哈哈,開個玩笑,再怎么也得介紹一下代碼的具體含義

pytesseract一般具有如下功能:

  • image_to_string將圖像上的Tesseract OCR運行結果返回到字符串
  • image_to_boxes返回包含已識別字符及其框邊界的結果
  • image_to_data返回包含框邊界,置信度和其他信息的結果
  • image_to_osd返回包含有關方向和腳本檢測的信息的結果
  • 這里我們使用image_to_data來獲取檢測到的字符以及置信度與具體的邊界位置,其他功能小伙伴們可以自行測試

    image_to_data(image,lang = None,config ='', nice = 0,output_type = Output.STRING)

    image Object,PIL Image /由Tesseract處理的圖像的NumPy數組

    lang String,Tesseract語言代碼字符串

    config String,任何其他配置為字符串

    nice Integer,修改Tesseract運行的處理器優先級。Windows不支持。

    output_type Class屬性,指定輸出的類型,默認為string

    我們這里選擇輸入一個字典,字典里面存放著測到的字符以及置信度與具體的邊界位置

    for i in range(0, len(results["text"])):

    x = results["left"][i]

    y = results["top"][i]

    w = results["width"][i]

    h = results["height"][i]

    text = results["text"][i]

    conf = int(results["conf"][i])

    我們遍歷整個字典,獲取了檢測字符串的初始位置(x,y),以及字符串的長度與高度(w,h),這樣我們就可以畫一個box來提示以及檢測到的字符串。

    text = results["text"][i]獲取識別到的字符串

    conf = int(results["conf"][i])獲取識別到字符串的置信度

    if conf > 50:

    text = "".join([c if ord(c) < 128 else "" for c in text]).strip()

    print(text)

    cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)

    cv2.imshow("Image", image)

    cv2.waitKey(0)

    我們選擇置信度大于50%的,把檢測到的字符串全部打印,并顯示到圖片上

    檢測到的字符

    tesseract 默認只識別英文,你若想識別其它語言,請下載對應的tessdata

    https://github.com/tesseract-ocr/tessdata

    image_to_data(image,lang = None,config ='', nice = 0,output_type = Output.STRING)

    然后修改此處的lang=“chi_sim”或者其他語言

    只檢測英文

    超強干貨來襲 云風專訪:近40年碼齡,通宵達旦的技術人生

    總結

    以上是生活随笔為你收集整理的3测试图片显示置信度_告别腾讯百度图片文字识别API调用,OCR图片文字识别就用这条代码...的全部內容,希望文章能夠幫你解決所遇到的問題。

    如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。