日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

pytesseract:opencv预处理图片

發布時間:2023/12/4 编程问答 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 pytesseract:opencv预处理图片 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

一、目的

原始圖片用pytesseract識別文字,精準度往往沒達到預期。使用opencv處理后,提高識別精準度。處理方法有

a.圖片轉成白底黑字。

b.截取圖片某固定區域。這個很重要,因為圖片包含圖標或其他形狀圖形,辨識導致錯亂的。

二、opencv 處理

import cv2#加載圖片 image = cv2.imread(filePath)#截取矩形區域 # 格式[y1: y2, x1: x2] , (x1,y1)矩形左上角,(x2,y2)矩形右下角. image = image[180:550, 55:280]#灰度轉換 GrayImage = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)#二值化 # cv2Type: int類型# 0. cv2.THRESH_BINARY# 表示閾值的二值化操作,大于閾值使用maxval表示,小于閾值使用0表示# # 1. cv2.THRESH_BINARY_INV# 表示閾值的二值化翻轉操作,大于閾值的使用0表示,小于閾值的使用最大值表示# ret, thresh2 = cv2.threshold(GrayImage, 88, 255, cv2.THRESH_BINARY_INV)#cv2Threshold 閾值ret, thresh2 = cv2.threshold(GrayImage, cv2Threshold, 255, cv2Type)#ocr 辨識 # output_type=Output.DICT 將獲取具體辨識數據,用于后期處理。 results = pytesseract.image_to_data(thresh2, output_type=Output.DICT, lang='eng')

寫文字,畫矩形

for i in range(0, len(results["text"])):text = results["text"][i].strip()tmp_tl_x = results["left"][i]tmp_tl_y = results["top"][i]tmp_br_x = tmp_tl_x + results["width"][i]tmp_br_y = tmp_tl_y + results["height"][i]#寫字cv2.putText(thresh2, text, (tmp_tl_x, tmp_tl_y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 255, 255), 1)#畫矩形cv2.rectangle(image, (tmp_tl_x, tmp_tl_y), (tmp_br_x, tmp_br_y), (0, 255, 255), 2)

參考:https://livezingy.com/pytesseract-image_to_data_locate_text/

總結

以上是生活随笔為你收集整理的pytesseract:opencv预处理图片的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。