Python实战教程 | 轻松批量识别数百个快递单号
前情提要
了解我的小伙伴可能都知道,經(jīng)常給大家送書,不算聯(lián)合抽獎送書,單獨我自購+出版社贊助已累計送出幾百本書籍。
如果是自購的話,還需要自己聯(lián)系快速小哥寄出書籍。
寄出后快遞小哥會給我截圖來反饋,然而我想要單號的時候就遇到問題了。
每次寄完書,我都只能得到n個截圖(內(nèi)含快遞信息)。
為了及時反饋大家物流信息,我需要盡快將快遞單號提取出來。
思考解決辦法
每次大概都有十幾到幾十張截圖,手動去識別真的太麻煩。
不如先看看每張截圖大概是什么樣子,再去想想批量處理的辦法吧。
主要是為了批量獲取圖片中的快遞單號,我想到了兩個解決辦法:
用python識別條形碼來直接獲得準確快遞單號
用python調(diào)用ocr,識別截圖中的快遞單號文字
大家覺得哪個更簡單更準確呢?
今天我先聊聊第一種方法的流程和踩坑經(jīng)歷。
遍歷圖片
首先,第一步需要先獲取文件夾中的所有截圖,再依次進行條形碼識別。
具體操作可以參考注釋
import?osdef?get_jpg():jpgs?=?[]path?=?os.getcwd()for?i?in?os.listdir(path):??#獲取文件列表if?i.split(".")[-1]?==?"jpg":??#篩選jpg文件(截圖)oldname=os.path.join(path,i)??#舊文件名i?=?i.replace('微信圖片_','')newname=os.path.join(path,i)??#新文件名os.rename(oldname,newname)??#改名jpgs.append(i)return?jpgs上面的代碼中除了遍歷篩選圖片,還涉及了改名的操作。
這是因為我在后面使用 opencv 時,打開的路徑只要含有中文就會一直報錯,于是我就干脆把截圖名稱里的中文去除。
執(zhí)行構(gòu)建的get_jpg()函數(shù),得到
這些就是演示文件中的四個截圖文件,下面開始對他們進行識別。
識別條形碼
python的第三方模塊 pyzbar 可以很方便地處理二維碼的識別。我們這次用它來識別一維條形碼的話,用法也大致一樣。不過還要搭配 cv2 使用,主要是為了利用cv2.imread()來讀取圖片文件。
注意:對于cv2模塊,安裝時需要輸入pip3 install opencv-python,但在導入的時候采用import cv2。
識別條形碼的具體語句如下所示:
import?pyzbar.pyzbar?as?pyzbar import?cv2def?get_barcode(img):image?=?cv2.imread(img)barcodes?=?pyzbar.decode(image)barcode?=?barcodes[0]barcode_data?=?barcode.data.decode("utf-8")return?barcode_data上面構(gòu)建的get_barcode()函數(shù)可以實現(xiàn)識別條形碼,并返回結(jié)果數(shù)據(jù)。
我們可以用for循環(huán)遍歷前文獲取的所有圖片,再依次使用get_barcode()函數(shù)來識別條形碼。
data_m?=[] for?i?in?jpgs:data?=?get_barcode(i)data_m.append(data) data_m可以發(fā)現(xiàn),成功識別了四張截圖里的條形碼,并獲取了對應(yīng)的快遞單號。
小結(jié)
回顧今天的問題案例,我先通過思考想出了兩種解決辦法。第一種的優(yōu)點是識別條形碼比OCR更準確,但是其只獲取了快遞單號。后續(xù)在給獲得贈書的同學反饋時,我還需要手動將名字和單號對應(yīng),不夠偷懶。后續(xù)將給大家介紹第二種方法的流程和優(yōu)缺點。
如果想看更多python改變生活的真實問題案例,給本文右下角點個贊吧????
如果你也有一直想用python解決的問題,歡迎在評論區(qū)告訴我????
我們的文章到此就結(jié)束啦,如果你喜歡今天的Python實戰(zhàn)教程,請持續(xù)關(guān)注菜鳥學Python。
推薦閱讀:入門:?最全的零基礎(chǔ)學Python的問題? |?零基礎(chǔ)學了8個月的Python??|?實戰(zhàn)項目?|學Python就是這條捷徑干貨:爬取豆瓣短評,電影《后來的我們》?|?38年NBA最佳球員分析?|? ?從萬眾期待到口碑撲街!唐探3令人失望? |?笑看新倚天屠龍記?|?燈謎答題王?|用Python做個海量小姐姐素描圖?|碟中諜這么火,我用機器學習做個迷你推薦系統(tǒng)電影趣味:彈球游戲? |?九宮格? |?漂亮的花?|?兩百行Python《天天酷跑》游戲!AI:?會做詩的機器人?|?給圖片上色?|?預測收入?|?碟中諜這么火,我用機器學習做個迷你推薦系統(tǒng)電影小工具:?Pdf轉(zhuǎn)Word,輕松搞定表格和水印!?|?一鍵把html網(wǎng)頁保存為pdf!|??再見PDF提取收費!?|?用90行代碼打造最強PDF轉(zhuǎn)換器,word、PPT、excel、markdown、html一鍵轉(zhuǎn)換?|?制作一款釘釘?shù)蛢r機票提示器!?|60行代碼做了一個語音壁紙切換器天天看小姐姐!|年度爆款文案1).臥槽!Pdf轉(zhuǎn)Word用Python輕松搞定!2).學Python真香!我用100行代碼做了個網(wǎng)站,幫人PS旅行圖片,賺個雞腿吃3).首播過億,火爆全網(wǎng),我分析了《乘風破浪的姐姐》,發(fā)現(xiàn)了這些秘密?4).80行代碼!用Python做一個哆來A夢分身?5).你必須掌握的20個python代碼,短小精悍,用處無窮?6).30個Python奇淫技巧集?7).我總結(jié)的80頁《菜鳥學Python精選干貨.pdf》,都是干貨?8).再見Python!我要學Go了!2500字深度分析!9).發(fā)現(xiàn)一個舔狗福利!這個Python爬蟲神器太爽了,自動下載妹子圖片點閱讀原文,領(lǐng)AI全套資料!總結(jié)
以上是生活随笔為你收集整理的Python实战教程 | 轻松批量识别数百个快递单号的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: “约见”面试官系列之常见面试题之第九十八
- 下一篇: 前端学习(2028)vue之电商管理系统