Python PDF 转 TXT
生活随笔
收集整理的這篇文章主要介紹了
Python PDF 转 TXT
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
整理了一下 Pyhton 的 PDF 轉 TXT 代碼。
目標:將 Data.pdf 文件轉為 Data.txt 文件。
封裝函數如下。
# 封裝函數 def pdf2txt(file_name):p = pdfplumber.open(file_name + ".pdf")page_num = len(p.pages)with pdfplumber.open(file_name + ".pdf") as pdf:for i in range(page_num):page = pdf.pages[i]text = page.extract_text()if text != None:f = open(file_name + ".txt", "a", encoding = "utf-8")f.write(text)print(file_name+' '+str(i+1)+'/'+str(page_num)+' 頁讀寫完成', end='\r')f.close() # 測試函數 file_name = 'Data' pdf2txt(file_name) # Data 32/143 頁讀寫完成總結
以上是生活随笔為你收集整理的Python PDF 转 TXT的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: unity 手机重力迷宫(四)
- 下一篇: 分享一个用python实现将pdf转tx