Python实现pdf转word
生活随笔
收集整理的這篇文章主要介紹了
Python实现pdf转word
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一、實驗目標
通過利用python中的pyinstaller庫和PySimpleGUI庫,實現將pdf轉為word的實際功能。
二、實驗準備
1、安裝pdf2docx庫
pip install pdf2docx2、安裝PySimpleGUI庫
pip install PySimpleGUI三、實驗代碼
from pdf2docx import Converter import PySimpleGUI as sgdef pdf2word(file_path):file_name = file_path.split('.')[0]doc_file = f'{file_name}.docx'p2w = Converter(file_path)p2w.convert(doc_file, start=0, end=None)p2w.close()return doc_filedef main():# 選擇主題sg.theme('DarkAmber')layout = [[sg.Text('pdfToword', font=('微軟雅黑', 12)),sg.Text('', key='filename', size=(50, 1), font=('微軟雅黑', 10))],[sg.Output(size=(80, 10), font=('微軟雅黑', 10))],[sg.FilesBrowse('選擇文件', key='file', target='filename'), sg.Button('開始轉換'), sg.Button('退出')]]# 創建窗口window = sg.Window("張臥虎", layout, font=("微軟雅黑", 15), default_element_size=(50, 1))# 事件循環while True:# 窗口的讀取,有兩個返回值(1.事件;2.值)event, values = window.read()print(event, values)if event == "開始轉換":if values['file'] and values['file'].split('.')[1] == 'pdf':filename = pdf2word(values['file'])print('文件個數 :1')print('\n' + '轉換成功!' + '\n')print('文件保存位置:', filename)elif values['file'] and values['file'].split(';')[0].split('.')[1] == 'pdf':print('文件個數 :{}'.format(len(values['file'].split(';'))))for f in values['file'].split(';'):filename = pdf2word(f)print('\n' + '轉換成功!' + '\n')print('文件保存位置:', filename)else:print('請選擇pdf格式的文件哦!')if event in (None, '退出'):breakwindow.close()main()四、部分代碼解析
1、pdf轉word代碼主體部分
def pdf2word(file_path):file_name = file_path.split('.')[0]doc_file = f'{file_name}.docx'p2w = Converter(file_path)p2w.convert(doc_file, start=0, end=None)p2w.close()return doc_fileconvert(doc_file,start,end)函數中
doc_file:轉化完成后文件名
start:轉化開始頁面
end:轉化結束頁面
注意點:
①若不給start,end參數則默認轉化全篇
②對于不連續的頁面,也可寫作convert(doc_file , pages = [2,4,6])
2、圖形化界面部分
sg.theme('default1') layout = [[sg.Text('pdfToword', font=('微軟雅黑', 12)),sg.Text('', key='filename', size=(50, 1), font=('微軟雅黑', 10))],[sg.Output(size=(80, 10), font=('微軟雅黑', 10))],[sg.FilesBrowse('選擇文件', key='file', target='filename'), sg.Button('開始轉換'),sg.Button('退出')]] window = sg.Window("id", layout, font=("微軟雅黑", 15), default_element_size=(50, 1))theme表示主題,即圖形化界面的主題顏色(sg.theme_list()可以查看所有可用主題)
3、實現多個文件轉化
if event == "開始轉換":if values['file'] and values['file'].split('.')[1] == 'pdf':filename = pdf2word(values['file'])print('文件個數 :1')print('\n' + '轉換成功!' + '\n')print('文件保存位置:', filename)elif values['file'] and values['file'].split(';')[0].split('.')[1] == 'pdf':print('文件個數 :{}'.format(len(values['file'].split(';'))))for f in values['file'].split(';'):filename = pdf2word(f)print('\n' + '轉換成功!' + '\n')print('文件保存位置:', filename)else:print('請選擇pdf格式的文件')①第一個if處,通過“.”進行劃分,判斷是否為單個且pdf格式文件
②else if處,通過“;”劃分,將所有文件的存儲路徑儲存在一個數組中,利用循環來遍歷數組,從而達到依次轉化的目的
③else處,若傳入非pdf文件則輸出提示文字
五、結果
?完結撒花!
總結
以上是生活随笔為你收集整理的Python实现pdf转word的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 锡山国土推行数据中心“在线变更”
- 下一篇: [剑指offer][JAVA]面试题第[