python读取word文档
周末需要做一個統計word文檔字數的問題,剛開始以為很簡單,因為之前做過excel表格相關的任務,所以認為利用擴展模塊應該比較簡單。
通過搜索,確實搜到了一個python操作word的模塊,python-docx?
通過命令安裝:pip install python-docx
使用代碼示例:
#讀取docx中的文本代碼示例
import docx
#獲取文檔對象
file=docx.Document("D:\\temp\\word.docx")
print("段落數:"+str(len(file.paragraphs)))#段落數為13,每個回車隔離一段
#輸出每一段的內容
for para in file.paragraphs:
print(para.text)
#輸出段落編號及段落內容
for i in range(len(file.paragraphs)):
print("第"+str(i)+"段的內容是:"+file.paragraphs[i].text)
拿過來自己試了一下,卻報了以下的錯誤:
拿異常上百度搜了一下,大致的意思是python-docx這個模塊貌似只支持docx文件,不支持doc。
好吧,嘗試另一種方法,使用antiword(這里使用的linux環境)
先下載安裝,地址:http://www.winfield.demon.nl/
使用tar解壓之后,分別用make ?和 make install命令進行安裝
切換到安裝的目錄后,使用“./antiword” + doc文件名即可讀取文件內容。
?
轉載于:https://www.cnblogs.com/niansi/p/7675505.html
總結
以上是生活随笔為你收集整理的python读取word文档的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 手机银行密码忘了怎么办
- 下一篇: 交通银行房贷利率是多少