日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程语言 > python >内容正文

python

python读取word文档

發布時間:2025/5/22 python 20 豆豆
生活随笔 收集整理的這篇文章主要介紹了 python读取word文档 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

周末需要做一個統計word文檔字數的問題,剛開始以為很簡單,因為之前做過excel表格相關的任務,所以認為利用擴展模塊應該比較簡單。

通過搜索,確實搜到了一個python操作word的模塊,python-docx?

通過命令安裝:pip install python-docx

使用代碼示例:

#讀取docx中的文本代碼示例
import docx
#獲取文檔對象
file=docx.Document("D:\\temp\\word.docx")
print("段落數:"+str(len(file.paragraphs)))#段落數為13,每個回車隔離一段

#輸出每一段的內容
for para in file.paragraphs:
  print(para.text)

#輸出段落編號及段落內容
for i in range(len(file.paragraphs)):
  print("第"+str(i)+"段的內容是:"+file.paragraphs[i].text)

拿過來自己試了一下,卻報了以下的錯誤:

拿異常上百度搜了一下,大致的意思是python-docx這個模塊貌似只支持docx文件,不支持doc。

好吧,嘗試另一種方法,使用antiword(這里使用的linux環境)

先下載安裝,地址:http://www.winfield.demon.nl/

使用tar解壓之后,分別用make ?和 make install命令進行安裝

切換到安裝的目錄后,使用“./antiword” + doc文件名即可讀取文件內容。

?

轉載于:https://www.cnblogs.com/niansi/p/7675505.html

總結

以上是生活随笔為你收集整理的python读取word文档的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。