【PYTHON,WORD】1.利用python-docx 读取word文件
生活随笔
收集整理的這篇文章主要介紹了
【PYTHON,WORD】1.利用python-docx 读取word文件
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
0.安裝python-docx模塊
windows:pip install python-docx
mac:pip3 install python-docx
1.word文檔結構
Document: 文檔
Paragraph:段落
Run:文字塊
共有三段
2.提取文字
2.1提取段落實例,段數:
結果:
[<docx.text.paragraph.Paragraph object at 0x000001F88E2F2E80>, <docx.text.paragraph.Paragraph object at 0x000001F88E2F2C88>, <docx.text.paragraph.Paragraph object at 0x000001F88E2F2EF0>] 3結果說明有三段
2.2提取段落內容
2.3獲取文字塊run
excel與python結合的第二部分內容,后續將會持續更新excel,ppt,爬蟲,人工智能
一個格式為一個文字塊run 上述句子有7個文字塊run
paragraph.runs 獲取一個列表,得到每個文字塊的實例
2.4提取文字塊的內容
from docx import Documentdoc = Document("0.docx") paragraph = doc.paragraphs[1] runs = paragraph.runs print(runs) for run in runs:print(run.text) excel與python結合的第二部分內容, 后續將會持續更新excel , ppt , 爬蟲 ,人工智能以上便是
word與python結合的第一部分內容,
后續將會持續更新excel,ppt,爬蟲,人工智能
等相關內容,敬請關注
總結
以上是生活随笔為你收集整理的【PYTHON,WORD】1.利用python-docx 读取word文件的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Python 操作Word文档(一)--
- 下一篇: python单词个数_python 统计