使用 python 在多个word文件中提取关键字
生活随笔
收集整理的這篇文章主要介紹了
使用 python 在多个word文件中提取关键字
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
使用 python 在多個word文件中提取關鍵字
當有大量word文檔,需要從里面提取包含某項信息的文字時,可用python的docx模塊
# 提取word文件中包含制定文字的段落到txt中 import os from docx import Document # word:要找的詞語 # out_file 保存查找結果的文件 def search_word_in_docx(word,out_file):# 獲取當前路徑下所有文件列表files = os.listdir()# 篩選出.docx格式的word文檔for file in files:# 若是存在doc格式的word文檔,則將其批量轉換為.docx格式即可if file.endswith('.docx') and not file.startswith('-$') :# 打開woord文檔doc = Document(file)# 獲取word文檔每一行的內容for i in doc.paragraphs:#以'愛國'開頭的段落,也可以改成以某個字結尾或者包含某個字if word in i.text:#if i.text.startswith('愛國'):with open(out_file, 'a+') as f:f.write(i.text+'\n'+'\n')search_word_in_docx('線','結果.txt')總結
以上是生活随笔為你收集整理的使用 python 在多个word文件中提取关键字的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: A*算法在最短路问题的应用及其使用举例
- 下一篇: W4_python_decorator_