python 读取文件_python读取docx文件,就是如此简单
生活随笔
收集整理的這篇文章主要介紹了
python 读取文件_python读取docx文件,就是如此简单
小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.
掃碼加入千人跳槽求職QQ群或微信圈子,每日都有全國(guó)招聘信息哦
? ?
中文編碼問(wèn)題總是讓人頭疼(尤其是mac本),想要用Python讀取word中的內(nèi)容。用open()經(jīng)常報(bào)錯(cuò),通過(guò)百度搜索+問(wèn)身邊小伙伴發(fā)現(xiàn)了Python有專(zhuān)門(mén)讀取.docx的模塊python_docx。本篇文章主要來(lái)解決一個(gè)讀取docx文件的基本操作。希望感興趣的小伙伴可以堅(jiān)持看下去同時(shí)歡迎提出寶貴的意見(jiàn)讓我們一起進(jìn)步!
01:問(wèn)題拋出與引入
import docxpath = "C:\\Users\\qin\\Desktop\\1.docx"file_object=open(path,'rb')print(file_object.read())#輸出結(jié)果如下所示:b'PK\x03\x04\x14\x00\x06\x00\x08\x00\x00\x00!\x00J\xbc\x02qm\x01\x00\x00(\x06\x00\x00\x13\x00\x08\x02[Content_Types].xml \xa2\x04\x02(\xa0\.....一個(gè)很簡(jiǎn)單的docx文件,打印出來(lái)的結(jié)果卻不是我們想要的。對(duì)此引入一個(gè)十分好用的docx模塊,下面就詳細(xì)介紹該模塊的一些基本操作。
02:安裝docx模塊
pip install python_docx
03:新建文檔對(duì)象
import docxfrom docx import Document# 新建文檔,并將其保存名為“test.docx”的文件document = Document()document.save('test.docx')04:添加文檔內(nèi)容
import docxfrom docx import Documentfrom docx.shared import Inchesdocument = Document('C:\\Users\\qin\\Desktop\\1.docx')document.add_heading('I like python', 0)#插入標(biāo)題:0表示樣式為title標(biāo)題document.add_heading('一級(jí)標(biāo)題', level=1)#插入1級(jí)標(biāo)題p = document.add_paragraph('Python是一種計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言 ')#插入段落document.add_picture('C:\\Users\\qin\\Desktop\\1.png', width=Inches(1.25)) #添加圖片并指定寬度table = document.add_table(rows=1, cols=3) #添加一個(gè)表格,每行三列hdr_cells = table.rows[0].cells #獲取第一行的單元格列表對(duì)象hdr_cells[0].text = 'ID' #為每一個(gè)單元格賦值hdr_cells[1].text = 'Name'hdr_cells[2].text = 'Age'new_cells = table.add_row().cells #為表格添加一行new_cells[0].text = '1'new_cells[1].text = 'Tom'new_cells[2].text = '15'document.add_page_break() #添加分頁(yè)符05:保存文檔內(nèi)容
名字相同則將修改的文件內(nèi)容保存;名字不同則將修改的文件內(nèi)容另存為。
import docxfrom docx import Documentdocument.save('C:\\Users\\qin\\Desktop\\1.docx')#保存document.save('C:\\Users\\qin\\Desktop\\2.docx')#另存為06:讀取文本內(nèi)容import docxfrom docx import Documentpath = "C:\\Users\\qin\\Desktop\\1.docx"document = Document(path)for paragraph in document.paragraphs: print(paragraph.text)07:讀取表格內(nèi)容import docxfrom docx import Documentpath = "C:\\Users\\qin\\Desktop\\1.docx"document = Document(path) # 讀入文件tables = document.tables # 獲取文件中的表格集table = tables[0] # 獲取文件中的第一個(gè)表格for i in range(0, len(table.rows)): # 從表格第一行開(kāi)始循環(huán)讀取表格數(shù)據(jù) result = f'{(table.cell(i, 0).text):<5}' + "" + f'{(table.cell(i, 1).text):<5}' + "" + f'{(table.cell(i, 2).text):<5}' # cell(i,0)表示第(i+1)行第1列數(shù)據(jù),以此類(lèi)推 print(result)想要知道docx模塊更多資料參考:https://python-docx.readthedocs.io/en/latest/轉(zhuǎn)發(fā)到朋友圈是最高的贊賞
因?yàn)椴皇翘焐愘|(zhì),所以必須天生勵(lì)志!
總結(jié)
以上是生活随笔為你收集整理的python 读取文件_python读取docx文件,就是如此简单的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: python数据分析报告主题_【原创】p
- 下一篇: 酷狗音乐允许好友找到我怎么关闭