當(dāng)前位置：首頁 > 编程语言 > python >内容正文

python

导出excel加粗_Python办公自动化｜从Word到Excel

發(fā)布時(shí)間：2025/3/20 python 43 豆豆

生活随笔收集整理的這篇文章主要介紹了导出excel加粗_Python办公自动化｜从Word到Excel 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

文章來源：早起Python 作者：陳熹

大家好，今天有一個(gè)公務(wù)員的小伙伴委托我給他幫個(gè)忙，大概是有這樣一份Word(由于涉及文件私密所以文中的具體內(nèi)容已做修改)

一共有近2600條類似格式的表格細(xì)欄，每個(gè)欄目包括的信息有：

日期
發(fā)文單位
文號(hào)
標(biāo)題
簽收欄

需要提取其中加粗的這三項(xiàng)內(nèi)容到Excel表格中存儲(chǔ)，表格樣式如下：

也就是需要將收文時(shí)間、文件標(biāo)題、文號(hào)填到指定位置，同時(shí)需要將時(shí)間修改為標(biāo)準(zhǔn)格式，如果是完全手動(dòng)復(fù)制和修改時(shí)間，依照一個(gè)條目10s的時(shí)間計(jì)算，一分鐘可以完成6條，那么最快也需要：

而這類格式規(guī)整的文件整理非常適合用Python來執(zhí)行，好的那么接下來請(qǐng)Python出場(chǎng)，必要的信息我在代碼中以注釋信息呈現(xiàn)。

首先使用Python將Word文件導(dǎo)入

# 導(dǎo)入需要的庫docx

from docx import Document

# 指定文件存放的路徑

path = r'C:甥敳獲word.docx'

# 讀取文件

document = Document(path)

# 讀取word中的所有表格

tables = document.tables

再把問題逐個(gè)劃分，首先嘗試獲取第一張表第一個(gè)文件條目的三個(gè)所需信息

# 獲取第一張表

table0 = tables[0]

仔細(xì)觀察可以發(fā)現(xiàn)一個(gè)文件條目占據(jù)了3行，所以對(duì)表格全部行循環(huán)迭代時(shí)可以設(shè)步長(zhǎng)為3

注意觀察表格，按照row和cell把所需內(nèi)容解析清楚

# 在全局放一個(gè)變量用來計(jì)數(shù)填序號(hào)

n = 0

for i in range(0, len(table0.rows) + 1, 3):

# 日期

date = table0.cell(i, 1).text

# 標(biāo)題

title = table0.cell(i + 1, 1).text.strip()

# 文號(hào)

dfn = tables[j].cell(i, 3).text.strip()

print(n, date, tite, dfn)

接下來需要解決的是，時(shí)間我們獲取的是 2/1 這種日/月的形式。我們需要轉(zhuǎn)化成 YYYY-MM-DD格式，而這利用到datetime包的strptime和strftime函數(shù)：

strptime: 解析字符串中蘊(yùn)含的時(shí)間
strftime: 轉(zhuǎn)化成所需的時(shí)間格式

#import datetime

n = 0

for i in range(0, len(table0.rows) + 1, 3):

# 日期

date = table0.cell(i, 1).text

# 有的條目時(shí)間是空的，這里不做過多判別

if '/' in date:

date = datetime.datetime.strptime(date, '%d/%m').strftime('2020-%m-%d')

else:

date = '-'

# 標(biāo)題

title = table0.cell(i + 1, 1).text.strip()

# 文號(hào)

dfn = tables[j].cell(i, 3).text.strip()

print(n, date, tite, dfn)

這樣一張表的內(nèi)容解析就完成了，注意這里用的是table[0]即第一張表，遍歷所有的表加一個(gè)嵌套循環(huán)就可以，另外也可以捕獲異常增加程序靈活性

n = 0

for j in range(len(tables)):

for i in range(0, len(tables[j].rows)+1, 3):

try:

# 日期

date = tables[j].cell(i, 1).text

if '/' in date:

date = datetime.datetime.strptime(date, '%d/%m').strftime('2020-%m-%d')

else:

date = '-'

# 標(biāo)題

title = tables[j].cell(i + 1, 1).text.strip()

# 文號(hào)

dfn = tables[j].cell(i, 3).text.strip()

n += 1

print(n, date, title, dfn)

except Exception as error:

# 捕獲異常，也可以用log寫到日志里方便查看和管理

print(error)

continue

信息解析和獲取完成就可以導(dǎo)出了，用到的包是openpyxl

from openpyxl import Workbook

# 實(shí)例化

wb = Workbook()

# 獲取當(dāng)前sheet

sheet = wb.active

# 設(shè)立表頭

header = ['序號(hào)', '收文時(shí)間', '辦文編號(hào)', '文件標(biāo)題', '文號(hào)', '備注']

sheet.append(header)

在最內(nèi)層解析循環(huán)的末尾加上如下代碼即可

row = [n, date, ' ', title, dfn, ' ']

sheet.append(row)

線程的最后記得保存

wb.save(r'C:甥敳獲20200420.xlsx')

運(yùn)行時(shí)間在10分鐘左右，大概離開了一會(huì)程序就執(zhí)行結(jié)束了

最后附上完整代碼，代碼很簡(jiǎn)單，理清思路最重要

#from docx import Document

import datetime

from openpyxl import Workbook

wb = Workbook()

sheet = wb.active

header = ['序號(hào)', '收文時(shí)間', '辦文編號(hào)', '文件標(biāo)題', '文號(hào)', '備注']

sheet.append(header)

path = r'C:甥敳獲word.docx'

document = Document(path)

tables = document.tables

n = 0

for j in range(len(tables)):

for i in range(0, len(tables[j].rows)+1, 3):

try:

# 日期

date = tables[j].cell(i, 1).text

if '/' in date:

date = datetime.datetime.strptime(date, '%d/%m').strftime('2020-%m-%d')

else:

date = '-'

# 標(biāo)題

title = tables[j].cell(i + 1, 1).text.strip()

# 文號(hào)

dfn = tables[j].cell(i, 3).text.strip()

n += 1

print(n, date, title, dfn)

row = [n, date, ' ', title, dfn, ' ']

sheet.append(row)

except Exception as error:

# 捕獲異常，也可以用log寫到日志里方便查看和管理

print(error)

continue

wb.save(r'C:甥敳獲20200420.xlsx')

如果你覺得文章不錯(cuò)的話，分享、收藏、在看是對(duì)猴哥的最大支持，是猴哥持續(xù)創(chuàng)作的動(dòng)力

總結(jié)

以上是生活随笔為你收集整理的导出excel加粗_Python办公自动化｜从Word到Excel的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：灵宝机器人编程学校_灵宝两所学校上榜“河
下一篇： python条件查询或 in_64.P

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

python

导出excel加粗_Python办公自动化｜从Word到Excel

總結(jié)