python将pdf格式的微信账单转换成excel数据表
做数据分析时,遇到需要将pdf格式的微信账单转换成excel格式的数据表。
·
有些情况下,我们需要将pdf格式的微信(支付宝)账单批量转换成excel数据表。
直接上源代码:
import pdfplumber
from openpyxl import Workbook
# 读取PDF文件
pdf_file = r'C:\Users\93177\Desktop\微信支付交易明细.pdf'
with pdfplumber.open(pdf_file) as pdf:
tables = []
# 遍历所有的页面
for page in pdf.pages:
tables.extend(page.extract_tables())
# 初始化一个空的Excel工作簿
merged_workbook = Workbook()
merged_sheet = merged_workbook.active
merged_sheet.append(['交易单号', '交易时间', '交易类型', '收/支/其他', '交易方式', '金额(元)', '交易对方', '商户单号']) # 根据实际表头数量修改
# 将表格数据添加到总的Excel工作簿中
for table in tables:
for row in table:
merged_sheet.append(row)
# 保存合并后的Excel文件
merged_workbook.save('合并后的微信账单数据文件.xlsx')
以下为转换成Excel格式的微信账单:

可以看到pdf格式的微信账单被完美的转换成excel格式。
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐



所有评论(0)