软件功能
1、支持批量扫描指定文件夹中的PDF发票文件,自动过滤非发票文件。
2、提取发票的核心信息,包括:发票代码、发票号码、开票日期、校验码、公司名称、金额和税额。
3、自动处理文本格式,去除多余空格或符号,确保数据整洁。
4、将提取的信息实时写入Excel表格,方便后续统计与管理。
5、异常处理机制完善,遇到无法读取的PDF文件时,会记录错误并继续处理其他文件。
使用方法
0、把软件或代码放到发票文件夹,再运行,默认执行当前目录(不包括子目录)所有pdf文件
1、运行程序后,软件将在当前目录下扫描所有PDF文件并提取发票信息:
2、将需要处理的PDF发票文件放入同一文件夹(程序当前工作目录)
3、运行程序,程序会自动识别文件夹内的PDF文件并解析第一页内容
4、提取成功的信息会显示在控制台,同时写入名为 “发票信息.xls” 的Excel文件
5、Excel表格中会按行记录每张发票的详细信息,列名依次为:发票代码、发票号码、开票日期、校验码、公司、金额、税额
6、遇到无法读取的文件,程序会在控制台输出错误信息,保证其他文件正常处理
运行环境
Python 3.x, 依赖库安装命令:pip install pdfplumber xlwt
运行方式:在cmd命令行中执行脚本即可
特点亮点
1、无需图形界面,轻量化,适合批量处理。
2、自动正则匹配发票关键字段,减少人工操作。
3、输出Excel文件格式统一,便于二次处理和统计。
隐藏内容需要回复可以看见
回复


楼主辛苦了,谢谢楼主,楼主好人一生平安!