PDF发票信息批量提取工具 PC版 - 转载分享

VIP2

1、支持批量扫描指定文件夹中的PDF发票文件，自动过滤非发票文件。

2、提取发票的核心信息，包括：发票代码、发票号码、开票日期、校验码、公司名称、金额和税额。

3、自动处理文本格式，去除多余空格或符号，确保数据整洁。

4、将提取的信息实时写入Excel表格，方便后续统计与管理。

5、异常处理机制完善，遇到无法读取的PDF文件时，会记录错误并继续处理其他文件。

0、把软件或代码放到发票文件夹，再运行，默认执行当前目录(不包括子目录)所有pdf文件

1、运行程序后，软件将在当前目录下扫描所有PDF文件并提取发票信息：

2、将需要处理的PDF发票文件放入同一文件夹（程序当前工作目录）

3、运行程序，程序会自动识别文件夹内的PDF文件并解析第一页内容

4、提取成功的信息会显示在控制台，同时写入名为 “发票信息.xls” 的Excel文件

5、Excel表格中会按行记录每张发票的详细信息，列名依次为：发票代码、发票号码、开票日期、校验码、公司、金额、税额

6、遇到无法读取的文件，程序会在控制台输出错误信息，保证其他文件正常处理

Python 3.x，依赖库安装命令：pip install pdfplumber xlwt

运行方式：在cmd命令行中执行脚本即可

1、无需图形界面，轻量化，适合批量处理。

2、自动正则匹配发票关键字段，减少人工操作。

3、输出Excel文件格式统一，便于二次处理和统计。

隐藏内容需要回复可以看见