关于银行对账单解析器

一个图书馆。六种格式。零网络调用。

简述: Bank Statement Parser 是一个开源 Python 库,可将七种银行对账单格式(CAMT.053、PAIN.001、CSV、OFX、QFX、MT940 和 PDF)解析为 pandas DataFrame。混合 PDF 管道带余额校验,REST API,智能分类,账本导出,27K+ tx/s 吞吐量。

Bank Statement Parser 是一个开源 Python 库,可将七种格式的银行对账单解析为结构化 pandas DataFrame。确定性核心在本地处理结构化格式,零网络调用。可选的混合 PDF 管道通过本地 LLM(经由 Ollama)处理数字和扫描对账单。

适用人群

支持的格式

格式 标准 文件类型 解析器/方法
CAMT.053 ISO 20022 银行对客户对账单 .xml CamtParser
PAIN.001 ISO 20022 贷记转账发起 .xml Pain001Parser
CSV 通用银行导出 .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 SWIFT 标准 .mt940, .sta Mt940Parser
PDF 数字和扫描对账单 .pdf smart_ingest()

所有格式均生成具有一致列名的标准化 pandas DataFrame,使下游处理与格式无关。

核心能力

安全与隐私

性能

指标 数值
CAMT.053 吞吐量 27,000+ tx/s
PAIN.001 吞吐量 52,000+ tx/s
单笔交易延迟(CAMT) 37 微秒
单笔交易延迟(PAIN.001) 19 微秒
首次返回结果 < 2 ms
内存扩展(1K-50K tx) 恒定(流式)
测试覆盖率 100% 分支覆盖
测试数 29 个测试文件中共 718 项

开始构建

[查看安装指南和示例 ❯][01]

[01]: /getting-started/index.html “入门指南” “GitHub 仓库”