幾秒鐘內即可開始
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, ready to use
一個庫,六種格式
使用單一統一的 API 將 CAMT.053、PAIN.001、CSV、OFX、QFX 和 MT940 解析為結構化 pandas DataFrame。無需為每種格式安裝單獨的軟體包。
| 特徵 | 銀行對帳單解析器 | 單一格式OSS(mt940、ofxparse) | SaaS(Ocrolus、Parseur) |
|---|---|---|---|
| 支援的格式 | 6、統一API | 各 1 個 | 許多(透過 OCR) |
| 資料隱私 | 100%本地,零網路調用 | 100%本地化 | 外部發送的數據 |
| 成本 | 免費,阿帕契 2.0 | 自由的 | $49-$1,000+/月 |
| PII 編輯 | 內置,預設開啟 | 不 | 各不相同 |
| 串流媒體 | 有限記憶體 | 不 | 不適用 |
| 郵遞區號安全 | 內建強化 | 不 | 不適用 |
| 重複資料刪除 | 內建置信度分數 | 不 | 一些 |
專為 ISO 20022 遷移而構建
SWIFT 設定了嚴格的截止日期:所有金融機構必須在 2027 年 11 月之前收到 CAMT.053,MT940/MT942/MT950 將在 2028 年 11 月之前完全停用。銀行對帳單解析器可在單一 API 中處理傳統 MT940 和現代 ISO 20022 格式(CAMT.053、PAIN.001),因此您的解析管道在過渡期間及之後都可以正常運作。
## 表現
- CAMT.053 解析每秒超過 27,000 筆交易
- 52,000+ 事務/秒 用於 PAIN.001 解析
- < 2 ms 獲得第一個結果的時間
- 恆定記憶體透過串流處理從 1K 到 50K+ 事務
- 467 次測試,Python 3.9 到 3.14 的分支覆蓋率為 100%
為什麼選擇銀行對帳單解析器?
- 格式自動偵測:
detect_statement_format()自動識別文件並create_parser()傳回正確的解析器。 - 隱私第一:預設啟用 PII 編輯。敏感欄位(姓名、IBAN、地址)在 CLI 輸出中被屏蔽。選擇加入
--show-pii當需要時。 - 生產就緒:安全 ZIP 攝取(炸彈保護、加密條目拒絕)、輸入驗證和路徑遍歷預防。
- 靈活輸出:匯出為 CSV、JSON、Excel,或轉換為 Polars DataFrame。
- 並行處理:同時解析多個文件
parse_files_parallel().
[開始使用❯][01] | [在 GitHub 上查看❯][02] | [在 PyPI 上查看❯][03]
[01]:/getting-started/index.html [02]:https://github.com/sebastienrousseau/bankstatementparser [03]: https://pypi.org/project/bankstatementparser/