關於銀行對帳單解析器

一個圖書館。六種格式。零網路呼叫。

TL;DR: Bank Statement Parser 是一個開源 Python 函式庫,可將七種銀行對帳單格式(CAMT.053、PAIN.001、CSV、OFX、QFX、MT940 及 PDF)解析為 pandas DataFrame。混合 PDF 管線搭配餘額驗證、REST API、交易增強、帳本匯出,吞吐量達 27K+ tx/s。

Bank Statement Parser 是一個開源 Python 函式庫,可將七種格式的銀行對帳單解析為結構化的 pandas DataFrame。確定性核心在本機處理結構化格式,零網路呼叫。可選的混合 PDF 管線透過本機 LLM(經由 Ollama)處理數位及掃描對帳單。

適用對象

支援的格式

格式 標準 檔案類型 解析器/方法
CAMT.053 ISO 20022 銀行對客戶對帳單 .xml CamtParser
PAIN.001 ISO 20022 貸記轉帳啟動 .xml Pain001Parser
CSV 一般銀行匯出 .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 SWIFT 標準 .mt940, .sta Mt940Parser
PDF 數位及掃描對帳單 .pdf smart_ingest()

所有格式都會產生具有一致欄位名稱的標準化 pandas DataFrame,使下游處理與格式無關。

核心功能

安全與隱私

效能

指標 數值
CAMT.053 吞吐量 27,000+ tx/s
PAIN.001 吞吐量 52,000+ tx/s
每筆交易延遲(CAMT) 37 微秒
每筆交易延遲(PAIN.001) 19 微秒
首次回傳結果時間 < 2 ms
記憶體擴展(1K-50K tx) 固定(串流)
測試覆蓋率 100% 分支覆蓋率
測試數量 29 個測試檔案中共 718 項

開始建構

[開始安裝與範例 ❯][01]

[01]: /getting-started/index.html “入門” “GitHub 儲存庫”