銀行對帳單解析器

將 CAMT.053、PAIN.001、CSV、OFX、QFX 和 MT940 解析為 pandas DataFrame。 27K+ tx/s、串流、PII 修訂、零網路呼叫。

pip 安裝銀行對帳單解析器

Bank Statement Parser 是一個開源 Python 函式庫,可將七種格式(CAMT.053、PAIN.001、CSV、OFX、QFX、MT940 及 PDF)的銀行對帳單解析為結構化的 pandas DataFrame。所有處理都在本機執行——確定性輸出、自動 PII 遮蔽,以及可選的混合 PDF 管線,在需要時透過本機 LLM 進行路由。

幾秒鐘即可開始

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

一套函式庫,七種格式

透過單一統一 API 將 CAMT.053、PAIN.001、CSV、OFX、QFX、MT940 及 PDF 解析為結構化的 pandas DataFrame。無需為每種格式分別安裝套件。

功能Bank Statement Parser單一格式 OSS(mt940、ofxparse)SaaS(Ocrolus、Parseur)
支援格式7 種,統一 API各 1 種多種(透過 OCR)
PDF 支援混合管線(確定性 + LLM + 視覺)有(雲端 OCR)
資料隱私100% 本機(LLM 透過 Ollama 本機執行)100% 本機資料傳送至外部
成本免費,Apache 2.0免費$49–$1,000+/月
餘額驗證黃金法則(期初 + 貸方 − 借方 = 期末)視情況而定
PII 遮蔽內建,預設啟用視情況而定
串流處理固定記憶體用量不適用
REST API內建 FastAPI 微服務
去重冪等交易雜湊部分
帳本匯出hledger + beancount

混合 PDF 管線

Bank Statement Parser v0.0.5+ 提供三路徑混合管線,用於處理 PDF 銀行對帳單:

每次擷取都透過黃金法則進行驗證:opening balance + credits − debits == closing balance

專為 ISO 20022 遷移打造

SWIFT 已設定明確期限:所有金融機構必須在 2027 年 11 月前接收 CAMT.053,MT940/MT942/MT950 將在 2028 年 11 月前完全停用。Bank Statement Parser 在單一 API 中同時支援傳統 MT940 及現代 ISO 20022 格式(CAMT.053、PAIN.001),讓您的解析管線在過渡期間及之後都能正常運作。

效能

為何選擇 Bank Statement Parser?

專為正式環境打造

Bank Statement Parser 專為處理敏感財務資料的財務團隊、金融科技開發人員及合規人員設計。該函式庫廣泛應用於 MT940 至 CAMT 遷移管線、自動對帳系統、PDF 對帳單匯入及金融機構的監管稽核工作流程。

正在評估替代方案? 查看 Bank Statement Parser 的比較結果 ❯ | 探索實際使用案例 ❯

開始使用 ❯ | 在 GitHub 上查看 ❯ | 在 PyPI 上查看 ❯