銀行取引明細書パーサー

CAMT.053、PAIN.001、CSV、OFX、QFX、MT940 を解析してパンダ データフレームに変換します。 27,000 以上の tx/s、ストリーミング、PII 編集、ネットワーク コールなし。

pip installbankstatementparser

Bank Statement Parser は、7 つの形式(CAMT.053、PAIN.001、CSV、OFX、QFX、MT940、PDF)の銀行取引明細書を構造化された pandas DataFrame に解析するオープンソースの Python ライブラリです。すべての処理はローカルで実行されます。確定的な出力、自動 PII 秘匿化、必要に応じてローカル LLM を経由するオプションのハイブリッド PDF パイプラインを備えています。

数秒で始められます

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

1 つのライブラリ、7 つのフォーマット

CAMT.053、PAIN.001、CSV、OFX、QFX、MT940、PDF を単一の統合 API で構造化された pandas DataFrame に解析します。形式ごとに個別のパッケージをインストールする必要はありません。

特徴Bank Statement Parser単一フォーマット OSS (mt940、ofxparse)SaaS (Ocrolus、Parseur)
サポート形式7、統合 API各 1 つ多数(OCR 経由)
PDF サポートハイブリッドパイプライン(確定的 + LLM + ビジョン)なしあり(クラウド OCR)
データプライバシー100% ローカル(LLM は Ollama 経由でローカル実行)100% ローカルデータが外部に送信される
料金無料、Apache 2.0無料$49〜$1,000+/月
残高検証ゴールデンルール(期首残高 + 入金 − 出金 = 期末残高)なしさまざま
PII 秘匿化内蔵、デフォルトでオンなしさまざま
ストリーミング制限されたメモリなし該当なし
REST API内蔵 FastAPI マイクロサービスなしあり
重複排除べき等なトランザクションハッシュなし一部あり
台帳エクスポートhledger + beancountなしなし

ハイブリッド PDF パイプライン

Bank Statement Parser v0.0.5 以降には、PDF 銀行取引明細書用の 3 パスハイブリッドパイプラインが含まれています。

すべての抽出はゴールデンルールで検証されます: opening balance + credits − debits == closing balance

ISO 20022 移行用に構築

SWIFT は明確な期限を設定しています。すべての金融機関は 2027 年 11 月までに CAMT.053 を受信する必要があり、MT940/MT942/MT950 は 2028 年 11 月までに完全に廃止されます。Bank Statement Parser はレガシーの MT940 と最新の ISO 20022 形式(CAMT.053、PAIN.001)の両方を単一の API で処理するため、解析パイプラインは移行中もその後も機能します。

パフォーマンス

なぜ Bank Statement Parser なのか?

本番環境向けに構築

Bank Statement Parser は、機密の財務データを処理する財務チーム、フィンテック開発者、コンプライアンス担当者向けに設計されています。MT940 から CAMT への移行パイプライン、自動調整システム、PDF 明細書の取り込み、金融機関全体の規制監査ワークフローで使用されています。

代替案を評価中ですか? Bank Statement Parser の比較をご覧ください ❯ | 実際のユースケースを探す ❯

はじめる ❯ | GitHub で見る ❯ | PyPI で見る ❯