銀行取引明細書パーサーについて

図書館がひとつ。 6つのフォーマット。ネットワーク通話ゼロ。

TL;DR: Bank Statement Parser は、7 つの銀行取引明細書形式(CAMT.053、PAIN.001、CSV、OFX、QFX、MT940、PDF)を pandas DataFrame に解析するオープンソースの Python ライブラリです。残高検証付きハイブリッド PDF パイプライン、REST API、エンリッチメント、台帳エクスポート、27,000+ tx/s スループット。

Bank Statement Parser は、7 つの形式の銀行取引明細書を構造化された pandas DataFrame に解析するオープンソース Python ライブラリです。確定的コアはネットワーク呼び出しなしでローカルに構造化形式を処理します。オプションのハイブリッド PDF パイプラインは、デジタルおよびスキャン明細書をローカル LLM(Ollama 経由)で処理します。

対象ユーザー

サポートされている形式

形式 標準 ファイルの種類 パーサー/メソッド
CAMT.053 ISO 20022 銀行対顧客明細書 .xml CamtParser
PAIN.001 ISO 20022 送金指図 .xml Pain001Parser
CSV 一般的な銀行エクスポート .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 SWIFT 標準 .mt940, .sta Mt940Parser
PDF デジタルおよびスキャン明細書 .pdf smart_ingest()

すべての形式で、一貫した列名を持つ正規化された pandas DataFrame が生成されるため、後続の処理は形式に依存しません。

主要な機能

セキュリティとプライバシー

パフォーマンス

指標
CAMT.053 スループット 27,000+ tx/秒
PAIN.001 スループット 52,000+ tx/秒
トランザクションあたりのレイテンシ(CAMT) 37 マイクロ秒
トランザクションあたりのレイテンシ(PAIN.001) 19 マイクロ秒
最初の結果が得られるまでの時間 < 2 ms
メモリスケーリング(1K〜50K tx) 一定(ストリーミング)
テストカバレッジ 100% ブランチカバレッジ
テスト数 29 テストファイルで 718

構築を開始する

インストールと使用例を始める ❯

"GitHub リポジトリ"