Über den Kontoauszugsparser

Eine Bibliothek. Sieben Formate. Keine Netzwerkanrufe.

TL;DR: Bank Statement Parser ist eine Open-Source-Python-Bibliothek, die sieben Kontoauszugsformate (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 und PDF) in pandas DataFrames überführt. Hybride PDF-Pipeline mit Saldoprüfung, REST API, Anreicherung, Ledger-Export, 27.000+ TX/s Durchsatz.

Bank Statement Parser ist eine Open-Source-Python-Bibliothek, die Kontoauszüge aus sieben Formaten in strukturierte pandas DataFrames überführt. Der deterministische Kern verarbeitet strukturierte Formate lokal ohne Netzwerkaufrufe. Die optionale hybride PDF-Pipeline leitet bei digitalen und gescannten Auszügen über lokale LLMs (via Ollama).

Für wen ist das?

Unterstützte Formate

Format Standard Dateitypen Parser/Methode
CAMT.053 ISO 20022 Bank-to-Customer Statement .xml CamtParser
PAIN.001 ISO 20022 Credit Transfer Initiation .xml Pain001Parser
CSV Generische Bankexporte .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 SWIFT-Standard .mt940, .sta Mt940Parser
PDF Digitale und gescannte Auszüge .pdf smart_ingest()

Alle Formate erzeugen normalisierte pandas DataFrames mit konsistenten Spaltennamen. Die nachgelagerte Verarbeitung ist damit formatunabhängig.

Wichtigste Funktionen

Sicherheit und Datenschutz

Leistung

Kennzahl Wert
CAMT.053-Durchsatz 27.000+ TX/s
PAIN.001-Durchsatz 52.000+ TX/s
Latenz pro Transaktion (CAMT) 37 Mikrosekunden
Latenz pro Transaktion (PAIN.001) 19 Mikrosekunden
Zeit bis zum ersten Ergebnis < 2 ms
Speicherskalierung (1K–50K TX) Konstant (Streaming)
Testabdeckung 100 % Branch-Coverage
Tests 718 in 29 Testdateien

Jetzt loslegen

Erste Schritte mit Installation und Beispielen ❯

"GitHub-Repository"