Kontoauszugsparer

Analysieren Sie CAMT.053, PAIN.001, CSV, OFX, QFX und MT940 in Pandas-DataFrames. 27.000+ Übertragungen/s, Streaming, PII-Redaktion, keine Netzwerkanrufe.

pip bankstatementparser installieren

Bank Statement Parser ist eine Open-Source-Python-Bibliothek, die Kontoauszüge in sieben Formaten (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 und PDF) in strukturierte pandas DataFrames überführt. Die gesamte Verarbeitung läuft lokal — deterministische Ausgabe, automatische PII-Schwärzung und eine optionale hybride PDF-Pipeline, die bei Bedarf lokale LLMs nutzt.

In Sekunden starten

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Eine Bibliothek, sieben Formate

Parsen Sie CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 und PDF in strukturierte pandas DataFrames mit einer einzigen, einheitlichen API. Sie müssen keine separaten Pakete für jedes Format installieren.

MerkmalBank Statement ParserEinzelformat-OSS (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Unterstützte Formate7, einheitliche APIJeweils 1Viele (via OCR)
PDF-UnterstützungHybride Pipeline (deterministisch + LLM + Vision)NeinJa (Cloud-OCR)
Datenschutz100 % lokal (LLMs laufen lokal via Ollama)100 % lokalDaten werden extern gesendet
KostenKostenlos, Apache 2.0Kostenlos49–1.000+ $/Monat
SaldoprüfungGolden Rule (Anfangssaldo + Gutschriften − Belastungen = Endsaldo)NeinUnterschiedlich
PII-SchwärzungIntegriert, standardmäßig aktivNeinUnterschiedlich
StreamingBegrenzter SpeicherNeinN/A
REST APIIntegrierter FastAPI-MicroserviceNeinJa
DeduplizierungIdempotente Transaktions-HashesNeinTeilweise
Ledger-Exporthledger + beancountNeinNein

Hybride PDF-Pipeline

Bank Statement Parser v0.0.5+ enthält eine dreistufige hybride Pipeline für PDF-Kontoauszüge:

Jede Extraktion wird mit der Golden Rule geprüft: opening balance + credits − debits == closing balance.

Entwickelt für die ISO 20022-Migration

SWIFT hat feste Fristen gesetzt: Alle Finanzinstitute müssen CAMT.053 bis November 2027 empfangen können, und MT940/MT942/MT950 wird bis November 2028 vollständig eingestellt. Bank Statement Parser verarbeitet sowohl das alte MT940 als auch moderne ISO 20022-Formate (CAMT.053, PAIN.001) in einer einzigen API. So funktioniert Ihre Parsing-Pipeline während der Umstellung und darüber hinaus.

Leistung

Warum Bank Statement Parser?

Gebaut für die Produktion

Bank Statement Parser ist für Treasury-Teams, Fintech-Entwickler und Compliance-Beauftragte konzipiert, die sensible Finanzdaten verarbeiten. Die Bibliothek wird in MT940-zu-CAMT-Migrationspipelines, automatisierten Abstimmungssystemen, PDF-Auszugsverarbeitung und regulatorischen Prüfabläufen in Finanzinstituten eingesetzt.

Alternativen prüfen? Sehen Sie, wie Bank Statement Parser im Vergleich abschneidet ❯ | Entdecken Sie reale Anwendungsfälle ❯

Erste Schritte ❯ | Auf GitHub ansehen ❯ | Auf PyPI ansehen ❯