In Sekunden starten
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, sofort einsatzbereit
Eine Bibliothek, sechs Formate
Verarbeiten Sie CAMT.053, PAIN.001, CSV, OFX, QFX und MT940 zu strukturierten pandas DataFrames -- mit einer einzigen, einheitlichen API. Sie muessen keine separaten Pakete fuer jedes Format installieren.
| Merkmal | Kontoauszug-Parser | Einzelformat-OSS (mt940, ofxparse) | SaaS (Ocrolus, Parseur) |
|---|---|---|---|
| Unterstuetzte Formate | 6, einheitliche API | jeweils 1 | Viele (via OCR) |
| Datenschutz | 100 % lokal, keine Netzwerkaufrufe | 100 % lokal | Daten werden extern gesendet |
| Kosten | Kostenlos, Apache 2.0 | Kostenlos | 49-1.000+ $/Monat |
| PII-Maskierung | Integriert, standardmaessig aktiv | Nein | Unterschiedlich |
| Streaming | Konstanter Speicherverbrauch | Nein | Nicht zutreffend |
| ZIP-Sicherheit | Integrierte Haertung | Nein | Nicht zutreffend |
| Deduplizierung | Integriert mit Konfidenzwerten | Nein | Teilweise |
Bereit fuer die ISO 20022 Migration
SWIFT hat verbindliche Fristen gesetzt: Alle Finanzinstitute muessen bis November 2027 CAMT.053 empfangen koennen, und MT940/MT942/MT950 werden bis November 2028 vollstaendig abgeloest. Kontoauszug-Parser unterstuetzt sowohl das bisherige MT940-Format als auch die modernen ISO 20022-Formate (CAMT.053, PAIN.001) ueber eine einzige API -- so funktioniert Ihre Verarbeitungspipeline sowohl waehrend der Umstellung als auch danach.
Leistung
- 27.000+ Transaktionen/Sekunde beim Parsen von CAMT.053
- 52.000+ Transaktionen/Sekunde beim Parsen von PAIN.001
- < 2 ms bis zum ersten Ergebnis
- Konstanter Speicherverbrauch von 1.000 bis 50.000+ Transaktionen dank Streaming
- 467 Tests mit 100 % Branch Coverage fuer Python 3.9 bis 3.14
Warum dieser Parser?
- Automatische Formaterkennung:
detect_statement_format()identifiziert Dateien automatisch undcreate_parser()liefert den passenden Parser. - Datenschutz an erster Stelle: PII-Maskierung ist standardmaessig aktiv. Sensible Felder (Namen, IBANs, Adressen) werden in der CLI-Ausgabe unkenntlich gemacht. Bei Bedarf koennen Sie mit
--show-piidie vollstaendigen Daten anzeigen. - Produktionsreif: Sichere ZIP-Verarbeitung (Schutz vor ZIP-Bomben, Ablehnung verschluesselter Eintraege), Eingabevalidierung und Schutz vor Path-Traversal-Angriffen.
- Flexible Ausgabe: Export nach CSV, JSON, Excel oder Konvertierung zu Polars DataFrames.
- Parallele Verarbeitung: Mehrere Dateien gleichzeitig parsen mit
parse_files_parallel().
Erste Schritte ❯ | Auf GitHub ansehen ❯ | Auf PyPI ansehen ❯