Parser voor bankafschriften

Parseer CAMT.053, PAIN.001, CSV, OFX, QFX en MT940 in panda's DataFrames. 27K+ tx/s, streaming, PII-redactie, geen netwerkoproepen.

pip installeer bankafschriftparser

Bank Statement Parser is een open-source Python-bibliotheek die bankafschriften uit zeven formaten (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 en PDF) parseert in gestructureerde pandas DataFrames. Alle verwerking vindt lokaal plaats — deterministische uitvoer, automatische PII-redactie en een optionele hybride PDF-pipeline die via lokale LLM's werkt wanneer nodig.

Ga binnen enkele seconden aan de slag

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Eén bibliotheek, zeven formaten

Parseer CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 en PDF in gestructureerde pandas DataFrames met één uniforme API. U hoeft geen aparte pakketten per formaat te installeren.

FunctieBank Statement ParserOSS met één formaat (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Ondersteunde formaten7, uniforme API1 per pakketVeel (via OCR)
PDF-ondersteuningHybride pipeline (deterministisch + LLM + vision)NeeJa (cloud OCR)
Gegevensprivacy100% lokaal (LLM's draaien lokaal via Ollama)100% lokaalGegevens extern verzonden
KostenGratis, Apache 2.0Gratis$49–$1.000+/maand
SaldoverificatieGolden Rule (beginsaldo + credit − debet = eindsaldo)NeeVarieert
PII-redactieIngebouwd, standaard ingeschakeldNeeVarieert
StreamingBeperkt geheugenNeeN.v.t.
REST APIIngebouwde FastAPI-microserviceNeeJa
OntdubbelingIdempotente transactie-hashesNeeSommige
Ledger-exporthledger + beancountNeeNee

Hybride PDF-pipeline

Bank Statement Parser v0.0.5+ bevat een drievoudige hybride pipeline voor PDF-bankafschriften:

Elke extractie wordt geverifieerd met de Golden Rule: opening balance + credits − debits == closing balance.

Gebouwd voor de ISO 20022-migratie

SWIFT heeft vaste deadlines gesteld: alle financiële instellingen moeten CAMT.053 ontvangen tegen november 2027. MT940/MT942/MT950 wordt volledig uitgefaseerd in november 2028. Bank Statement Parser verwerkt zowel legacy MT940 als moderne ISO 20022-formaten (CAMT.053, PAIN.001) in één API. Uw parsing-pipeline werkt tijdens de transitie en daarna.

Prestaties

Waarom Bank Statement Parser?

Gebouwd voor productie

Bank Statement Parser is ontworpen voor treasuryteams, fintech-ontwikkelaars en compliance-functionarissen die gevoelige financiële gegevens verwerken. De bibliotheek wordt gebruikt bij MT940-naar-CAMT-migratiepipelines, geautomatiseerde afstemmingssystemen, PDF-afschriftverwerking en workflows voor regelgevende audits bij financiële instellingen.

Alternatieven evalueren? Zie hoe Bank Statement Parser zich verhoudt ❯ | Ontdek praktijkvoorbeelden ❯

Aan de slag ❯ | Bekijk op GitHub ❯ | Bekijk op PyPI ❯