Over de bankafschriftparser

Eén bibliotheek. Zeven formaten. Geen netwerkoproepen.

TL;DR: Bank Statement Parser is een open-source Python-bibliotheek die zeven bankafschriftformaten (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 en PDF) parseert in pandas DataFrames. Hybride PDF-pipeline met saldoverificatie, REST API, verrijking, ledger-export, 27K+ tx/s doorvoer.

Bank Statement Parser is een open-source Python-bibliotheek die bankafschriften uit zeven formaten parseert in gestructureerde pandas DataFrames. De deterministische kern verwerkt gestructureerde formaten lokaal zonder netwerkverkeer. De optionele hybride PDF-pipeline routeert via lokale LLM's (via Ollama) voor digitale en gescande afschriften.

Voor wie is dit bedoeld?

Ondersteunde formaten

Formaat Standaard Bestandstypen Parser/Methode
CAMT.053 ISO 20022 Bank-naar-klantafschrift .xml CamtParser
PAIN.001 ISO 20022 Credit Transfer Initiation .xml Pain001Parser
CSV Generieke bankexporten .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 SWIFT-standaard .mt940, .sta Mt940Parser
PDF Digitale en gescande afschriften .pdf smart_ingest()

Alle formaten produceren genormaliseerde pandas DataFrames met consistente kolomnamen. Dat maakt verdere verwerking formaatobafhankelijk.

Belangrijkste mogelijkheden

Beveiliging en privacy

Prestaties

Metriek Waarde
CAMT.053-doorvoer 27.000+ tx/s
PAIN.001-doorvoer 52.000+ tx/s
Latentie per transactie (CAMT) 37 microseconden
Latentie per transactie (PAIN.001) 19 microseconden
Tijd tot eerste resultaat < 2 ms
Geheugenschaling (1K–50K tx) Constant (streaming)
Testdekking 100% branchdekking
Tests 718 verdeeld over 29 testbestanden

Begin met bouwen

Aan de slag met installatie en voorbeelden ❯