Overzicht
Bank Statement Parser is de enige open-source Python-bibliotheek die zeven bankafschriftformaten parseert — inclusief PDF via een hybride LLM-pipeline — met een uniforme API. Bibliotheken met één formaat (mt-940, ofxparse, pycamt) verwerken elk één formaat. SaaS-tools (Ocrolus, Parseur) bieden cloud-OCR, maar vereisen het extern verzenden van gegevens en kosten $49–$1.000+/maand.
Open-source alternatieven
Bibliotheken met één formaat
De meeste open-source parsers voor bankafschriften verwerken slechts één formaat. Als u meerdere formaten nodig heeft, moet u afzonderlijke bibliotheken installeren en onderhouden met verschillende API's, uitvoerschema's en updatecycli.
| Bibliotheek | Formaten | Uitvoer | Saldoverificatie | Ledger-export | |
|---|---|---|---|---|---|
| Bank Statement Parser | 7 formaten | Hybride pipeline | pandas DataFrame | Golden Rule | hledger, beancount |
| mt-940 (WoLpH) | Alleen MT940 | Nee | Python-objecten | Nee | Nee |
| ofxparse | Alleen OFX | Nee | Python-objecten | Nee | Nee |
| pycamt | Alleen CAMT.053 | Nee | Python-objecten | Nee | Nee |
| ofxtools | Alleen OFX v1/v2 | Nee | Python-objecten | Nee | Nee |
vs pyiso20022
pyiso20022 genereert Python-dataklassen uit de volledige ISO 20022-schemacatalogus. Het is een algemene ISO 20022-toolkit voor het werken met PACS-, PAIN-, CAMT- en ADMI-berichten.
Bank Statement Parser is specifiek gebouwd voor het parseren van bankafschriften naar DataFrames met productiefuncties:
| Functie | Bank Statement Parser | pyiso20022 |
|---|---|---|
| Doel | Afschriften parseren + extractie + export | ISO 20022-schematoolkit |
| Uitvoer | pandas/Polars DataFrames | Python-dataklassen |
| Formaten | 7 (inclusief PDF, niet-ISO) | Alleen ISO 20022 |
| PDF-ondersteuning | Hybride pipeline (deterministisch + LLM + vision) | Nee |
| Saldoverificatie | Golden Rule + multi-valuta | Nee |
| REST API | Ingebouwde FastAPI | Nee |
| Verrijking | LLM-gestuurde categorisatie | Nee |
| Ledger-export | hledger + beancount | Nee |
| Streaming | Ja (begrensd geheugen) | Nee |
| PII-redactie | Ingebouwd | Nee |
| Ontdubbeling | Idempotente transactie-hashes | Nee |
| CLI | Ja | Nee |
Gebruik pyiso20022 als u met de volledige ISO 20022-berichtencatalogus moet werken. Gebruik Bank Statement Parser als u bankafschriften moet parseren naar gestructureerde gegevens voor analyse, afstemming of rapportage.
SaaS-alternatieven
SaaS-tools zoals Ocrolus, Parseur en Sensible bieden het parseren van bankafschriften als cloudservice. Ze gebruiken doorgaans OCR om gescande PDF's te verwerken en ondersteunen honderden bankspecifieke formaten.
| Functie | Bank Statement Parser | SaaS-tools |
|---|---|---|
| Gegevensprivacy | 100% lokaal (LLM's via Ollama) | Gegevens verzonden naar de cloud |
| Kosten | Gratis (Apache 2.0) | $49–$1.000+/maand (vanaf Q1 2026) |
| Formaten | 7 (gestructureerd + PDF) | Honderden (via OCR) |
| PDF-ondersteuning | Ja — hybride pipeline (deterministisch + LLM + vision) | Ja (cloud-OCR) |
| Saldoverificatie | Golden Rule (automatisch) | Handmatig / beperkt |
| Latentie | <2 ms (gestructureerd), seconden (PDF+LLM) | 1–30 seconden |
| Doorvoer | 27.000+ tx/seconde (gestructureerd) | API-snelheidslimiet |
| REST API | Ingebouwde FastAPI | Eigen protocol |
| Ledger-export | hledger + beancount | Nee |
| Leverancierslock-in | Geen | Ja |
| Naleving | Lokale verwerking, SBOM | Verschilt per aanbieder |
LLM-gebaseerde parsers
Een groeiend aantal tools (Inscribe, Unstract, Mozilla.ai blueprints) gebruikt grote taalmodellen om bankafschriften te parseren, inclusief gescande PDF's. Toen Chase eind 2025 het formaat van hun consumentenafschriften opnieuw ontwierp, gingen template-gebaseerde parsers kapot terwijl LLM-parsers zich automatisch aanpasten.
Bank Statement Parser bevat nu een eigen hybride LLM-pipeline (v0.0.5+) die volledig lokaal draait via Ollama. Het combineert het beste van beide benaderingen:
- Gestructureerde formaten (XML, CSV, OFX, MT940): Deterministische parsing — 100% nauwkeurigheid, sub-milliseconde latentie, nul LLM-kosten.
- PDF-afschriften: Drievoudige routering (deterministische tabelextractie → tekst-LLM → vision-LLM) met automatische Golden Rule-verificatie om extractiefouten te detecteren.
In tegenstelling tot cloud-only LLM-parsers biedt de hybride pipeline van Bank Statement Parser:
- Draait 100% lokaal (Ollama) — geen gegevens verlaten uw machine.
- Verifieert elke extractie met saldoverificatie (Golden Rule).
- Ondersteunt interactieve beoordelingsmodus voor gemarkeerde afwijkingen.
- Produceert idempotente transactie-hashes voor veilige incrementele opname.
Wanneer u pure SaaS LLM-parsers kiest boven Bank Statement Parser: U ontvangt afschriften van honderden banken met sterk verschillende PDF-lay-outs en heeft directe dekking nodig zonder lokale infrastructuur.
Wanneer u Bank Statement Parser kiest: U heeft lokale verwerking nodig voor naleving. U wilt saldoverificatie. U heeft ledger-export nodig. U wilt nul doorlopende kosten.
Benchmarkmethodologie: Prestatiecijfers gemeten op Apple M2, Python 3.12, met een CAMT.053-bestand van 5.000 transacties (2,1 MB). Resultaten gemiddeld over 100 runs. Lokaal reproduceren: python -m bankstatementparser.bench. SaaS-latentie gebaseerd op gepubliceerde API-documentatie per april 2026.
Zie praktijkvoorbeelden ❯ | Plan uw MT940-naar-CAMT-migratie ❯