Volg de ontwikkeling van de bankafschriftparser. Abonneer je via RSS of bekijk de GitHub-repository voor releasemeldingen.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 15-03-2026 (laatste)
- Parallelle bestandsparsering toegevoegd met
parse_files_parallel()met behulp van ProcessPoolExecutor. - Echte streaming toegevoegd voor grote PAIN.001-bestanden (50 MB+) met begrensd geheugen.
- Prestatieoptimalisaties: CAMT-doorvoer overschrijdt nu 27.000 tx/s, PAIN.001 overschrijdt 52.000 tx/s.
- Toegevoegd
Deduplicatorklasse voor het detecteren van exacte duplicaten en vermoedelijke overeenkomsten met betrouwbaarheidsscores. - Toegevoegd
from_string()Enfrom_bytes()methoden voor parseren in het geheugen zonder schijf-I/O. - Toegevoegd
iter_secure_xml_entries()voor veilige ZIP-archiefverwerking. - Uitgebreide CI met handhaving van prestatiedrempels.
v0.0.3 — 20-11-2025
- Ondersteuning voor CSV-, OFX-, QFX- en MT940-parser toegevoegd.
- Automatische detectie van formaten toegevoegd met
detect_statement_format()Encreate_parser(). - PII-redactie toegevoegd (standaard ingeschakeld in CLI- en streamingmodus).
- Exporthulpmiddelen toegevoegd voor CSV, JSON en Excel.
- Optionele Polars DataFrame-ondersteuning toegevoegd.
- Uitgebreide testsuite naar 718 tests met 100% vestigingsdekking.
v0.0.2 — 10-06-2025
- PAIN.001-parser toegevoegd (
Pain001Parser) voor ISO 20022-initiatiebestanden voor overboekingen. - CLI-interface toegevoegd (
python -m bankstatementparser.cli). - Streamingmodus toegevoegd met
parse_streaming(). - Toegevoegde invoervalidatie en bestandsgroottelimieten.
v0.0.1 — 15-01-2025
- Eerste uitgave.
- CAMT.053-parser (
CamtParser) voor bank-naar-klantafschriften volgens ISO 20022. - panda's DataFrame-uitvoer.
- Basisversterking van XML-beveiliging (XXE-bescherming, no_network).
Bekijk de volledige commitgeschiedenis op GitHub.