Följ utvecklingen av Bank Statement Parser. Prenumerera via RSS eller titta på GitHub-arkivet för releasemeddelanden.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 2026-03-15
- Lade till parallell filanalys med
parse_files_parallel()med ProcessPoolExecutor. - Lagt till sann streaming för stora PAIN.001-filer (50 MB+) med begränsat minne.
- Prestandaoptimeringar: CAMT-genomströmningen överstiger nu 27 000 tx/s, PAIN.001 överstiger 52 000 tx/s.
- Tillagd
Deduplicatorklass för att upptäcka exakta dubbletter och misstänkta matchningar med konfidenspoäng. - Tillagd
from_string()ochfrom_bytes()metoder för in-memory parsing utan disk I/O. - Tillagd
iter_secure_xml_entries()för säker ZIP-arkivbehandling. - Utökad CI med upprätthållande av prestationströskel.
v0.0.3 — 2025-11-20
- Lade till CSV, OFX, QFX och MT940 parserstöd.
- Lade till format automatisk upptäckt med
detect_statement_format()ochcreate_parser(). - Tillagd PII-redigering (på som standard i CLI och streamingläge).
- Lade till exporthjälpmedel för CSV, JSON och Excel.
- Tillagt valfritt Polars DataFrame-stöd.
- Utökad testsvit till 718 tester med 100 % grentäckning.
v0.0.2 — 2025-06-10
- Lade till PAIN.001 parser (
Pain001Parser) för ISO 20022 initieringsfiler för kreditöverföring. - Tillagt CLI-gränssnitt (
python -m bankstatementparser.cli). - Lade till streamingläge med
parse_streaming(). - Lade till indatavalidering och filstorleksgränser.
v0.0.1 — 2025-01-15
- Första release.
- CAMT.053 parser (
CamtParser) för ISO 20022 bank-till-kund-utdrag. - pandas DataFrame-utgång.
- Grundläggande XML-säkerhetshärdning (XXE-skydd, inget_nätverk).
Se den fullständiga historiken på GitHub.