Verfolgen Sie die Entwicklung des Bank Statement Parser. Abonnieren Sie über RSS oder schauen Sie sich das [GitHub-Repository] an (https://github.com/sebastienrousseau/bankstatementparser) für Freigabebenachrichtigungen.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 – 15.03.2026 (Neueste)
- Paralleles Parsen von Dateien mit hinzugefügt
parse_files_parallel()mit ProcessPoolExecutor. – Echtes Streaming für große PAIN.001-Dateien (50 MB+) mit begrenztem Speicher hinzugefügt. - Leistungsoptimierungen: Der CAMT-Durchsatz übersteigt jetzt 27.000 Tx/s, PAIN.001 übersteigt 52.000 Tx/s.
- Hinzugefügt
DeduplicatorKlasse zum Erkennen exakter Duplikate und vermuteter Übereinstimmungen mit Konfidenzwerten. - Hinzugefügt
from_string()Undfrom_bytes()Methoden für das In-Memory-Parsing ohne Festplatten-I/O. - Hinzugefügt
iter_secure_xml_entries()für die sichere Verarbeitung von ZIP-Archiven. – Erweitertes CI mit Durchsetzung von Leistungsschwellenwerten.
v0.0.3 – 20.11.2025
- CSV-, OFX-, QFX- und MT940-Parser-Unterstützung hinzugefügt.
- Automatische Formaterkennung mit hinzugefügt
detect_statement_format()Undcreate_parser(). – PII-Schwärzung hinzugefügt (standardmäßig aktiviert im CLI- und Streaming-Modus). - Exporthilfen für CSV, JSON und Excel hinzugefügt.
- Optionale Polars DataFrame-Unterstützung hinzugefügt.
- Erweiterte Testsuite auf 718 Tests mit 100 % Zweigstellenabdeckung.
v0.0.2 – 10.06.2025
- PAIN.001-Parser hinzugefügt (
Pain001Parser) für ISO 20022-Credit-Transfer-Initiierungsdateien. - CLI-Schnittstelle hinzugefügt (
python -m bankstatementparser.cli). - Streaming-Modus mit hinzugefügt
parse_streaming(). - Eingabevalidierung und Dateigrößenbeschränkungen hinzugefügt.
v0.0.1 – 15.01.2025
- Erstveröffentlichung.
- CAMT.053-Parser (
CamtParser) für Bank-zu-Kunden-Kontoauszüge nach ISO 20022. - Pandas DataFrame-Ausgabe.
- Grundlegende XML-Sicherheitshärtung (XXE-Schutz, no_network).
Sehen Sie sich den vollständigen Commit-Verlauf auf [GitHub] an.https://github.com/sebastienrousseau/bankstatementparser/commits/main).