Segui lo sviluppo del parser estratto conto bancario. Iscriviti tramite RSS o guarda il repository GitHub per le notifiche di rilascio.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 15-03-2026 (più recente)
- Aggiunta l'analisi di file paralleli con
parse_files_parallel()utilizzando ProcessPoolExecutor. - Aggiunto il vero streaming per file PAIN.001 di grandi dimensioni (50 MB+) con memoria limitata.
- Ottimizzazioni delle prestazioni: il throughput CAMT ora supera 27.000 tx/s, PAIN.001 supera 52.000 tx/s.
- Aggiunto
Deduplicatorclasse per rilevare duplicati esatti e corrispondenze sospette con punteggi di confidenza. - Aggiunto
from_string()Efrom_bytes()metodi per l'analisi in memoria senza I/O del disco. - Aggiunto
iter_secure_xml_entries()per l'elaborazione sicura dell'archivio ZIP. - CI estesa con applicazione della soglia prestazionale.
v0.0.3 — 20/11/2025
- Aggiunto il supporto per parser CSV, OFX, QFX e MT940.
- Aggiunto rilevamento automatico del formato con
detect_statement_format()Ecreate_parser(). - Aggiunta la redazione PII (attiva per impostazione predefinita nella CLI e in modalità streaming).
- Aggiunti aiutanti di esportazione per CSV, JSON ed Excel.
- Aggiunto il supporto opzionale Polars DataFrame.
- Suite di test estesa a 718 test con copertura delle filiali del 100%.
v0.0.2 — 10/06/2025
- Aggiunto il parser PAIN.001 (
Pain001Parser) per i file di avvio del bonifico ISO 20022. - Aggiunta interfaccia CLI (
python -m bankstatementparser.cli). - Aggiunta la modalità streaming con
parse_streaming(). - Aggiunta la convalida dell'input e i limiti delle dimensioni dei file.
v0.0.1 — 15-01-2025
- Rilascio iniziale.
- Analizzatore CAMT.053 (
CamtParser) per gli estratti conto banca-cliente ISO 20022. - Uscita DataFrame di Panda.
- Rafforzamento della sicurezza XML di base (protezione XXE, no_network).
Visualizza la cronologia completa dei commit su GitHub.