Urmăriți dezvoltarea analizei extrasului de cont. Abonați-vă prin RSS sau urmăriți repozitivul GitHub pentru notificări de lansare.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 2026-03-15
- S-a adăugat analiza paralelă a fișierelor cu
parse_files_parallel()folosind ProcessPoolExecutor. - S-a adăugat fluxul real pentru fișiere mari PAIN.001 (50 MB+) cu memorie limitată.
- Optimizări de performanță: debitul CAMT depășește acum 27.000 tx/s, PAIN.001 depășește 52.000 tx/s.
- Adăugat
Deduplicatorclasă pentru detectarea dublurilor exacte și a potrivirilor suspecte cu scoruri de încredere. - Adăugat
from_string()şifrom_bytes()metode pentru analizarea în memorie fără I/O pe disc. - Adăugat
iter_secure_xml_entries()pentru procesarea securizată a arhivei ZIP. - CI extins cu aplicarea pragului de performanță.
v0.0.3 — 2025-11-20
- S-a adăugat suport pentru analizatorul CSV, OFX, QFX și MT940.
- A fost adăugată detectarea automată a formatului cu
detect_statement_format()şicreate_parser(). - S-a adăugat redarea PII (activată implicit în modul CLI și streaming).
- S-au adăugat ajutoare de export pentru CSV, JSON și Excel.
- S-a adăugat suport opțional Polars DataFrame.
- Suita de teste extinsă la 718 de teste cu acoperire de 100% a ramurilor.
v0.0.2 — 2025-06-10
- S-a adăugat analizatorul PAIN.001 (
Pain001Parser) pentru dosarele de inițiere a transferului de credite ISO 20022. - S-a adăugat interfață CLI (
python -m bankstatementparser.cli). - S-a adăugat modul de streaming cu
parse_streaming(). - S-au adăugat validarea intrării și limitele de dimensiune a fișierului.
v0.0.1 — 2025-01-15
- Lansare inițială.
- Analizor CAMT.053 (
CamtParser) pentru extrasele de cont de la bancă la client conform ISO 20022. - ieșire Pandas DataFrame.
- Întărirea securității XML de bază (protecție XXE, no_network).
Vizualizați istoricul complet al comitărilor pe GitHub.