Śledź rozwój analizatora wyciągów bankowych. Subskrybuj przez RSS lub obejrzyj repozytorium GitHub dla powiadomień o wydaniu.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 2026-03-15
- Dodano równoległe analizowanie plików za pomocą
parse_files_parallel()przy użyciu ProcessPoolExecutora. - Dodano prawdziwe przesyłanie strumieniowe dla dużych plików PAIN.001 (50 MB+) z ograniczoną pamięcią.
- Optymalizacja wydajności: przepustowość CAMT przekracza obecnie 27 000 tx/s, PAIN.001 przekracza 52 000 tx/s.
- Dodano
Deduplicatorklasa do wykrywania dokładnych duplikatów i podejrzanych dopasowań z wynikami zaufania. - Dodano
from_string()Ifrom_bytes()metody analizowania w pamięci bez operacji we/wy dysku. - Dodano
iter_secure_xml_entries()do bezpiecznego przetwarzania archiwum ZIP. — Rozszerzony CI z egzekwowaniem progów wydajności.
v0.0.3 — 20.11.2025
— Dodano obsługę analizatora CSV, OFX, QFX i MT940.
- Dodano automatyczne wykrywanie formatu za pomocą
detect_statement_format()Icreate_parser(). - Dodano redakcję PII (domyślnie włączona w trybie CLI i trybie przesyłania strumieniowego).
- Dodano pomocników eksportu dla CSV, JSON i Excel. — Dodano opcjonalną obsługę Polars DataFrame.
- Rozszerzony zestaw testów do 718 testów ze 100% pokryciem gałęzi.
v0.0.2 — 2025-06-10
- Dodano parser PAIN.001 (
Pain001Parser) dla plików inicjowania polecenia przelewu ISO 20022. - Dodano interfejs CLI (
python -m bankstatementparser.cli). - Dodano tryb przesyłania strumieniowego z
parse_streaming(). - Dodano sprawdzanie poprawności danych wejściowych i ograniczenia rozmiaru pliku.
v0.0.1 — 15.01.2025
- Pierwsze wydanie.
- Parser CAMT.053 (
CamtParser) w przypadku wyciągów bankowych dla klientów zgodnych z normą ISO 20022. - wyjście DataFrame pand.
- Podstawowe wzmocnienie bezpieczeństwa XML (ochrona XXE, no_network).
Wyświetl pełną historię zatwierdzeń w GitHub.