Слідкуйте за розвитком аналізатора банківських виписок. Підпишіться через RSS або перегляньте репозиторій GitHub для повідомлень про випуск.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 2026-03-15
— Додано паралельний аналіз файлів за допомогоюparse_files_parallel()за допомогою ProcessPoolExecutor.
— Додано справжнє потокове передавання для великих файлів PAIN.001 (50 МБ+) з обмеженою пам’яттю.
— Оптимізація продуктивності: пропускна спроможність CAMT тепер перевищує 27 000 tx/s, PAIN.001 перевищує 52 000 tx/s.
- Додано
Deduplicatorклас для виявлення точних дублікатів і підозрюваних збігів з балами достовірності. - Додано
from_string()іfrom_bytes()методи аналізу в пам'яті без дискового введення-виведення. - Додано
iter_secure_xml_entries()для безпечної обробки ZIP-архіву. - Розширений CI із застосуванням порогового значення продуктивності.
v0.0.3 — 2025-11-20
— Додано підтримку парсерів CSV, OFX, QFX і MT940.
— Додано автоматичне визначення формату за допомогоюdetect_statement_format()іcreate_parser().
— Додано редагування ідентифікаційної інформації (увімкнено за замовчуванням у CLI та потоковому режимі).
— Додано помічники експорту для CSV, JSON і Excel.
— Додано додаткову підтримку Polars DataFrame.
— Розширено набір тестів до 718 тестів із 100% покриттям філій.
v0.0.2 — 2025-06-10
— Додано аналізатор PAIN.001 (Pain001Parser) для файлів ініціації кредитного переказу ISO 20022.
— Додано інтерфейс CLI (python -m bankstatementparser.cli).
— Додано потоковий режим зparse_streaming().
— Додано перевірку введення та обмеження розміру файлу.
v0.0.1 — 2025-01-15
- Початковий випуск.
- аналізатор CAMT.053 (
CamtParser) для виписок між банками та клієнтами згідно з ISO 20022. - Вивід pandas DataFrame. — Базове посилення безпеки XML (захист XXE, no_network).
Переглянути повну історію комітів на GitHub.