Banka Ekstresi Ayrıştırıcı gelişimini takip edin. RSS aracılığıyla abone olun veya [GitHub deposunu] izleyin(https://github.com/sebastienrousseau/bankstatementparser) sürüm bildirimleri için.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 2026-03-15
- Paralel dosya ayrıştırma eklendi
parse_files_parallel()ProcessPoolExecutor'u kullanarak. - Sınırlı belleğe sahip büyük PAIN.001 dosyaları (50 MB+) için gerçek akış eklendi.
- Performans optimizasyonları: CAMT verimi artık 27.000 tx/s'yi, PAIN.001 ise 52.000 tx/s'yi aşıyor.
- Eklendi
DeduplicatorKesin kopyaları ve güven puanlarıyla şüpheli eşleşmeleri tespit etmek için sınıf. - Eklendi
from_string()Vefrom_bytes()Disk G/Ç'si olmadan bellek içi ayrıştırma yöntemleri. - Eklendi
iter_secure_xml_entries()Güvenli ZIP arşivi işleme için. - Performans eşiği uygulamasıyla genişletilmiş CI.
v0.0.3 — 2025-11-20
- CSV, OFX, QFX ve MT940 ayrıştırıcı desteği eklendi.
- Format otomatik algılama özelliği eklendi
detect_statement_format()Vecreate_parser(). - PII düzenlemesi eklendi (CLI ve akış modunda varsayılan olarak açıktır).
- CSV, JSON ve Excel için dışa aktarma yardımcıları eklendi.
- İsteğe bağlı Polars DataFrame desteği eklendi.
- Test paketi %100 branş kapsamıyla 718 teste genişletildi.
v0.0.2 — 2025-06-10
- PAIN.001 ayrıştırıcı eklendi (
Pain001Parser) ISO 20022 kredi transferi başlatma dosyaları için. - CLI arayüzü eklendi (
python -m bankstatementparser.cli). - Akış modu eklendi
parse_streaming(). - Giriş doğrulama ve dosya boyutu sınırları eklendi.
v0.0.1 — 2025-01-15
- İlk sürüm.
- CAMT.053 ayrıştırıcı (
CamtParser) ISO 20022 bankadan müşteriye bildirimler için. - pandaların DataFrame çıktısı.
- Temel XML güvenliğinin güçlendirilmesi (XXE koruması, ağ yok).
Taahhüt geçmişinin tamamını [GitHub]'da görüntüleyin(https://github.com/sebastienrousseau/bankstatementparser/commits/main).