Siga el desarrollo del analizador de extractos bancarios. Suscríbase a través de RSS o mire el repositorio de GitHub para notificaciones de lanzamiento.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 2026-03-15
- Se agregó análisis de archivos paralelo con
parse_files_parallel()utilizando ProcessPoolExecutor. - Se agregó transmisión real para archivos PAIN.001 grandes (50 MB+) con memoria limitada.
- Optimizaciones de rendimiento: el rendimiento de CAMT ahora supera los 27.000 tx/s, PAIN.001 supera los 52.000 tx/s.
- Agregado
Deduplicatorclase para detectar duplicados exactos y coincidencias sospechosas con puntuaciones de confianza. - Agregado
from_string()yfrom_bytes()métodos para el análisis en memoria sin E/S de disco. - Agregado
iter_secure_xml_entries()para el procesamiento seguro de archivos ZIP. - CI extendida con aplicación de umbral de rendimiento.
v0.0.3 — 2025-11-20
- Se agregó compatibilidad con analizadores CSV, OFX, QFX y MT940.
- Se agregó detección automática de formato con
detect_statement_format()ycreate_parser(). - Se agregó redacción de PII (activada de forma predeterminada en CLI y modo de transmisión).
- Se agregaron ayudas de exportación para CSV, JSON y Excel.
- Se agregó compatibilidad opcional con Polars DataFrame.
- Conjunto de pruebas ampliado a 718 pruebas con cobertura de sucursales del 100 %.
v0.0.2 — 2025-06-10
- Se agregó el analizador PAIN.001 (
Pain001Parser) para archivos de inicio de transferencia de crédito ISO 20022. - Interfaz CLI agregada (
python -m bankstatementparser.cli). - Modo de transmisión agregado con
parse_streaming(). - Se agregó validación de entrada y límites de tamaño de archivo.
v0.0.1 — 2025-01-15
- Lanzamiento inicial.
- Analizador CAMT.053 (
CamtParser) para extractos de banco a cliente ISO 20022. - Salida del DataFrame de pandas.
- Refuerzo de seguridad XML básico (protección XXE, no_network).
Vea el historial de confirmaciones completo en GitHub.