Acompanhe o desenvolvimento do Analisador de Extratos Bancários. Assine via RSS ou assista ao repositório GitHub para notificações de lançamento.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 15/03/2026
- Adicionada análise paralela de arquivos com
parse_files_parallel()usando ProcessPoolExecutor. - Adicionado streaming verdadeiro para arquivos PAIN.001 grandes (50 MB+) com memória limitada.
- Otimizações de desempenho: a taxa de transferência CAMT agora excede 27.000 tx/s, PAIN.001 excede 52.000 tx/s.
- Adicionado
Deduplicatorclasse para detectar duplicatas exatas e suspeitas de correspondências com pontuações de confiança. - Adicionado
from_string()efrom_bytes()métodos para análise na memória sem E/S de disco. - Adicionado
iter_secure_xml_entries()para processamento seguro de arquivos ZIP. - CI estendido com aplicação de limite de desempenho.
v0.0.3 — 20/11/2025
- Adicionado suporte ao analisador CSV, OFX, QFX e MT940.
- Adicionada detecção automática de formato com
detect_statement_format()ecreate_parser(). - Adicionada redação de PII (ativada por padrão na CLI e no modo de streaming).
- Adicionados auxiliares de exportação para CSV, JSON e Excel.
- Adicionado suporte opcional para Polars DataFrame.
- Conjunto de testes expandido para 718 testes com cobertura de 100% das filiais.
v0.0.2 — 10/06/2025
- Adicionado analisador PAIN.001 (
Pain001Parser) para arquivos de início de transferência de créditos ISO 20022. - Adicionada interface CLI (
python -m bankstatementparser.cli). - Adicionado modo de streaming com
parse_streaming(). - Adicionados limites de validação de entrada e tamanho de arquivo.
v0.0.1 — 15/01/2025
- Lançamento inicial.
- Analisador CAMT.053 (
CamtParser) para extratos de banco para cliente ISO 20022. - saída do DataFrame do pandas.
- Fortalecimento básico de segurança XML (proteção XXE, no_network).
Veja o histórico completo de commits no GitHub.