Sobre o analisador de extrato bancário

Uma biblioteca. Siete formatos. Zero chamadas de rede.

TL;DR: Bank Statement Parser é uma biblioteca Python de código aberto que analisa sete formatos de extrato bancário (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 e PDF) em DataFrames pandas. Pipeline híbrido de PDF com verificação de saldo, REST API, enriquecimento, exportação contábil, mais de 27 mil tx/s.

Bank Statement Parser é uma biblioteca Python de código aberto que analisa extratos bancários de sete formatos em DataFrames pandas estruturados. O núcleo determinístico processa formatos estruturados localmente, sem chamadas de rede. O pipeline híbrido de PDF opcional usa LLMs locais (via Ollama) para extratos digitais e digitalizados.

Para Quem É?

Formatos Suportados

Formato Padrão Tipos de arquivo Parser/Método
CAMT.053 ISO 20022 Extrato Banco-para-Cliente .xml CamtParser
PAIN.001 ISO 20022 Iniciação de Transferência de Crédito .xml Pain001Parser
CSV Exportações bancárias genéricas .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 Padrão SWIFT .mt940, .sta Mt940Parser
PDF Extratos digitais e digitalizados .pdf smart_ingest()

Todos os formatos produzem DataFrames pandas normalizados com nomes de colunas consistentes, tornando o processamento posterior independente do formato.

Principais Recursos

Segurança e Privacidade

Desempenho

Métrica Valor
Throughput CAMT.053 27.000+ tx/s
Throughput PAIN.001 52.000+ tx/s
Latência por transação (CAMT) 37 microssegundos
Latência por transação (PAIN.001) 19 microssegundos
Tempo para o primeiro resultado < 2 ms
Escala de memória (1K-50K tx) Constante (streaming)
Cobertura de testes 100% de cobertura de ramificação
Testes 718 em 29 arquivos de teste

Comece Agora

Comece com a instalação e exemplos ❯

"Repositório GitHub"