Analisador de extrato bancário

Analise CAMT.053, PAIN.001, CSV, OFX, QFX e MT940 em DataFrames do pandas. 27K+ tx/s, streaming, redação de PII, zero chamadas de rede.

pip instalar analisador de extrato bancário

Bank Statement Parser é uma biblioteca Python de código aberto que analisa extratos bancários em sete formatos (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 e PDF) e os converte em DataFrames pandas estruturados. Todo o processamento é local — saída determinística, redação automática de PII e um pipeline híbrido de PDF opcional que usa LLMs locais quando necessário.

Comece em Segundos

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Uma Biblioteca, Sete Formatos

Analise CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 e PDF em DataFrames pandas estruturados com uma API única e unificada. Não é preciso instalar pacotes separados para cada formato.

RecursoBank Statement ParserOSS de formato único (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Formatos suportados7, API unificada1 cadaMuitos (via OCR)
Suporte a PDFPipeline híbrido (determinístico + LLM + visão)NãoSim (OCR na nuvem)
Privacidade de dados100% local (LLMs rodam localmente via Ollama)100% localDados enviados externamente
CustoGratuito, Apache 2.0GratuitoUS$ 49–US$ 1.000+/mês
Verificação de saldoGolden Rule (abertura + créditos − débitos = fechamento)NãoVaria
Redação de PIIIntegrada, ativada por padrãoNãoVaria
StreamingMemória limitadaNãoN/D
REST APIMicrosserviço FastAPI integradoNãoSim
DeduplicaçãoHashes de transação idempotentesNãoParcial
Exportação contábilhledger + beancountNãoNão

Pipeline Híbrido de PDF

O Bank Statement Parser v0.0.5+ inclui um pipeline híbrido de três caminhos para extratos bancários em PDF:

Toda extração é verificada com a Golden Rule: opening balance + credits − debits == closing balance.

Preparado para a Migração ISO 20022

A SWIFT definiu prazos firmes: todas as instituições financeiras devem receber CAMT.053 até novembro de 2027, e o MT940/MT942/MT950 será totalmente desativado até novembro de 2028. O Bank Statement Parser lida com o MT940 legado e os formatos modernos ISO 20022 (CAMT.053, PAIN.001) em uma única API. Seu pipeline de análise funciona durante a transição e depois dela.

Desempenho

Por Que Bank Statement Parser?

Feito para Produção

O Bank Statement Parser foi projetado para equipes de tesouraria, desenvolvedores de fintech e responsáveis por conformidade que processam dados financeiros sensíveis. A biblioteca é usada em pipelines de migração MT940 para CAMT, sistemas de reconciliação automatizada, ingestão de extratos em PDF e fluxos de trabalho de auditoria regulatória em instituições financeiras.

Avaliando alternativas? Veja como o Bank Statement Parser se compara ❯ | Explore casos de uso reais ❯

Comece agora ❯ | Ver no GitHub ❯ | Ver no PyPI ❯