Comece em segundos
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, pronto para uso
Uma biblioteca, seis formatos
Analise CAMT.053, PAIN.001, CSV, OFX, QFX e MT940 em DataFrames pandas estruturados com uma unica API unificada. Sem necessidade de instalar pacotes separados para cada formato.
| Funcionalidade | Analisador de extratos bancarios | OSS de formato unico (mt940, ofxparse) | SaaS (Ocrolus, Parseur) |
|---|---|---|---|
| Formatos suportados | 6, API unificada | 1 cada | Muitos (via OCR) |
| Privacidade dos dados | 100% local, zero chamadas de rede | 100% local | Dados enviados externamente |
| Custo | Gratuito, Apache 2.0 | Gratuito | $49-$1.000+/mes |
| Mascaramento PII | Integrado, ativado por padrao | Nao | Varia |
| Streaming | Memoria limitada | Nao | N/A |
| Seguranca ZIP | Protecao integrada | Nao | N/A |
| Deduplicacao | Integrada com scores de confianca | Nao | Parcial |
Construido para a migracao ISO 20022
SWIFT estabeleceu prazos firmes: todas as instituicoes financeiras devem receber CAMT.053 ate novembro de 2027, e MT940/MT942/MT950 serao completamente aposentados ate novembro de 2028. O Analisador de extratos bancarios lida com tanto o legado MT940 quanto os formatos modernos ISO 20022 (CAMT.053, PAIN.001) em uma unica API, para que seu pipeline de analise funcione durante a transicao e alem.
Desempenho
- 27.000+ transacoes/segundo para analise CAMT.053
- 52.000+ transacoes/segundo para analise PAIN.001
- < 2 ms tempo ate o primeiro resultado
- Memoria constante de 1K a 50K+ transacoes via streaming
- 467 testes com cobertura 100% de branches em Python 3.9 ate 3.14
Por que o Analisador de extratos bancarios?
- Deteccao automatica de formato:
detect_statement_format()identifica arquivos automaticamente ecreate_parser()retorna o parser correto. - Privacidade em primeiro lugar: Mascaramento de PII ativado por padrao. Campos sensiveis (nomes, IBANs, enderecos) sao mascarados na saida CLI. Ative com
--show-piiquando necessario. - Pronto para producao: Ingestao segura de ZIP (protecao contra bombas, rejeicao de entradas criptografadas), validacao de entrada e prevencao de travessia de caminho.
- Saida flexivel: Exporte para CSV, JSON, Excel ou converta para DataFrames Polars.
- Processamento paralelo: Analise multiplos arquivos simultaneamente com
parse_files_parallel().