v0.0.4 (Mais recente)
- Adicionada analise paralela de arquivos com
parse_files_parallel()usando ProcessPoolExecutor. - Adicionado streaming real para arquivos PAIN.001 grandes (50 MB+) com memoria limitada.
- Otimizacoes de desempenho: throughput CAMT agora excede 27.000 transacoes/s, PAIN.001 excede 52.000 transacoes/s.
- Adicionada classe
Deduplicatorpara deteccao de duplicatas exatas e correspondencias suspeitas com scores de confianca. - Adicionados metodos
from_string()efrom_bytes()para analise em memoria sem operacoes de I/O em disco. - Adicionado
iter_secure_xml_entries()para processamento seguro de arquivos ZIP. - CI expandido com imposicao de limiares de desempenho.
v0.0.3
- Adicionado suporte a parsers CSV, OFX, QFX e MT940.
- Adicionada deteccao automatica de formato com
detect_statement_format()ecreate_parser(). - Adicionado mascaramento de PII (ativado por padrao no CLI e modo streaming).
- Adicionados auxiliares de exportacao para CSV, JSON e Excel.
- Adicionado suporte opcional a DataFrames Polars.
- Suite de testes expandida para 467 testes com cobertura 100% de branches.
v0.0.2
- Adicionado parser PAIN.001 (
Pain001Parser) para arquivos ISO 20022 de iniciacao de transferencia de credito. - Adicionada interface CLI (
python -m bankstatementparser.cli). - Adicionado modo streaming com
parse_streaming(). - Adicionada validacao de entrada e limites de tamanho de arquivo.
v0.0.1
- Lancamento inicial.
- Parser CAMT.053 (
CamtParser) para extratos ISO 20022 banco-para-cliente. - Saida DataFrame pandas.
- Protecao basica de seguranca XML (protecao XXE, no_network).
Veja o historico completo de commits no GitHub.