v0.0.4 (Última versión)
- Añadido análisis paralelo de archivos con
parse_files_parallel()usando ProcessPoolExecutor. - Añadido streaming real para archivos PAIN.001 grandes (50 MB+) con memoria acotada.
- Optimizaciones de rendimiento: el rendimiento de CAMT ahora supera las 27.000 tx/s, PAIN.001 supera las 52.000 tx/s.
- Añadida clase
Deduplicatorpara detectar duplicados exactos y coincidencias sospechosas con puntuaciones de confianza. - Añadidos métodos
from_string()yfrom_bytes()para análisis en memoria sin E/S de disco. - Añadido
iter_secure_xml_entries()para procesamiento seguro de archivos ZIP. - Ampliada la CI con aplicación de umbrales de rendimiento.
v0.0.3
- Añadido soporte para analizadores CSV, OFX, QFX y MT940.
- Añadida detección automática de formato con
detect_statement_format()ycreate_parser(). - Añadida redacción de datos personales (PII) (activada por defecto en CLI y modo streaming).
- Añadidos asistentes de exportación para CSV, JSON y Excel.
- Añadido soporte opcional de DataFrames con Polars.
- Suite de pruebas ampliada a 467 tests con 100% de cobertura de ramas.
v0.0.2
- Añadido analizador PAIN.001 (
Pain001Parser) para archivos de iniciación de transferencias de crédito ISO 20022. - Añadida interfaz CLI (
python -m bankstatementparser.cli). - Añadido modo streaming con
parse_streaming(). - Añadida validación de entrada y límites de tamaño de archivo.
v0.0.1
- Versión inicial.
- Analizador CAMT.053 (
CamtParser) para extractos bancarios ISO 20022 de banco a cliente. - Salida en DataFrame de pandas.
- Endurecimiento básico de seguridad XML (protección XXE, no_network).
Consulte el historial completo de commits en GitHub.