Comience en segundos
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, listo para usar
Una biblioteca, seis formatos
Analice CAMT.053, PAIN.001, CSV, OFX, QFX y MT940 en DataFrames de pandas estructurados con una API única y unificada. No necesita instalar paquetes separados para cada formato.
| Característica | Analizador de extractos bancarios | OSS de formato único (mt940, ofxparse) | SaaS (Ocrolus, Parseur) |
|---|---|---|---|
| Formatos soportados | 6, API unificada | 1 cada uno | Muchos (vía OCR) |
| Privacidad de datos | 100% local, cero llamadas de red | 100% local | Datos enviados externamente |
| Coste | Gratuito, Apache 2.0 | Gratuito | $49-$1,000+/mes |
| Enmascaramiento de PII | Integrado, activo por defecto | No | Variable |
| Streaming | Memoria acotada | No | N/A |
| Seguridad ZIP | Protección integrada | No | N/A |
| Deduplicación | Integrada con puntuaciones de confianza | No | Parcial |
Preparado para la migración ISO 20022
SWIFT ha establecido plazos firmes: todas las instituciones financieras deben recibir CAMT.053 para noviembre de 2027, y MT940/MT942/MT950 se retirarán completamente en noviembre de 2028. El Analizador de extractos bancarios gestiona tanto el formato heredado MT940 como los formatos modernos ISO 20022 (CAMT.053, PAIN.001) en una única API, de modo que su pipeline de análisis funciona durante la transición y después.
Rendimiento
- 27,000+ transacciones/segundo para análisis CAMT.053
- 52,000+ transacciones/segundo para análisis PAIN.001
- < 2 ms tiempo hasta el primer resultado
- Memoria constante de 1K a 50K+ transacciones mediante streaming
- 467 pruebas con 100% de cobertura de ramas en Python 3.9 a 3.14
¿Por qué este analizador?
- Detección automática de formato:
detect_statement_format()identifica archivos automáticamente ycreate_parser()devuelve el analizador correcto. - Privacidad ante todo: El enmascaramiento de PII está activo por defecto. Los campos sensibles (nombres, IBANs, direcciones) se ocultan en la salida CLI. Active la visualización con
--show-piicuando lo necesite. - Listo para producción: Ingesta segura de ZIP (protección contra bombas, rechazo de entradas cifradas), validación de entrada y prevención de path traversal.
- Salida flexible: Exporte a CSV, JSON, Excel, o convierta a DataFrames de Polars.
- Procesamiento en paralelo: Analice múltiples archivos simultáneamente con
parse_files_parallel().