Acerca del analizador de extractos bancarios

Una biblioteca. Siete formatos. Cero llamadas de red.

TL;DR: Bank Statement Parser es una biblioteca Python de código abierto que analiza siete formatos de extractos bancarios (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 y PDF) en pandas DataFrames. Pipeline híbrido para PDF con verificación de saldo, REST API, enriquecimiento, exportación contable, más de 27K tx/s de rendimiento.

Bank Statement Parser es una biblioteca Python de código abierto que analiza extractos bancarios en siete formatos y los convierte en pandas DataFrames estructurados. El núcleo determinista procesa formatos estructurados de forma local sin llamadas de red. El pipeline híbrido opcional para PDF recurre a LLMs locales (vía Ollama) para extractos digitales y escaneados.

¿Para quién es esto?

Formatos admitidos

Formato Estándar Tipos de archivo Analizador/Método
CAMT.053 ISO 20022 Extracto banco-a-cliente .xml CamtParser
PAIN.001 ISO 20022 Iniciación de transferencia de crédito .xml Pain001Parser
CSV Exportaciones bancarias genéricas .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 Estándar SWIFT .mt940, .sta Mt940Parser
PDF Extractos digitales y escaneados .pdf smart_ingest()

Todos los formatos producen pandas DataFrames normalizados con nombres de columna consistentes, lo que hace que el procesamiento posterior sea independiente del formato.

Capacidades clave

Seguridad y privacidad

Rendimiento

Métrica Valor
Rendimiento CAMT.053 27.000+ tx/s
Rendimiento PAIN.001 52.000+ tx/s
Latencia por transacción (CAMT) 37 microsegundos
Latencia por transacción (PAIN.001) 19 microsegundos
Tiempo hasta el primer resultado < 2 ms
Escalado de memoria (1K-50K tx) Constante (streaming)
Cobertura de pruebas 100% cobertura de ramas
Pruebas 718 en 29 archivos de prueba

Empiece a construir

Comience con la instalación y ejemplos ❯

"Repositorio GitHub"