Analizador de extractos bancarios

Analice CAMT.053, PAIN.001, CSV, OFX, QFX y MT940 en pandas DataFrames. 27K+ tx/s, streaming, redacción de PII, cero llamadas de red.

pip instalar analizador de extractos bancarios

Bank Statement Parser es una biblioteca Python de código abierto que analiza extractos bancarios en siete formatos (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 y PDF) y los convierte en pandas DataFrames estructurados. Todo el procesamiento se ejecuta de forma local: salida determinista, redacción automática de PII y un pipeline híbrido opcional para PDF que recurre a LLMs locales cuando es necesario.

Comience en segundos

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Una biblioteca, siete formatos

Analice CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 y PDF en pandas DataFrames estructurados con una única API unificada. No necesita instalar paquetes separados para cada formato.

CaracterísticaBank Statement ParserOSS de formato único (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Formatos soportados7, API unificada1 cada unoMuchos (vía OCR)
Soporte PDFPipeline híbrido (determinista + LLM + visión)NoSí (OCR en la nube)
Privacidad de datos100% local (LLMs locales vía Ollama)100% localDatos enviados externamente
CostoGratis, Apache 2.0Gratis$49-$1,000+/mes
Verificación de saldoRegla de Oro (apertura + créditos − débitos = cierre)NoVaría
Redacción de PIIIntegrada, activada por defectoNoVaría
StreamingMemoria acotadaNoN/A
REST APIMicroservicio FastAPI integradoNo
DeduplicaciónHashes de transacción idempotentesNoParcial
Exportación contablehledger + beancountNoNo

Pipeline híbrido para PDF

Bank Statement Parser v0.0.5+ incluye un pipeline híbrido de tres rutas para extractos bancarios en PDF:

Cada extracción se verifica con la Regla de Oro: opening balance + credits − debits == closing balance.

Creado para la migración ISO 20022

SWIFT ha establecido plazos firmes: todas las instituciones financieras deben recibir CAMT.053 antes de noviembre de 2027, y MT940/MT942/MT950 se retirarán por completo en noviembre de 2028. Bank Statement Parser maneja tanto el formato heredado MT940 como los formatos modernos ISO 20022 (CAMT.053, PAIN.001) en una única API, para que su pipeline de análisis funcione durante la transición y después.

Rendimiento

¿Por qué Bank Statement Parser?

Construido para producción

Bank Statement Parser está diseñado para equipos de tesorería, desarrolladores fintech y responsables de cumplimiento que procesan datos financieros sensibles. La biblioteca se utiliza en pipelines de migración de MT940 a CAMT, sistemas de conciliación automatizados, ingesta de extractos PDF y flujos de auditoría regulatoria en instituciones financieras.

¿Evaluando alternativas? Vea cómo se compara Bank Statement Parser ❯ | Explore casos de uso del mundo real ❯

Comenzar ❯ | Ver en GitHub ❯ | Ver en PyPI ❯