Analizator extras de cont

Analizați CAMT.053, PAIN.001, CSV, OFX, QFX și MT940 în Pandas DataFrames. 27K+ tx/s, streaming, redarea PII, zero apeluri de rețea.

pip install bankstatementparser

Bank Statement Parser este o bibliotecă Python open-source care analizează extrase bancare din șapte formate (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 și PDF) în DataFrames pandas structurate. Toată procesarea rulează local — ieșire deterministă, redactare automată a PII și un pipeline hibrid opțional pentru PDF care apelează LLM-uri locale atunci când este necesar.

Începeți în câteva secunde

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

O bibliotecă, șapte formate

Analizați CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 și PDF în DataFrames pandas structurate cu un singur API unificat. Nu trebuie să instalați pachete separate pentru fiecare format.

FuncționalitateBank Statement ParserOSS cu format unic (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Formate suportate7, API unificat1 fiecareMulte (prin OCR)
Suport PDFPipeline hibrid (deterministic + LLM + vision)NuDa (OCR cloud)
Confidențialitatea datelor100% local (LLM-urile rulează local prin Ollama)100% localDate trimise extern
CostGratuit, Apache 2.0Gratuit49–1.000+ $/lună
Verificarea solduluiRegula de Aur (sold inițial + credite − debite = sold final)NuVariază
Redactare PIIÎncorporată, activată implicitNuVariază
StreamingMemorie limitatăNuN/A
REST APIMicroserviciu FastAPI încorporatNuDa
DeduplicareHash-uri idempotente ale tranzacțiilorNuParțial
Export registruhledger + beancountNuNu

Pipeline hibrid pentru PDF

Bank Statement Parser v0.0.5+ include un pipeline hibrid cu trei căi pentru extrasele bancare în format PDF:

Fiecare extracție este verificată cu Regula de Aur: opening balance + credits − debits == closing balance.

Creat pentru migrarea ISO 20022

SWIFT a stabilit termene ferme: toate instituțiile financiare trebuie să primească CAMT.053 până în noiembrie 2027, iar MT940/MT942/MT950 va fi retras complet până în noiembrie 2028. Bank Statement Parser gestionează atât formatele vechi MT940, cât și formatele moderne ISO 20022 (CAMT.053, PAIN.001) într-un singur API, astfel încât pipeline-ul de analiză funcționează în timpul tranziției și după aceea.

Performanță

De ce Bank Statement Parser?

Construit pentru producție

Bank Statement Parser este conceput pentru echipe de trezorerie, dezvoltatori fintech și ofițeri de conformitate care procesează date financiare sensibile. Biblioteca este utilizată în pipeline-uri de migrare MT940-la-CAMT, sisteme automate de reconciliere, ingestie de extrase PDF și fluxuri de audit de reglementare în cadrul instituțiilor financiare.

Evaluați alternative? Vedeți cum se compară Bank Statement Parser ❯ | Explorați cazuri reale de utilizare ❯

Începeți ❯ | Vizualizați pe GitHub ❯ | Vizualizați pe PyPI ❯