Parser ng Bank Statement

I-parse ang CAMT.053, PAIN.001, CSV, OFX, QFX, at MT940 sa mga pandas DataFrames. 27K+ tx/s, streaming, PII redaction, zero na tawag sa network.

pip install bankstatementparser

Ang Bank Statement Parser ay isang open-source na Python library na nag-pa-parse ng mga bank statement mula sa pitong format (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940, at PDF) sa structured pandas DataFrames. Lahat ng pagpoproseso ay tumatakbo nang lokal — deterministikong output, awtomatikong PII redaction, at opsyonal na hybrid PDF pipeline na gumagamit ng lokal na mga LLM kapag kinakailangan.

Magsimula sa Ilang Segundo

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Isang Library, Pitong Format

I-parse ang CAMT.053, PAIN.001, CSV, OFX, QFX, MT940, at PDF sa mga structured pandas DataFrames gamit ang iisang, pinag-isang API. Hindi na kailangang mag-install ng hiwalay na mga pakete para sa bawat format.

TampokBank Statement ParserSingle-format OSS (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Mga format na sinusuportahan7, pinag-isang API1 bawat isaMarami (sa pamamagitan ng OCR)
Suporta sa PDFHybrid pipeline (deterministic + LLM + vision)WalaOo (cloud OCR)
Pagkapribado ng data100% lokal (tumatakbo ang mga LLM nang lokal sa pamamagitan ng Ollama)100% lokalIpinapadala ang data sa labas
GastosLibre, Apache 2.0Libre$49-$1,000+/buwan
Beripikasyon ng balanseGolden Rule (opening + credits − debits = closing)WalaNag-iiba
PII redactionBuilt-in, naka-on bilang defaultWalaNag-iiba
StreamingBounded memoryWalaN/A
REST APIBuilt-in na FastAPI microserviceWalaOo
DeduplikasyonIdempotent na transaction hashWalaBahagya
Ledger exporthledger + beancountWalaWala

Hybrid PDF Pipeline

Kasama sa Bank Statement Parser v0.0.5+ ang tatlong-landas na hybrid pipeline para sa mga PDF bank statement:

Bawat extraction ay bineberipika gamit ang Golden Rule: opening balance + credits − debits == closing balance.

Binuo para sa ISO 20022 Migration

Nagtakda ang SWIFT ng matatag na mga deadline: lahat ng institusyong pinansyal ay dapat makatanggap ng CAMT.053 bago ang Nobyembre 2027, at ang MT940/MT942/MT950 ay ganap na magre-retire sa Nobyembre 2028. Hinahawakan ng Bank Statement Parser ang parehong legacy na MT940 at modernong ISO 20022 na mga format (CAMT.053, PAIN.001) sa iisang API, kaya gumagana ang iyong parsing pipeline sa panahon ng transisyon at pagkatapos nito.

Pagganap

Bakit Bank Statement Parser?

Binuo para sa Produksyon

Ang Bank Statement Parser ay idinisenyo para sa mga treasury team, fintech developer, at mga opisyal ng pagsunod na nagpoproseso ng sensitibong data sa pananalapi. Ginagamit ang library sa MT940-to-CAMT migration pipeline, automated reconciliation system, PDF statement ingestion, at regulatory audit workflow sa mga institusyong pinansyal.

Sinusuri ang mga alternatibo? Tingnan kung paano naghahambing ang Bank Statement Parser ❯ | Tuklasin ang mga real-world na use case ❯

Magsimula ❯ | Tingnan sa GitHub ❯ | Tingnan sa PyPI ❯