Pengurai Laporan Bank

Parsing CAMT.053, PAIN.001, CSV, OFX, QFX, dan MT940 ke dalam pandas DataFrames. 27K+ tx/s, streaming, redaksi PII, tanpa panggilan jaringan.

pip instal parser pernyataan bank

Bank Statement Parser adalah pustaka Python sumber terbuka yang mengurai laporan bank dari tujuh format (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940, dan PDF) ke dalam pandas DataFrames terstruktur. Semua pemrosesan berjalan secara lokal — keluaran deterministik, redaksi PII otomatis, dan pipeline PDF hibrida opsional yang menggunakan LLM lokal bila diperlukan.

Mulai dalam Hitungan Detik

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Satu Pustaka, Tujuh Format

Urai CAMT.053, PAIN.001, CSV, OFX, QFX, MT940, dan PDF ke dalam pandas DataFrames terstruktur dengan satu API terpadu. Tidak perlu menginstal paket terpisah untuk setiap format.

FiturBank Statement ParserOSS format tunggal (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Format didukung7, API terpadumasing-masing 1Banyak (via OCR)
Dukungan PDFPipeline hibrida (deterministik + LLM + vision)TidakYa (cloud OCR)
Privasi data100% lokal (LLM berjalan lokal via Ollama)100% lokalData dikirim ke pihak ketiga
BiayaGratis, Apache 2.0Gratis$49-$1.000+/bln
Verifikasi saldoGolden Rule (saldo awal + kredit − debit = saldo akhir)TidakBervariasi
Redaksi PIIBawaan, aktif secara defaultTidakBervariasi
StreamingMemori terbatasTidakT/A
REST APIMicroservice FastAPI bawaanTidakYa
DeduplikasiHash transaksi idempotenTidakSebagian
Ekspor ledgerhledger + beancountTidakTidak

Pipeline PDF Hibrida

Bank Statement Parser v0.0.5+ menyertakan pipeline hibrida tiga jalur untuk laporan bank PDF:

Setiap ekstraksi diverifikasi dengan Golden Rule: opening balance + credits − debits == closing balance.

Dibangun untuk Migrasi ISO 20022

SWIFT telah menetapkan tenggat waktu: semua lembaga keuangan harus menerima CAMT.053 paling lambat November 2027, dan MT940/MT942/MT950 akan dihentikan sepenuhnya pada November 2028. Bank Statement Parser menangani MT940 lama dan format ISO 20022 modern (CAMT.053, PAIN.001) dalam satu API, sehingga pipeline penguraian Anda berfungsi selama transisi dan setelahnya.

Performa

Mengapa Bank Statement Parser?

Dibangun untuk Produksi

Bank Statement Parser dirancang untuk tim perbendaharaan, pengembang fintech, dan petugas kepatuhan yang memproses data keuangan sensitif. Pustaka ini digunakan dalam pipeline migrasi MT940-ke-CAMT, sistem rekonsiliasi otomatis, ingesti laporan PDF, dan alur kerja audit regulasi di seluruh lembaga keuangan.

Mengevaluasi alternatif? Lihat perbandingan Bank Statement Parser ❯ | Jelajahi kasus penggunaan nyata ❯

Mulai ❯ | Lihat di GitHub ❯ | Lihat di PyPI ❯