Tungkol sa Bank Statement Parser

Isang Library. Anim na Format. Zero Network Calls.

TL;DR: Ang Bank Statement Parser ay isang open-source na Python library na nag-pa-parse ng pitong bank statement format (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940, at PDF) sa mga pandas DataFrames. Hybrid PDF pipeline na may beripikasyon ng balanse, REST API, enrichment, ledger export, 27K+ tx/s throughput.

Ang Bank Statement Parser ay isang open-source na Python library na nag-pa-parse ng mga bank statement mula sa pitong format sa structured pandas DataFrames. Pinoproseso ng deterministikong core ang mga structured na format nang lokal na walang tawag sa network. Ang opsyonal na hybrid PDF pipeline ay dumadaan sa mga lokal na LLM (sa pamamagitan ng Ollama) para sa mga digital at na-scan na statement.

Para Kanino Ito?

Mga Sinusuportahang Format

Format Pamantayan Mga Uri ng File Parser/Paraan
CAMT.053 ISO 20022 Bank-to-Customer Statement .xml CamtParser
PAIN.001 ISO 20022 Credit Transfer Initiation .xml Pain001Parser
CSV Mga generic na bank export .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 Pamantayan ng SWIFT .mt940, .sta Mt940Parser
PDF Mga digital at na-scan na statement .pdf smart_ingest()

Lahat ng format ay gumagawa ng mga normalised na pandas DataFrames na may pare-parehong mga pangalan ng column, kaya format-agnostic ang downstream processing.

Mga Pangunahing Kakayahan

Seguridad at Privacy

Pagganap

Sukatan Halaga
CAMT.053 throughput 27,000+ tx/s
PAIN.001 throughput 52,000+ tx/s
Per-transaction latency (CAMT) 37 microseconds
Per-transaction latency (PAIN.001) 19 microseconds
Oras hanggang sa unang resulta < 2 ms
Pag-scale ng memorya (1K-50K tx) Constant (streaming)
Saklaw ng pagsubok 100% branch coverage
Mga pagsubok 718 sa 29 na test file

Simulan ang Pagbuo

Magsimula sa pag-install at mga halimbawa ❯

"GitHub Repository"