Om Bank Statement Parser

Ett bibliotek. Sju format. Noll nätverkssamtal.

TL;DR: Bank Statement Parser är ett Python-bibliotek med öppen källkod som analyserar sju kontoutdragsformat (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 och PDF) till pandas DataFrames. Hybrid-PDF-pipeline med saldoverifiering, REST API, berikande, ledger-export, 27K+ tx/s genomströmning.

Bank Statement Parser är ett Python-bibliotek med öppen källkod som analyserar kontoutdrag från sju format till strukturerade pandas DataFrames. Den deterministiska kärnan bearbetar strukturerade format lokalt utan nätverksanrop. Den valfria hybrid-PDF-pipelinen dirigerar via lokala LLM:er (via Ollama) för digitala och skannade utdrag.

Vem är detta till för?

Format som stöds

Format Standard Filtyper Parser/metod
CAMT.053 ISO 20022 Bank-to-Customer Statement .xml CamtParser
PAIN.001 ISO 20022 Credit Transfer Initiation .xml Pain001Parser
CSV Generisk bankexport .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 SWIFT standard .mt940, .sta Mt940Parser
PDF Digitala och skannade utdrag .pdf smart_ingest()

Alla format producerar normaliserade pandas DataFrames med konsekventa kolumnnamn, vilket gör nedströmsbearbetning formatagnostisk.

Nyckelfunktioner

Säkerhet och integritet

Prestanda

Mått Värde
CAMT.053 genomströmning 27 000+ tx/s
PAIN.001 genomströmning 52 000+ tx/s
Latens per transaktion (CAMT) 37 mikrosekunder
Latens per transaktion (PAIN.001) 19 mikrosekunder
Tid till första resultat < 2 ms
Minnesskalning (1K–50K tx) Konstant (streaming)
Testtäckning 100 % grenstäckning
Tester 718 över 29 testfiler

Börja bygga

Kom igång med installation och exempel ❯

"GitHub Repository"