Despre analizatorul extras de cont

O singură bibliotecă. Șase formate. Zero apeluri de rețea.

TL;DR: Bank Statement Parser este o bibliotecă Python open-source care analizează șapte formate de extras de cont (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 și PDF) în pandas DataFrames. Pipeline hibrid pentru PDF cu verificarea soldului, REST API, îmbogățire, export registru, debit de 27K+ tx/s.

Bank Statement Parser este o bibliotecă Python open-source care analizează extrase bancare din șapte formate în DataFrames pandas structurate. Nucleul deterministic procesează formatele structurate local, fără apeluri de rețea. Pipeline-ul hibrid opțional pentru PDF rutează prin LLM-uri locale (prin Ollama) pentru extrasele digitale și scanate.

Pentru cine este?

Formate suportate

Format Standard Tipuri de fișiere Parser/Metodă
CAMT.053 ISO 20022 Extras bancă-către-client .xml CamtParser
PAIN.001 ISO 20022 Inițiere transfer de credit .xml Pain001Parser
CSV Exporturi bancare generice .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 Standard SWIFT .mt940, .sta Mt940Parser
PDF Extrase digitale și scanate .pdf smart_ingest()

Toate formatele produc DataFrames pandas normalizate cu nume de coloane consistente, făcând procesarea ulterioară independentă de format.

Funcționalități principale

Securitate și confidențialitate

Performanță

Metrică Valoare
Debit CAMT.053 27.000+ tx/s
Debit PAIN.001 52.000+ tx/s
Latență per tranzacție (CAMT) 37 microsecunde
Latență per tranzacție (PAIN.001) 19 microsecunde
Timp până la primul rezultat < 2 ms
Scalare memorie (1K-50K tx) Constantă (streaming)
Acoperire teste 100% acoperire ramuri
Teste 718 în 29 fișiere de test

Începeți să construiți

[Începeți cu instalarea și exemplele ❯][01]

[01]: /getting-started/index.html “Primii pași” “Depozit GitHub”