Informacje o analizatorze wyciągów bankowych

Jedna biblioteka. Sześć formatów. Zero połączeń sieciowych.

W skrócie: Bank Statement Parser to biblioteka Pythona typu open source, która parsuje siedem formatów wyciągów bankowych (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 i PDF) do pandas DataFrames. Hybrydowy pipeline PDF z weryfikacją salda, REST API, wzbogacanie danych, eksport do księgi, przepustowość 27 tys.+ tx/s.

Bank Statement Parser to biblioteka Pythona typu open source, która parsuje wyciągi bankowe z siedmiu formatów do ustrukturyzowanych pandas DataFrames. Deterministyczny rdzeń przetwarza formaty strukturalne lokalnie, bez żadnych połączeń sieciowych. Opcjonalny hybrydowy pipeline PDF kieruje dane przez lokalne modele LLM (przez Ollama) dla wyciągów cyfrowych i zeskanowanych.

Dla kogo jest ta biblioteka?

Obsługiwane formaty

Format Standard Typy plików Parser/metoda
CAMT.053 ISO 20022 Bank-to-Customer Statement .xml CamtParser
PAIN.001 ISO 20022 Credit Transfer Initiation .xml Pain001Parser
CSV Ogólne eksporty bankowe .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 Standard SWIFT .mt940, .sta Mt940Parser
PDF Wyciągi cyfrowe i zeskanowane .pdf smart_ingest()

Wszystkie formaty tworzą znormalizowane pandas DataFrames ze spójnymi nazwami kolumn, co sprawia, że dalsze przetwarzanie jest niezależne od formatu.

Kluczowe możliwości

Bezpieczeństwo i prywatność

Wydajność

Metryka Wartość
Przepustowość CAMT.053 27 000+ tx/s
Przepustowość PAIN.001 52 000+ tx/s
Opóźnienie na transakcję (CAMT) 37 mikrosekund
Opóźnienie na transakcję (PAIN.001) 19 mikrosekund
Czas do pierwszego wyniku < 2 ms
Skalowanie pamięci (1K-50K tx) Stałe (streaming)
Pokrycie testowe 100% pokrycie gałęzi
Testy 718 w 29 plikach testowych

Zacznij budować

[Rozpocznij od instalacji i przykładów ❯][01]

[01]: /getting-started/index.html “Pierwsze kroki” “Repozytorium GitHub”