O analyzátoru bankovních výpisů

Jedna knihovna. Šest formátů. Nulová síťová volání.

TL;DR: Bank Statement Parser je open-source Python knihovna, která analyzuje sedm formátů bankovních výpisů (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 a PDF) do pandas DataFrames. Hybridní PDF pipeline s ověřením zůstatku, REST API, obohacení, export do účetnictví, propustnost 27K+ tx/s.

Bank Statement Parser je open-source Python knihovna, která analyzuje bankovní výpisy ze sedmi formátů do strukturovaných pandas DataFrames. Deterministické jádro zpracovává strukturované formáty lokálně bez síťových volání. Volitelný hybridní PDF pipeline směruje přes lokální LLM (prostřednictvím Ollama) pro digitální a naskenované výpisy.

Pro koho je to určeno?

Podporované formáty

Formát Standard Typy souborů Parser/Metoda
CAMT.053 ISO 20022 Bank-to-Customer Statement .xml CamtParser
PAIN.001 ISO 20022 Credit Transfer Initiation .xml Pain001Parser
CSV Generické bankovní exporty .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 Standard SWIFT .mt940, .sta Mt940Parser
PDF Digitální a naskenované výpisy .pdf smart_ingest()

Všechny formáty produkují normalizované pandas DataFrames s konzistentními názvy sloupců, což činí následné zpracování nezávislým na formátu.

Klíčové funkce

Zabezpečení a soukromí

Výkon

Metrika Hodnota
Propustnost CAMT.053 27 000+ tx/s
Propustnost PAIN.001 52 000+ tx/s
Latence na transakci (CAMT) 37 mikrosekund
Latence na transakci (PAIN.001) 19 mikrosekund
Čas do prvního výsledku < 2 ms
Škálování paměti (1K–50K tx) Konstantní (streaming)
Pokrytí testy 100% pokrytí větví
Testy 718 v 29 testovacích souborech

Začněte tvořit

Začněte s instalací a příklady ❯