Začněte za pár sekund
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, připravený k použití
Jedna knihovna, šest formátů
Analyzujte CAMT.053, PAIN.001, CSV, OFX, QFX a MT940 do strukturovaných pandas DataFrames pomocí jediného, jednotného API. Není třeba instalovat samostatné balíčky pro každý formát.
| Funkce | Analyzátor bankovních výpisů | Jednoformátový OSS (mt940, ofxparse) | SaaS (Ocrolus, Parseur) |
|---|---|---|---|
| Podporované formáty | 6, jednotné API | 1 každý | Mnoho (přes OCR) |
| Ochrana dat | 100% lokální, žádná síťová volání | 100% lokální | Data odesílána externě |
| Cena | Zdarma, Apache 2.0 | Zdarma | 49–1 000+ $/měs. |
| Maskování PII | Vestavěné, ve výchozím stavu zapnuto | Ne | Různé |
| Streaming | Omezená paměť | Ne | N/A |
| Zabezpečení ZIP | Vestavěné zpevnění | Ne | N/A |
| Deduplikace | Vestavěná s hodnocením spolehlivosti | Ne | Částečně |
Připraveno pro migraci ISO 20022
SWIFT stanovil pevné termíny: všechny finanční instituce musí přijímat CAMT.053 do listopadu 2027 a formáty MT940/MT942/MT950 budou plně vyřazeny do listopadu 2028. Analyzátor bankovních výpisů zpracovává jak starší MT940, tak moderní formáty ISO 20022 (CAMT.053, PAIN.001) v jediném API, takže váš zpracovatelský pipeline funguje během přechodu i po něm.
Výkon
- 27 000+ transakcí/sekundu pro analýzu CAMT.053
- 52 000+ transakcí/sekundu pro analýzu PAIN.001
- < 2 ms čas do prvního výsledku
- Konstantní paměť od 1K do 50K+ transakcí díky streaming
- 467 testů se 100% pokrytím větví pro Python 3.9 až 3.14
Proč tento analyzátor?
- Automatická detekce formátu:
detect_statement_format()automaticky identifikuje soubory acreate_parser()vrátí správný parser. - Ochrana soukromí na prvním místě: Maskování PII je ve výchozím stavu zapnuto. Citlivá pole (jména, IBAN, adresy) jsou maskována ve výstupu CLI. V případě potřeby povolte pomocí
--show-pii. - Připraveno pro produkci: Zabezpečené zpracování ZIP (ochrana před bombami, odmítnutí šifrovaných položek), validace vstupů a prevence procházení cest.
- Flexibilní výstup: Export do CSV, JSON, Excel nebo konverze do Polars DataFrames.
- Paralelní zpracování: Analyzujte více souborů současně pomocí
parse_files_parallel().