Zacznij w kilka sekund
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, gotowy do uzycia
Jedna biblioteka, szesc formatow
Analizuj CAMT.053, PAIN.001, CSV, OFX, QFX i MT940 do strukturyzowanych DataFrames pandas za pomoca jednego, zunifikowanego API. Nie musisz instalowac oddzielnych pakietow dla kazdego formatu.
| Funkcjonalnosc | Parser wyciagow bankowych | OSS z jednym formatem (mt940, ofxparse) | SaaS (Ocrolus, Parseur) |
|---|---|---|---|
| Obslugiwane formaty | 6, zunifikowane API | 1 kazdy | Wiele (przez OCR) |
| Prywatnosc danych | 100% lokalnie, zero polaczen sieciowych | 100% lokalnie | Dane wysylane na zewnatrz |
| Koszt | Bezplatny, Apache 2.0 | Bezplatny | 49-1000+ $/mies. |
| Maskowanie PII | Wbudowane, wlaczone domyslnie | Nie | Rozne |
| Streaming | Ograniczona pamiec | Nie | N/D |
| Bezpieczenstwo ZIP | Wbudowana ochrona | Nie | N/D |
| Deduplikacja | Wbudowana z wynikami zaufania | Nie | Czesciowo |
Zbudowany pod migracje ISO 20022
SWIFT ustanowil twarde terminy: wszystkie instytucje finansowe musza moc odbierac CAMT.053 do listopada 2027, a MT940/MT942/MT950 zostana calkowicie wycofane do listopada 2028. Parser wyciagow bankowych obsluguje zarowno starszy MT940, jak i nowoczesne formaty ISO 20022 (CAMT.053, PAIN.001) w jednym API, dzieki czemu Twoj potok analizy dziala podczas przejscia i pozniej.
Wydajnosc
- 27 000+ transakcji/sekunde dla analizy CAMT.053
- 52 000+ transakcji/sekunde dla analizy PAIN.001
- < 2 ms czas do pierwszego wyniku
- Stala pamiec od 1K do 50K+ transakcji przez streaming
- 467 testow ze 100% pokryciem branchow na Python 3.9 do 3.14
Dlaczego Parser wyciagow bankowych?
- Automatyczne wykrywanie formatu:
detect_statement_format()automatycznie identyfikuje pliki, acreate_parser()zwraca odpowiedni parser. - Prywatnosc na pierwszym miejscu: Maskowanie PII jest wlaczone domyslnie. Wrazliwe pola (imiona, numery IBAN, adresy) sa maskowane w wyjsciu CLI. Wlacz z
--show-piigdy potrzeba. - Gotowy do produkcji: Bezpieczne przetwarzanie ZIP (ochrona przed bombami, odrzucanie zaszyfrowanych wpisow), walidacja danych wejsciowych i zapobieganie przechodzeniu sciezek.
- Elastyczne wyjscie: Eksport do CSV, JSON, Excel lub konwersja do DataFrames Polars.
- Przetwarzanie rownolegle: Analizuj wiele plikow jednoczesnie za pomoca
parse_files_parallel().