v0.0.4 (Nejnovější)
- Přidáno paralelní zpracování souborů pomocí
parse_files_parallel()s využitím ProcessPoolExecutor. - Přidán skutečný streaming pro velké soubory PAIN.001 (50 MB+) s omezenou pamětí.
- Optimalizace výkonu: propustnost CAMT nyní přesahuje 27 000 tx/s, PAIN.001 přesahuje 52 000 tx/s.
- Přidána třída
Deduplicatorpro detekci přesných duplicit a podezřelých shod se skóre spolehlivosti. - Přidány metody
from_string()afrom_bytes()pro analýzu v paměti bez diskových I/O operací. - Přidána funkce
iter_secure_xml_entries()pro bezpečné zpracování ZIP archivů. - Rozšířeno CI o vynucování výkonnostních prahů.
v0.0.3
- Přidána podpora parserů CSV, OFX, QFX a MT940.
- Přidána automatická detekce formátu pomocí
detect_statement_format()acreate_parser(). - Přidáno maskování PII (ve výchozím nastavení zapnuto v CLI a streamovacím režimu).
- Přidány pomocné funkce pro export do CSV, JSON a Excelu.
- Přidána volitelná podpora Polars DataFrame.
- Rozšířena testovací sada na 467 testů se 100% pokrytím větví.
v0.0.2
- Přidán parser PAIN.001 (
Pain001Parser) pro soubory iniciace kreditních převodů ISO 20022. - Přidáno rozhraní příkazového řádku (
python -m bankstatementparser.cli). - Přidán streamovací režim pomocí
parse_streaming(). - Přidána validace vstupů a omezení velikosti souborů.
v0.0.1
- Počáteční vydání.
- Parser CAMT.053 (
CamtParser) pro výpisy banka-zákazník dle ISO 20022. - Výstup do pandas DataFrame.
- Základní zabezpečení XML (ochrana před XXE, no_network).
Kompletní historii commitů najdete na GitHubu.