v0.0.4 (Aktuell)
- Paralleles Parsen von Dateien mit
parse_files_parallel()unter Verwendung von ProcessPoolExecutor hinzugefügt. - Echtes Streaming für große PAIN.001-Dateien (50 MB+) mit begrenztem Speicherverbrauch hinzugefügt.
- Leistungsoptimierungen: CAMT-Durchsatz überschreitet jetzt 27.000 Transaktionen/s, PAIN.001 überschreitet 52.000 Transaktionen/s.
Deduplicator-Klasse zur Erkennung exakter Duplikate und vermuteter Übereinstimmungen mit Konfidenzwerten hinzugefügt.from_string()- undfrom_bytes()-Methoden für In-Memory-Parsing ohne Festplatten-I/O hinzugefügt.iter_secure_xml_entries()für sichere ZIP-Archivverarbeitung hinzugefügt.- CI um Durchsetzung von Performance-Schwellenwerten erweitert.
v0.0.3
- Unterstützung für CSV-, OFX-, QFX- und MT940-Parser hinzugefügt.
- Automatische Formaterkennung mit
detect_statement_format()undcreate_parser()hinzugefügt. - PII Redaction hinzugefügt (standardmäßig aktiviert in CLI und Streaming-Modus).
- Export-Hilfsfunktionen für CSV, JSON und Excel hinzugefügt.
- Optionale Polars-DataFrame-Unterstützung hinzugefügt.
- Testsuite auf 467 Tests mit 100 % Branch-Abdeckung erweitert.
v0.0.2
- PAIN.001-Parser (
Pain001Parser) für ISO 20022-Überweisungsinitiierungsdateien hinzugefügt. - CLI-Schnittstelle (
python -m bankstatementparser.cli) hinzugefügt. - Streaming-Modus mit
parse_streaming()hinzugefügt. - Eingabevalidierung und Dateigrößenlimits hinzugefügt.
v0.0.1
- Erstveröffentlichung.
- CAMT.053-Parser (
CamtParser) für ISO 20022-Kontoauszüge (Bank-to-Customer). - pandas DataFrame-Ausgabe.
- Grundlegende XML-Sicherheitshärtung (XXE-Schutz, no_network).
Die vollständige Commit-Historie finden Sie auf GitHub.