Începeți în câteva secunde
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, gata de utilizare
O bibliotecă, șase formate
Analizați CAMT.053, PAIN.001, CSV, OFX, QFX și MT940 în DataFrames pandas structurate cu un singur API unificat. Nu trebuie să instalați pachete separate pentru fiecare format.
| Funcționalitate | Analizor de extrase bancare | OSS cu format unic (mt940, ofxparse) | SaaS (Ocrolus, Parseur) |
|---|---|---|---|
| Formate suportate | 6, API unificat | 1 fiecare | Multe (via OCR) |
| Confidențialitatea datelor | 100% local, zero apeluri de rețea | 100% local | Date trimise extern |
| Cost | Gratuit, Apache 2.0 | Gratuit | 49-1.000+$/lună |
| Mascare PII | Integrată, activată implicit | Nu | Variază |
| Streaming | Memorie limitată | Nu | N/A |
| Securitate ZIP | Protecție integrată | Nu | N/A |
| Deduplicare | Integrată cu scoruri de încredere | Nu | Parțial |
Construit pentru migrarea ISO 20022
SWIFT a stabilit termene ferme: toate instituțiile financiare trebuie să poată primi CAMT.053 până în noiembrie 2027, iar MT940/MT942/MT950 vor fi complet retrase până în noiembrie 2028. Analizorul de extrase bancare gestionează atât formatul vechi MT940, cât și formatele moderne ISO 20022 (CAMT.053, PAIN.001) într-un singur API, astfel încât pipeline-ul dvs. de analiză funcționează în timpul tranziției și ulterior.
Performanță
- 27.000+ tranzacții/secundă pentru analiza CAMT.053
- 52.000+ tranzacții/secundă pentru analiza PAIN.001
- < 2 ms timp până la primul rezultat
- Memorie constantă de la 1K la 50K+ tranzacții prin streaming
- 467 teste cu acoperire 100% a ramurilor pe Python 3.9 până la 3.14
De ce Analizorul de extrase bancare?
- Detectare automată a formatului:
detect_statement_format()identifică automat fișierele șicreate_parser()returnează parserul potrivit. - Confidențialitate pe primul loc: Mascarea PII este activată implicit. Câmpurile sensibile (nume, IBAN-uri, adrese) sunt mascate în ieșirea CLI. Activați cu
--show-piicând este necesar. - Pregătit pentru producție: Ingestie securizată ZIP (protecție împotriva bombelor, respingerea intrărilor criptate), validare a datelor de intrare și prevenirea traversării căilor.
- Ieșire flexibilă: Export în CSV, JSON, Excel sau conversie în DataFrames Polars.
- Procesare paralelă: Analizați mai multe fișiere simultan cu
parse_files_parallel().