Magsimula sa Ilang Segundo
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, ready to use
Isang Library, Anim na Format
I-parse ang CAMT.053, PAIN.001, CSV, OFX, QFX, at MT940 sa mga structured pandas DataFrames na may iisang, pinag-isang API. Hindi na kailangang mag-install ng hiwalay na mga pakete para sa bawat format.
| Tampok | Parser ng Bank Statement | Isang format na OSS (mt940, ofxparse) | SaaS (Ocrolus, Parseur) |
|---|---|---|---|
| Mga format na suportado | 6, pinag-isang API | 1 bawat isa | Marami (sa pamamagitan ng OCR) |
| Pagkapribado ng data | 100% lokal, walang mga tawag sa network | 100% lokal | Ipinadala ang data sa labas |
| Gastos | Libre, Apache 2.0 | Libre | $49-$1,000+/buwan |
| PII redaction | Built-in, naka-on bilang default | Hindi | Nag-iiba |
| Streaming | Bounded memory | Hindi | N/A |
| ZIP seguridad | Built-in na hardening | Hindi | N/A |
| Deduplikasyon | Built-in na may mga marka ng kumpiyansa | Hindi | Ang ilan |
Binuo para sa ISO 20022 Migration
Ang SWIFT ay nagtakda ng matatag na mga deadline: ang lahat ng mga institusyong pampinansyal ay dapat makatanggap ng CAMT.053 bago ang Nobyembre 2027, at ang MT940/MT942/MT950 ay ganap na magretiro sa Nobyembre 2028. Ang Bank Statement Parser ay humahawak sa parehong legacy na MT940 at modernong ISO 20022 na mga format (CAMT.053, PAIN, at PAIN) sa panahon ng iyong paglipat ng pipeline at PAIN.001. sa kabila.
Pagganap
- 27,000+ transaksyon/segundo para sa pag-parse ng CAMT.053
- 52,000+ transaksyon/segundo para sa PAIN.001 na pag-parse
- *** 2 ms** oras sa unang resulta
- Constant memory mula 1K hanggang 50K+ na transaksyon sa pamamagitan ng streaming
- 467 pagsubok na may 100% saklaw ng sangay sa Python 3.9 hanggang 3.14
Bakit Bank Statement Parser?
- Format Auto-Detection:
detect_statement_format()awtomatikong kinikilala ang mga file atcreate_parser()ibinabalik ang tamang parser. - Privacy First: Naka-on ang PII redaction bilang default. Ang mga sensitibong field (mga pangalan, IBAN, address) ay naka-mask sa output ng CLI. Mag-opt in gamit ang
--show-piikapag kailangan. - Handa na ang Produksyon: Secure na pag-ingest ng ZIP (proteksyon sa bomba, pagtanggi sa naka-encrypt na entry), validation ng input, at pag-iwas sa pagtawid sa landas.
- Flexible Output: I-export sa CSV, JSON, Excel, o i-convert sa Polars DataFrames.
- Parallel Processing: Mag-parse ng maraming file nang sabay-sabay
parse_files_parallel().