सेकंडों में शुरू करें
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, उपयोग के लिए तैयार
एक लाइब्रेरी, छह फॉर्मेट
CAMT.053, PAIN.001, CSV, OFX, QFX और MT940 को एकल, एकीकृत API के साथ संरचित pandas DataFrames में पार्स करें। प्रत्येक फॉर्मेट के लिए अलग पैकेज इंस्टॉल करने की आवश्यकता नहीं।
| विशेषता | बैंक स्टेटमेंट पार्सर | एकल-फॉर्मेट OSS (mt940, ofxparse) | SaaS (Ocrolus, Parseur) |
|---|---|---|---|
| समर्थित फॉर्मेट | 6, एकीकृत API | प्रत्येक 1 | अनेक (OCR के माध्यम से) |
| डेटा गोपनीयता | 100% स्थानीय, शून्य नेटवर्क कॉल | 100% स्थानीय | डेटा बाहर भेजा जाता है |
| लागत | मुफ्त, Apache 2.0 | मुफ्त | $49-$1,000+/महीना |
| PII मास्किंग | बिल्ट-इन, डिफ़ॉल्ट रूप से चालू | नहीं | भिन्न |
| स्ट्रीमिंग | सीमित मेमोरी | नहीं | लागू नहीं |
| ZIP सुरक्षा | बिल्ट-इन हार्डनिंग | नहीं | लागू नहीं |
| डिडुप्लीकेशन | कॉन्फिडेंस स्कोर के साथ बिल्ट-इन | नहीं | कुछ |
ISO 20022 माइग्रेशन के लिए बनाया गया
SWIFT ने कठोर समय सीमा निर्धारित की है: सभी वित्तीय संस्थानों को नवंबर 2027 तक CAMT.053 प्राप्त करना होगा, और MT940/MT942/MT950 नवंबर 2028 तक पूरी तरह से बंद हो जाएंगे। बैंक स्टेटमेंट पार्सर एकल API में लीगेसी MT940 और आधुनिक ISO 20022 फॉर्मेट (CAMT.053, PAIN.001) दोनों को संभालता है, ताकि आपकी पार्सिंग पाइपलाइन संक्रमण के दौरान और उसके बाद भी काम करे।
प्रदर्शन
- 27,000+ लेनदेन/सेकंड CAMT.053 पार्सिंग के लिए
- 52,000+ लेनदेन/सेकंड PAIN.001 पार्सिंग के लिए
- < 2 मिसे पहले परिणाम तक का समय
- स्थिर मेमोरी स्ट्रीमिंग के माध्यम से 1K से 50K+ लेनदेन तक
- 467 टेस्ट Python 3.9 से 3.14 में 100% ब्रांच कवरेज के साथ
बैंक स्टेटमेंट पार्सर क्यों?
- फॉर्मेट ऑटो-डिटेक्शन:
detect_statement_format()फाइलों को स्वचालित रूप से पहचानता है औरcreate_parser()सही पार्सर लौटाता है। - गोपनीयता पहले: PII मास्किंग डिफ़ॉल्ट रूप से चालू है। संवेदनशील फ़ील्ड (नाम, IBAN, पते) CLI आउटपुट में छिपाए जाते हैं। जरूरत पड़ने पर
--show-piiका उपयोग करें। - प्रोडक्शन तैयार: सुरक्षित ZIP इंजेशन (बम प्रोटेक्शन, एन्क्रिप्टेड एंट्री रिजेक्शन), इनपुट वैलिडेशन, और पाथ ट्रैवर्सल प्रिवेंशन।
- लचीला आउटपुट: CSV, JSON, Excel में एक्सपोर्ट करें, या Polars DataFrames में कन्वर्ट करें।
- समानांतर प्रसंस्करण:
parse_files_parallel()के साथ कई फाइलों को एक साथ पार्स करें।