बैंक स्टेटमेंट पार्सर

CAMT.053, PAIN.001, CSV, OFX, QFX और MT940 को पांडा डेटाफ़्रेम में पार्स करें। 27K+ tx/s, स्ट्रीमिंग, PII रिडक्शन, शून्य नेटवर्क कॉल।

पिप इंस्टाल बैंकस्टेटमेंटपार्सर

Bank Statement Parser एक ओपन-सोर्स Python लाइब्रेरी है जो सात प्रारूपों (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940, और PDF) से बैंक स्टेटमेंट को संरचित pandas DataFrames में पार्स करती है। सारी प्रोसेसिंग स्थानीय रूप से चलती है — नियतात्मक आउटपुट, स्वचालित PII रिडक्शन, और एक वैकल्पिक hybrid PDF pipeline जो ज़रूरत पड़ने पर स्थानीय LLM के माध्यम से रूट करती है।

सेकंडों में शुरू करें

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

एक लाइब्रेरी, सात प्रारूप

एक ही एकीकृत API से CAMT.053, PAIN.001, CSV, OFX, QFX, MT940, और PDF को संरचित pandas DataFrames में पार्स करें। हर प्रारूप के लिए अलग पैकेज इंस्टॉल करने की ज़रूरत नहीं।

विशेषताBank Statement Parserएकल-प्रारूप OSS (mt940, ofxparse)SaaS (Ocrolus, Parseur)
समर्थित प्रारूप7, एकीकृत API1 प्रत्येकअनेक (OCR के माध्यम से)
PDF सपोर्टHybrid pipeline (deterministic + LLM + vision)नहींहाँ (cloud OCR)
डेटा गोपनीयता100% स्थानीय (LLM Ollama के माध्यम से स्थानीय रूप से चलते हैं)100% स्थानीयडेटा बाहर भेजा जाता है
लागतमुफ़्त, Apache 2.0मुफ़्त$49-$1,000+/महीना
बैलेंस सत्यापनGolden Rule (opening + credits − debits = closing)नहींभिन्न
PII रिडक्शनअंतर्निर्मित, डिफ़ॉल्ट रूप से चालूनहींभिन्न
Streamingसीमित मेमोरीनहींN/A
REST APIअंतर्निर्मित FastAPI माइक्रोसर्विसनहींहाँ
डिडुप्लीकेशनIdempotent transaction hashesनहींकुछ
Ledger निर्यातhledger + beancountनहींनहीं

Hybrid PDF Pipeline

Bank Statement Parser v0.0.5+ में PDF बैंक स्टेटमेंट के लिए तीन-पथ hybrid pipeline शामिल है:

हर extraction Golden Rule से सत्यापित होती है: opening balance + credits − debits == closing balance

ISO 20022 माइग्रेशन के लिए निर्मित

SWIFT ने निश्चित समय सीमा तय की है: सभी वित्तीय संस्थानों को नवंबर 2027 तक CAMT.053 प्राप्त करना होगा, और MT940/MT942/MT950 नवंबर 2028 तक पूरी तरह बंद हो जाएगा। Bank Statement Parser पुराने MT940 और आधुनिक ISO 20022 प्रारूपों (CAMT.053, PAIN.001) दोनों को एक ही API में संभालता है, इसलिए आपकी parsing pipeline संक्रमण के दौरान और उसके बाद भी काम करती है।

प्रदर्शन

Bank Statement Parser क्यों?

प्रोडक्शन के लिए निर्मित

Bank Statement Parser को ट्रेजरी टीमों, फिनटेक डेवलपर्स, और संवेदनशील वित्तीय डेटा प्रोसेस करने वाले कंप्लायंस अधिकारियों के लिए डिज़ाइन किया गया है। लाइब्रेरी का उपयोग MT940-से-CAMT माइग्रेशन pipelines, स्वचालित reconciliation सिस्टम, PDF स्टेटमेंट ingestion, और वित्तीय संस्थानों में regulatory audit वर्कफ़्लो में किया जाता है।

विकल्पों का मूल्यांकन कर रहे हैं? देखें Bank Statement Parser की तुलना कैसे होती है ❯ | वास्तविक उपयोग के मामले देखें ❯

शुरू करें ❯ | GitHub पर देखें ❯ | PyPI पर देखें ❯