ব্যাঙ্ক স্টেটমেন্ট পার্সার

CAMT.053, PAIN.001, CSV, OFX, QFX, এবং MT940 কে পান্ডা ডেটাফ্রেমে পার্স করুন। 27K+ tx/s, স্ট্রিমিং, PII রিডাকশন, শূন্য নেটওয়ার্ক কল।

পিপ ইন্সটল ব্যাঙ্ক স্টেটমেন্ট পার্সার

Bank Statement Parser একটি ওপেন-সোর্স পাইথন লাইব্রেরি যা সাতটি ফর্ম্যাট (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940, এবং PDF) থেকে ব্যাঙ্ক স্টেটমেন্ট স্ট্রাকচার্ড pandas DataFrame-এ পার্স করে। সমস্ত প্রক্রিয়াকরণ স্থানীয়ভাবে চলে — নির্ধারক আউটপুট, স্বয়ংক্রিয় PII রিডাকশন, এবং একটি ঐচ্ছিক hybrid PDF pipeline যা প্রয়োজনে স্থানীয় LLM-এর মাধ্যমে রাউট করে।

সেকেন্ডের মধ্যে শুরু করুন

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

একটি লাইব্রেরি, সাতটি ফরম্যাট

CAMT.053, PAIN.001, CSV, OFX, QFX, MT940, এবং PDF একটি একক, ইউনিফাইড API দিয়ে স্ট্রাকচার্ড pandas DataFrame-এ পার্স করুন। প্রতিটি ফর্ম্যাটের জন্য আলাদা প্যাকেজ ইনস্টল করার দরকার নেই।

বৈশিষ্ট্যBank Statement Parserএকক-ফরম্যাট OSS (mt940, ofxparse)SaaS (Ocrolus, Parseur)
সমর্থিত ফর্ম্যাট7, ইউনিফাইড APIপ্রতিটিতে 1টিঅনেকগুলি (OCR এর মাধ্যমে)
PDF সাপোর্টHybrid pipeline (deterministic + LLM + vision)নাহ্যাঁ (cloud OCR)
ডেটা গোপনীয়তা100% স্থানীয় (LLM স্থানীয়ভাবে Ollama দিয়ে চলে)100% স্থানীয়ডেটা বাইরে পাঠানো হয়
খরচবিনামূল্যে, Apache 2.0বিনামূল্যে$49-$1,000+/মাস
ব্যালেন্স যাচাইGolden Rule (opening + credits − debits = closing)নাবিভিন্ন
PII রিডাকশনবিল্ট-ইন, ডিফল্টরূপে চালুনাবিভিন্ন
Streamingসীমাবদ্ধ মেমরিনাN/A
REST APIবিল্ট-ইন FastAPI মাইক্রোসার্ভিসনাহ্যাঁ
ডিডুপ্লিকেশনIdempotent transaction hashনাকিছু
Ledger এক্সপোর্টhledger + beancountনানা

Hybrid PDF Pipeline

Bank Statement Parser v0.0.5+ PDF ব্যাঙ্ক স্টেটমেন্টের জন্য তিন-পথের hybrid pipeline অন্তর্ভুক্ত করে:

প্রতিটি এক্সট্র্যাকশন Golden Rule দিয়ে যাচাই করা হয়: opening balance + credits − debits == closing balance

ISO 20022 মাইগ্রেশনের জন্য তৈরি

SWIFT দৃঢ় সময়সীমা নির্ধারণ করেছে: সমস্ত আর্থিক প্রতিষ্ঠানকে নভেম্বর 2027 এর মধ্যে CAMT.053 গ্রহণ করতে হবে এবং নভেম্বর 2028 এর মধ্যে MT940/MT942/MT950 সম্পূর্ণরূপে বাতিল হবে। Bank Statement Parser লিগ্যাসি MT940 এবং আধুনিক ISO 20022 ফর্ম্যাট (CAMT.053, PAIN.001) উভয়ই একটি একক API-তে পরিচালনা করে, তাই আপনার parsing pipeline রূপান্তরের সময় এবং তার পরেও কাজ করে।

পারফরম্যান্স

কেন Bank Statement Parser?

প্রোডাকশনের জন্য তৈরি

Bank Statement Parser ট্রেজারি দল, ফিনটেক ডেভেলপার এবং সংবেদনশীল আর্থিক ডেটা প্রক্রিয়াকারী কমপ্লায়েন্স অফিসারদের জন্য ডিজাইন করা হয়েছে। লাইব্রেরিটি MT940-থেকে-CAMT মাইগ্রেশন pipeline, স্বয়ংক্রিয় রিকনসিলিয়েশন সিস্টেম, PDF স্টেটমেন্ট ইনজেশন, এবং আর্থিক প্রতিষ্ঠান জুড়ে নিয়ন্ত্রক অডিট ওয়ার্কফ্লোতে ব্যবহৃত হয়।

বিকল্প মূল্যায়ন করছেন? দেখুন Bank Statement Parser কীভাবে তুলনা করে ❯ | বাস্তব ব্যবহারের ক্ষেত্র অন্বেষণ করুন ❯

শুরু করুন ❯ | GitHub-এ দেখুন ❯ | PyPI-তে দেখুন ❯