ব্যাংক স্টেটমেন্ট পার্সার সম্পর্কে

একটি লাইব্রেরি। ছয় ফরম্যাট। জিরো নেটওয়ার্ক কল।

TL;DR: Bank Statement Parser একটি ওপেন-সোর্স পাইথন লাইব্রেরি যা সাতটি ব্যাঙ্ক স্টেটমেন্ট ফর্ম্যাট (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940, এবং PDF) pandas DataFrame-এ পার্স করে। Hybrid PDF pipeline সহ ব্যালেন্স যাচাই, REST API, enrichment, ledger এক্সপোর্ট, 27K+ tx/s থ্রুপুট।

Bank Statement Parser একটি ওপেন-সোর্স পাইথন লাইব্রেরি যা সাতটি ফর্ম্যাট থেকে ব্যাঙ্ক স্টেটমেন্ট স্ট্রাকচার্ড pandas DataFrame-এ পার্স করে। নির্ধারক কোর স্ট্রাকচার্ড ফর্ম্যাট শূন্য নেটওয়ার্ক কলে স্থানীয়ভাবে প্রক্রিয়া করে। ঐচ্ছিক hybrid PDF pipeline ডিজিটাল ও স্ক্যান করা স্টেটমেন্টের জন্য স্থানীয় LLM-এর (Ollama-র মাধ্যমে) দিকে রাউট করে।

এটা কার জন্য?

সমর্থিত ফর্ম্যাট

ফর্ম্যাট স্ট্যান্ডার্ড ফাইলের ধরন পার্সার/মেথড
CAMT.053 ISO 20022 Bank-to-Customer Statement .xml CamtParser
PAIN.001 ISO 20022 Credit Transfer Initiation .xml Pain001Parser
CSV জেনেরিক ব্যাঙ্ক এক্সপোর্ট .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 SWIFT standard .mt940, .sta Mt940Parser
PDF ডিজিটাল ও স্ক্যান করা স্টেটমেন্ট .pdf smart_ingest()

সব ফর্ম্যাটই সামঞ্জস্যপূর্ণ কলাম নাম সহ নরমালাইজড pandas DataFrame তৈরি করে, যা ডাউনস্ট্রিম প্রক্রিয়াকরণ ফর্ম্যাট-অজ্ঞেয় করে তোলে।

মূল ক্ষমতা

নিরাপত্তা এবং গোপনীয়তা

পারফরম্যান্স

মেট্রিক মান
CAMT.053 থ্রুপুট 27,000+ tx/s
PAIN.001 থ্রুপুট 52,000+ tx/s
প্রতি-লেনদেন লেটেন্সি (CAMT) 37 মাইক্রোসেকেন্ড
প্রতি-লেনদেন লেটেন্সি (PAIN.001) 19 মাইক্রোসেকেন্ড
প্রথম ফলাফলের সময় < 2 ms
মেমরি স্কেলিং (1K-50K tx) ধ্রুবক (streaming)
টেস্ট কভারেজ 100% branch coverage
টেস্ট 29টি টেস্ট ফাইল জুড়ে 718

তৈরি করা শুরু করুন

ইনস্টলেশন ও উদাহরণ দিয়ে শুরু করুন ❯

"GitHub Repository"