ব্যাংক স্টেটমেন্ট পার্সার উন্নয়ন অনুসরণ করুন. RSS এর মাধ্যমে সদস্যতা নিন বা GitHub সংগ্রহস্থল প্রকাশের বিজ্ঞপ্তির জন্য।
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 2026-03-15
- এর সাথে সমান্তরাল ফাইল পার্সিং যোগ করা হয়েছে
parse_files_parallel()ProcessPoolExecutor ব্যবহার করে। - আবদ্ধ মেমরি সহ বড় PAIN.001 ফাইল (50 MB+) এর জন্য সত্য স্ট্রিমিং যোগ করা হয়েছে।
- পারফরম্যান্স অপ্টিমাইজেশন: CAMT থ্রুপুট এখন 27,000 tx/s ছাড়িয়ে গেছে, PAIN.001 52,000 tx/s ছাড়িয়ে গেছে।
- যোগ করা হয়েছে
Deduplicatorআত্মবিশ্বাসের স্কোর সহ সঠিক সদৃশ এবং সন্দেহজনক ম্যাচ সনাক্ত করার জন্য ক্লাস। - যোগ করা হয়েছে
from_string()এবংfrom_bytes()ডিস্ক I/O ছাড়া ইন-মেমরি পার্সিংয়ের পদ্ধতি। - যোগ করা হয়েছে
iter_secure_xml_entries()নিরাপদ জিপ সংরক্ষণাগার প্রক্রিয়াকরণের জন্য। - পারফরম্যান্স থ্রেশহোল্ড প্রয়োগের সাথে বর্ধিত CI।
v0.0.3 — 2025-11-20
- CSV, OFX, QFX, এবং MT940 পার্সার সমর্থন যোগ করা হয়েছে।
- এর সাথে ফর্ম্যাট স্বয়ংক্রিয় সনাক্তকরণ যুক্ত করা হয়েছে
detect_statement_format()এবংcreate_parser(). - PII রিডাকশন যোগ করা হয়েছে (সিএলআই এবং স্ট্রিমিং মোডে ডিফল্টরূপে চালু)।
- CSV, JSON, এবং Excel এর জন্য রপ্তানি সহায়ক যোগ করা হয়েছে।
- ঐচ্ছিক পোলার ডেটাফ্রেম সমর্থন যোগ করা হয়েছে।
- 100% শাখা কভারেজ সহ 718 টি পরীক্ষায় প্রসারিত পরীক্ষা স্যুট।
v0.0.2 — 2025-06-10
- PAIN.001 পার্সার যোগ করা হয়েছে (
Pain001Parser) ISO 20022 ক্রেডিট ট্রান্সফার ইনিশিয়েশন ফাইলের জন্য। - CLI ইন্টারফেস যোগ করা হয়েছে (
python -m bankstatementparser.cli) - এর সাথে স্ট্রিমিং মোড যোগ করা হয়েছে
parse_streaming(). - ইনপুট বৈধতা এবং ফাইলের আকার সীমা যোগ করা হয়েছে।
v0.0.1 — 2025-01-15
- প্রাথমিক প্রকাশ।
- CAMT.053 পার্সার (
CamtParser) ISO 20022 ব্যাঙ্ক-টু-কাস্টমার স্টেটমেন্টের জন্য। - পান্ডাস ডেটাফ্রেম আউটপুট।
- বেসিক XML সিকিউরিটি হার্ডেনিং (XXE সুরক্ষা, no_network)।
[GitHub](এ সম্পূর্ণ কমিট ইতিহাস দেখুনhttps://github.com/sebastienrousseau/bankstatementparser/commits/main).