نظرة عامة
Bank Statement Parser هي مكتبة Python مفتوحة المصدر الوحيدة التي تحلل سبعة تنسيقات لكشوفات الحساب البنكية — بما في ذلك PDF عبر خط أنابيب LLM هجين — بواجهة موحدة. المكتبات أحادية التنسيق (mt-940، ofxparse، pycamt) تتعامل كل منها مع تنسيق واحد. أدوات SaaS (Ocrolus، Parseur) تقدم OCR سحابيًا لكنها تتطلب إرسال البيانات خارجيًا وتكلف 49$–1,000$+/شهر.
البدائل مفتوحة المصدر
مكتبات أحادية التنسيق
معظم محللات كشوفات الحساب مفتوحة المصدر تتعامل مع تنسيق واحد فقط. إذا احتجت تنسيقات متعددة، يجب تثبيت وصيانة مكتبات منفصلة بواجهات ومخططات إخراج ودورات تحديث مختلفة.
| المكتبة | التنسيقات | الإخراج | التحقق من الرصيد | تصدير دفتر الأستاذ | |
|---|---|---|---|---|---|
| Bank Statement Parser | 7 تنسيقات | خط أنابيب هجين | pandas DataFrame | القاعدة الذهبية | hledger، beancount |
| mt-940 (WoLpH) | MT940 فقط | لا | كائنات Python | لا | لا |
| ofxparse | OFX فقط | لا | كائنات Python | لا | لا |
| pycamt | CAMT.053 فقط | لا | كائنات Python | لا | لا |
| ofxtools | OFX v1/v2 فقط | لا | كائنات Python | لا | لا |
مقابل pyiso20022
pyiso20022 يُنشئ فئات بيانات Python من كتالوج مخطط ISO 20022 الكامل. وهي مجموعة أدوات ISO 20022 للأغراض العامة للتعامل مع رسائل PACS وPAIN وCAMT وADMI.
Bank Statement Parser مصمم خصيصًا لتحليل كشوفات الحساب إلى DataFrames مع ميزات إنتاجية:
| الميزة | Bank Statement Parser | pyiso20022 |
|---|---|---|
| الغرض | تحليل كشوفات + استخراج + تصدير | مجموعة أدوات مخطط ISO 20022 |
| الإخراج | DataFrames من pandas/Polars | فئات بيانات Python |
| التنسيقات | 7 (بما في ذلك PDF وغير ISO) | ISO 20022 فقط |
| دعم PDF | خط أنابيب هجين (حتمي + LLM + رؤية) | لا |
| التحقق من الرصيد | القاعدة الذهبية + متعدد العملات | لا |
| REST API | FastAPI مدمج | لا |
| الإثراء | تصنيف مدعوم بـ LLM | لا |
| تصدير دفتر الأستاذ | hledger + beancount | لا |
| Streaming | نعم (ذاكرة محدودة) | لا |
| تنقيح PII | مدمج | لا |
| إزالة التكرار | hash حتمي للمعاملات | لا |
| CLI | نعم | لا |
استخدم pyiso20022 إذا كنت بحاجة للتعامل مع كتالوج رسائل ISO 20022 الكامل. استخدم Bank Statement Parser إذا كنت بحاجة لتحليل كشوفات الحساب إلى بيانات منظمة للتحليل أو التسوية أو إعداد التقارير.
بدائل SaaS
أدوات SaaS مثل Ocrolus وParseur وSensible تقدم تحليل كشوفات الحساب كخدمة سحابية. تستخدم عادةً OCR للتعامل مع ملفات PDF الممسوحة ضوئيًا وتدعم مئات التنسيقات الخاصة بالبنوك.
| الميزة | Bank Statement Parser | أدوات SaaS |
|---|---|---|
| خصوصية البيانات | 100% محلي (نماذج LLM عبر Ollama) | البيانات تُرسل إلى السحابة |
| التكلفة | مجاني (Apache 2.0) | 49$–1,000$+/شهر (اعتبارًا من الربع الأول 2026) |
| التنسيقات | 7 (منظمة + PDF) | مئات (عبر OCR) |
| دعم PDF | نعم — خط أنابيب هجين (حتمي + LLM + رؤية) | نعم (OCR سحابي) |
| التحقق من الرصيد | القاعدة الذهبية (تلقائي) | يدوي / محدود |
| زمن الاستجابة | أقل من 2 مللي ثانية (منظم)، ثوانٍ (PDF+LLM) | 1-30 ثانية |
| الإنتاجية | 27,000+ معاملة/ثانية (منظم) | معدل API محدود |
| REST API | FastAPI مدمج | ملكي |
| تصدير دفتر الأستاذ | hledger + beancount | لا |
| قفل البائع | لا يوجد | نعم |
| الامتثال | معالجة محلية، SBOM | يختلف حسب المزود |
المحللات المعتمدة على LLM
عدد متزايد من الأدوات (Inscribe، Unstract، مخططات Mozilla.ai) تستخدم نماذج لغوية كبيرة لتحليل كشوفات الحساب، بما في ذلك ملفات PDF الممسوحة ضوئيًا. عندما أعاد Chase تصميم تنسيق كشف المستهلك في أواخر 2025، تعطلت المحللات المعتمدة على القوالب بينما تكيفت محللات LLM تلقائيًا.
Bank Statement Parser يتضمن الآن خط أنابيب LLM هجينًا خاصًا به (v0.0.5+) يعمل محليًا بالكامل عبر Ollama. يجمع أفضل المقاربتين:
- التنسيقات المنظمة (XML، CSV، OFX، MT940): تحليل حتمي — دقة 100%، زمن استجابة أقل من مللي ثانية، صفر تكلفة LLM.
- كشوفات PDF: توجيه ثلاثي المسارات (استخراج جداول حتمي ← نص + LLM ← رؤية + LLM) مع تحقق تلقائي بالقاعدة الذهبية لالتقاط أخطاء الاستخراج.
على عكس محللات LLM السحابية فقط، خط أنابيب Bank Statement Parser الهجين:
- يعمل 100% محليًا (Ollama) — لا تغادر بياناتك جهازك.
- يتحقق من كل استخراج بالقاعدة الذهبية.
- يدعم وضع المراجعة التفاعلية للتناقضات المُبلّغ عنها.
- يُنتج hash حتمي للمعاملات لاستيعاب تدريجي آمن.
متى تختار محللات LLM SaaS بدلًا من Bank Statement Parser: تستقبل كشوفات من مئات البنوك بتخطيطات PDF مختلفة جدًا وتحتاج تغطية جاهزة بدون تشغيل بنية محلية.
متى تختار Bank Statement Parser: تحتاج معالجة محلية للامتثال. تريد تحقق الرصيد. تحتاج تصدير دفتر أستاذ. تريد صفر تكلفة مستمرة.
منهجية قياس الأداء: أرقام الأداء قيست على Apple M2، Python 3.12، باستخدام ملف CAMT.053 يضم 5,000 معاملة (2.1 ميغابايت). المتوسط عبر 100 جولة. لإعادة الإنتاج محليًا: python -m bankstatementparser.bench. زمن استجابة SaaS مبني على وثائق API المنشورة حتى أبريل 2026.
راجع حالات الاستخدام الواقعية ❯ | خطط لترحيل MT940 إلى CAMT ❯