התחל בשניות
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, מוכן לשימוש
ספרייה אחת, שישה פורמטים
נתח CAMT.053, PAIN.001, CSV, OFX, QFX ו-MT940 ל-DataFrames מובנים של pandas עם API אחיד יחיד. אין צורך להתקין חבילות נפרדות לכל פורמט.
| תכונה | מנתח דפי חשבון בנק | OSS בפורמט יחיד (mt940, ofxparse) | SaaS (Ocrolus, Parseur) |
|---|---|---|---|
| פורמטים נתמכים | 6, API אחיד | 1 כל אחד | רבים (דרך OCR) |
| פרטיות נתונים | מקומי 100%, אפס קריאות רשת | מקומי 100% | נתונים נשלחים החוצה |
| עלות | חינם, Apache 2.0 | חינם | $49-$1,000+/חודש |
| מיסוך PII | מובנה, פועל כברירת מחדל | לא | משתנה |
| סטרימינג | זיכרון מוגבל | לא | לא רלוונטי |
| אבטחת ZIP | הקשחה מובנית | לא | לא רלוונטי |
| ביטול כפילויות | מובנה עם ציוני ביטחון | לא | חלקי |
בנוי למעבר ISO 20022
SWIFT קבע לוחות זמנים ברורים: כל המוסדות הפיננסיים חייבים לקבל CAMT.053 עד נובמבר 2027, ו-MT940/MT942/MT950 ייפסקו לחלוטין עד נובמבר 2028. מנתח דפי חשבון בנק מטפל הן בפורמט הישן MT940 והן בפורמטים המודרניים של ISO 20022 (CAMT.053, PAIN.001) ב-API יחיד, כך שצינור הניתוח שלך עובד במהלך המעבר ומעבר לו.
ביצועים
- 27,000+ עסקאות/שנייה לניתוח CAMT.053
- 52,000+ עסקאות/שנייה לניתוח PAIN.001
- < 2 מילישניות זמן לתוצאה ראשונה
- זיכרון קבוע מ-1K עד 50K+ עסקאות דרך סטרימינג
- 467 בדיקות עם כיסוי ענפים של 100% ב-Python 3.9 עד 3.14
למה מנתח דפי חשבון בנק?
- זיהוי פורמט אוטומטי:
detect_statement_format()מזהה קבצים אוטומטית ו-create_parser()מחזיר את המנתח הנכון. - פרטיות קודמת: מיסוך PII פועל כברירת מחדל. שדות רגישים (שמות, IBAN, כתובות) מוסתרים בפלט CLI. השתמש ב-
--show-piiבעת הצורך. - מוכן לייצור: קליטת ZIP מאובטחת (הגנת פצצות, דחיית ערכים מוצפנים), אימות קלט ומניעת מעבר נתיבים.
- פלט גמיש: ייצוא ל-CSV, JSON, Excel, או המרה ל-DataFrames של Polars.
- עיבוד מקבילי: נתח מספר קבצים בו-זמנית עם
parse_files_parallel().