מנתח דפי בנק

נתח CAMT.053, PAIN.001, CSV, OFX, QFX ו-MT940 לתוך DataFrames של פנדה. 27K+ tx/s, סטרימינג, עריכת PII, אפס שיחות רשת.

pip להתקין את bankstatementparser

Bank Statement Parser היא ספריית Python בקוד פתוח שמנתחת דפי חשבון בנק משבעה פורמטים (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 ו-PDF) לתוך DataFrames מובנים של pandas. כל העיבוד רץ מקומית — פלט דטרמיניסטי, עריכת PII אוטומטית, ו-pipeline היברידי אופציונלי ל-PDF שמנתב דרך LLMs מקומיים בעת הצורך.

התחל תוך שניות

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

ספרייה אחת, שבעה פורמטים

נתח CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 ו-PDF לתוך DataFrames מובנים של pandas עם API יחיד ומאוחד. אין צורך להתקין חבילות נפרדות לכל פורמט.

תכונהBank Statement ParserOSS בפורמט יחיד (mt940, ofxparse)SaaS (Ocrolus, Parseur)
פורמטים נתמכים7, API מאוחד1 כל אחדרבים (באמצעות OCR)
תמיכה ב-PDFPipeline היברידי (דטרמיניסטי + LLM + vision)לאכן (OCR בענן)
פרטיות נתונים100% מקומי (LLMs רצים מקומית דרך Ollama)100% מקומינתונים נשלחים החוצה
עלותחינם, Apache 2.0חינם$49-$1,000+/חודש
אימות יתרהכלל הזהב (פתיחה + זיכויים − חיובים = סגירה)לאמשתנה
עריכת PIIמובנית, פועלת כברירת מחדללאמשתנה
streamingזיכרון מוגבללאלא רלוונטי
REST APIשירות FastAPI מובנהלאכן
מניעת כפילויותhash עסקאות אידמפוטנטילאחלקי
ייצוא ל-Ledgerhledger + beancountלאלא

Pipeline היברידי ל-PDF

Bank Statement Parser v0.0.5+ כולל pipeline היברידי בשלושה נתיבים לדפי חשבון PDF:

כל חילוץ מאומת באמצעות כלל הזהב: opening balance + credits − debits == closing balance.

נבנה להגירת ISO 20022

SWIFT קבעה מועדים ברורים: כל המוסדות הפיננסיים חייבים לקבל CAMT.053 עד נובמבר 2027, ו-MT940/MT942/MT950 יצאו משימוש לחלוטין עד נובמבר 2028. Bank Statement Parser מטפל גם בפורמט MT940 הישן וגם בפורמטים המודרניים של ISO 20022 (CAMT.053, PAIN.001) ב-API יחיד, כך שה-pipeline שלך עובד במהלך המעבר וגם אחריו.

ביצועים

למה Bank Statement Parser?

נבנה לייצור

Bank Statement Parser מיועד לצוותי אוצר, מפתחי פינטק וקציני ציות המעבדים נתונים פיננסיים רגישים. הספרייה משמשת ב-pipelines של הגירה מ-MT940 ל-CAMT, מערכות התאמה אוטומטיות, קליטת דפי חשבון PDF, ותהליכי ביקורת רגולטוריים במוסדות פיננסיים.

בודקים חלופות? ראו כיצד Bank Statement Parser משתווה ❯ | גלו מקרי שימוש מהעולם האמיתי ❯

התחל ❯ | צפה ב-GitHub ❯ | צפה ב-PyPI ❯