ตัวแยกวิเคราะห์ใบแจ้งยอดธนาคาร

แยก CAMT.053, PAIN.001, CSV, OFX, QFX และ MT940 เป็น DataFrames ของแพนด้า 27K+ tx/s, การสตรีม, การแก้ไข PII, การโทรผ่านเครือข่ายเป็นศูนย์

pip ติดตั้งตัวแยกคำสั่งธนาคาร

Bank Statement Parser เป็นไลบรารี Python แบบโอเพ่นซอร์สที่แยกวิเคราะห์ใบแจ้งยอดธนาคารจากเจ็ดรูปแบบ (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 และ PDF) ลงใน pandas DataFrames ที่มีโครงสร้าง การประมวลผลทั้งหมดทำงานภายในเครื่อง — เอาต์พุตแบบกำหนดได้ การปกปิด PII อัตโนมัติ และไปป์ไลน์ PDF แบบไฮบริดที่ส่งต่อไปยัง LLM ในเครื่องเมื่อจำเป็น

เริ่มต้นในไม่กี่วินาที

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

หนึ่งไลบรารี เจ็ดรูปแบบ

แยกวิเคราะห์ CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 และ PDF ลงใน pandas DataFrames ที่มีโครงสร้างด้วย API แบบรวมเพียงตัวเดียว ไม่จำเป็นต้องติดตั้งแพ็กเกจแยกสำหรับแต่ละรูปแบบ

คุณสมบัติBank Statement ParserOSS รูปแบบเดียว (mt940, ofxparse)SaaS (Ocrolus, Parseur)
รูปแบบที่รองรับ7, API แบบรวมอย่างละ 1หลายรูปแบบ (ผ่าน OCR)
รองรับ PDFไปป์ไลน์ไฮบริด (deterministic + LLM + vision)ไม่มีมี (cloud OCR)
ความเป็นส่วนตัวของข้อมูลประมวลผลในเครื่อง 100% (LLM ทำงานในเครื่องผ่าน Ollama)ประมวลผลในเครื่อง 100%ข้อมูลถูกส่งออกภายนอก
ค่าใช้จ่ายฟรี, Apache 2.0ฟรี$49-$1,000+/เดือน
การตรวจสอบยอดคงเหลือGolden Rule (ยอดเปิด + เครดิต - เดบิต = ยอดปิด)ไม่มีแตกต่างกันไป
การปกปิด PIIในตัว เปิดตามค่าเริ่มต้นไม่มีแตกต่างกันไป
สตรีมมิงหน่วยความจำคงที่ไม่มีN/A
REST APIFastAPI microservice ในตัวไม่มีมี
การขจัดข้อมูลซ้ำIdempotent transaction hashesไม่มีบางส่วน
ส่งออก Ledgerhledger + beancountไม่มีไม่มี

ไปป์ไลน์ PDF แบบไฮบริด

Bank Statement Parser v0.0.5+ มีไปป์ไลน์ไฮบริดสามเส้นทางสำหรับใบแจ้งยอดธนาคาร PDF:

การดึงข้อมูลทุกครั้งจะถูกตรวจสอบด้วย Golden Rule: opening balance + credits − debits == closing balance

สร้างขึ้นเพื่อการย้ายระบบ ISO 20022

SWIFT ได้กำหนดเส้นตายไว้ชัดเจน: สถาบันการเงินทุกแห่งต้องรับ CAMT.053 ได้ภายในเดือนพฤศจิกายน 2027 และ MT940/MT942/MT950 จะถูกเลิกใช้ทั้งหมดภายในเดือนพฤศจิกายน 2028 Bank Statement Parser รองรับทั้งรูปแบบ MT940 แบบเดิมและรูปแบบ ISO 20022 สมัยใหม่ (CAMT.053, PAIN.001) ใน API เดียว ไปป์ไลน์การแยกวิเคราะห์ของคุณจึงทำงานได้ทั้งในระหว่างการเปลี่ยนผ่านและหลังจากนั้น

ประสิทธิภาพ

ทำไมต้อง Bank Statement Parser?

สร้างขึ้นเพื่อใช้งานจริง

Bank Statement Parser ออกแบบมาสำหรับทีมคลัง นักพัฒนาฟินเทค และเจ้าหน้าที่กำกับดูแลที่ประมวลผลข้อมูลทางการเงินที่ละเอียดอ่อน ไลบรารีนี้ใช้ในไปป์ไลน์การย้ายข้อมูล MT940 สู่ CAMT ระบบกระทบยอดอัตโนมัติ การนำเข้าใบแจ้งยอด PDF และเวิร์กโฟลว์การตรวจสอบตามกฎระเบียบในสถาบันการเงินต่างๆ

กำลังประเมินทางเลือกอื่น? ดูว่า Bank Statement Parser เปรียบเทียบอย่างไร ❯ | สำรวจกรณีการใช้งานจริง ❯

เริ่มต้นใช้งาน ❯ | ดูบน GitHub ❯ | ดูบน PyPI ❯