เกี่ยวกับตัวแยกวิเคราะห์ใบแจ้งยอดจากธนาคาร

ห้องสมุดแห่งหนึ่ง หกรูปแบบ โทรผ่านเครือข่ายเป็นศูนย์

สรุปสั้นๆ: Bank Statement Parser เป็นไลบรารี Python แบบโอเพ่นซอร์สที่แยกวิเคราะห์ใบแจ้งยอดธนาคารเจ็ดรูปแบบ (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 และ PDF) ลงใน pandas DataFrames ไปป์ไลน์ PDF แบบไฮบริดพร้อมการตรวจสอบยอดคงเหลือ, REST API, การเสริมข้อมูล, ส่งออก ledger, ปริมาณงาน 27K+ tx/s

Bank Statement Parser เป็นไลบรารี Python แบบโอเพ่นซอร์สที่แยกวิเคราะห์ใบแจ้งยอดธนาคารจากเจ็ดรูปแบบลงใน pandas DataFrames ที่มีโครงสร้าง แกนหลักแบบ deterministic ประมวลผลรูปแบบที่มีโครงสร้างภายในเครื่องโดยไม่มีการเรียกเครือข่าย ไปป์ไลน์ PDF แบบไฮบริดที่เป็นตัวเลือกเสริมจะส่งต่อผ่าน LLM ในเครื่อง (ผ่าน Ollama) สำหรับใบแจ้งยอดดิจิทัลและสแกน

เหมาะสำหรับใคร?

รูปแบบที่รองรับ

รูปแบบ มาตรฐาน ประเภทไฟล์ Parser/Method
CAMT.053 ISO 20022 Bank-to-Customer Statement .xml CamtParser
PAIN.001 ISO 20022 Credit Transfer Initiation .xml Pain001Parser
CSV การส่งออกทั่วไปของธนาคาร .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 มาตรฐาน SWIFT .mt940, .sta Mt940Parser
PDF ใบแจ้งยอดดิจิทัลและสแกน .pdf smart_ingest()

ทุกรูปแบบจะสร้าง pandas DataFrames ที่ปรับมาตรฐานแล้ว พร้อมชื่อคอลัมน์ที่สอดคล้องกัน ทำให้การประมวลผลปลายทางไม่ขึ้นกับรูปแบบ

ความสามารถหลัก

ความปลอดภัยและความเป็นส่วนตัว

ประสิทธิภาพ

เมตริก ค่า
ปริมาณงาน CAMT.053 27,000+ tx/s
ปริมาณงาน PAIN.001 52,000+ tx/s
เวลาแฝงต่อธุรกรรม (CAMT) 37 ไมโครวินาที
เวลาแฝงต่อธุรกรรม (PAIN.001) 19 ไมโครวินาที
เวลาจนถึงผลลัพธ์แรก < 2 ms
การปรับขนาดหน่วยความจำ (1K-50K tx) คงที่ (สตรีมมิง)
ความครอบคลุมการทดสอบ 100% branch coverage
การทดสอบ 718 จาก 29 ไฟล์ทดสอบ

เริ่มสร้าง

เริ่มต้นด้วยการติดตั้งและตัวอย่าง ❯

"GitHub Repository"