ตัวแยกวิเคราะห์ใบแจ้งยอดธนาคาร เป็นไลบรารี Python แบบโอเพ่นซอร์สที่แยกวิเคราะห์ใบแจ้งยอดธนาคารจากหกรูปแบบ (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940) ลงใน DataFrames แพนด้าที่มีโครงสร้าง การประมวลผลทั้งหมดทำงานภายในเครื่อง — การเรียกเครือข่ายเป็นศูนย์, เอาต์พุตตามที่กำหนด และการแก้ไข PII อัตโนมัติ
เริ่มต้นในไม่กี่วินาที
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, ready to use
หนึ่งไลบรารี หกรูปแบบ
แยกวิเคราะห์ CAMT.053, PAIN.001, CSV, OFX, QFX และ MT940 ลงใน DataFrames ของ pandas ที่มีโครงสร้างด้วย API แบบครบวงจรเพียงตัวเดียว ไม่จำเป็นต้องติดตั้งแพ็คเกจแยกกันสำหรับแต่ละรูปแบบ
| คุณสมบัติ | ตัวแยกวิเคราะห์ใบแจ้งยอดธนาคาร | OSS รูปแบบเดียว (mt940, ofxparse) | SaaS (ออโครลัส, พาร์เซอร์) |
|---|---|---|---|
| รูปแบบที่รองรับ | 6 API แบบรวม | อย่างละ 1 อัน | มากมาย (ผ่าน OCR) |
| ความเป็นส่วนตัวของข้อมูล | ท้องถิ่น 100% การโทรผ่านเครือข่ายเป็นศูนย์ | ท้องถิ่น 100% | ข้อมูลที่ส่งไปภายนอก |
| ค่าใช้จ่าย | ฟรี อาปาเช่ 2.0 | ฟรี | $49-$1,000+/เดือน |
| การปกปิด PII | ในตัว เปิดตามค่าเริ่มต้น | เลขที่ | แตกต่างกันไป |
| สตรีมมิ่ง | หน่วยความจำที่ถูกจำกัด | เลขที่ | ไม่มี |
| การรักษาความปลอดภัยทางไปรษณีย์ | มีการชุบแข็งในตัว | เลขที่ | ไม่มี |
| การขจัดข้อมูลซ้ำซ้อน | มีคะแนนความมั่นใจในตัว | เลขที่ | บาง |
สร้างขึ้นเพื่อการโยกย้าย ISO 20022
SWIFT ได้กำหนดกำหนดเวลาที่แน่นอน: สถาบันการเงินทุกแห่งจะต้องได้รับ CAMT.053 ภายในเดือนพฤศจิกายน 2027 และ MT940/MT942/MT950 จะถูกเลิกใช้งานโดยสมบูรณ์ภายในเดือนพฤศจิกายน 2028 ตัวแยกวิเคราะห์ใบแจ้งยอดธนาคาร รองรับทั้งรูปแบบ MT940 ดั้งเดิมและรูปแบบ ISO 20022 สมัยใหม่ (CAMT.053, PAIN.001) ใน API เดียว ดังนั้นไปป์ไลน์การแยกวิเคราะห์ของคุณจึงทำงานได้ในระหว่างการเปลี่ยนแปลงและหลังจากนั้น
ผลงาน
- 27,000+ ธุรกรรม/วินาที สำหรับการแยกวิเคราะห์ CAMT.053
- 52,000+ ธุรกรรม/วินาที สำหรับการแยกวิเคราะห์ PAIN.001
- < 2 ms ถึงเวลาผลลัพธ์แรก
- หน่วยความจำคงที่ ตั้งแต่ 1,000 ถึง 50,000+ ธุรกรรมผ่านการสตรีม
- การทดสอบ 467 รายการ พร้อมการครอบคลุมสาขา 100% ทั่วทั้ง Python 3.9 ถึง 3.14
ทำไมตัวแยกวิเคราะห์ใบแจ้งยอดธนาคาร?
- ฟอร์แมตการตรวจจับอัตโนมัติ:
detect_statement_format()ระบุไฟล์โดยอัตโนมัติและcreate_parser()ส่งคืน parser ที่ถูกต้อง - ความเป็นส่วนตัวต้องมาก่อน: การแก้ไข PII เปิดอยู่ตามค่าเริ่มต้น ฟิลด์ที่ละเอียดอ่อน (ชื่อ, IBAN, ที่อยู่) จะถูกปกปิดในเอาต์พุต CLI เลือกเข้าร่วมด้วย
--show-piiเมื่อจำเป็น - พร้อมสำหรับการผลิต: การนำเข้า ZIP อย่างปลอดภัย (การป้องกันระเบิด การปฏิเสธการเข้าที่เข้ารหัส) การตรวจสอบความถูกต้องอินพุต และการป้องกันการข้ามเส้นทาง
- เอาต์พุตที่ยืดหยุ่น: ส่งออกเป็น CSV, JSON, Excel หรือแปลงเป็น Polars DataFrames
- การประมวลผลแบบขนาน: แยกวิเคราะห์ไฟล์หลายไฟล์พร้อมกัน
parse_files_parallel().
กำลังประเมินทางเลือกอื่นๆ ดูว่า ตัวแยกวิเคราะห์ใบแจ้งยอดธนาคาร เปรียบเทียบอย่างไร ❯ | สำรวจกรณีการใช้งานจริง ❯