Giới thiệu về Trình phân tích sao kê ngân hàng

Một thư viện. Sáu định dạng. Không có cuộc gọi mạng.

TL;DR: Bank Statement Parser là thư viện Python mã nguồn mở giúp phân tích bảy định dạng sao kê ngân hàng (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 và PDF) thành pandas DataFrames. Pipeline PDF hybrid với xác minh số dư, REST API, làm giàu dữ liệu, xuất sổ cái, thông lượng 27K+ tx/s.

Bank Statement Parser là thư viện Python mã nguồn mở giúp phân tích sao kê ngân hàng từ bảy định dạng thành pandas DataFrames có cấu trúc. Phần lõi xác định xử lý các định dạng có cấu trúc cục bộ mà không cần kết nối mạng. Pipeline PDF hybrid tùy chọn chuyển qua LLM cục bộ (qua Ollama) cho các sao kê kỹ thuật số và sao kê quét.

Dành cho ai?

Định dạng hỗ trợ

Định dạng Tiêu chuẩn Loại tệp Parser/Phương thức
CAMT.053 ISO 20022 Sao kê ngân hàng gửi khách hàng .xml CamtParser
PAIN.001 ISO 20022 Khởi tạo chuyển khoản .xml Pain001Parser
CSV Xuất dữ liệu ngân hàng tổng hợp .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 Tiêu chuẩn SWIFT .mt940, .sta Mt940Parser
PDF Sao kê kỹ thuật số và sao kê quét .pdf smart_ingest()

Tất cả định dạng đều tạo ra pandas DataFrames chuẩn hóa với tên cột nhất quán, giúp xử lý downstream không phụ thuộc vào định dạng.

Khả năng chính

Bảo mật và quyền riêng tư

Hiệu suất

Chỉ số Giá trị
Thông lượng CAMT.053 27.000+ tx/s
Thông lượng PAIN.001 52.000+ tx/s
Độ trễ mỗi giao dịch (CAMT) 37 micro giây
Độ trễ mỗi giao dịch (PAIN.001) 19 micro giây
Thời gian đến kết quả đầu tiên < 2 ms
Mở rộng bộ nhớ (1K-50K tx) Không đổi (streaming)
Độ phủ kiểm tra 100% độ phủ nhánh
Bài kiểm tra 718 trên 29 tệp kiểm tra

Bắt đầu xây dựng

Bắt đầu với hướng dẫn cài đặt và ví dụ ❯

"Kho lưu trữ GitHub"