Trình phân tích báo cáo ngân hàng

Phân tích CAMT.053, PAIN.001, CSV, OFX, QFX và MT940 thành DataFrames của gấu trúc. 27K+ tx/s, phát trực tuyến, biên tập PII, không có cuộc gọi mạng.

pip cài đặt bảng sao kê ngân hàng

Bank Statement Parser là thư viện Python mã nguồn mở giúp phân tích sao kê ngân hàng từ bảy định dạng (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 và PDF) thành các pandas DataFrames có cấu trúc. Toàn bộ quá trình xử lý chạy cục bộ — đầu ra xác định, tự động ẩn danh PII, và có pipeline PDF hybrid tùy chọn tự động chuyển qua LLM cục bộ khi cần.

Bắt đầu trong vài giây

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Một thư viện, bảy định dạng

Phân tích CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 và PDF thành các pandas DataFrames có cấu trúc với một API thống nhất duy nhất. Không cần cài đặt các gói riêng biệt cho từng định dạng.

Tính năngBank Statement ParserOSS đơn định dạng (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Định dạng hỗ trợ7, API thống nhấtMỗi gói 1 định dạngNhiều (qua OCR)
Hỗ trợ PDFPipeline hybrid (deterministic + LLM + vision)KhôngCó (cloud OCR)
Bảo mật dữ liệu100% cục bộ (LLM chạy cục bộ qua Ollama)100% cục bộDữ liệu gửi ra ngoài
Chi phíMiễn phí, Apache 2.0Miễn phí$49-$1,000+/tháng
Xác minh số dưGolden Rule (số dư đầu kỳ + có − nợ = số dư cuối kỳ)KhôngTùy thuộc
Ẩn danh PIITích hợp sẵn, bật mặc địnhKhôngTùy thuộc
StreamingBộ nhớ giới hạnKhôngN/A
REST APITích hợp microservice FastAPIKhông
Chống trùng lặpHash giao dịch idempotentKhôngMột phần
Xuất sổ cáihledger + beancountKhôngKhông

Pipeline PDF Hybrid

Bank Statement Parser v0.0.5+ bao gồm pipeline hybrid ba đường dẫn cho sao kê ngân hàng PDF:

Mọi kết quả trích xuất đều được xác minh bằng Golden Rule: opening balance + credits − debits == closing balance.

Được xây dựng cho cuộc chuyển đổi ISO 20022

SWIFT đã đặt thời hạn rõ ràng: tất cả tổ chức tài chính phải nhận được CAMT.053 trước tháng 11/2027, và MT940/MT942/MT950 sẽ ngừng hoạt động hoàn toàn trước tháng 11/2028. Bank Statement Parser xử lý cả định dạng MT940 cũ và ISO 20022 hiện đại (CAMT.053, PAIN.001) trong một API duy nhất, giúp pipeline phân tích của bạn hoạt động trong suốt quá trình chuyển đổi và sau đó.

Hiệu suất

Tại sao chọn Bank Statement Parser?

Được xây dựng cho production

Bank Statement Parser được thiết kế cho các nhóm ngân quỹ, nhà phát triển fintech, và nhân viên tuân thủ xử lý dữ liệu tài chính nhạy cảm. Thư viện được sử dụng trong pipeline chuyển đổi MT940-sang-CAMT, hệ thống đối chiếu tự động, nhập sao kê PDF, và quy trình kiểm toán theo quy định tại các tổ chức tài chính.

Đang đánh giá các lựa chọn thay thế? Xem so sánh Bank Statement Parser ❯ | Khám phá các trường hợp sử dụng thực tế ❯

Bắt đầu ❯ | Xem trên GitHub ❯ | Xem trên PyPI ❯