Theo dõi sự phát triển của Trình phân tích sao kê ngân hàng. Đăng ký qua RSS hoặc xem kho GitHub để biết thông báo phát hành.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 15-03-2026 (Mới nhất)
- Đã thêm phân tích tệp song song với
parse_files_parallel()sử dụng ProcessPoolExecutor. - Đã thêm tính năng phát trực tuyến thực sự cho các tệp PAIN.001 lớn (50 MB+) có bộ nhớ giới hạn.
- Tối ưu hóa hiệu suất: Thông lượng CAMT hiện vượt quá 27.000 tx/s, PAIN.001 vượt quá 52.000 tx/s.
- Đã thêm
Deduplicatorlớp để phát hiện các bản sao chính xác và các kết quả trùng khớp bị nghi ngờ có điểm tin cậy. - Đã thêm
from_string()Vàfrom_bytes()phương pháp phân tích cú pháp trong bộ nhớ mà không cần I/O đĩa. - Đã thêm
iter_secure_xml_entries()để xử lý lưu trữ ZIP an toàn. - CI mở rộng với việc thực thi ngưỡng hiệu suất.
v0.0.3 — 20-11-2025
- Đã thêm hỗ trợ trình phân tích cú pháp CSV, OFX, QFX và MT940.
- Đã thêm tính năng tự động phát hiện định dạng với
detect_statement_format()Vàcreate_parser(). - Đã thêm tính năng chỉnh sửa PII (bật theo mặc định trong CLI và chế độ phát trực tuyến).
- Đã thêm trình trợ giúp xuất cho CSV, JSON và Excel.
- Đã thêm hỗ trợ Polars DataFrame tùy chọn.
- Bộ thử nghiệm mở rộng lên 718 thử nghiệm với phạm vi bao phủ 100% chi nhánh.
v0.0.2 — 2025-06-10
- Đã thêm trình phân tích cú pháp PAIN.001 (
Pain001Parser) đối với các tệp khởi tạo chuyển giao tín chỉ ISO 20022. - Đã thêm giao diện CLI (
python -m bankstatementparser.cli). - Đã thêm chế độ phát trực tuyến với
parse_streaming(). - Đã thêm xác thực đầu vào và giới hạn kích thước tệp.
v0.0.1 — 2025-01-15
- Phát hành lần đầu.
- Trình phân tích cú pháp CAMT.053 (
CamtParser) đối với các báo cáo giữa ngân hàng với khách hàng theo tiêu chuẩn ISO 20022. - đầu ra DataFrame của gấu trúc.
- Tăng cường bảo mật XML cơ bản (bảo vệ XXE, no_network).
Xem toàn bộ lịch sử cam kết trên GitHub.