關注銀行對帳單解析器的開發。透過 RSS 訂閱或觀看 GitHub 儲存庫 用於發布通知。
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 2026-03-15(最新)
- 新增了平行文件解析
parse_files_parallel()使用 ProcessPoolExecutor。 - 為具有有限記憶體的大型 PAIN.001 檔案 (50 MB+) 添加了真正的串流。
- 效能最佳化:CAMT 吞吐量現已超過 27,000 tx/s,PAIN.001 超過 52,000 tx/s。
- 添加
Deduplicator用於檢測精確重複項和與置信度分數的可疑匹配的類別。 - 添加
from_string()和from_bytes()無需磁碟 I/O 的記憶體解析方法。 - 添加
iter_secure_xml_entries()用於安全的 ZIP 存檔處理。 - 具有效能閾值強制執行的擴展 CI。
v0.0.3 — 2025-11-20
- 新增了 CSV、OFX、QFX 和 MT940 解析器支援。
- 新增了格式自動偵測
detect_statement_format()和create_parser()。 - 新增了 PII 編輯(在 CLI 和流模式下預設為啟用)。
- 新增了 CSV、JSON 和 Excel 的匯出幫助程式。
- 新增了可選的 Polars DataFrame 支援。
- 將測試套件擴展至 718 個測試,分支覆蓋率為 100%。
v0.0.2 — 2025-06-10
- 新增了 PAIN.001 解析器(
Pain001Parser) 用於 ISO 20022 學分轉移啟動文件。 - 新增了 CLI 介面(
python -m bankstatementparser.cli)。 - 新增了串流模式
parse_streaming()。 - 新增了輸入驗證和檔案大小限制。
v0.0.1 — 2025-01-15
- 初始版本。
- CAMT.053 解析器(
CamtParser) 適用於 ISO 20022 銀行對客戶報表。 - 大熊貓資料幀輸出。
- 基本 XML 安全強化(XXE 保護、no_network)。
在 GitHub.
<腳本類型=“應用程式/ld+json”> { “@上下文”:“https://schema.org「, "@type": "軟體應用程式", "name": "銀行對帳單解析器", "applicationCategory": "開發者應用程式", "operatingSystem": "跨平台", "軟體版本": "0.0.4", "發佈日期": "2026-03-15", "releaseNotes": "新增了平行檔案解析、PAIN.001 的真正串流、效能最佳化(27K+ tx/s CAMT、52K+ tx/s PAIN.001)、重複資料刪除器類別、記憶體中解析、安全 ZIP 處理。 ", “下載地址”:“https://pypi.org/project/bankstatementparser/「, “執照”: ”https://opensource.org/licenses/Apache-2.0「, 「作者」:{ "@type": "人", “姓名”:“塞巴斯蒂安·盧梭” } } </腳本>