v0.0.4(最新)
- 新增了平行文件解析
parse_files_parallel()使用 ProcessPoolExecutor。 - 為具有有限記憶體的大型 PAIN.001 檔案 (50 MB+) 添加了真正的串流。
- 效能最佳化:CAMT 吞吐量現已超過 27,000 tx/s,PAIN.001 超過 52,000 tx/s。
- 添加
Deduplicator用於檢測精確重複項和與置信度分數的可疑匹配的類別。 - 添加
from_string()和from_bytes()無需磁碟 I/O 的記憶體解析方法。 - 添加
iter_secure_xml_entries()用於安全的 ZIP 存檔處理。 - 具有效能閾值強制執行的擴展 CI。
v0.0.3
- 新增了 CSV、OFX、QFX 和 MT940 解析器支援。
- 新增了格式自動偵測
detect_statement_format()和create_parser()。 - 新增了 PII 編輯(在 CLI 和流模式下預設為啟用)。
- 新增了 CSV、JSON 和 Excel 的匯出幫助程式。
- 新增了可選的 Polars DataFrame 支援。
- 將測試套件擴展至 467 個測試,分支覆蓋率為 100%。
v0.0.2
- 新增了 PAIN.001 解析器(
Pain001Parser) 用於 ISO 20022 學分轉移啟動文件。 - 新增了 CLI 介面(
python -m bankstatementparser.cli)。 - 新增了串流模式
parse_streaming()。 - 新增了輸入驗證和檔案大小限制。
v0.0.1
- 初始版本。
- CAMT.053 解析器(
CamtParser) 適用於 ISO 20022 銀行對客戶報表。 - 大熊貓資料幀輸出。
- 基本 XML 安全強化(XXE 保護、no_network)。
在 GitHub.