Bank Statement Parser の開発をフォローしてください。 RSS 経由で購読するか、GitHub リポジトリ リリース通知用。
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 2026-03-15
- 並列ファイル解析を追加しました
parse_files_parallel()ProcessPoolExecutor を使用します。 - メモリ制限のある大きな PAIN.001 ファイル (50 MB 以上) に対する真のストリーミングを追加しました。
- パフォーマンスの最適化: CAMT スループットは 27,000 tx/s を超え、PAIN.001 は 52,000 tx/s を超えています。
- 追加した
Deduplicator完全な重複と疑わしい一致を信頼スコアで検出するためのクラス。 - 追加した
from_string()そしてfrom_bytes()ディスク I/O を使用しないメモリ内解析のメソッド。 - 追加した
iter_secure_xml_entries()安全な ZIP アーカイブ処理用。 - パフォーマンスしきい値を強制する拡張 CI。
v0.0.3 — 2025-11-20
- CSV、OFX、QFX、MT940 パーサーのサポートを追加しました。
- 形式の自動検出を追加しました
detect_statement_format()そしてcreate_parser()。 - PII 編集を追加しました (CLI およびストリーミング モードではデフォルトでオン)。
- CSV、JSON、Excel 用のエクスポート ヘルパーを追加しました。
- オプションの Polars DataFrame サポートを追加しました。
- テスト スイートを 100% ブランチ カバレッジの 718 テストに拡張しました。
v0.0.2 — 2025-06-10
- PAIN.001 パーサーを追加 (
Pain001Parser) ISO 20022 単位転送開始ファイル用。 - CLI インターフェースを追加 (
python -m bankstatementparser.cli)。 - ストリーミングモードを追加しました
parse_streaming()。 - 入力検証とファイル サイズ制限を追加しました。
v0.0.1 — 2025-01-15
- 初期リリース。
- CAMT.053 パーサー (
CamtParser) ISO 20022 の銀行から顧客への取引明細書用。 - パンダのデータフレーム出力。
- 基本的な XML セキュリティ強化 (XXE 保護、no_network)。
GitHub で完全なコミット履歴を表示します。https://github.com/sebastienrousseau/bankstatementparser/commits/main).