은행 명세서 파서 개발을 따르십시오. RSS를 통해 구독하거나 GitHub 저장소 출시 알림용입니다.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 2026-03-15
- 병렬 파일 구문 분석이 추가되었습니다.
parse_files_parallel()ProcessPoolExecutor를 사용합니다. - 메모리가 제한된 대용량 PAIN.001 파일(50MB 이상)에 대한 트루 스트리밍을 추가했습니다.
- 성능 최적화: CAMT 처리량은 이제 27,000tx/s를 초과하고 PAIN.001은 52,000tx/s를 초과합니다.
- 추가됨
Deduplicator신뢰도 점수를 사용하여 정확한 중복 항목과 의심되는 항목을 검색하는 클래스입니다. - 추가됨
from_string()그리고from_bytes()디스크 I/O 없이 메모리 내 구문 분석을 위한 방법. - 추가됨
iter_secure_xml_entries()안전한 ZIP 아카이브 처리를 위해. - 성능 임계값 적용을 통한 확장 CI.
v0.0.3 — 2025-11-20
- CSV, OFX, QFX 및 MT940 파서 지원이 추가되었습니다.
- 형식 자동 감지 기능이 추가되었습니다.
detect_statement_format()그리고create_parser(). - PII 수정이 추가되었습니다(CLI 및 스트리밍 모드에서는 기본적으로 활성화됨).
- CSV, JSON, Excel용 내보내기 도우미가 추가되었습니다.
- 선택적인 Polars DataFrame 지원이 추가되었습니다.
- 100% 분기 적용 범위를 갖춘 718개 테스트로 테스트 모음을 확장했습니다.
v0.0.2 — 2025-06-10
- PAIN.001 파서 추가(
Pain001Parser) ISO 20022 학점 이전 시작 파일의 경우. - CLI 인터페이스 추가(
python -m bankstatementparser.cli). - 스트리밍 모드가 추가되었습니다.
parse_streaming(). - 입력 유효성 검사 및 파일 크기 제한이 추가되었습니다.
v0.0.1 — 2025-01-15
- 최초 출시.
- CAMT.053 파서(
CamtParser) ISO 20022 은행-고객 명세서용. - 팬더 DataFrame 출력.
- 기본 XML 보안 강화(XXE 보호, no_network).
[GitHub](에서 전체 커밋 내역을 확인하세요.https://github.com/sebastienrousseau/bankstatementparser/commits/main).
<스크립트 유형="application/ld+json"> { "@컨텍스트": "https://schema.org", "@type": "소프트웨어응용 프로그램", "name": "은행 명세서 파서", "applicationCategory": "DeveloperApplication", "operatingSystem": "교차 플랫폼", "소프트웨어버전": "0.0.4", "datePublished": "2026-04-11", "releaseNotes": "병렬 파일 구문 분석, PAIN.001에 대한 진정한 스트리밍, 성능 최적화(27K+ tx/s CAMT, 52K+ tx/s PAIN.001), 중복 제거기 클래스, 메모리 내 구문 분석, 보안 ZIP 처리가 추가되었습니다.", "다운로드 URL": "https://pypi.org/project/bankstatementparser/", "라이센스": "https://opensource.org/licenses/Apache-2.0", "저자": { "@type": "사람", "이름": "세바스티앙 루소" } }