은행 계좌 명세서 파서 정보

하나의 도서관. 6가지 형식. 네트워크 호출이 없습니다.

요약: Bank Statement Parser는 7가지 은행 명세서 형식(CAMT.053, PAIN.001, CSV, OFX, QFX, MT940, PDF)을 pandas DataFrame으로 파싱하는 오픈 소스 Python 라이브러리입니다. 잔액 검증이 포함된 하이브리드 PDF 파이프라인, REST API, 보강, 원장 내보내기, 27K+ tx/s 처리량을 제공합니다.

Bank Statement Parser는 7가지 형식의 은행 명세서를 구조화된 pandas DataFrame으로 파싱하는 오픈 소스 Python 라이브러리입니다. 결정적 코어는 구조화된 형식을 네트워크 호출 없이 로컬에서 처리합니다. 선택적 하이브리드 PDF 파이프라인은 디지털 및 스캔 명세서를 로컬 LLM(Ollama 경유)을 통해 처리합니다.

대상 사용자

지원 형식

형식 표준 파일 유형 파서/메서드
CAMT.053 ISO 20022 은행-고객 명세서 .xml CamtParser
PAIN.001 ISO 20022 자금이체 개시 .xml Pain001Parser
CSV 일반 은행 내보내기 .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 SWIFT 표준 .mt940, .sta Mt940Parser
PDF 디지털 및 스캔 명세서 .pdf smart_ingest()

모든 형식은 일관된 열 이름을 가진 정규화된 pandas DataFrame을 생성하므로, 다운스트림 처리가 형식에 구애받지 않습니다.

주요 기능

보안 및 프라이버시

성능

지표
CAMT.053 처리량 27,000+ tx/s
PAIN.001 처리량 52,000+ tx/s
트랜잭션당 지연 시간 (CAMT) 37 마이크로초
트랜잭션당 지연 시간 (PAIN.001) 19 마이크로초
첫 번째 결과 반환 시간 < 2 ms
메모리 확장 (1K-50K tx) 일정 (스트리밍)
테스트 커버리지 100% 브랜치 커버리지
테스트 29개 테스트 파일에 걸쳐 718개

시작하기

설치 및 예제로 시작하기 ❯

"GitHub 저장소"