Bankutdrag Parser

Analysera CAMT.053, PAIN.001, CSV, OFX, QFX och MT940 till pandas DataFrames. 27K+ tx/s, streaming, PII-redaktion, noll nätverksanrop.

pip installera bankstatementparser

Bank Statement Parser är ett Python-bibliotek med öppen källkod som analyserar kontoutdrag från sju format (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 och PDF) till strukturerade pandas DataFrames. All bearbetning körs lokalt — deterministisk utdata, automatisk PII-redaktion och en valfri hybrid-PDF-pipeline som dirigerar via lokala LLM:er vid behov.

Kom igång på några sekunder

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Ett bibliotek, sju format

Analysera CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 och PDF till strukturerade pandas DataFrames med ett enda, enhetligt API. Du behöver inte installera separata paket för varje format.

FunktionBank Statement ParserEnkelformat OSS (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Format som stöds7, enhetligt API1 stMånga (via OCR)
PDF-stödHybrid-pipeline (deterministisk + LLM + vision)NejJa (moln-OCR)
Datasekretess100 % lokalt (LLM:er körs lokalt via Ollama)100 % lokaltData skickas externt
KostnadGratis, Apache 2.0Gratis$49–$1 000+/mån
SaldoverifieringGolden Rule (ingående + krediteringar − debiteringar = utgående)NejVarierar
PII-redaktionInbyggd, på som standardNejVarierar
StreamingBegränsat minneNejN/A
REST APIInbyggd FastAPI-mikrotjänstNejJa
DedupliceringIdempotenta transaktionshasharNejDelvis
Ledger-exporthledger + beancountNejNej

Hybrid-PDF-pipeline

Bank Statement Parser v0.0.5+ inkluderar en trevägs hybrid-pipeline för PDF-kontoutdrag:

Varje extraktion verifieras med Golden Rule: opening balance + credits − debits == closing balance.

Byggd för ISO 20022-migreringen

SWIFT har satt fasta deadlines: alla finansinstitut måste ta emot CAMT.053 senast november 2027, och MT940/MT942/MT950 kommer att vara helt avvecklade senast november 2028. Bank Statement Parser hanterar både äldre MT940 och moderna ISO 20022-format (CAMT.053, PAIN.001) i ett enda API, så din pipeline fungerar under övergången och därefter.

Prestanda

Varför Bank Statement Parser?

Byggd för produktion

Bank Statement Parser är designad för treasury-team, fintech-utvecklare och efterlevnadsansvariga som behandlar känslig finansiell data. Biblioteket används i MT940-till-CAMT-migreringspipelines, automatiserade avstämningssystem, PDF-utdragsinmatning och regulatoriska granskningsflöden inom finansinstitut.

Utvärderar du alternativ? Se hur Bank Statement Parser jämför ❯ | Utforska verkliga användningsfall ❯

Kom igång ❯ | Visa på GitHub ❯ | Visa på PyPI ❯