Analyzátor bankovních výpisů

Analyzujte CAMT.053, PAIN.001, CSV, OFX, QFX a MT940 do datových rámců pandas. 27K+ tx/s, streamování, redakce PII, nulová síťová volání.

pip install bankstatementparser

Bank Statement Parser je open-source Python knihovna, která analyzuje bankovní výpisy ze sedmi formátů (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 a PDF) do strukturovaných pandas DataFrames. Veškeré zpracování probíhá lokálně — deterministický výstup, automatická redakce PII a volitelný hybridní PDF pipeline, který v případě potřeby směruje přes lokální LLM.

Začněte během sekund

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Jedna knihovna, sedm formátů

Analyzujte CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 a PDF do strukturovaných pandas DataFrames pomocí jediného API. Není třeba instalovat samostatné balíčky pro každý formát.

FunkceBank Statement ParserJednoformátový OSS (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Podporované formáty7, jednotné API1 každýMnoho (přes OCR)
Podpora PDFHybridní pipeline (deterministický + LLM + vision)NeAno (cloud OCR)
Ochrana dat100% lokální (LLM běží lokálně přes Ollama)100% lokálníData odesílána externě
NákladyZdarma, Apache 2.0Zdarma49–1 000+ $/měs.
Ověření zůstatkuGolden Rule (počáteční + kredity − debety = konečný)NeRůzné
Redakce PIIVestavěná, ve výchozím nastavení zapnutáNeRůzné
StreamingOmezená paměťNeN/A
REST APIVestavěný FastAPI mikroservisNeAno
DeduplikaceIdempotentní transakční hasheNeČástečně
Export do účetnictvíhledger + beancountNeNe

Hybridní PDF pipeline

Bank Statement Parser v0.0.5+ obsahuje tříúrovňový hybridní pipeline pro PDF bankovní výpisy:

Každá extrakce je ověřena pomocí Golden Rule: opening balance + credits − debits == closing balance.

Vytvořeno pro migraci ISO 20022

SWIFT stanovil pevné termíny: všechny finanční instituce musí přijímat CAMT.053 do listopadu 2027 a MT940/MT942/MT950 budou plně vyřazeny do listopadu 2028. Bank Statement Parser zpracovává jak starší MT940, tak moderní ISO 20022 formáty (CAMT.053, PAIN.001) v jednom API. Váš pipeline tak funguje během přechodu i po něm.

Výkon

Proč Bank Statement Parser?

Postaveno pro produkci

Bank Statement Parser je navržen pro treasury týmy, fintech vývojáře a compliance pracovníky zpracovávající citlivá finanční data. Knihovna se používá v migračních pipeline MT940-na-CAMT, automatizovaných systémech odsouhlasení, při zpracování PDF výpisů a ve workflow regulačních auditů napříč finančními institucemi.

Porovnáváte alternativy? Podívejte se, jak si Bank Statement Parser stojí ❯ | Prozkoumejte reálné případy použití ❯

Začít ❯ | Zobrazit na GitHubu ❯ | Zobrazit na PyPI ❯