Parser wyciągów bankowych

Przeanalizuj CAMT.053, PAIN.001, CSV, OFX, QFX i MT940 w pandach DataFrames. Ponad 27 tys. tx/s, przesyłanie strumieniowe, redagowanie danych osobowych, zero połączeń sieciowych.

pip zainstaluj parser wyciągów bankowych

Bank Statement Parser to biblioteka Pythona typu open source, która parsuje wyciągi bankowe z siedmiu formatów (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 i PDF) do ustrukturyzowanych pandas DataFrames. Całe przetwarzanie odbywa się lokalnie — deterministyczne wyniki, automatyczna redakcja danych osobowych oraz opcjonalny hybrydowy pipeline PDF, który w razie potrzeby kieruje dane przez lokalne modele LLM.

Rozpocznij w kilka sekund

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Jedna biblioteka, siedem formatów

Parsuj CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 i PDF do ustrukturyzowanych pandas DataFrames za pomocą jednego, ujednoliconego API. Nie trzeba instalować osobnych pakietów dla każdego formatu.

FunkcjaBank Statement ParserJednoformatowy OSS (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Obsługiwane formaty7, ujednolicone API1 każdyWiele (przez OCR)
Obsługa PDFHybrydowy pipeline (deterministyczny + LLM + wizja)NieTak (chmurowy OCR)
Prywatność danych100% lokalnie (LLM działają lokalnie przez Ollama)100% lokalnieDane wysyłane na zewnątrz
KosztBezpłatny, Apache 2.0Bezpłatny49–1000+ USD/mies.
Weryfikacja saldaGolden Rule (otwarcie + uznania − obciążenia = zamknięcie)NieRóżnie
Redakcja PIIWbudowana, domyślnie włączonaNieRóżnie
StreamingOgraniczona pamięćNieNie dotyczy
REST APIWbudowany mikroserwis FastAPINieTak
DeduplikacjaIdempotentne hash transakcjiNieCzęściowo
Eksport do księgihledger + beancountNieNie

Hybrydowy pipeline PDF

Bank Statement Parser w wersji 0.0.5+ zawiera trójścieżkowy hybrydowy pipeline do wyciągów bankowych w formacie PDF:

Każda ekstrakcja jest weryfikowana za pomocą Golden Rule: opening balance + credits − debits == closing balance.

Stworzony dla migracji ISO 20022

SWIFT wyznaczył twarde terminy: wszystkie instytucje finansowe muszą obsługiwać CAMT.053 do listopada 2027, a MT940/MT942/MT950 zostaną całkowicie wycofane do listopada 2028. Bank Statement Parser obsługuje zarówno starsze formaty MT940, jak i nowoczesne ISO 20022 (CAMT.053, PAIN.001) w jednym API. Pipeline parsowania działa zarówno w okresie przejściowym, jak i po nim.

Wydajność

Dlaczego Bank Statement Parser?

Zbudowany do produkcji

Bank Statement Parser jest przeznaczony dla zespołów skarbowych, programistów fintech i specjalistów ds. zgodności przetwarzających wrażliwe dane finansowe. Biblioteka jest wykorzystywana w pipeline'ach migracji MT940-do-CAMT, systemach automatycznego uzgadniania, przetwarzaniu wyciągów PDF oraz przepływach pracy audytu regulacyjnego w instytucjach finansowych.

Oceniasz alternatywy? Zobacz porównanie Bank Statement Parser ❯ | Poznaj rzeczywiste przypadki użycia ❯

Rozpocznij ❯ | Zobacz na GitHub ❯ | Zobacz na PyPI ❯