Парсер банківської виписки

Проаналізуйте CAMT.053, PAIN.001, CSV, OFX, QFX і MT940 у фреймах даних pandas. 27K+ tx/s, потокове передавання, редагування ідентифікаційної інформації, нуль мережевих викликів.

pip інсталювати bankstatementparser

Bank Statement Parser — це бібліотека Python з відкритим кодом, яка аналізує банківські виписки із семи форматів (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 та PDF) у структуровані pandas DataFrames. Уся обробка виконується локально — детермінований результат, автоматичне приховування персональних даних та опціональний гібридний PDF pipeline, який за потреби використовує локальні LLM.

Розпочніть за лічені секунди

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Одна бібліотека, сім форматів

Аналізуйте CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 та PDF у структуровані pandas DataFrames за допомогою єдиного API. Не потрібно встановлювати окремі пакети для кожного формату.

ФункціяBank Statement ParserОдноформатні OSS (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Підтримувані формати7, єдиний APIПо 1 кожнийБагато (через OCR)
Підтримка PDFГібридний pipeline (детерміністичний + LLM + vision)НіТак (хмарний OCR)
Конфіденційність даних100% локально (LLM працюють локально через Ollama)100% локальноДані надсилаються назовні
ВартістьБезкоштовно, Apache 2.0Безкоштовно$49–$1 000+/міс
Перевірка балансуЗолоте правило (початок + надходження − списання = кінець)НіПо-різному
Приховування персональних данихВбудоване, увімкнене за замовчуваннямНіПо-різному
StreamingОбмежена пам'ятьНіN/A
REST APIВбудований мікросервіс FastAPIНіТак
ДедуплікаціяІдемпотентні hash транзакційНіЧастково
Експорт у бухгалтеріюhledger + beancountНіНі

Гібридний PDF Pipeline

Bank Statement Parser v0.0.5+ містить тришляховий гібридний pipeline для PDF банківських виписок:

Кожне витягування перевіряється Золотим правилом: opening balance + credits − debits == closing balance.

Створено для міграції на ISO 20022

SWIFT встановив чіткі терміни: усі фінансові установи мають приймати CAMT.053 до листопада 2027 року, а MT940/MT942/MT950 буде повністю припинено до листопада 2028 року. Bank Statement Parser працює як із застарілим MT940, так і з сучасними форматами ISO 20022 (CAMT.053, PAIN.001) через єдиний API. Ваш pipeline аналізу працюватиме під час переходу і після нього.

Продуктивність

Чому Bank Statement Parser?

Створено для продакшену

Bank Statement Parser розроблений для команд казначейства, розробників фінтех-рішень та спеціалістів з комплаєнсу, які обробляють конфіденційні фінансові дані. Бібліотека використовується в pipeline міграції MT940-на-CAMT, автоматизованих системах звірки, завантаженні PDF-виписок та робочих процесах регуляторного аудиту у фінансових установах.

Оцінюєте альтернативи? Дивіться порівняння Bank Statement Parser ❯ | Ознайомтеся з реальними сценаріями використання ❯

Розпочати ❯ | Переглянути на GitHub ❯ | Переглянути на PyPI ❯