Парсер банковских выписок

Разберите CAMT.053, PAIN.001, CSV, OFX, QFX и MT940 в DataFrames pandas. 27 тыс.+ транзакций в секунду, потоковая передача, редактирование личных данных, отсутствие сетевых вызовов.

pip install Bankstatementparser

Bank Statement Parser — это библиотека Python с открытым исходным кодом, которая разбирает банковские выписки семи форматов (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 и PDF) в структурированные DataFrames pandas. Вся обработка выполняется локально — детерминированный вывод, автоматическое маскирование персональных данных и опциональный гибридный PDF-pipeline, который при необходимости направляет запросы через локальные LLM.

Начните за считанные секунды

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Одна библиотека, семь форматов

Разбирайте CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 и PDF в структурированные DataFrames pandas с помощью единого API. Не нужно устанавливать отдельные пакеты для каждого формата.

ВозможностьBank Statement ParserОдноформатные OSS (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Поддерживаемые форматы7, единый APIПо 1Много (через OCR)
Поддержка PDFГибридный pipeline (детерминированный + LLM + vision)НетДа (облачный OCR)
Конфиденциальность данных100% локально (LLM через Ollama)100% локальноДанные отправляются на внешний сервер
СтоимостьБесплатно, Apache 2.0Бесплатно$49–$1 000+/мес.
Проверка балансаЗолотое правило (начальный + кредит − дебет = конечный)НетЗависит от сервиса
Маскирование PIIВстроенное, включено по умолчаниюНетЗависит от сервиса
StreamingОграниченная памятьНетН/Д
REST APIВстроенный микросервис FastAPIНетДа
ДедупликацияИдемпотентные hash транзакцийНетЧастично
Экспорт в бухгалтериюhledger + beancountНетНет

Гибридный PDF-pipeline

Bank Statement Parser v0.0.5+ включает трёхэтапный гибридный pipeline для PDF-выписок:

Каждое извлечение проверяется Золотым правилом: opening balance + credits − debits == closing balance.

Создано для миграции на ISO 20022

SWIFT установил жёсткие сроки: все финансовые учреждения должны принимать CAMT.053 к ноябрю 2027 года, а MT940/MT942/MT950 будут полностью упразднены к ноябрю 2028 года. Bank Statement Parser работает и с устаревшим MT940, и с современными форматами ISO 20022 (CAMT.053, PAIN.001) через единый API. Ваш pipeline будет работать как во время перехода, так и после него.

Производительность

Почему Bank Statement Parser?

Создано для продакшена

Bank Statement Parser создан для казначейских команд, разработчиков финтех-приложений и специалистов по комплаенсу, работающих с конфиденциальными финансовыми данными. Библиотека используется в pipeline миграции MT940-to-CAMT, системах автоматической сверки, PDF-загрузке выписок и рабочих процессах регуляторного аудита.

Сравниваете альтернативы? Посмотрите, как выглядит Bank Statement Parser на фоне конкурентов ❯ | Изучите реальные сценарии использования ❯

Начать работу ❯ | Открыть на GitHub ❯ | Открыть на PyPI ❯