О парсере банковских выписок

Одна библиотека. Шесть форматов. Ноль сетевых вызовов.

Кратко: Bank Statement Parser — это библиотека Python с открытым исходным кодом, которая разбирает семь форматов банковских выписок (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 и PDF) в DataFrames pandas. Гибридный PDF-pipeline с проверкой баланса, REST API, обогащение данных, экспорт в бухгалтерию, пропускная способность 27 000+ транзакций/с.

Bank Statement Parser — это библиотека Python с открытым исходным кодом, которая разбирает банковские выписки семи форматов в структурированные DataFrames pandas. Детерминированное ядро обрабатывает структурированные форматы локально, без сетевых вызовов. Опциональный гибридный PDF-pipeline направляет запросы через локальные LLM (через Ollama) для цифровых и сканированных выписок.

Для кого это?

Поддерживаемые форматы

Формат Стандарт Типы файлов Парсер/Метод
CAMT.053 ISO 20022 Bank-to-Customer Statement .xml CamtParser
PAIN.001 ISO 20022 Credit Transfer Initiation .xml Pain001Parser
CSV Общий банковский экспорт .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 Стандарт SWIFT .mt940, .sta Mt940Parser
PDF Цифровые и сканированные выписки .pdf smart_ingest()

Все форматы создают нормализованные DataFrames pandas с едиными именами столбцов. Дальнейшая обработка не зависит от формата.

Ключевые возможности

Безопасность и конфиденциальность

Производительность

Метрика Значение
Пропускная способность CAMT.053 27 000+ транзакций/с
Пропускная способность PAIN.001 52 000+ транзакций/с
Задержка на транзакцию (CAMT) 37 микросекунд
Задержка на транзакцию (PAIN.001) 19 микросекунд
Время до первого результата < 2 мс
Масштабирование памяти (1K–50K транзакций) Постоянное (streaming)
Покрытие тестами 100% покрытие ветвей
Тесты 718 в 29 тестовых файлах

Начните работу

Перейти к установке и примерам ❯

"GitHub Repository"