Про аналізатор банківських виписок

Одна бібліотека. Шість форматів. Нуль мережевих викликів.

Коротко: Bank Statement Parser — це бібліотека Python з відкритим кодом, яка аналізує сім форматів банківських виписок (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 та PDF) у pandas DataFrames. Гібридний PDF pipeline з перевіркою балансу, REST API, збагачення, експорт у бухгалтерію, пропускна здатність 27K+ tx/s.

Bank Statement Parser — це бібліотека Python з відкритим кодом, яка аналізує банківські виписки із семи форматів у структуровані pandas DataFrames. Детерміністичне ядро обробляє структуровані формати локально без мережевих викликів. Опціональний гібридний PDF pipeline маршрутизує через локальні LLM (через Ollama) для цифрових і сканованих виписок.

Для кого це?

Підтримувані формати

Формат Стандарт Типи файлів Парсер/Метод
CAMT.053 ISO 20022 Виписка банку для клієнта .xml CamtParser
PAIN.001 ISO 20022 Ініціювання кредитового переказу .xml Pain001Parser
CSV Загальний банківський експорт .csv CsvStatementParser
OFX Open Financial Exchange .ofx OfxParser
QFX Quicken Financial Exchange .qfx QfxParser
MT940 Стандарт SWIFT .mt940, .sta Mt940Parser
PDF Цифрові та скановані виписки .pdf smart_ingest()

Усі формати створюють нормалізовані pandas DataFrames з однаковими назвами стовпців, що робить подальшу обробку незалежною від формату.

Ключові можливості

Безпека та конфіденційність

Продуктивність

Метрика Значення
Пропускна здатність CAMT.053 27 000+ tx/s
Пропускна здатність PAIN.001 52 000+ tx/s
Затримка на транзакцію (CAMT) 37 мікросекунд
Затримка на транзакцію (PAIN.001) 19 мікросекунд
Час до першого результату < 2 мс
Масштабування пам’яті (1K–50K tx) Стале (streaming)
Покриття тестами 100% покриття гілок
Тести 718 у 29 тестових файлах

Почніть роботу

Встановлення та приклади для початку ❯

"GitHub Repository"