Парсер банковских выписок — это библиотека Python с открытым исходным кодом, которая анализирует банковские выписки из шести форматов (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940) в структурированные DataFrames pandas. Вся обработка выполняется локально — отсутствие сетевых вызовов, детерминированный вывод и автоматическое редактирование личных данных.
Начните работу за считанные секунды
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, ready to use
Одна библиотека, шесть форматов
Разберите CAMT.053, PAIN.001, CSV, OFX, QFX и MT940 в структурированные DataFrames pandas с помощью единого унифицированного API. Нет необходимости устанавливать отдельные пакеты для каждого формата.
| Особенность | Парсер банковских выписок | Одноформатное OSS (mt940, ofxparse) | SaaS (Ocrolus, Parseur) |
|---|---|---|---|
| Поддерживаемые форматы | 6, унифицированный API | 1 каждый | Многие (через OCR) |
| Конфиденциальность данных | 100% местные звонки, ноль сетевых звонков | 100% местный | Данные отправлены извне |
| Расходы | Бесплатно, Апач 2.0 | Бесплатно | $49–$1000+/мес. |
| Редактирование личных данных | Встроенный, включен по умолчанию | Нет | Варьируется |
| Потоковое вещание | Ограниченная память | Нет | Н/Д |
| Почтовый индекс | Встроенная закалка | Нет | Н/Д |
| Дедупликация | Встроенные оценки достоверности | Нет | Некоторый |
Создано для перехода на ISO 20022
SWIFT установил четкие сроки: все финансовые учреждения должны получить CAMT.053 к ноябрю 2027 года, а MT940/MT942/MT950 будут полностью выведены из эксплуатации к ноябрю 2028 года. Парсер банковских выписок обрабатывает как устаревшие форматы MT940, так и современные форматы ISO 20022 (CAMT.053, PAIN.001) в одном API, поэтому ваш конвейер анализа работает во время перехода и после него.
Производительность
- 27 000+ транзакций в секунду для анализа CAMT.053
- 52 000+ транзакций в секунду для анализа PAIN.001
- < 2 мс время до первого результата
- Постоянная память от 1 000 до 50 000+ транзакций посредством потоковой передачи
- 467 тестов со 100 % охватом ветвей Python 3.9–3.14.
Зачем нужен парсер банковских выписок?
- Автоопределение формата:
detect_statement_format()автоматически идентифицирует файлы иcreate_parser()возвращает правильный парсер. - Конфиденциальность прежде всего: редактирование личных данных включено по умолчанию. Чувствительные поля (имена, номера IBAN, адреса) маскируются в выходных данных CLI. Примите участие с помощью
--show-piiкогда это необходимо. - Готовность к производству: безопасная загрузка ZIP-файлов (защита от бомб, отклонение зашифрованных записей), проверка входных данных и предотвращение обхода пути.
- Гибкий вывод: экспорт в CSV, JSON, Excel или преобразование в кадры данных Polars.
- Параллельная обработка: анализ нескольких файлов одновременно
parse_files_parallel().
Оцениваете альтернативы? Посмотрите, как сравнивается анализатор банковских выписок ❯ | Изучите реальные варианты использования ❯
[Начать ❯][01] | [Просмотреть на GitHub ❯][02] | [Просмотреть на PyPI ❯][03]
[01]: /начало работы/index.html [02]:https://github.com/sebastienrousseau/bankstatementparser [03]: https://pypi.org/project/bankstatementparser/