Розпочніть за лічені секунди
pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format
fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse() # pandas DataFrame, ready to use
Одна бібліотека, шість форматів
Аналізуйте CAMT.053, PAIN.001, CSV, OFX, QFX і MT940 на структуровані pandas DataFrames за допомогою єдиного уніфікованого API. Не потрібно встановлювати окремі пакети для кожного формату.
| Особливість | Парсер банківської виписки | Одноформатний OSS (mt940, ofxparse) | SaaS (Ocrolus, Parseur) |
|---|---|---|---|
| Підтримувані формати | 6, уніфікований API | по 1 кожному | Багато (через OCR) |
| Конфіденційність даних | 100% місцевий, без мережевих дзвінків | 100% місцевий | Дані надіслано ззовні |
| Вартість | Безкоштовно, Apache 2.0 | безкоштовно | $49-$1000+/міс |
| Редакція ідентифікаційної інформації | Вбудований, включений за замовчуванням | немає | Варіюється |
| Потокове передавання | Обмежена пам'ять | немає | N/A |
| Безпека ZIP | Вбудоване зміцнення | немає | N/A |
| Дедуплікація | Вбудований з оцінками впевненості | немає | Деякі |
Створено для переходу на ISO 20022
SWIFT встановив чіткі терміни: усі фінансові установи мають отримати CAMT.053 до листопада 2027 року, а MT940/MT942/MT950 буде повністю припинено до листопада 2028 року. Парсер банківських виписок обробляє застарілий формат MT940 і сучасний формат ISO 20022 (CAMT.053, PAIN.001) в єдиному API, тож ваш конвеєр аналізу працює під час переходу. і далі.
Продуктивність
- 27 000+ транзакцій за секунду для аналізу CAMT.053
- 52 000+ транзакцій за секунду для аналізу PAIN.001
- < 2 мс час до першого результату
- Постійна пам'ять від 1K до 50K+ транзакцій через потокове передавання
- 467 тестів зі 100% охопленням гілок у Python 3.9–3.14
Чому аналізатор банківських виписок?
- Автоматичне визначення формату:
detect_statement_format()автоматично визначає файли таcreate_parser()повертає правильний аналізатор. - Privacy First: редагування ідентифікаційної інформації ввімкнено за умовчанням. Конфіденційні поля (імена, IBAN, адреси) маскуються у вихідних даних CLI. Підключитися за допомогою
--show-piiколи потрібно. - Виробнича готовність: безпечне введення ZIP-файлів (захист від бомб, відхилення зашифрованого входу), перевірка введених даних і запобігання проходженню шляху.
- Гнучкий вихід: експортуйте в CSV, JSON, Excel або конвертуйте в Polars DataFrames.
- Паралельна обробка: аналіз кількох файлів одночасно
parse_files_parallel().