Парсер банковских выписок

Как мы защищаем ваши финансовые данные

TL;DR: Парсер банковских выписок не выполняет никаких сетевых вызовов, по умолчанию редактирует PII, усиливает синтаксический анализ XML от атак XXE и поставляется с зависимостями с хеш-блокировкой SHA-256 и SBOM CycloneDX.

Безопасность по задумке

Парсер банковских выписок создан для обработки конфиденциальных финансовых данных. В каждом проектном решении приоритет отдается безопасности, конфиденциальности и возможности аудита.

Нулевой доступ к сети

Вся обработка происходит локально в вашей среде выполнения. Библиотека не выполняет вызовов API, не использует облачных подключений и не собирает данные телеметрии. XML-парсеры явно настроены с помощьюno_network=True, resolve_entities=False, иload_dtd=Falseдля предотвращения любого исходящего доступа.

Редактирование личных данных

Личная информация (имена, номера IBAN, почтовые адреса) автоматически редактируется в режиме вывода CLI и потоковой передачи. Это включено по умолчанию.

Безопасность XML (защита XXE)

Все виды использования синтаксического анализа XMLlxmlс усиленными настройками:

Безопасность ZIP-архива

iter_secure_xml_entries()проверяет каждого члена ZIP перед извлечением:

Предотвращение обхода пути

Проверка входных данных блокирует опасные пути к файлам:

Детерминированный вывод

Учитывая один и тот же входной файл, синтаксический анализатор при каждом запуске выдает байтовые выходные данные. Никакой случайности, никакого модельного вывода, никакой эвристической выборки. Это критично для:

Безопасность цепочки поставок

Проверить локально

python -m pytest                          # 467 tests, 100% branch coverage
python scripts/verify_locked_hashes.py    # SHA-256 hash verification
git log --show-signature -1               # Verify commit signature