Vue d'ensemble
Bank Statement Parser est la seule bibliothèque Python open source qui analyse sept formats de relevés bancaires — dont le PDF via un pipeline LLM hybride — avec une API unifiée. Les bibliothèques monoformat (mt-940, ofxparse, pycamt) gèrent chacune un seul format. Les outils SaaS (Ocrolus, Parseur) proposent de l'OCR cloud mais exigent l'envoi de données à l'extérieur et coûtent de 49 $ à 1 000 $+/mois.
Alternatives open source
Bibliothèques monoformat
La plupart des analyseurs de relevés bancaires open source ne gèrent qu'un seul format. Si vous avez besoin de plusieurs formats, vous devez installer et maintenir des bibliothèques séparées avec des API, des schémas de sortie et des cycles de mise à jour différents.
| Bibliothèque | Formats | Sortie | Vérification du solde | Export comptable | |
|---|---|---|---|---|---|
| Bank Statement Parser | 7 formats | Pipeline hybride | pandas DataFrame | Règle d'or | hledger, beancount |
| mt-940 (WoLpH) | MT940 uniquement | Non | Objets Python | Non | Non |
| ofxparse | OFX uniquement | Non | Objets Python | Non | Non |
| pycamt | CAMT.053 uniquement | Non | Objets Python | Non | Non |
| ofxtools | OFX v1/v2 uniquement | Non | Objets Python | Non | Non |
vs pyiso20022
pyiso20022 génère des dataclasses Python à partir du catalogue complet des schémas ISO 20022. C'est un outil généraliste pour travailler avec les messages PACS, PAIN, CAMT et ADMI.
Bank Statement Parser est conçu spécifiquement pour analyser les relevés bancaires en DataFrames avec des fonctionnalités de production :
| Fonctionnalité | Bank Statement Parser | pyiso20022 |
|---|---|---|
| Objectif | Analyse + extraction + export de relevés | Boîte à outils de schémas ISO 20022 |
| Sortie | DataFrames pandas/Polars | Dataclasses Python |
| Formats | 7 (dont PDF et non-ISO) | ISO 20022 uniquement |
| Support PDF | Pipeline hybride (déterministe + LLM + vision) | Non |
| Vérification du solde | Règle d'or + multi-devises | Non |
| API REST | FastAPI intégré | Non |
| Enrichissement | Catégorisation par LLM | Non |
| Export comptable | hledger + beancount | Non |
| Streaming | Oui (mémoire bornée) | Non |
| Masquage des données personnelles | Intégré | Non |
| Déduplication | Hash idempotent des transactions | Non |
| CLI | Oui | Non |
Utilisez pyiso20022 si vous devez travailler avec le catalogue complet des messages ISO 20022. Utilisez Bank Statement Parser si vous devez analyser des relevés bancaires en données structurées pour l'analyse, le rapprochement ou le reporting.
Alternatives SaaS
Les outils SaaS comme Ocrolus, Parseur et Sensible proposent l'analyse de relevés bancaires en tant que service cloud. Ils utilisent généralement l'OCR pour traiter les PDF scannés et prennent en charge des centaines de formats spécifiques aux banques.
| Fonctionnalité | Bank Statement Parser | Outils SaaS |
|---|---|---|
| Confidentialité des données | 100 % local (LLM via Ollama) | Données envoyées vers le cloud |
| Coût | Gratuit (Apache 2.0) | 49 $ à 1 000 $+/mois (au T1 2026) |
| Formats | 7 (structurés + PDF) | Des centaines (via OCR) |
| Support PDF | Oui — pipeline hybride (déterministe + LLM + vision) | Oui (OCR cloud) |
| Vérification du solde | Règle d'or (automatique) | Manuelle / limitée |
| Latence | < 2 ms (structuré), secondes (PDF+LLM) | 1 à 30 secondes |
| Débit | 27 000+ tx/seconde (structuré) | Limité par l'API |
| API REST | FastAPI intégré | Propriétaire |
| Export comptable | hledger + beancount | Non |
| Dépendance fournisseur | Aucune | Oui |
| Conformité | Traitement local, SBOM | Variable selon le fournisseur |
Analyseurs basés sur des LLM
Un nombre croissant d'outils (Inscribe, Unstract, Mozilla.ai blueprints) utilisent des grands modèles de langage pour analyser les relevés bancaires, y compris les PDF scannés. Quand Chase a revu la mise en page de ses relevés grand public fin 2025, les analyseurs basés sur des modèles ont cassé tandis que les analyseurs LLM se sont adaptés automatiquement.
Bank Statement Parser inclut désormais son propre pipeline LLM hybride (v0.0.5+) qui fonctionne entièrement en local via Ollama. Il combine le meilleur des deux approches :
- Formats structurés (XML, CSV, OFX, MT940) : analyse déterministe — 100 % de précision, latence sous la milliseconde, zéro coût LLM.
- Relevés PDF : routage à trois voies (extraction déterministe de tableaux, text-LLM, vision-LLM) avec vérification automatique par la Règle d'or pour détecter les erreurs d'extraction.
Contrairement aux analyseurs LLM cloud, le pipeline hybride de Bank Statement Parser :
- Fonctionne 100 % en local (Ollama) — aucune donnée ne quitte votre machine.
- Vérifie chaque extraction avec la vérification du solde (Règle d'or).
- Propose un mode de revue interactif pour les écarts signalés.
- Produit des hash de transactions idempotents pour une ingestion incrémentale fiable.
Quand choisir un analyseur LLM SaaS plutôt que Bank Statement Parser : vous recevez des relevés de centaines de banques avec des mises en page PDF très différentes et vous avez besoin d'une couverture prête à l'emploi sans infrastructure locale.
Quand choisir Bank Statement Parser : vous avez besoin d'un traitement local pour la conformité. Vous voulez la vérification du solde. Vous avez besoin d'export comptable. Vous voulez zéro coût récurrent.
Méthodologie de benchmark : les chiffres de performance sont mesurés sur Apple M2, Python 3.12, avec un fichier CAMT.053 de 5 000 transactions (2,1 Mo). Résultats moyennés sur 100 exécutions. Reproduisez en local : python -m bankstatementparser.bench. La latence SaaS est basée sur la documentation API publiée en avril 2026.
Découvrez des cas d'utilisation concrets ❯ | Planifiez votre migration MT940 vers CAMT ❯