Analyseur de relevé bancaire

Analysez CAMT.053, PAIN.001, CSV, OFX, QFX et MT940 dans des DataFrames pandas. 27 000 tx/s, streaming, rédaction de données personnelles, zéro appel réseau.

pip installer l'analyseur de relevés bancaires

Bank Statement Parser est une bibliothèque Python open source qui analyse les relevés bancaires dans sept formats (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 et PDF) et les convertit en DataFrames pandas structurés. Tout le traitement se fait localement — sortie déterministe, masquage automatique des données personnelles et un pipeline PDF hybride optionnel qui passe par des LLM locaux si nécessaire.

Démarrez en quelques secondes

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Une bibliothèque, sept formats

Analysez CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 et PDF en DataFrames pandas structurés avec une seule API unifiée. Pas besoin d'installer un package séparé pour chaque format.

FonctionnalitéBank Statement ParserOSS monoformat (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Formats pris en charge7, API unifiée1 chacunNombreux (via OCR)
Support PDFPipeline hybride (déterministe + LLM + vision)NonOui (OCR cloud)
Confidentialité des données100 % local (LLM via Ollama)100 % localDonnées envoyées à l'extérieur
CoûtGratuit, Apache 2.0Gratuit49 $ à 1 000 $+/mois
Vérification du soldeRègle d'or (ouverture + crédits − débits = clôture)NonVariable
Masquage des données personnellesIntégré, activé par défautNonVariable
StreamingMémoire bornéeNonN/A
API RESTMicroservice FastAPI intégréNonOui
DéduplicationHash idempotent des transactionsNonPartiel
Export comptablehledger + beancountNonNon

Pipeline PDF hybride

Bank Statement Parser v0.0.5+ inclut un pipeline hybride à trois voies pour les relevés bancaires PDF :

Chaque extraction est vérifiée avec la Règle d'or : opening balance + credits − debits == closing balance.

Conçu pour la migration ISO 20022

SWIFT a fixé des échéances fermes : toutes les institutions financières doivent recevoir CAMT.053 d'ici novembre 2027, et les MT940/MT942/MT950 seront entièrement retirés d'ici novembre 2028. Bank Statement Parser gère à la fois les formats anciens MT940 et les formats modernes ISO 20022 (CAMT.053, PAIN.001) dans une seule API. Votre pipeline d'analyse fonctionne pendant la transition et au-delà.

Performance

Pourquoi Bank Statement Parser ?

Conçu pour la production

Bank Statement Parser est conçu pour les équipes de trésorerie, les développeurs fintech et les responsables de la conformité qui traitent des données financières sensibles. La bibliothèque est utilisée dans les pipelines de migration MT940 vers CAMT, les systèmes de rapprochement automatisés, l'ingestion de relevés PDF et les flux d'audit réglementaire au sein des institutions financières.

Vous évaluez les alternatives ? Découvrez comment Bank Statement Parser se compare ❯ | Explorez des cas d'utilisation concrets ❯

Commencer ❯ | Voir sur GitHub ❯ | Voir sur PyPI ❯