Suivez le développement de l’analyseur de relevés bancaires. Abonnez-vous via RSS ou regardez le dépôt GitHub pour les notifications de version.
v0.0.8 — 2026-04-11 (Latest) — "Full Platform"
- Multi-currency balance verification —
verify_balance_multi_currency()groups by currency, runs Golden Rule per group. - hledger + beancount export —
to_hledger()andto_beancount()inbankstatementparser.export. - Bulk directory scanner —
scan_and_ingest()scans folder trees, deduplicates across batch. - Account mapping rules —
AccountMapperwith ordered regex rules from JSON config. - REST API — FastAPI wrapper with
/ingestand/healthendpoints ([api]extra).
v0.0.7 — 2026-04-08 — "Universal Vision"
- Direct Ollama bridge (
ollama_direct_completion) — bypasses LiteLLM long-prompt hang. - Strip mode (
VisionExtractor.strip_rows=True) — splits dense pages into overlapping bands for small local models. - Recommended vision model changed from
llavatominicpm-v.
v0.0.6 — 2026-04-08 — "Intelligence Layer"
- Dropped Python 3.9 support (now 3.10-3.14).
- Enrichment module (
Categorizer,EnrichedTransaction,DEFAULT_CATEGORY_SCHEMA). - Interactive review mode with
--type reviewCLI command. - Per-row bounding box extraction (
Transaction.source_bbox).
v0.0.5 — 2026-04-08 — "Universal Extraction"
- Hybrid PDF pipeline (
smart_ingest()) with deterministic/text-LLM/vision-LLM routing. LLMExtractorfor digital PDFs via LiteLLM.VisionExtractorfor scanned PDFs via multimodal vision models.- Golden Rule balance verification (
opening + credits - debits == closing). - Idempotent deduplication via
transaction_hash(MD5 fingerprint).
v0.0.4 — 2026-03-15
- Ajout de l'analyse de fichiers parallèles avec
parse_files_parallel()en utilisant ProcessPoolExecutor. - Ajout d'un véritable streaming pour les gros fichiers PAIN.001 (50 Mo+) avec une mémoire limitée.
- Optimisations des performances : le débit CAMT dépasse désormais 27 000 tx/s, PAIN.001 dépasse 52 000 tx/s.
- Ajouté
Deduplicatorclasse pour détecter les doublons exacts et les correspondances suspectées avec des scores de confiance. - Ajouté
from_string()etfrom_bytes()méthodes d'analyse en mémoire sans E/S disque. - Ajouté
iter_secure_xml_entries()pour un traitement sécurisé des archives ZIP. - CI étendu avec application de seuils de performances.
v0.0.3 — 20/11/2025
- Ajout de la prise en charge des analyseurs CSV, OFX, QFX et MT940.
- Ajout de la détection automatique du format avec
detect_statement_format()etcreate_parser(). - Ajout de la rédaction des PII (activée par défaut en mode CLI et streaming).
- Ajout d'assistants d'exportation pour CSV, JSON et Excel.
- Ajout de la prise en charge facultative de Polars DataFrame.
- Suite de tests étendue à 718 tests avec une couverture de branche à 100 %.
v0.0.2 — 2025-06-10
- Ajout de l'analyseur PAIN.001 (
Pain001Parser) pour les dossiers d'initiation au virement ISO 20022. - Ajout de l'interface CLI (
python -m bankstatementparser.cli). - Ajout du mode streaming avec
parse_streaming(). - Ajout de la validation des entrées et des limites de taille de fichier.
v0.0.1 — 2025-01-15
- Version initiale.
- Analyseur CAMT.053 (
CamtParser) pour les relevés bancaires aux clients ISO 20022. - Sortie Pandas DataFrame.
- Renforcement de la sécurité XML de base (protection XXE, no_network).
Consultez l'historique complet des validations sur GitHub.