Banka Ekstresi Ayrıştırıcı

CAMT.053, PAIN.001, CSV, OFX, QFX ve MT940'ı panda DataFrames'e ayrıştırın. 27.000'den fazla tx/s, akış, PII düzenlemesi, sıfır ağ çağrısı.

pip install banka beyanı ayrıştırıcı

Bank Statement Parser, yedi formattaki (CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 ve PDF) banka ekstrelerini yapılandırılmış pandas DataFrames'e dönüştüren açık kaynaklı bir Python kitaplığıdır. Tüm işlemler yerel olarak çalışır — deterministik çıktı, otomatik PII redaksiyonu ve gerektiğinde yerel LLM'ler üzerinden yönlendirme yapan isteğe bağlı hibrit PDF pipeline.

Saniyeler İçinde Başlayın

pip install bankstatementparser
from bankstatementparser import create_parser, detect_statement_format

fmt = detect_statement_format("statement.xml")
parser = create_parser("statement.xml", fmt)
df = parser.parse()  # pandas DataFrame, ready to use
# Parse PDFs with the hybrid pipeline (v0.0.5+)
from bankstatementparser.hybrid import smart_ingest

result = smart_ingest("statement.pdf")
print(result.source_method)         # "deterministic" | "llm" | "vision"
print(result.verification.status)   # VERIFIED | DISCREPANCY | FAILED
GitHub StarsMonthly DownloadsPyPI VersionPythonLicenseTestsCoverage

Tek Kitaplık, Yedi Format

CAMT.053, PAIN.001, CSV, OFX, QFX, MT940 ve PDF formatlarını tek bir birleşik API ile yapılandırılmış pandas DataFrames'e dönüştürün. Her format için ayrı paket kurmanıza gerek yok.

ÖzellikBank Statement ParserTek formatlı OSS (mt940, ofxparse)SaaS (Ocrolus, Parseur)
Desteklenen formatlar7, birleşik APIHer biri 1Birçok (OCR ile)
PDF desteğiHibrit pipeline (deterministik + LLM + görüntü)HayırEvet (bulut OCR)
Veri gizliliği%100 yerel (LLM'ler Ollama ile yerel çalışır)%100 yerelVeriler dışarı gönderilir
MaliyetÜcretsiz, Apache 2.0Ücretsiz49$-1.000$+/ay
Bakiye doğrulamaAltın Kural (açılış + alacak − borç = kapanış)HayırDeğişir
PII redaksiyonuYerleşik, varsayılan olarak açıkHayırDeğişir
StreamingSınırlı bellekHayırYok
REST APIYerleşik FastAPI mikro hizmetiHayırEvet
TekilleştirmeIdempotent işlem hash'leriHayırKısmen
Defter dışa aktarımıhledger + beancountHayırHayır

Hibrit PDF Pipeline

Bank Statement Parser v0.0.5+ sürümü, PDF banka ekstreleri için üç yollu hibrit pipeline içerir:

Her çıkarım Altın Kural ile doğrulanır: opening balance + credits − debits == closing balance.

ISO 20022 Geçişi için Tasarlandı

SWIFT kesin son tarihler belirledi: tüm finans kuruluşları Kasım 2027'ye kadar CAMT.053 alabilmelidir ve MT940/MT942/MT950 Kasım 2028'de tamamen kullanımdan kalkacaktır. Bank Statement Parser, hem eski MT940 hem de modern ISO 20022 formatlarını (CAMT.053, PAIN.001) tek bir API'de yönetir. Böylece ayrıştırma pipeline'ınız geçiş sürecinde ve sonrasında çalışmaya devam eder.

Performans

Neden Bank Statement Parser?

Üretim İçin Tasarlandı

Bank Statement Parser; hassas finansal verileri işleyen hazine ekipleri, fintech geliştiricileri ve uyum görevlileri için tasarlanmıştır. Kitaplık; MT940'tan CAMT'ye geçiş hatlarında, otomatik mutabakat sistemlerinde, PDF ekstre alımında ve finans kuruluşlarındaki düzenleyici denetim iş akışlarında kullanılır.

Alternatifleri mi değerlendiriyorsunuz? Bank Statement Parser karşılaştırmasını görün ❯ | Gerçek dünya kullanım örneklerini keşfedin ❯

Başlayın ❯ | GitHub'da görüntüleyin ❯ | PyPI'de görüntüleyin ❯