Genel Bakış
Bank Statement Parser, yedi banka ekstresi formatını -- PDF dahil, hibrit LLM pipeline ile -- birleşik bir API ile ayrıştıran tek açık kaynaklı Python kitaplığıdır. Tek formatlı kitaplıklar (mt-940, ofxparse, pycamt) her biri yalnızca bir formatı işler. SaaS araçları (Ocrolus, Parseur) bulut OCR sunar ancak verilerin dışarı gönderilmesini gerektirir ve aylık 49$-1.000$+ maliyete sahiptir.
Açık Kaynak Alternatifleri
Tek Formatlı Kitaplıklar
Çoğu açık kaynak banka ekstresi ayrıştırıcısı yalnızca tek bir formatı işler. Birden fazla formata ihtiyacınız varsa farklı API'lere, çıktı şemalarına ve güncelleme döngülerine sahip ayrı kitaplıklar kurmanız ve sürdürmeniz gerekir.
| Kitaplık | Formatlar | Çıktı | Bakiye Doğrulama | Defter Dışa Aktarımı | |
|---|---|---|---|---|---|
| Bank Statement Parser | 7 format | Hibrit pipeline | pandas DataFrame | Altın Kural | hledger, beancount |
| mt-940 (WoLpH) | Yalnızca MT940 | Hayır | Python nesneleri | Hayır | Hayır |
| ofxparse | Yalnızca OFX | Hayır | Python nesneleri | Hayır | Hayır |
| pycamt | Yalnızca CAMT.053 | Hayır | Python nesneleri | Hayır | Hayır |
| ofxtools | Yalnızca OFX v1/v2 | Hayır | Python nesneleri | Hayır | Hayır |
pyiso20022 ile Karşılaştırma
pyiso20022, tam ISO 20022 şema kataloğundan Python veri sınıfları oluşturur. PACS, PAIN, CAMT ve ADMI mesajlarıyla çalışmaya yönelik genel amaçlı bir ISO 20022 araç setidir.
Bank Statement Parser, üretim özelliklerine sahip banka ekstrelerini DataFrames'e ayrıştırmak için özel olarak tasarlanmıştır:
| Özellik | Bank Statement Parser | pyiso20022 |
|---|---|---|
| Amaç | Ekstre ayrıştırma + çıkarım + dışa aktarım | ISO 20022 şema araç seti |
| Çıktı | pandas/Polars DataFrames | Python veri sınıfları |
| Formatlar | 7 (PDF ve ISO dışı dahil) | Yalnızca ISO 20022 |
| PDF desteği | Hibrit pipeline (deterministik + LLM + görüntü) | Hayır |
| Bakiye doğrulama | Altın Kural + çoklu para birimi | Hayır |
| REST API | Yerleşik FastAPI | Hayır |
| Zenginleştirme | LLM destekli sınıflandırma | Hayır |
| Defter dışa aktarımı | hledger + beancount | Hayır |
| Streaming | Evet (sınırlı bellek) | Hayır |
| PII redaksiyonu | Yerleşik | Hayır |
| Tekilleştirme | Idempotent işlem hash'leri | Hayır |
| CLI | Evet | Hayır |
ISO 20022 mesaj kataloğunun tamamıyla çalışmanız gerekiyorsa pyiso20022'yi kullanın. Analiz, mutabakat veya raporlama için banka ekstrelerini yapılandırılmış verilere dönüştürmeniz gerekiyorsa Bank Statement Parser'ı kullanın.
SaaS Alternatifleri
Ocrolus, Parseur ve Sensible gibi SaaS araçları, banka ekstresi ayrıştırmayı bir bulut hizmeti olarak sunar. Taranmış PDF'leri işlemek için genellikle OCR kullanırlar ve yüzlerce bankaya özgü formatı desteklerler.
| Özellik | Bank Statement Parser | SaaS Araçları |
|---|---|---|
| Veri gizliliği | %100 yerel (LLM'ler Ollama ile) | Veriler buluta gönderilir |
| Maliyet | Ücretsiz (Apache 2.0) | 49$-1.000$+/ay (2026 1. Çeyrek itibarıyla) |
| Formatlar | 7 (yapılandırılmış + PDF) | Yüzlerce (OCR ile) |
| PDF desteği | Evet — hibrit pipeline (deterministik + LLM + görüntü) | Evet (bulut OCR) |
| Bakiye doğrulama | Altın Kural (otomatik) | Manuel / sınırlı |
| Gecikme | <2 ms (yapılandırılmış), saniyeler (PDF+LLM) | 1-30 saniye |
| Aktarım hızı | 27.000+ tx/saniye (yapılandırılmış) | API hız sınırlı |
| REST API | Yerleşik FastAPI | Özel mülk |
| Defter dışa aktarımı | hledger + beancount | Hayır |
| Satıcıya bağımlılık | Yok | Evet |
| Uyumluluk | Yerel işleme, SBOM | Sağlayıcıya göre değişir |
LLM Tabanlı Ayrıştırıcılar
Giderek artan sayıda araç (Inscribe, Unstract, Mozilla.ai planları), taranmış PDF'ler dahil banka ekstrelerini ayrıştırmak için büyük dil modelleri kullanıyor. Chase, 2025 sonlarında tüketici ekstresi formatını yeniden tasarladığında şablon tabanlı ayrıştırıcılar bozuldu; LLM ayrıştırıcıları ise otomatik olarak uyum sağladı.
Bank Statement Parser artık kendi hibrit LLM pipeline'ını içeriyor (v0.0.5+) ve tamamen yerel olarak Ollama üzerinden çalışır. Her iki yaklaşımın en iyisini birleştirir:
- Yapılandırılmış formatlar (XML, CSV, OFX, MT940): Deterministik ayrıştırma — %100 doğruluk, milisaniye altı gecikme, sıfır LLM maliyeti.
- PDF ekstreler: Üç yollu yönlendirme (deterministik tablo çıkarımı -> metin-LLM -> görüntü-LLM) ve çıkarım hatalarını yakalamak için otomatik Altın Kural doğrulaması.
Yalnızca bulut tabanlı LLM ayrıştırıcılarından farklı olarak, Bank Statement Parser'ın hibrit pipeline'ı:
- %100 yerel çalışır (Ollama) — hiçbir veri makinenizden çıkmaz.
- Her çıkarımı bakiye doğrulamasıyla (Altın Kural) kontrol eder.
- İşaretlenen tutarsızlıklar için etkileşimli inceleme modunu destekler.
- Güvenli artımlı veri alımı için idempotent işlem hash'leri üretir.
Saf SaaS LLM ayrıştırıcılarını Bank Statement Parser yerine ne zaman tercih etmelisiniz: Yüzlerce bankadan çok farklı PDF düzenlerine sahip ekstreler alıyorsanız ve yerel altyapı kurmadan hazır kapsam istiyorsanız.
Bank Statement Parser'ı ne zaman tercih etmelisiniz: Uyumluluk için yerel işlemeye ihtiyacınız var. Bakiye doğrulaması istiyorsunuz. Defter dışa aktarımına ihtiyacınız var. Devam eden maliyetin sıfır olmasını istiyorsunuz.
Karşılaştırma metodolojisi: Performans rakamları Apple M2, Python 3.12 üzerinde 5.000 işlemlik CAMT.053 dosyası (2,1 MB) ile ölçülmüştür. Sonuçlar 100 çalıştırmanın ortalamasıdır. Yerel olarak tekrarlayın: python -m bankstatementparser.bench. SaaS gecikme süreleri Nisan 2026 itibarıyla yayınlanan API belgelerine dayanmaktadır.
Gerçek dünya kullanım örneklerini görün ❯ | MT940'tan CAMT'ye geçişinizi planlayın ❯