Översikt
Bank Statement Parser är det enda Python-biblioteket med öppen källkod som tolkar sju kontoutdragsformat — inklusive PDF via en hybrid-LLM-pipeline — med ett enhetligt API. Enkelformatsbibliotek (mt-940, ofxparse, pycamt) hanterar var sitt format. SaaS-verktyg (Ocrolus, Parseur) erbjuder moln-OCR men kräver att data skickas externt och kostar $49–$1 000+/månad.
Alternativ med öppen källkod
Enkelformatsbibliotek
De flesta öppen källkods-parsers för kontoutdrag hanterar bara ett format. Om du behöver flera format måste du installera och underhålla separata bibliotek med olika API:er, utdatascheman och uppdateringscykler.
| Bibliotek | Format | Utdata | Saldoverifiering | Ledger-export | |
|---|---|---|---|---|---|
| Bank Statement Parser | 7 format | Hybrid-pipeline | pandas DataFrame | Golden Rule | hledger, beancount |
| mt-940 (WoLpH) | Enbart MT940 | Nej | Python-objekt | Nej | Nej |
| ofxparse | Enbart OFX | Nej | Python-objekt | Nej | Nej |
| pycamt | Enbart CAMT.053 | Nej | Python-objekt | Nej | Nej |
| ofxtools | Enbart OFX v1/v2 | Nej | Python-objekt | Nej | Nej |
vs pyiso20022
pyiso20022 genererar Python-dataklasser från hela ISO 20022-schemakatalogen. Det är en allmän ISO 20022-verktygslåda för att arbeta med PACS-, PAIN-, CAMT- och ADMI-meddelanden.
Bank Statement Parser är specialbyggd för att tolka kontoutdrag till DataFrames med produktionsfunktioner:
| Funktion | Bank Statement Parser | pyiso20022 |
|---|---|---|
| Syfte | Utdragstolkning + extraktion + export | ISO 20022-schemaverktygslåda |
| Utdata | pandas/Polars DataFrames | Python-dataklasser |
| Format | 7 (inklusive PDF, icke-ISO) | Enbart ISO 20022 |
| PDF-stöd | Hybrid-pipeline (deterministisk + LLM + vision) | Nej |
| Saldoverifiering | Golden Rule + multivaluta | Nej |
| REST API | Inbyggd FastAPI | Nej |
| Berikande | LLM-driven kategorisering | Nej |
| Ledger-export | hledger + beancount | Nej |
| Streaming | Ja (begränsat minne) | Nej |
| PII-redaktion | Inbyggd | Nej |
| Deduplicering | Idempotenta transaktionshashar | Nej |
| CLI | Ja | Nej |
Använd pyiso20022 om du behöver arbeta med hela ISO 20022-meddelandekatalogen. Använd Bank Statement Parser om du behöver tolka kontoutdrag till strukturerad data för analys, avstämning eller rapportering.
SaaS-alternativ
SaaS-verktyg som Ocrolus, Parseur och Sensible erbjuder kontoutdragstolkning som en molntjänst. De använder vanligtvis OCR för att hantera skannade PDF:er och stöder hundratals bankspecifika format.
| Funktion | Bank Statement Parser | SaaS-verktyg |
|---|---|---|
| Datasekretess | 100 % lokalt (LLM:er via Ollama) | Data skickas till molnet |
| Kostnad | Gratis (Apache 2.0) | $49–$1 000+/mån (per Q1 2026) |
| Format | 7 (strukturerade + PDF) | Hundratals (via OCR) |
| PDF-stöd | Ja — hybrid-pipeline (deterministisk + LLM + vision) | Ja (moln-OCR) |
| Saldoverifiering | Golden Rule (automatisk) | Manuell / begränsad |
| Latens | <2 ms (strukturerat), sekunder (PDF+LLM) | 1–30 sekunder |
| Genomströmning | 27 000+ tx/sekund (strukturerat) | API-hastighetsbegränsad |
| REST API | Inbyggd FastAPI | Proprietär |
| Ledger-export | hledger + beancount | Nej |
| Leverantörslåsning | Ingen | Ja |
| Efterlevnad | Lokal bearbetning, SBOM | Varierar per leverantör |
LLM-baserade parsers
Ett växande antal verktyg (Inscribe, Unstract, Mozilla.ai blueprints) använder stora språkmodeller för att tolka kontoutdrag, inklusive skannade PDF:er. När Chase designade om sitt konsumentutdragsformat i slutet av 2025 gick mallbaserade parsers sönder medan LLM-parsers anpassade sig automatiskt.
Bank Statement Parser inkluderar nu sin egen hybrid-LLM-pipeline (v0.0.5+) som körs helt lokalt via Ollama. Den kombinerar det bästa från båda metoderna:
- Strukturerade format (XML, CSV, OFX, MT940): Deterministisk tolkning — 100 % noggrannhet, sub-millisekunders latens, noll LLM-kostnad.
- PDF-utdrag: Trevägsdirigering (deterministisk tabellextraktion → text-LLM → vision-LLM) med automatisk Golden Rule-verifiering för att fånga extraktionsfel.
Till skillnad från molnbaserade LLM-parsers gör Bank Statement Parsers hybrid-pipeline följande:
- Körs 100 % lokalt (Ollama) — ingen data lämnar din maskin.
- Verifierar varje extraktion med saldoverifiering (Golden Rule).
- Stöder interaktivt granskningsläge för flaggade avvikelser.
- Producerar idempotenta transaktionshashar för säker inkrementell inmatning.
När du bör välja rena SaaS-LLM-parsers framför Bank Statement Parser: Du tar emot utdrag från hundratals banker med vitt skilda PDF-layouter och behöver täckning direkt utan lokal infrastruktur.
När du bör välja Bank Statement Parser: Du behöver lokal bearbetning för efterlevnad. Du vill ha saldoverifiering. Du behöver ledger-export. Du vill ha noll löpande kostnad.
Benchmark-metodik: Prestandasiffror mätta på Apple M2, Python 3.12, med en CAMT.053-fil med 5 000 transaktioner (2,1 MB). Resultat genomsnitt över 100 körningar. Reproducera lokalt: python -m bankstatementparser.bench. SaaS-latens baserad på publicerad API-dokumentation per april 2026.
Se verkliga användningsfall ❯ | Planera din MT940-till-CAMT-migrering ❯