Skip to content

Releases: Keyvanhardani/german-ocr

v0.6.0 - German-OCR 2B + llama.cpp Backend

04 Jan 22:45

Choose a tag to compare

What's New

German-OCR 2B Support

  • New lightweight 2B model (1.5 GB) optimized for CPU/Edge
  • Full llama.cpp backend integration
  • ~23 tok/s on CPU, ~127 tok/s on GPU

Installation

# Standard
pip install german-ocr

# With llama.cpp support
pip install german-ocr[llamacpp]

Usage

from german_ocr import GermanOCR

# Auto-detect backend
ocr = GermanOCR()

# Or specify llama.cpp
ocr = GermanOCR(backend="llamacpp")
text = ocr.extract("invoice.png")

Hardware Support

  • NVIDIA (CUDA)
  • Apple Silicon (Metal)
  • AMD/Intel (Vulkan)
  • Intel NPU (OpenVINO)
  • CPU (everywhere)

Links

v0.5.1 - Logo & Model Branding Update

02 Jan 20:54

Choose a tag to compare

Änderungen

Logo Update

  • Neues kompaktes Icon im README

Model Branding

  • Alle Beispiele verwenden jetzt die offiziellen Modellnamen:
    • german-ocr-ultra - Maximale Präzision
    • german-ocr-pro - Schnell und zuverlässig
    • german-ocr - DSGVO-konform, lokale Verarbeitung

Installation

pip install german-ocr==0.5.1

Quick Start

from german_ocr import CloudClient

client = CloudClient(
    api_key="gocr_xxxxxxxx",
    api_secret="your_secret"
)

# German-OCR Ultra für maximale Präzision
result = client.analyze("dokument.pdf", model="german-ocr-ultra")
print(result.text)

German-OCR 2B v2

04 Jan 17:01

Choose a tag to compare

German-OCR 2B v2

Kompaktes Vision-Language Modell für deutsche Dokumenten-OCR.

Highlights

  • 100% Genauigkeit auf deutschen Dokumenten
  • Nur 1.5 GB - läuft auf jedem Laptop
  • GPU/NPU-Support: CUDA, Metal, Vulkan, OpenVINO
  • Läuft auch komplett auf CPU

Performance

  • GPU (RTX 4060): 127 tok/s
  • CPU-only: 23 tok/s

Dateien

  • German-OCR-Engine.2B.gguf - LLM Engine (1.03 GB)
  • German-OCR-Worker-2B.gguf - Vision Encoder (424 MB)

Installation

pip install german-ocr[llamacpp]
from german_ocr import GermanOCR
ocr = GermanOCR(backend="llamacpp")
text = ocr.extract("rechnung.png")

v0.5.0 - Model Branding

27 Dec 11:42

Choose a tag to compare

Preise aus README und SDK entfernt, URL korrigiert

- Preise aus öffentlicher Dokumentation entfernt
- Portal URL zu app.german-ocr.de korrigiert
- Vorbereitung für PyPI Release

Entwickelt bei Keyvan.ai

v0.4.0 - Cloud API Client

25 Dec 21:52

Choose a tag to compare

Features

  • CloudClient für api.german-ocr.de Integration
  • CLI Cloud-Support: --cloud, --api-key, --output-format, --prompt
  • Output-Formate: json, markdown, text, n8n
  • Progress-Callback für große PDFs
  • Job-Cancellation Support

Installation

pip install german-ocr --upgrade

Verwendung

CLI

# Cloud API
german-ocr --cloud --api-key YOUR_KEY rechnung.pdf --output-format json

# Lokal (wie bisher)
german-ocr rechnung.png

Python

from german_ocr import CloudClient

client = CloudClient(api_key="...")
result = client.analyze("dokument.pdf", output_format="json")
print(result.text)

Entwickelt bei Keyvan.ai

v0.3.0

06 Dec 11:51

Choose a tag to compare

Turbo

feat: Add German-OCR Turbo model support and multi-format output

v0.2.0

04 Dec 10:39
0614a80

Choose a tag to compare

alpha

Add files via upload