Releases · Keyvanhardani/german-ocr

04 Jan 22:45

Keyvanhardani

v0.6.0

f6f4a55

v0.6.0 - German-OCR 2B + llama.cpp Backend Latest

Latest

What's New

German-OCR 2B Support

New lightweight 2B model (1.5 GB) optimized for CPU/Edge
Full llama.cpp backend integration
~23 tok/s on CPU, ~127 tok/s on GPU

Installation

# Standard
pip install german-ocr

# With llama.cpp support
pip install german-ocr[llamacpp]

Usage

from german_ocr import GermanOCR

# Auto-detect backend
ocr = GermanOCR()

# Or specify llama.cpp
ocr = GermanOCR(backend="llamacpp")
text = ocr.extract("invoice.png")

Hardware Support

NVIDIA (CUDA)
Apple Silicon (Metal)
AMD/Intel (Vulkan)
Intel NPU (OpenVINO)
CPU (everywhere)

Änderungen

Logo Update

Neues kompaktes Icon im README

Model Branding

Alle Beispiele verwenden jetzt die offiziellen Modellnamen:
- german-ocr-ultra - Maximale Präzision
- german-ocr-pro - Schnell und zuverlässig
- german-ocr - DSGVO-konform, lokale Verarbeitung

Installation

pip install german-ocr==0.5.1

Quick Start

from german_ocr import CloudClient

client = CloudClient(
    api_key="gocr_xxxxxxxx",
    api_secret="your_secret"
)

# German-OCR Ultra für maximale Präzision
result = client.analyze("dokument.pdf", model="german-ocr-ultra")
print(result.text)

Assets 2

04 Jan 17:01

Keyvanhardani

v2B-v2

a38fd11

German-OCR 2B v2

Kompaktes Vision-Language Modell für deutsche Dokumenten-OCR.

Highlights

100% Genauigkeit auf deutschen Dokumenten
Nur 1.5 GB - läuft auf jedem Laptop
GPU/NPU-Support: CUDA, Metal, Vulkan, OpenVINO
Läuft auch komplett auf CPU

Performance

GPU (RTX 4060): 127 tok/s
CPU-only: 23 tok/s

Dateien

German-OCR-Engine.2B.gguf - LLM Engine (1.03 GB)
German-OCR-Worker-2B.gguf - Vision Encoder (424 MB)

Installation

pip install german-ocr[llamacpp]

from german_ocr import GermanOCR
ocr = GermanOCR(backend="llamacpp")
text = ocr.extract("rechnung.png")

Assets 4

27 Dec 11:42

Keyvanhardani

v0.5.0

f741528

v0.5.0 - Model Branding

Preise aus README und SDK entfernt, URL korrigiert

- Preise aus öffentlicher Dokumentation entfernt
- Portal URL zu app.german-ocr.de korrigiert
- Vorbereitung für PyPI Release

Entwickelt bei Keyvan.ai

Assets 2

25 Dec 21:52

Keyvanhardani

v0.4.0

57e1196

v0.4.0 - Cloud API Client

Features

CloudClient für api.german-ocr.de Integration
CLI Cloud-Support: --cloud, --api-key, --output-format, --prompt
Output-Formate: json, markdown, text, n8n
Progress-Callback für große PDFs
Job-Cancellation Support

Installation

pip install german-ocr --upgrade

Verwendung

CLI

# Cloud API
german-ocr --cloud --api-key YOUR_KEY rechnung.pdf --output-format json

# Lokal (wie bisher)
german-ocr rechnung.png

Python

from german_ocr import CloudClient

client = CloudClient(api_key="...")
result = client.analyze("dokument.pdf", output_format="json")
print(result.text)

Entwickelt bei Keyvan.ai

Assets 2

06 Dec 11:51

Keyvanhardani

Turbo

2ec1fcf

v0.3.0

Turbo

feat: Add German-OCR Turbo model support and multi-format output

Assets 2

04 Dec 10:39

Keyvanhardani

alpha

0614a80

v0.2.0

alpha

Add files via upload

Assets 2

Uh oh!

Releases: Keyvanhardani/german-ocr

v0.6.0 - German-OCR 2B + llama.cpp Backend

What's New

German-OCR 2B Support

Installation

Usage

Hardware Support

Links

Uh oh!

v0.5.1 - Logo & Model Branding Update

Änderungen

Logo Update

Model Branding

Installation

Quick Start

Uh oh!

German-OCR 2B v2

German-OCR 2B v2

Highlights

Performance

Dateien

Installation

Uh oh!

v0.5.0 - Model Branding

Uh oh!

v0.4.0 - Cloud API Client

Features

Installation

Verwendung

CLI

Python

Uh oh!

v0.3.0

Uh oh!

v0.2.0

Uh oh!