Releases: Keyvanhardani/german-ocr
Releases · Keyvanhardani/german-ocr
v0.6.0 - German-OCR 2B + llama.cpp Backend
What's New
German-OCR 2B Support
- New lightweight 2B model (1.5 GB) optimized for CPU/Edge
- Full llama.cpp backend integration
- ~23 tok/s on CPU, ~127 tok/s on GPU
Installation
# Standard
pip install german-ocr
# With llama.cpp support
pip install german-ocr[llamacpp]Usage
from german_ocr import GermanOCR
# Auto-detect backend
ocr = GermanOCR()
# Or specify llama.cpp
ocr = GermanOCR(backend="llamacpp")
text = ocr.extract("invoice.png")Hardware Support
- NVIDIA (CUDA)
- Apple Silicon (Metal)
- AMD/Intel (Vulkan)
- Intel NPU (OpenVINO)
- CPU (everywhere)
Links
- Ollama:
ollama pull Keyvan/german-ocr-2b - HuggingFace: https://huggingface.co/Keyven/german-ocr-2b-gguf
v0.5.1 - Logo & Model Branding Update
Änderungen
Logo Update
- Neues kompaktes Icon im README
Model Branding
- Alle Beispiele verwenden jetzt die offiziellen Modellnamen:
german-ocr-ultra- Maximale Präzisiongerman-ocr-pro- Schnell und zuverlässiggerman-ocr- DSGVO-konform, lokale Verarbeitung
Installation
pip install german-ocr==0.5.1Quick Start
from german_ocr import CloudClient
client = CloudClient(
api_key="gocr_xxxxxxxx",
api_secret="your_secret"
)
# German-OCR Ultra für maximale Präzision
result = client.analyze("dokument.pdf", model="german-ocr-ultra")
print(result.text)German-OCR 2B v2
German-OCR 2B v2
Kompaktes Vision-Language Modell für deutsche Dokumenten-OCR.
Highlights
- 100% Genauigkeit auf deutschen Dokumenten
- Nur 1.5 GB - läuft auf jedem Laptop
- GPU/NPU-Support: CUDA, Metal, Vulkan, OpenVINO
- Läuft auch komplett auf CPU
Performance
- GPU (RTX 4060): 127 tok/s
- CPU-only: 23 tok/s
Dateien
German-OCR-Engine.2B.gguf- LLM Engine (1.03 GB)German-OCR-Worker-2B.gguf- Vision Encoder (424 MB)
Installation
pip install german-ocr[llamacpp]from german_ocr import GermanOCR
ocr = GermanOCR(backend="llamacpp")
text = ocr.extract("rechnung.png")v0.5.0 - Model Branding
Preise aus README und SDK entfernt, URL korrigiert - Preise aus öffentlicher Dokumentation entfernt - Portal URL zu app.german-ocr.de korrigiert - Vorbereitung für PyPI Release Entwickelt bei Keyvan.ai
v0.4.0 - Cloud API Client
Features
- CloudClient für api.german-ocr.de Integration
- CLI Cloud-Support:
--cloud,--api-key,--output-format,--prompt - Output-Formate: json, markdown, text, n8n
- Progress-Callback für große PDFs
- Job-Cancellation Support
Installation
pip install german-ocr --upgradeVerwendung
CLI
# Cloud API
german-ocr --cloud --api-key YOUR_KEY rechnung.pdf --output-format json
# Lokal (wie bisher)
german-ocr rechnung.pngPython
from german_ocr import CloudClient
client = CloudClient(api_key="...")
result = client.analyze("dokument.pdf", output_format="json")
print(result.text)Entwickelt bei Keyvan.ai
v0.3.0
Turbo feat: Add German-OCR Turbo model support and multi-format output
v0.2.0
alpha Add files via upload