Skip to content
makr-code edited this page Dec 22, 2025 · 2 revisions

ThemisDB Dokumentations-Index

Stand: 20. Dezember 2025
Version: 1.3.0 (LLM Integration Release)
Typ: Dokumentations-Index


🚀 NEW in v1.3.0: Native LLM Integration (Optional Feature) ✅

AI direkt in der Datenbank - ohne externe API-Kosten!

Wichtig: LLM-Integration ist ein optionales Feature in v1.3.0:

  • Erfordert Build-Flag: -DTHEMIS_ENABLE_LLM=ON
  • Benötigt externe Abhängigkeit: llama.cpp (separat klonen)
  • Siehe Build Guide für Setup-Anweisungen

ThemisDB kann als erste Multi-Model-Datenbank mit eingebetteter LLM-Engine erweitert werden:

Highlights (Production-Ready, wenn aktiviert)

  • 🧠 Embedded llama.cpp - SLMs/LLMs (1B-70B Parameter) direkt auf GPU ✅
  • GPU Acceleration - Signifikanter Speedup mit NVIDIA CUDA support ✅
  • 💾 PagedAttention - Optimierte Memory-Verwaltung ✅
  • 🎯 Continuous Batching - Mehrere concurrent requests ✅
  • 🔧 Kernel Fusion - CUDA kernels für zusätzlichen Speedup ✅
  • 📊 Production Monitoring - Grafana/Prometheus Integration ✅
  • 🔌 Plugin Architecture - Extensible LLM backend system ✅
  • 🌐 RPC Framework - Inter-Shard Communication für distributed LLM ops ✅
  • 🖼️ Image Analysis Plugins - Multi-backend AI (llama.cpp Vision, ONNX CLIP, OpenCV DNN) ✅

Network Protocol Enhancements (v1.3.0)

  • 🌐 HTTP/2 with Server Push - CDC/Changefeed mit proaktiver Event-Delivery (~0ms Latenz) ✅
  • 🔌 WebSocket Support - CDC streaming mit bidirektionaler Echtzeit-Kommunikation ✅
  • 📡 MQTT Broker - WebSocket transport, Rate limiting, Monitoring-Metriken ✅
  • 🚀 HTTP/3 Base - QUIC-basierte Implementierung (ngtcp2 + nghttp3) 🚧
  • 🐘 PostgreSQL Wire Protocol - SQL-to-Cypher Translation für BI-Tool Kompatibilität ✅
  • 🤖 MCP Server - Model Context Protocol mit cross-platform Support ✅

Performance Metrics (mit GPU)

  • Signifikanter Speedup mit GPU vs CPU-only
  • Memory-Ersparnis mit PagedAttention
  • Zusätzliche Optimierung mit Kernel Fusion
  • Umfassende Test Coverage mit Unit Tests

GPU-Tier Empfehlungen

GPU-Tier Hardware Model Use Case Kosten/1M Tokens vs. GPT-4
Entry RTX 4060 Ti (16GB) Phi-3-Mini (3.8B) FAQ, einfache RAG €0.02 1500x günstiger
Mid-Range RTX 4090 (24GB) Mistral-7B Production RAG €0.05 600x günstiger
High-End A100 (80GB) Llama-3-70B Enterprise Scale €0.15 200x günstiger

Break-Even vs. Hyperscaler: 2-7 Monate je nach Hardware-Tier

Dokumentation (v1.3.0)


📁 Dokumentations-Struktur (Neu Organisiert)

Die Dokumentation wurde neu strukturiert für bessere Übersichtlichkeit:

Root-Dokumente (nur essentials):

  • README.md - Hauptdokumentation
  • index.md - Dokumentations-Index
  • glossary.md - Terminologie

Organisierte Ordner:

  • aql/ - AQL Grammatik (EBNF)v1.3.0
  • build/ - Build-System-Dokumentation (BUILD-SYSTEM.md, BUILDGUIDE.md, etc.)
  • development/ - Entwicklungs-Dokumentation (IMPLEMENTATION-.md, CODE_REVIEW-.md)
  • guides/ - Benutzer- und Entwickler-Guides (RAILWAY_COMPLETE_GUIDE.md, etc.)
  • architecture/ - Architektur-Dokumentation (ARCHITECTURE_OVERVIEW.md, etc.)
  • stakeholder/ - Stakeholder-Dokumentation
  • releases/ - Release-Notizen (v1.3.0.md, v1.2.0.md, v1.1.0.md, etc.)
  • llm/ - LLM & AI Integrationv1.3.0 RELEASED
  • plugins/ - RPC Frameworkv1.3.0
  • archive/ - Alte/historische Dokumentation

🔮 COMING SOON - v1.1.0 Optimization Release (Q1 2026):

Fokus: Bestehende Libraries besser nutzen + vLLM Co-Location
Highlights:

  • ✅ RocksDB TTL, Incremental Backup, Stats (keine neue Lib!)
  • ✅ TBB Parallel Sort, Concurrent Containers (keine neue Lib!)
  • ✅ Arrow Parquet Export (keine neue Lib!)
  • CUDA als Kernbestand (wenn GPU verfügbar, NICHT Enterprise!)
  • 🆕 ThemisDB + vLLM Synergie (optimierte CPU/GPU/RAM Koordination)
  • ✅ mimalloc (einzige neue Dependency, 20-40% Memory Boost)

Engineering: 9-11 Wochen | Impact: 3-10x Performance
Details: v1.1.0 Variant Strategy

🚀 PLANNED - v1.2.0 Enterprise Features (Q2 2026):

Fokus: vLLM AI Support (LoRA), Geo-Spatial (PostGIS), IoT/Timescale
Highlights:

  • LoRA Manager - Multi-Tenant LoRA Serving (HuggingFace PEFT)
  • FAISS Advanced - IVF+PQ Vector Search (bereits integriert, erweitern!)
  • GEOS + PROJ - PostGIS Compatibility (Topology + Geography)
  • Hypertables - TimescaleDB-kompatibel via RocksDB CF (nur Code!)
  • cuSpatial - GPU Geo Ops (optional, nutzt Arrow + CUDA)

Engineering: 12-16 Wochen | Impact: PostGIS + LoRA + TimescaleDB Compatibility
Details: Enterprise Features Strategy


📚 Haupt-Dokumentation

Übersichtsdokumente


🎯 Nach Zielgruppe

Für Stakeholder & Management

Für Entwickler

Für DevOps & Operations

Für Security & Compliance


🏗️ Nach Architektur-Ebene

Query & Analytics Layer

Storage & Index Layer

Distribution & Scaling Layer

Acceleration Layer

  • GPU Acceleration Plan - 10 GPU Backends (173K LOC)
    • CUDA, Vulkan, FAISS, DirectX, HIP, OpenCL, OneAPI, ZLUDA

Content & Data Processing

Server & API Layer

Security & Governance Layer


🚀 Quick Start Guides

Installation & Deployment

Getting Started


📖 Referenz-Dokumentation

Client SDKs

Data Import/Export

Plugin Development


🔧 Administration & Operations

Admin Tools

Operations Guides

Performance & Monitoring


📊 Reports & Status

Development Reports

Status Reports

Roadmap & Planning


📦 Integration & Ingestion

Data Ingestion

Enterprise Integration


🔍 Source Code Dokumentation

Module Documentation (src/)

Alle 26 Module mit detaillierter Dokumentation in src/:

  • Acceleration - GPU/CPU Backends (173K LOC)
  • Analytics - OLAP, CEP (57K LOC)
  • API - GraphQL, Geo Hooks
  • Auth - JWT Validation
  • Cache - Semantic Cache
  • CDC - Change Data Capture
  • Content - 15 File Processors (256K LOC)
  • Exporters - Data Export
  • Geo - Spatial Operations
  • Governance - Policy Engine
  • Importers - Data Import
  • Index - Vector, Graph, Secondary (400K LOC)
  • LLM - LLM Integration
  • Network - Wire Protocol
  • Observability - Metrics, Tracing
  • Plugins - Plugin System
  • Query - AQL Engine (240K LOC)
  • Replication - Leader-Follower, Multi-Master (12K LOC)
  • Security - Encryption, RBAC (187K LOC)
  • Server - HTTP, API Handlers (164K LOC)
  • Sharding - VCC-URN, Gossip (300K LOC)
  • Storage - RocksDB, MVCC (76K LOC)
  • Timeseries - Gorilla Compression (39K LOC)
  • Transaction - MVCC, SAGA (42K LOC)
  • Updates - Schema Migration
  • Utils - Utilities (120K LOC)

🎓 Weitere Ressourcen

External Links

Benchmarking & Performance

Release Documentation


📝 Dokumentations-Standards

Format & Struktur

  • Format: Markdown (.md)
  • Encoding: UTF-8
  • Line Endings: LF (Unix-style)
  • Code Blocks: Sprache immer angeben
  • Links: Relative Pfade verwenden

Contributing

  1. Struktur folgen - Docs im passenden Unterverzeichnis platzieren
  2. Proper verlinken - Relative Links zu anderen Dokumenten
  3. README updaten - Relevante README.md-Dateien aktualisieren
  4. Markdown-Style - Style Guide befolgen
  5. Aktuell halten - Docs bei Feature-Änderungen updaten

Build-Prozess

# Dependencies installieren
pip install -r requirements-docs.txt

# Dokumentation bauen
.\build-docs.ps1

# Lokal testen
mkdocs serve

Dokumentation wird automatisch zu GitHub Pages deployt bei Merge zu main.


📞 Support & Community


📊 Dokumentations-Statistiken

Metrik Wert
Dokumentationsdateien 456+
Dokumentationsordner 71
Source-Code LOC 90.829
Source Files 191 (.cpp)
Header Files 132 (.h)
Module 26 Verzeichnisse
Logische Komponenten 16

Version: 1.3.0
Last Updated: 20. Dezember 2025
License: See LICENSE

ThemisDB Dokumentation

Version: 1.3.0 | Stand: Dezember 2025


📋 Schnellstart


🏗️ Architektur


🗄️ Basismodell


💾 Storage & MVCC


📇 Indexe & Statistiken


🔍 Query & AQL


💰 Caching


📦 Content Pipeline


🔎 Suche


⚡ Performance & Benchmarks


🏢 Enterprise Features


✅ Qualitätssicherung


🧮 Vektor & GNN


🌍 Geo Features


🛡️ Sicherheit & Governance

Authentication

Schlüsselverwaltung

Verschlüsselung

TLS & Certificates

PKI & Signatures

PII Detection

Vault & HSM

Audit & Compliance

Security Audits

Gap Analysis


🚀 Deployment & Betrieb

Docker

Observability

Change Data Capture

Operations


💻 Entwicklung

API Implementations

Changefeed

Security Development

Development Overviews


📄 Publikation & Ablage


🔧 Admin-Tools


🔌 APIs


📚 Client SDKs


📊 Implementierungs-Zusammenfassungen


📅 Planung & Reports


📖 Dokumentation


📝 Release Notes


📖 Styleguide & Glossar


🗺️ Roadmap & Changelog


💾 Source Code Documentation

Main Programs

Source Code Module


🗄️ Archive


🤝 Community & Support


Vollständige Dokumentation: https://makr-code.github.io/ThemisDB/

Clone this wiki locally