-
Notifications
You must be signed in to change notification settings - Fork 1
query_hybrid_benchmarks
Stand: 5. Dezember 2025
Version: 1.0.0
Kategorie: Query
Dieser Bericht dokumentiert die Messmethodik und Zielmetriken für die neuen Optimierungen:
- Parallel Filtering (TBB + multiGet)
- SIMD L2 Distance (AVX2/AVX512 Fallback Scalar)
- Geo-aware Cost Optimizer (Vector-first vs. Spatial-first Plan)
-
Datei:
benchmarks/bench_simd_distance.cpp- Vergleicht
simd::l2_distance()gegen eine reine Scalar-Implementierung für Dimensionen {64,128,256,512}. - Metrik: Zeit pro Distanzberechnung (µs).
- Vergleicht
-
Datei:
benchmarks/bench_hybrid_vector_geo.cpp- Misst ANN-Suchkosten für Hybrid Vector+Geo (vereinfachter Pfad; SpatialIndex hier nicht integriert um Setup klein zu halten).
- Metrik: Zeit für Top-k Suche (ms) bei N=5000, k=10.
- Datei:
tests/test_hybrid_optimizations.cpp(Grundgerüst)- Testfälle:
- Vector-first Plan (erzwungen via
bbox_ratio_threshold = 0.0). - Brute-Force Pfad ohne Vektorindex (SIMD Distanz, Reihenfolge-Semantik).
- Vector-first Plan (erzwungen via
- Finalisierung nach Einbindung eines SecondaryIndexManager Test-Fixtures.
- Testfälle:
| Szenario | Basis (vor Optimierung) | Ziel (nach Optimierung) | Erwartete Speedup |
|---|---|---|---|
| Brute-Force L2 (512 dim) | ~X µs | ~X/1.4 µs | 1.3–1.5× |
| Vector-first Hybrid k=10 (N=5k) | ~Y ms (Spatial-first) | ~Y/1.2 ms | 1.1–1.3× |
| Content+Geo 1000 FT Hits | ~Z ms | ~Z/2 ms | 1.8–2.2× |
| Graph+Geo BFS depth 5 (500 nodes) | ~A ms | ~A/1.5 ms | 1.4–1.6× |
Hinweis: Platzhalter (X,Y,Z,A) werden nach erstem Benchmark-Lauf ersetzt.
cmake -S . -B build -G "Visual Studio 17 2022" -A x64 -DCMAKE_BUILD_TYPE=Release -DTHEMIS_ENABLE_AVX2=ON
cmake --build build --config Release --target themis_benchmarks.\buildench_simd_distance.exe --benchmark_color=yes
.\build hemis_benchmarks.exe --benchmark_filter=Hybrid_VectorFirstcmake --build build --config Debug --target themis_tests
.uild hemis_tests.exe --gtest_filter=HybridOptimizations.*Nach dem Lauf die Rohdaten (JSON möglich via --benchmark_format=json) sichern:
.uildench_simd_distance.exe --benchmark_format=json > simd_distance_results.jsonKennzahlen werden in diesen Bericht aufgenommen und im DATABASE_CAPABILITIES_ROADMAP.md konsolidiert.
config:hybrid_query erlaubt Feintuning:
{
"vector_first_overfetch": 6,
"bbox_ratio_threshold": 0.25,
"min_chunk_spatial_eval": 64,
"min_chunk_vector_bf": 128
}- Assertions in
test_hybrid_optimizations.cppvervollständigen (Plan-Erkennung, Distanz-Sortierung). - Erweiterung des Hybrid-Benchmarks um SpatialIndex Pfad (R-Tree).
- Dokumentation realer Messwerte und Vergleich mit Ziel-Schwellen.
- SIMD Pfad fällt bei fehlender AVX2/AVX512 CPU transparent auf Scalar zurück (Performance-Minderung, keine Korrektheitsrisiken).
- Parallelisierung nutzt Chunking, testweise obere Schranke für Speicherverbrauch kontrollieren.
- Overfetch-Faktor > 10 kann Speicher-/CPU-Druck erzeugen; Standard 5 ist konservativ.
Letzte Aktualisierung: 17.11.2025
ThemisDB v1.3.4 | GitHub | Documentation | Discussions | License
Last synced: January 02, 2026 | Commit: 6add659
Version: 1.3.0 | Stand: Dezember 2025
- Übersicht
- Home
- Dokumentations-Index
- Quick Reference
- Sachstandsbericht 2025
- Features
- Roadmap
- Ecosystem Overview
- Strategische Übersicht
- Geo/Relational Storage
- RocksDB Storage
- MVCC Design
- Transaktionen
- Time-Series
- Memory Tuning
- Chain of Thought Storage
- Query Engine & AQL
- AQL Syntax
- Explain & Profile
- Rekursive Pfadabfragen
- Temporale Graphen
- Zeitbereichs-Abfragen
- Semantischer Cache
- Hybrid Queries (Phase 1.5)
- AQL Hybrid Queries
- Hybrid Queries README
- Hybrid Query Benchmarks
- Subquery Quick Reference
- Subquery Implementation
- Content Pipeline
- Architektur-Details
- Ingestion
- JSON Ingestion Spec
- Enterprise Ingestion Interface
- Geo-Processor Design
- Image-Processor Design
- Hybrid Search Design
- Fulltext API
- Hybrid Fusion API
- Stemming
- Performance Tuning
- Migration Guide
- Future Work
- Pagination Benchmarks
- Enterprise README
- Scalability Features
- HTTP Client Pool
- Build Guide
- Implementation Status
- Final Report
- Integration Analysis
- Enterprise Strategy
- Verschlüsselungsstrategie
- Verschlüsselungsdeployment
- Spaltenverschlüsselung
- Encryption Next Steps
- Multi-Party Encryption
- Key Rotation Strategy
- Security Encryption Gap Analysis
- Audit Logging
- Audit & Retention
- Compliance Audit
- Compliance
- Extended Compliance Features
- Governance-Strategie
- Compliance-Integration
- Governance Usage
- Security/Compliance Review
- Threat Model
- Security Hardening Guide
- Security Audit Checklist
- Security Audit Report
- Security Implementation
- Development README
- Code Quality Pipeline
- Developers Guide
- Cost Models
- Todo Liste
- Tool Todo
- Core Feature Todo
- Priorities
- Implementation Status
- Roadmap
- Future Work
- Next Steps Analysis
- AQL LET Implementation
- Development Audit
- Sprint Summary (2025-11-17)
- WAL Archiving
- Search Gap Analysis
- Source Documentation Plan
- Changefeed README
- Changefeed CMake Patch
- Changefeed OpenAPI
- Changefeed OpenAPI Auth
- Changefeed SSE Examples
- Changefeed Test Harness
- Changefeed Tests
- Dokumentations-Inventar
- Documentation Summary
- Documentation TODO
- Documentation Gap Analysis
- Documentation Consolidation
- Documentation Final Status
- Documentation Phase 3
- Documentation Cleanup Validation
- API
- Authentication
- Cache
- CDC
- Content
- Geo
- Governance
- Index
- LLM
- Query
- Security
- Server
- Storage
- Time Series
- Transaction
- Utils
Vollständige Dokumentation: https://makr-code.github.io/ThemisDB/