-
Notifications
You must be signed in to change notification settings - Fork 1
features_path_constraints
Constraints für Graph-Pfade und Traversals.
- 📋 Übersicht
- ✨ Features
- 🚀 Schnellstart
- 📖 Detaillierte Dokumentation
- 💡 Best Practices
- 🔧 Troubleshooting
- 📚 Siehe auch
- 📝 Changelog
Aktuell werden FILTER-Ausdrücke in Traversals nur am letzten Level vor dem Enqueue angewendet (konservatives Pruning). Dies ist sicher, aber lässt Optimierungspotenzial auf Zwischenebenen ungenutzt.
Pfad-Constraints ermöglichen aggressiveres Pruning auf allen Tiefen, indem Prädikate entlang des gesamten Pfads gelten.
Query:
FOR v IN 1..3 OUTBOUND 'user1' GRAPH 'social'
FILTER e.type == 'follows'
RETURN v
Naive (falsche) Interpretation:
- "Schneide alle Kanten ab, bei denen
e.type != 'follows'" -
Problem: Bei depth=1 ist
edie Kante von user1 → v1, aber bei depth=2 istedie Kante zum aktuellen Knoten (v2), nicht die gesamte Pfadhistorie.
Ergebnis: Zu viele Pfade abgeschnitten, die über alternative Routen erreichbar wären.
Semantik: FILTER gilt nur für die eingehende Kante zur aktuellen Zeile (depth).
Syntax:
FILTER e.type == 'follows' -- nur am letzten Level sicher
Anwendung:
- Am letzten Level vor Enqueue prüfen (✅ implementiert)
- Auf Zwischenebenen: nicht prunen (würde Pfade abschneiden)
Semantik: FILTER gilt für alle Kanten entlang des Pfads von Start bis aktueller Zeile.
Syntax (zukünftig):
FILTER PATH.ALL(e, e.type == 'follows')
Bedeutung:
- Prüfe bei jedem Expand: Ist die neue Kante ein
follows? - Wenn nein: Pfad ist ungültig → nicht enqueuen
- Sicher auf allen Tiefen!
Implementierung:
- Beim Enqueue: Prüfe
a.edgeIdgegen Constraint - Tracking: Optional Pfad-Historie (Liste der edgeIds) mitführen, falls Constraints auf "vorherige Kante" prüfen
Semantik: Mindestens eine Kante entlang des Pfads erfüllt Prädikat.
Syntax (zukünftig):
FILTER PATH.ANY(e, e.weight > 10)
Implementierung:
- Pfad-State: Boolean Flag
hasSeenHeavyEdge - Beim Enqueue: Update Flag
- Bei Result-Zeile: Prüfe Flag
Semantik: Kein Vertex entlang des Pfads darf Prädikat verletzen.
Syntax (zukünftig):
FILTER PATH.NONE(v, v.blocked == true)
Implementierung:
- Beim Enqueue: Prüfe neuen Vertex
nbgegen Constraint - Wenn
nb.blocked == true: Nicht enqueuen - Sicher auf allen Tiefen!
| Constraint-Typ | Anwendungstiefe | Implementierung |
|---|---|---|
| Last-Edge (e.field OP value) | Nur letztes Level | ✅ Implementiert (evalSingleE) |
| Last-Vertex (v.field OP value) | Nur letztes Level | ✅ Implementiert (evalSingleV) |
| PATH.ALL(e, ...) | Alle Tiefen | 🔜 Geplant (Expand-Zeit-Check) |
| PATH.NONE(v, ...) | Alle Tiefen | 🔜 Geplant (Expand-Zeit-Check) |
| PATH.ANY(e, ...) | Alle Tiefen (State) | 🔜 Geplant (Flag-basiert) |
struct PathConstraintExpr : Expression {
enum class Type { All, Any, None };
Type type;
char varName; // 'e' oder 'v'
std::unique_ptr<Expression> predicate;
};Parser-Syntax:
PATH.ALL(e, e.type == 'follows')
PATH.NONE(v, v.blocked == true)
PATH.ANY(e, e.weight > 10)
struct FilterClassification {
std::vector<Expression*> lastEdgeOnly;
std::vector<Expression*> lastVertexOnly;
std::vector<Expression*> pathAllEdge;
std::vector<Expression*> pathNoneVertex;
std::vector<Expression*> pathAnyEdge;
std::vector<Expression*> mixed; // AND/OR kombiniert, keine einfache Klassifikation
};
FilterClassification classifyFilters(const std::vector<std::unique_ptr<FilterClause>>& filters);auto enqueueOut = [&](const std::vector<AdjacencyInfo>& adj) {
for (const auto& a : adj) {
// PATH.ALL(e, e.type == 'follows')
for (const auto& pathAllE : pathAllEdgeConstraints) {
if (!evalEdgeConstraint(a.edgeId, pathAllE)) {
prunedAllDepths++;
continue; // sicher auf allen Tiefen!
}
}
// PATH.NONE(v, v.blocked == true)
for (const auto& pathNoneV : pathNoneVertexConstraints) {
if (evalVertexConstraint(a.targetPk, pathNoneV)) {
prunedAllDepths++;
continue; // blockierter Vertex → skip
}
}
// Konservative Prüfungen (nur letztes Level)
if (depth + 1 == t.maxDepth) {
// ... (wie bisher)
}
if (visited.insert(a.targetPk).second) {
parent[a.targetPk] = {node, a.edgeId};
qnodes.push({a.targetPk, depth + 1});
enqueuedPerDepth[depth + 1]++;
}
}
};struct PathState {
bool hasSeenHeavyEdge = false;
// weitere Flags je Constraint
};
std::unordered_map<std::string, PathState> pathStates;
// Beim Enqueue:
PathState newState = pathStates[node];
if (checkEdgeWeight(a.edgeId) > 10) newState.hasSeenHeavyEdge = true;
pathStates[a.targetPk] = newState;
// Bei Result-Zeile:
if (pathAnyEdgeConstraints.hasHeavyEdge && !pathStates[node].hasSeenHeavyEdge) {
pass = false; // PATH.ANY nicht erfüllt
}- Frontier-Reduktion: Aggressives Pruning auf allen Tiefen
- Frühzeitiger Abbruch: Ungültige Pfade werden sofort verworfen
- Weniger Entity-Loads: Nur validierte Pfade landen in Result-Set
- Expand-Zeit-Overhead: Jede Kante wird gegen PATH.ALL/NONE geprüft
- Memory: PathState für PATH.ANY (HashMap, kleine Keys)
Faustregel:
- Nutzen > Kosten, wenn Constraints selektiv sind (z. B. nur 10% der Kanten sind
follows)
- Phase 1: Parser-Erweiterung (PATH.ALL/NONE/ANY Syntax)
- Phase 2: AST-Classifier (Filter-Typen erkennen)
- Phase 3: BFS Expand-Zeit-Checks (PATH.ALL/NONE)
- Phase 4: State-Tracking (PATH.ANY)
-
Phase 5: Metriken (
pruned_all_depths,path_state_size) - Phase 6: Tests & Benchmarks (Vergleich mit/ohne Constraints)
FOR v IN 1..3 OUTBOUND 'user1' GRAPH 'social'
FILTER PATH.ALL(e, e.type == 'follows')
RETURN v
Effekt: BFS expandiert nur über follows-Kanten, alle anderen werden auf allen Tiefen gedroppt.
FOR v IN 1..5 OUTBOUND 'user1' GRAPH 'social'
FILTER PATH.NONE(v, v.blocked == true)
RETURN v
Effekt: Pfade, die einen blockierten Vertex passieren, werden sofort verworfen.
FOR v IN 1..4 OUTBOUND 'user1' GRAPH 'social'
FILTER PATH.ANY(e, e.weight > 10)
RETURN v
Effekt: Nur Pfade mit mindestens einer starken Kante (weight > 10) landen im Result.
| Aktuelle Implementierung | Pfad-Constraints (geplant) |
|---|---|
| Pruning nur am letzten Level | Pruning auf allen Tiefen |
| Unsicher für Zwischenebenen | Sichere Semantik durch PATH.ALL/NONE |
| Einfach (kein State) | State-Tracking für PATH.ANY |
| Konservativ (viele False Positives) | Aggressiv (nur valide Pfade expandiert) |
Empfehlung:
- Phase 1-3 implementieren (PATH.ALL/NONE) für sofortigen Nutzen
- Phase 4 (PATH.ANY) optional, falls Use-Cases existieren
- Metriken sammeln:
pruned_all_depthsvs.pruned_last_levelVergleich
Siehe auch:
ThemisDB v1.3.4 | GitHub | Documentation | Discussions | License
Last synced: January 02, 2026 | Commit: 6add659
Version: 1.3.0 | Stand: Dezember 2025
- Übersicht
- Home
- Dokumentations-Index
- Quick Reference
- Sachstandsbericht 2025
- Features
- Roadmap
- Ecosystem Overview
- Strategische Übersicht
- Geo/Relational Storage
- RocksDB Storage
- MVCC Design
- Transaktionen
- Time-Series
- Memory Tuning
- Chain of Thought Storage
- Query Engine & AQL
- AQL Syntax
- Explain & Profile
- Rekursive Pfadabfragen
- Temporale Graphen
- Zeitbereichs-Abfragen
- Semantischer Cache
- Hybrid Queries (Phase 1.5)
- AQL Hybrid Queries
- Hybrid Queries README
- Hybrid Query Benchmarks
- Subquery Quick Reference
- Subquery Implementation
- Content Pipeline
- Architektur-Details
- Ingestion
- JSON Ingestion Spec
- Enterprise Ingestion Interface
- Geo-Processor Design
- Image-Processor Design
- Hybrid Search Design
- Fulltext API
- Hybrid Fusion API
- Stemming
- Performance Tuning
- Migration Guide
- Future Work
- Pagination Benchmarks
- Enterprise README
- Scalability Features
- HTTP Client Pool
- Build Guide
- Implementation Status
- Final Report
- Integration Analysis
- Enterprise Strategy
- Verschlüsselungsstrategie
- Verschlüsselungsdeployment
- Spaltenverschlüsselung
- Encryption Next Steps
- Multi-Party Encryption
- Key Rotation Strategy
- Security Encryption Gap Analysis
- Audit Logging
- Audit & Retention
- Compliance Audit
- Compliance
- Extended Compliance Features
- Governance-Strategie
- Compliance-Integration
- Governance Usage
- Security/Compliance Review
- Threat Model
- Security Hardening Guide
- Security Audit Checklist
- Security Audit Report
- Security Implementation
- Development README
- Code Quality Pipeline
- Developers Guide
- Cost Models
- Todo Liste
- Tool Todo
- Core Feature Todo
- Priorities
- Implementation Status
- Roadmap
- Future Work
- Next Steps Analysis
- AQL LET Implementation
- Development Audit
- Sprint Summary (2025-11-17)
- WAL Archiving
- Search Gap Analysis
- Source Documentation Plan
- Changefeed README
- Changefeed CMake Patch
- Changefeed OpenAPI
- Changefeed OpenAPI Auth
- Changefeed SSE Examples
- Changefeed Test Harness
- Changefeed Tests
- Dokumentations-Inventar
- Documentation Summary
- Documentation TODO
- Documentation Gap Analysis
- Documentation Consolidation
- Documentation Final Status
- Documentation Phase 3
- Documentation Cleanup Validation
- API
- Authentication
- Cache
- CDC
- Content
- Geo
- Governance
- Index
- LLM
- Query
- Security
- Server
- Storage
- Time Series
- Transaction
- Utils
Vollständige Dokumentation: https://makr-code.github.io/ThemisDB/