livepeer · mjh1 · Oct 13, 2025 · Oct 14, 2025 · Oct 14, 2025 · Oct 14, 2025
diff --git a/cmd/livepeer/starter/flags.go b/cmd/livepeer/starter/flags.go
@@ -75,8 +75,8 @@ func NewLivepeerConfig(fs *flag.FlagSet) LivepeerConfig {
 	cfg.LiveAIAuthWebhookURL = fs.String("liveAIAuthWebhookUrl", "", "Live AI RTMP authentication webhook URL")
 	cfg.LivePaymentInterval = fs.Duration("livePaymentInterval", *cfg.LivePaymentInterval, "Interval to pay process Gateway <> Orchestrator Payments for Live AI Video")
 	cfg.LiveOutSegmentTimeout = fs.Duration("liveOutSegmentTimeout", *cfg.LiveOutSegmentTimeout, "Timeout duration to wait the output segment to be available in the Live AI pipeline; defaults to no timeout")
-	cfg.LiveAICapRefreshModels = fs.String("liveAICapRefreshModels", "", "Comma separated list of models to periodically fetch capacity for. Leave unset to switch off periodic refresh.")
 	cfg.LiveAISaveNSegments = fs.Int("liveAISaveNSegments", 10, "Set how many segments to save to disk for debugging (both input and output)")
+	cfg.LiveAICapReportInterval = fs.Duration("liveAICapReportInterval", *cfg.LiveAICapReportInterval, "Interval to report Live AI container capacity metrics")
 
 	// Onchain:
 	cfg.EthAcctAddr = fs.String("ethAcctAddr", *cfg.EthAcctAddr, "Existing Eth account address. For use when multiple ETH accounts exist in the keystore directory")

diff --git a/cmd/livepeer/starter/starter.go b/cmd/livepeer/starter/starter.go
@@ -184,7 +184,7 @@ type LivepeerConfig struct {
 	LiveAIHeartbeatInterval    *time.Duration
 	LivePaymentInterval        *time.Duration
 	LiveOutSegmentTimeout      *time.Duration
-	LiveAICapRefreshModels     *string
+	LiveAICapReportInterval    *time.Duration
 	LiveAISaveNSegments        *int
 }
 
@@ -241,6 +241,7 @@ func DefaultLivepeerConfig() LivepeerConfig {
 	defaultLiveOutSegmentTimeout := 0 * time.Second
 	defaultGatewayHost := ""
 	defaultLiveAIHeartbeatInterval := 5 * time.Second
+	defaultLiveAICapReportInterval := 25 * time.Minute
 
 	// Onchain:
 	defaultEthAcctAddr := ""
@@ -359,6 +360,7 @@ func DefaultLivepeerConfig() LivepeerConfig {
 		LiveOutSegmentTimeout:    &defaultLiveOutSegmentTimeout,
 		GatewayHost:              &defaultGatewayHost,
 		LiveAIHeartbeatInterval:  &defaultLiveAIHeartbeatInterval,
+		LiveAICapReportInterval:  &defaultLiveAICapReportInterval,
 
 		// Onchain:
 		EthAcctAddr:             &defaultEthAcctAddr,
@@ -1591,7 +1593,7 @@ func StartLivepeer(ctx context.Context, cfg LivepeerConfig) {
 		if *cfg.Network != "offchain" {
 			ctx, cancel := context.WithCancel(ctx)
 			defer cancel()
-			dbOrchPoolCache, err := discovery.NewDBOrchestratorPoolCache(ctx, n, timeWatcher, orchBlacklist, *cfg.DiscoveryTimeout)
+			dbOrchPoolCache, err := discovery.NewDBOrchestratorPoolCache(ctx, n, timeWatcher, orchBlacklist, *cfg.DiscoveryTimeout, *cfg.LiveAICapReportInterval)
 			if err != nil {
 				exit("Could not create orchestrator pool with DB cache: %v", err)
 			}
@@ -1756,9 +1758,6 @@ func StartLivepeer(ctx context.Context, cfg LivepeerConfig) {
 	if cfg.LiveAITrickleHostForRunner != nil {
 		n.LiveAITrickleHostForRunner = *cfg.LiveAITrickleHostForRunner
 	}
-	if cfg.LiveAICapRefreshModels != nil && *cfg.LiveAICapRefreshModels != "" {
-		n.LiveAICapRefreshModels = strings.Split(*cfg.LiveAICapRefreshModels, ",")
-	}
 	n.LiveAISaveNSegments = cfg.LiveAISaveNSegments
 
 	//Create Livepeer Node

diff --git a/core/livepeernode.go b/core/livepeernode.go
@@ -168,7 +168,6 @@ type LivepeerNode struct {
 	LiveAIHeartbeatInterval    time.Duration
 	LivePaymentInterval        time.Duration
 	LiveOutSegmentTimeout      time.Duration
-	LiveAICapRefreshModels     []string
 	LiveAISaveNSegments        *int
 
 	// Gateway

diff --git a/discovery/db_discovery.go b/discovery/db_discovery.go
@@ -14,34 +14,33 @@ import (
 	"github.com/livepeer/go-livepeer/core"
 	"github.com/livepeer/go-livepeer/eth"
 	lpTypes "github.com/livepeer/go-livepeer/eth/types"
+	"github.com/livepeer/go-livepeer/monitor"
 	"github.com/livepeer/go-livepeer/net"
 	"github.com/livepeer/go-livepeer/pm"
 	"github.com/livepeer/go-livepeer/server"
 
 	"github.com/golang/glog"
 )
 
-var cacheRefreshInterval = 25 * time.Minute
-var getTicker = func() *time.Ticker {
-	return time.NewTicker(cacheRefreshInterval)
-}
+var networkCapabilitiesReportingInterval = 25 * time.Minute
 
 type ticketParamsValidator interface {
 	ValidateTicketParams(ticketParams *pm.TicketParams) error
 }
 
 type DBOrchestratorPoolCache struct {
-	store                 common.OrchestratorStore
-	lpEth                 eth.LivepeerEthClient
-	ticketParamsValidator ticketParamsValidator
-	rm                    common.RoundsManager
-	bcast                 common.Broadcaster
-	orchBlacklist         []string
-	discoveryTimeout      time.Duration
-	node                  *core.LivepeerNode
+	store                           common.OrchestratorStore
+	lpEth                           eth.LivepeerEthClient
+	ticketParamsValidator           ticketParamsValidator
+	rm                              common.RoundsManager
+	bcast                           common.Broadcaster
+	orchBlacklist                   []string
+	discoveryTimeout                time.Duration
+	node                            *core.LivepeerNode
+	lastNetworkCapabilitiesReported time.Time
 }
 
-func NewDBOrchestratorPoolCache(ctx context.Context, node *core.LivepeerNode, rm common.RoundsManager, orchBlacklist []string, discoveryTimeout time.Duration) (*DBOrchestratorPoolCache, error) {
+func NewDBOrchestratorPoolCache(ctx context.Context, node *core.LivepeerNode, rm common.RoundsManager, orchBlacklist []string, discoveryTimeout time.Duration, liveAICapReportInterval time.Duration) (*DBOrchestratorPoolCache, error) {
 	if node.Eth == nil {
 		return nil, fmt.Errorf("could not create DBOrchestratorPoolCache: LivepeerEthClient is nil")
 	}
@@ -66,7 +65,7 @@ func NewDBOrchestratorPoolCache(ctx context.Context, node *core.LivepeerNode, rm
 			return err
 		}
 
-		if err := dbo.pollOrchestratorInfo(ctx); err != nil {
+		if err := dbo.pollOrchestratorInfo(ctx, liveAICapReportInterval); err != nil {
 			return err
 		}
 		return nil
@@ -252,13 +251,13 @@ func (dbo *DBOrchestratorPoolCache) cacheOrchestratorStake() error {
 	return nil
 }
 
-func (dbo *DBOrchestratorPoolCache) pollOrchestratorInfo(ctx context.Context) error {
+func (dbo *DBOrchestratorPoolCache) pollOrchestratorInfo(ctx context.Context, liveAICapReportInterval time.Duration) error {
 	if err := dbo.cacheOrchInfos(); err != nil {
 		glog.Errorf("unable to poll orchestrator info: %v", err)
 		return err
 	}
 
-	ticker := getTicker()
+	ticker := time.NewTicker(liveAICapReportInterval)
 	go func() {
 		for {
 			select {
@@ -393,12 +392,59 @@ func (dbo *DBOrchestratorPoolCache) cacheOrchInfos() error {
 			i = numOrchs //exit loop
 		}
 	}
-	//save network capabilities in LivepeerNode
-	dbo.node.UpdateNetworkCapabilities(orchNetworkCapabilities)
+
+	// Only update network capabilities every 25 minutes
+	if time.Since(dbo.lastNetworkCapabilitiesReported) >= networkCapabilitiesReportingInterval {
+		// Save network capabilities in LivepeerNode
+		dbo.node.UpdateNetworkCapabilities(orchNetworkCapabilities)
+
+		dbo.lastNetworkCapabilitiesReported = time.Now()
+	}
+
+	// Report AI container capacity metrics
+	reportAICapacityFromNetworkCapabilities(orchNetworkCapabilities)
 
 	return nil
 }
 
+func reportAICapacityFromNetworkCapabilities(orchNetworkCapabilities []*common.OrchNetworkCapabilities) {
+	// Build structured capacity data
+	modelCapacities := make(map[string]*monitor.ModelAICapacities)
+
+	for _, orchCap := range orchNetworkCapabilities {
+		models := getModelCapsFromNetCapabilities(orchCap.Capabilities)
+
+		for modelID, model := range models {
+			if _, exists := modelCapacities[modelID]; !exists {
+				modelCapacities[modelID] = &monitor.ModelAICapacities{
+					ModelID:       modelID,
+					Orchestrators: make(map[string]monitor.AIContainerCapacity),
+				}
+			}
+
+			capacity := monitor.AIContainerCapacity{
+				Idle:  int(model.Capacity),
+				InUse: int(model.CapacityInUse),
+			}
+			modelCapacities[modelID].Orchestrators[orchCap.OrchURI] = capacity
+		}
+	}
+
+	monitor.ReportAIContainerCapacity(modelCapacities)
+}
+
+func getModelCapsFromNetCapabilities(caps *net.Capabilities) map[string]*net.Capabilities_CapabilityConstraints_ModelConstraint {
+	if caps == nil || caps.Constraints == nil || caps.Constraints.PerCapability == nil {
+		return nil
+	}
+	liveAI, ok := caps.Constraints.PerCapability[uint32(core.Capability_LiveVideoToVideo)]
+	if !ok {
+		return nil
+	}
+
+	return liveAI.Models
+}
+
 func (dbo *DBOrchestratorPoolCache) Broadcaster() common.Broadcaster {
 	return dbo.bcast
 }

diff --git a/discovery/discovery.go b/discovery/discovery.go
@@ -246,7 +246,6 @@ func (o *orchestratorPool) GetOrchestrators(ctx context.Context, numOrchestrator
 	for _, i := range rand.Perm(numAvailableOrchs) {
 		go getOrchInfo(ctx, common.OrchestratorDescriptor{linfos[i], nil}, 0, odCh, errCh, allOrchDescrCh)
 	}
-	go reportLiveAICapacity(allOrchDescrCh, caps)
 
 	// use a timer to time out the entire get info loop below
 	cutoffTimer := time.NewTimer(maxGetOrchestratorCutoffTimeout)
@@ -326,62 +325,6 @@ func (o *orchestratorPool) GetOrchestrators(ctx context.Context, numOrchestrator
 	return ods, nil
 }
 
-func getModelCaps(caps *net.Capabilities) map[string]*net.Capabilities_CapabilityConstraints_ModelConstraint {
-	if caps == nil || caps.Constraints == nil || caps.Constraints.PerCapability == nil {
-		return nil
-	}
-	liveAI, ok := caps.Constraints.PerCapability[uint32(core.Capability_LiveVideoToVideo)]
-	if !ok {
-		return nil
-	}
-
-	return liveAI.Models
-}
-
-func reportLiveAICapacity(ch chan common.OrchestratorDescriptor, caps common.CapabilityComparator) {
-	if !monitor.Enabled {
-		return
-	}
-	modelsReq := getModelCaps(caps.ToNetCapabilities())
-
-	var allOrchInfo []common.OrchestratorDescriptor
-	var done bool
-	for {
-		select {
-		case od := <-ch:
-			allOrchInfo = append(allOrchInfo, od)
-		case <-time.After(maxGetOrchestratorCutoffTimeout):
-			done = true
-		}
-		if done {
-			break
-		}
-	}
-
-	idleContainersByModelAndOrchestrator := make(map[string]map[string]int)
-	for _, od := range allOrchInfo {
-		var models map[string]*net.Capabilities_CapabilityConstraints_ModelConstraint
-		if od.RemoteInfo != nil {
-			models = getModelCaps(od.RemoteInfo.Capabilities)
-		}
-
-		for modelID := range modelsReq {
-			idle := 0
-			if models != nil {
-				if model, ok := models[modelID]; ok {
-					idle = int(model.Capacity)
-				}
-			}
-
-			if _, exists := idleContainersByModelAndOrchestrator[modelID]; !exists {
-				idleContainersByModelAndOrchestrator[modelID] = make(map[string]int)
-			}
-			idleContainersByModelAndOrchestrator[modelID][od.LocalInfo.URL.String()] = idle
-		}
-	}
-	monitor.AIContainersIdleAfterGatewayDiscovery(idleContainersByModelAndOrchestrator)
-}
-
 func (o *orchestratorPool) Size() int {
 	return len(o.infos)
 }