worker/src/lib/HeliconeProxyRequest/ProxyForwarder.ts

-Original file line number
+Diff line change
@@ Expand Up @@
     import { modelCostBreakdownFromRegistry } from "@helicone-package/cost/costCalc";
     import { heliconeProviderToModelProviderName } from "@helicone-package/cost/models/provider-helpers";
+    interface CostCalculationParams {
+      loggable: DBLoggable;
+      proxyRequest: HeliconeProxyRequest;
+    }
+    /**
+     * Calculates the cost of a request from the response body.
+     * This function waits for the full response to be received before calculating.
+     */
+    async function calculateCostFromResponse({
+      loggable,
+      proxyRequest,
+    }: CostCalculationParams): Promise<number | undefined> {
+      try {
+        const rawResponseResult = await loggable.readRawResponse();
+        if (rawResponseResult.error !== null) {
+          console.error("Error reading raw response for cost calculation:", rawResponseResult.error);
+          return undefined;
+        }
+        const rawResponse = rawResponseResult.data;
+        let cost: number | undefined = undefined;
+        // Handle AI Gateway requests (both BYOK and PTB)
+        const gatewayAttempt = proxyRequest.requestWrapper.getGatewayAttempt();
+        if (rawResponse && gatewayAttempt) {
+          const attemptModel = gatewayAttempt.endpoint.providerModelId;
+          const attemptProvider = gatewayAttempt.endpoint.provider;
+          const usageProcessor = getUsageProcessor(attemptProvider);
+          if (usageProcessor) {
+            const usage = await usageProcessor.parse({
+              responseBody: rawResponse,
+              isStream: proxyRequest.isStream,
+              model: attemptModel,
+            });
+            if (usage.data) {
+              const breakdown = modelCostBreakdownFromRegistry({
+                modelUsage: usage.data,
+                providerModelId: attemptModel,
+                provider: attemptProvider,
+              });
+              if (breakdown) {
+                cost = breakdown.totalCost;
+              }
+            }
+          }
+        } else if (rawResponse) {
+          // For non AI Gateway requests, fall back to legacy methods
+          const responseBodyResult = await loggable.parseRawResponse(rawResponse);
+          if (responseBodyResult.error !== null) {
+            console.error("Error parsing response for cost calculation:", responseBodyResult.error);
+            return undefined;
+          }
+          const responseData = responseBodyResult.data;
+          const model = responseData?.response.model;
+          const provider = proxyRequest.provider;
+          if (model && provider && responseData) {
+            // Provider -> ModelProviderName to try and use new registry
+            const modelProviderName = heliconeProviderToModelProviderName(provider);
+            if (modelProviderName) {
+              // Try usage processor + new registry first
+              const usageProcessor = getUsageProcessor(modelProviderName);
+              if (usageProcessor) {
+                const usage = await usageProcessor.parse({
+                  responseBody: rawResponse,
+                  isStream: proxyRequest.isStream,
+                  model: model,
+                });
+                if (usage.data) {
+                  const breakdown = modelCostBreakdownFromRegistry({
+                    modelUsage: usage.data,
+                    providerModelId: model,
+                    provider: modelProviderName,
+                  });
+                  cost = breakdown?.totalCost;
+                }
+              }
+            }
+            // Final fallback for providers not in ModelProviderName
+            if (cost === undefined) {
+              cost =
+                costOfPrompt({
+                  model,
+                  promptTokens: responseData.response.prompt_tokens ?? 0,
+                  completionTokens: responseData.response.completion_tokens ?? 0,
+                  provider,
+                  promptCacheWriteTokens:
+                    responseData.response.prompt_cache_write_tokens ?? 0,
+                  promptCacheReadTokens:
+                    responseData.response.prompt_cache_read_tokens ?? 0,
+                  promptAudioTokens:
+                    responseData.response.prompt_audio_tokens ?? 0,
+                  completionAudioTokens:
+                    responseData.response.completion_audio_tokens ?? 0,
+                }) ?? 0;
+            }
+          }
+        }
+        return cost;
+      } catch (e) {
+        console.error("Error calculating cost:", e);
+        return undefined;
+      }
+    }
     export async function proxyForwarder(
       request: RequestWrapper,
       env: Env,
@@ Expand Down Expand Up / @@ -388,6 +505,31 @@ export async function proxyForwarder( @@
         responseBuilder.setHeader("Helicone-Cache", "MISS");
       }
+      // Calculate cost synchronously if includeCost header is set
+      // Note: This buffers the entire response, so streaming benefits are lost when enabled
+      const includeCost = proxyRequest.requestWrapper.heliconeHeaders.featureFlags.includeCost;
+      let responseBody: BodyInit | null = response.body;
+      if (includeCost) {
+        try {
+          // Wait for the full response to calculate cost
+          const cost = await calculateCostFromResponse({
+            loggable,
+            proxyRequest,
+          });
+          if (cost !== undefined) {
+            responseBuilder.setHeader("Helicone-Cost", cost.toString());
+          }
+          // Get the buffered response body to return
+          const { body: bodyChunks } = await loggable.waitForResponse();
+          responseBody = bodyChunks.join("");
+        } catch (e) {
+          console.error("Error calculating cost for response header:", e);
+        }
+      }
       if (
         request?.heliconeHeaders?.heliconeAuth ||
         request?.heliconeHeaders.heliconeAuthV2 ||
@@ Expand All / @@ -410,7 +552,7 @@ export async function proxyForwarder( @@
       }
       return responseBuilder.build({
-        body: response.body,
+        body: responseBody,
         inheritFrom: response,
         status: response.status,
       });
@@ Expand Down @@

worker/src/lib/models/HeliconeHeaders.ts

-Original file line number
+Diff line change
@@ Expand Up / @@ -26,6 +26,7 @@ export interface IHeliconeHeaders { @@
         streamForceFormat: boolean;
         increaseTimeout: boolean;
         streamUsage: boolean;
+        includeCost: boolean;
       };
       retryHeaders: Nullable<{
         enabled: boolean;
@@ Expand Down Expand Up / @@ -98,6 +99,7 @@ export class HeliconeHeaders implements IHeliconeHeaders { @@
         streamForceFormat: boolean;
         increaseTimeout: boolean;
         streamUsage: boolean;
+        includeCost: boolean;
       };
       retryHeaders: Nullable<{
         enabled: boolean;
@@ Expand Down Expand Up @@
         const streamForceFormat = this.headers.get("helicone-stream-force-format");
         const increaseTimeout = this.headers.get("helicone-increase-timeout");
         const streamUsage = this.headers.get("helicone-stream-usage");
+        const includeCost = this.headers.get("helicone-include-cost");
         return {
           streamForceFormat: streamForceFormat === "true",
           increaseTimeout: increaseTimeout === "true",
           streamUsage: streamUsage === "true",
+          includeCost: includeCost === "true",
         };
       }
@@ Expand Down @@

claude/add-cost-response-header-q5ZpB #5500

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Draft

chitalian wants to merge 1 commit into main from claude/add-cost-response-header-q5ZpB

+147 −1

-Original file line number
+Diff line change
@@ Expand Up @@
     import { modelCostBreakdownFromRegistry } from "@helicone-package/cost/costCalc";
     import { heliconeProviderToModelProviderName } from "@helicone-package/cost/models/provider-helpers";
+    interface CostCalculationParams {
+      loggable: DBLoggable;
+      proxyRequest: HeliconeProxyRequest;
+    }
+    /**
+     * Calculates the cost of a request from the response body.
+     * This function waits for the full response to be received before calculating.
+     */
+    async function calculateCostFromResponse({
+      loggable,
+      proxyRequest,
+    }: CostCalculationParams): Promise<number | undefined> {
+      try {
+        const rawResponseResult = await loggable.readRawResponse();
+        if (rawResponseResult.error !== null) {
+          console.error("Error reading raw response for cost calculation:", rawResponseResult.error);
+          return undefined;
+        }
+        const rawResponse = rawResponseResult.data;
+        let cost: number | undefined = undefined;
+        // Handle AI Gateway requests (both BYOK and PTB)
+        const gatewayAttempt = proxyRequest.requestWrapper.getGatewayAttempt();
+        if (rawResponse && gatewayAttempt) {
+          const attemptModel = gatewayAttempt.endpoint.providerModelId;
+          const attemptProvider = gatewayAttempt.endpoint.provider;
+          const usageProcessor = getUsageProcessor(attemptProvider);
+          if (usageProcessor) {
+            const usage = await usageProcessor.parse({
+              responseBody: rawResponse,
+              isStream: proxyRequest.isStream,
+              model: attemptModel,
+            });
+            if (usage.data) {
+              const breakdown = modelCostBreakdownFromRegistry({
+                modelUsage: usage.data,
+                providerModelId: attemptModel,
+                provider: attemptProvider,
+              });
+              if (breakdown) {
+                cost = breakdown.totalCost;
+              }
+            }
+          }
+        } else if (rawResponse) {
+          // For non AI Gateway requests, fall back to legacy methods
+          const responseBodyResult = await loggable.parseRawResponse(rawResponse);
+          if (responseBodyResult.error !== null) {
+            console.error("Error parsing response for cost calculation:", responseBodyResult.error);
+            return undefined;
+          }
+          const responseData = responseBodyResult.data;
+          const model = responseData?.response.model;
+          const provider = proxyRequest.provider;
+          if (model && provider && responseData) {
+            // Provider -> ModelProviderName to try and use new registry
+            const modelProviderName = heliconeProviderToModelProviderName(provider);
+            if (modelProviderName) {
+              // Try usage processor + new registry first
+              const usageProcessor = getUsageProcessor(modelProviderName);
+              if (usageProcessor) {
+                const usage = await usageProcessor.parse({
+                  responseBody: rawResponse,
+                  isStream: proxyRequest.isStream,
+                  model: model,
+                });
+                if (usage.data) {
+                  const breakdown = modelCostBreakdownFromRegistry({
+                    modelUsage: usage.data,
+                    providerModelId: model,
+                    provider: modelProviderName,
+                  });
+                  cost = breakdown?.totalCost;
+                }
+              }
+            }
+            // Final fallback for providers not in ModelProviderName
+            if (cost === undefined) {
+              cost =
+                costOfPrompt({
+                  model,
+                  promptTokens: responseData.response.prompt_tokens ?? 0,
+                  completionTokens: responseData.response.completion_tokens ?? 0,
+                  provider,
+                  promptCacheWriteTokens:
+                    responseData.response.prompt_cache_write_tokens ?? 0,
+                  promptCacheReadTokens:
+                    responseData.response.prompt_cache_read_tokens ?? 0,
+                  promptAudioTokens:
+                    responseData.response.prompt_audio_tokens ?? 0,
+                  completionAudioTokens:
+                    responseData.response.completion_audio_tokens ?? 0,
+                }) ?? 0;
+            }
+          }
+        }
+        return cost;
+      } catch (e) {
+        console.error("Error calculating cost:", e);
+        return undefined;
+      }
+    }
     export async function proxyForwarder(
       request: RequestWrapper,
       env: Env,
@@ Expand Down Expand Up / @@ -388,6 +505,31 @@ export async function proxyForwarder( @@
         responseBuilder.setHeader("Helicone-Cache", "MISS");
       }
+      // Calculate cost synchronously if includeCost header is set
+      // Note: This buffers the entire response, so streaming benefits are lost when enabled
+      const includeCost = proxyRequest.requestWrapper.heliconeHeaders.featureFlags.includeCost;
+      let responseBody: BodyInit | null = response.body;
+      if (includeCost) {
+        try {
+          // Wait for the full response to calculate cost
+          const cost = await calculateCostFromResponse({
+            loggable,
+            proxyRequest,
+          });
+          if (cost !== undefined) {
+            responseBuilder.setHeader("Helicone-Cost", cost.toString());
+          }
+          // Get the buffered response body to return
+          const { body: bodyChunks } = await loggable.waitForResponse();
+          responseBody = bodyChunks.join("");
+        } catch (e) {
+          console.error("Error calculating cost for response header:", e);
+        }
+      }
       if (
         request?.heliconeHeaders?.heliconeAuth ||
         request?.heliconeHeaders.heliconeAuthV2 ||
@@ Expand All / @@ -410,7 +552,7 @@ export async function proxyForwarder( @@
       }
       return responseBuilder.build({
-        body: response.body,
+        body: responseBody,
         inheritFrom: response,
         status: response.status,
       });
@@ Expand Down @@

-Original file line number
+Diff line change
@@ Expand Up / @@ -26,6 +26,7 @@ export interface IHeliconeHeaders { @@
         streamForceFormat: boolean;
         increaseTimeout: boolean;
         streamUsage: boolean;
+        includeCost: boolean;
       };
       retryHeaders: Nullable<{
         enabled: boolean;
@@ Expand Down Expand Up / @@ -98,6 +99,7 @@ export class HeliconeHeaders implements IHeliconeHeaders { @@
         streamForceFormat: boolean;
         increaseTimeout: boolean;
         streamUsage: boolean;
+        includeCost: boolean;
       };
       retryHeaders: Nullable<{
         enabled: boolean;
@@ Expand Down Expand Up @@
         const streamForceFormat = this.headers.get("helicone-stream-force-format");
         const increaseTimeout = this.headers.get("helicone-increase-timeout");
         const streamUsage = this.headers.get("helicone-stream-usage");
+        const includeCost = this.headers.get("helicone-include-cost");
         return {
           streamForceFormat: streamForceFormat === "true",
           increaseTimeout: increaseTimeout === "true",
           streamUsage: streamUsage === "true",
+          includeCost: includeCost === "true",
         };
       }
@@ Expand Down @@

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

claude/add-cost-response-header-q5ZpB #5500

Diff view

Diff view

There are no files selected for viewing

Uh oh!

claude/add-cost-response-header-q5ZpB #5500

Are you sure you want to change the base?

claude/add-cost-response-header-q5ZpB #5500

Uh oh!

Uh oh!

Diff view

Diff view

There are no files selected for viewing

Uh oh!