From 982505d7449f077996feb7a6c4b547f39339a5a3 Mon Sep 17 00:00:00 2001
From: Jorge Antonio <matroid@outlook.com>
Date: Fri, 10 Jan 2025 16:33:41 +0000
Subject: [PATCH 1/2] first commit

---
 atoma-proxy/src/server/streamer.rs | 322 ++++++++++++++++-------------
 1 file changed, 179 insertions(+), 143 deletions(-)
diff --git a/atoma-proxy/src/server/streamer.rs b/atoma-proxy/src/server/streamer.rs
index 8e1ec21f..0f729738 100644
--- a/atoma-proxy/src/server/streamer.rs
+++ b/atoma-proxy/src/server/streamer.rs
@@ -271,157 +271,29 @@ impl Stream for Streamer {
 
         match self.stream.as_mut().poll_next(cx) {
             Poll::Ready(Some(Ok(chunk))) => {
-                if self.status != StreamStatus::Started {
-                    self.status = StreamStatus::Started;
-                }
-
-                if chunk.as_ref() == KEEP_ALIVE_CHUNK {
-                    return Poll::Pending;
-                }
-
-                let chunk_str = match std::str::from_utf8(&chunk) {
-                    Ok(v) => v,
-                    Err(e) => {
-                        error!(
-                            target = "atoma-service",
-                            level = "error",
-                            "Invalid UTF-8 sequence: {}",
-                            e
-                        );
-                        return Poll::Ready(Some(Err(Error::new(format!(
-                            "Invalid UTF-8 sequence: {}",
-                            e
-                        )))));
-                    }
-                };
-
-                let chunk_str = chunk_str.strip_prefix(DATA_PREFIX).unwrap_or(chunk_str);
-
-                if chunk_str.starts_with(DONE_CHUNK) {
-                    // This is the last chunk, meaning the inference streaming is complete
-                    self.status = StreamStatus::Completed;
-                    return Poll::Ready(None);
-                }
-
-                let chunk = match serde_json::from_str::<Value>(chunk_str) {
-                    Ok(chunk) => {
-                        if !self.chunk_buffer.is_empty() {
-                            error!(
-                                target = "atoma-service-streamer",
-                                level = "error",
-                                "Error parsing previous chunk(s), as chunk buffer is not empty: {}",
-                                self.chunk_buffer
-                            );
-                            self.chunk_buffer.clear();
-                        }
-                        chunk
-                    }
-                    Err(e) => {
-                        if e.is_eof() {
-                            info!(
-                                target = "atoma-service-streamer",
-                                parse_chunk = "eof_chunk",
-                                "EOF reached, pushing chunk to buffer: {}",
-                                chunk_str
-                            );
-                            self.chunk_buffer.push_str(chunk_str);
-                            return Poll::Pending;
-                        }
-
-                        if self.chunk_buffer.is_empty() {
+                match self.handle_stream_chunk(chunk) {
+                    Poll::Ready(Some(Ok(event))) => Poll::Ready(Some(Ok(event))),
+                    Poll::Ready(Some(Err(e))) => {
+                        self.status = StreamStatus::Failed(e.to_string());
+                        if let Err(e) = update_state_manager(
+                            &self.state_manager_sender,
+                            self.stack_small_id,
+                            self.estimated_total_tokens,
+                            self.estimated_total_tokens,
+                            &self.endpoint,
+                        ) {
                             error!(
                                 target = "atoma-service-streamer",
                                 level = "error",
-                                "Error parsing chunk {chunk_str}: {}",
+                                "Error updating stack num tokens: {}",
                                 e
                             );
-                            return Poll::Ready(Some(Err(Error::new(format!(
-                                "Error parsing chunk: {}",
-                                e
-                            )))));
-                        }
-
-                        self.chunk_buffer.push_str(chunk_str);
-                        match serde_json::from_str::<Value>(&self.chunk_buffer) {
-                            Ok(chunk) => {
-                                info!(
-                                    target = "atoma-service-streamer",
-                                    parse_chunk = "eof_chunk",
-                                    "Chunk parsed successfully, clearing buffer: {}",
-                                    self.chunk_buffer
-                                );
-                                self.chunk_buffer.clear();
-                                chunk
-                            }
-                            Err(e) => {
-                                if e.is_eof() {
-                                    // NOTE: We don't need to push the chunk to the buffer, as it was pushed already
-                                    return Poll::Pending;
-                                }
-                                error!(
-                                    target = "atoma-service-streamer",
-                                    level = "error",
-                                    "Error parsing chunk {}: {}",
-                                    self.chunk_buffer,
-                                    e
-                                );
-                                self.chunk_buffer.clear();
-                                return Poll::Ready(Some(Err(Error::new(format!(
-                                    "Error parsing chunk: {}",
-                                    e
-                                )))));
-                            }
                         }
+                        Poll::Ready(Some(Err(e)))
                     }
-                };
-
-                if self.start_decode.is_none() {
-                    self.start_decode = Some(Instant::now());
-                    let latency = self.start.elapsed().as_secs_f64();
-                    self.state_manager_sender
-                        .send(AtomaAtomaStateManagerEvent::UpdateNodeLatencyPerformance {
-                            timestamp: DateTime::<Utc>::from(std::time::SystemTime::now()), // Convert to chrono::DateTime<Utc>
-                            node_small_id: self.node_id,
-                            latency,
-                        })
-                        .map_err(|e| {
-                            error!(
-                                target = "atoma-service-streamer",
-                                level = "error",
-                                "Error updating node latency performance: {}",
-                                e
-                            );
-                            Error::new(format!("Error updating node latency performance: {}", e))
-                        })?;
+                    Poll::Pending => Poll::Pending,
+                    Poll::Ready(None) => Poll::Ready(None),
                 }
-
-                if self.endpoint == CHAT_COMPLETIONS_PATH {
-                    let choices = match chunk.get(CHOICES).and_then(|choices| choices.as_array()) {
-                        Some(choices) => choices,
-                        None => {
-                            error!(
-                                target = "atoma-service-streamer",
-                                level = "error",
-                                "Error getting choices from chunk"
-                            );
-                            return Poll::Ready(Some(Err(Error::new(
-                                "Error getting choices from chunk",
-                            ))));
-                        }
-                    };
-
-                    if choices.is_empty() {
-                        if let Some(usage) = chunk.get(USAGE) {
-                            self.status = StreamStatus::Completed;
-                            self.handle_final_chunk(usage)?;
-                        }
-                    }
-                } else if let Some(usage) = chunk.get(USAGE) {
-                    self.status = StreamStatus::Completed;
-                    self.handle_final_chunk(usage)?;
-                }
-
-                Poll::Ready(Some(Ok(Event::default().json_data(&chunk)?)))
             }
             Poll::Ready(Some(Err(e))) => {
                 self.status = StreamStatus::Failed(e.to_string());
@@ -443,3 +315,167 @@ impl Stream for Streamer {
         }
     }
 }
+
+
+impl Streamer {
+    #[instrument(
+        level = "info",
+        skip(self, chunk),
+        fields(
+            endpoint = "handle_stream_chunk",
+        )
+    )]
+    fn handle_stream_chunk(&mut self, chunk: Bytes) -> Poll<Option<Result<Event, Error>>> {
+        if self.status != StreamStatus::Started {
+            self.status = StreamStatus::Started;
+        }
+
+        if chunk.as_ref() == KEEP_ALIVE_CHUNK {
+            return Poll::Pending;
+        }
+
+        let chunk_str = match std::str::from_utf8(&chunk) {
+            Ok(v) => v,
+            Err(e) => {
+                error!(
+                    target = "atoma-service",
+                    level = "error",
+                    "Invalid UTF-8 sequence: {}",
+                    e
+                );
+                return Poll::Ready(Some(Err(Error::new(format!(
+                    "Invalid UTF-8 sequence: {}",
+                    e
+                )))));
+            }
+        };
+
+        let chunk_str = chunk_str.strip_prefix(DATA_PREFIX).unwrap_or(chunk_str);
+
+        if chunk_str.starts_with(DONE_CHUNK) {
+            // This is the last chunk, meaning the inference streaming is complete
+            self.status = StreamStatus::Completed;
+            return Poll::Ready(None);
+        }
+
+        let chunk = match serde_json::from_str::<Value>(chunk_str) {
+            Ok(chunk) => {
+                if !self.chunk_buffer.is_empty() {
+                    error!(
+                        target = "atoma-service-streamer",
+                        level = "error",
+                        "Error parsing previous chunk(s), as chunk buffer is not empty: {}",
+                        self.chunk_buffer
+                    );
+                    self.chunk_buffer.clear();
+                }
+                chunk
+            }
+            Err(e) => {
+                if e.is_eof() {
+                    info!(
+                        target = "atoma-service-streamer",
+                        parse_chunk = "eof_chunk",
+                        "EOF reached, pushing chunk to buffer: {}",
+                        chunk_str
+                    );
+                    self.chunk_buffer.push_str(chunk_str);
+                    return Poll::Pending;
+                }
+
+                if self.chunk_buffer.is_empty() {
+                    error!(
+                        target = "atoma-service-streamer",
+                        level = "error",
+                        "Error parsing chunk {chunk_str}: {}",
+                        e
+                    );
+                    return Poll::Ready(Some(Err(Error::new(format!(
+                        "Error parsing chunk: {}",
+                        e
+                    )))));
+                }
+
+                self.chunk_buffer.push_str(chunk_str);
+                match serde_json::from_str::<Value>(&self.chunk_buffer) {
+                    Ok(chunk) => {
+                        info!(
+                            target = "atoma-service-streamer",
+                            parse_chunk = "eof_chunk",
+                            "Chunk parsed successfully, clearing buffer: {}",
+                            self.chunk_buffer
+                        );
+                        self.chunk_buffer.clear();
+                        chunk
+                    }
+                    Err(e) => {
+                        if e.is_eof() {
+                            // NOTE: We don't need to push the chunk to the buffer, as it was pushed already
+                            return Poll::Pending;
+                        }
+                        error!(
+                            target = "atoma-service-streamer",
+                            level = "error",
+                            "Error parsing chunk {}: {}",
+                            self.chunk_buffer,
+                            e
+                        );
+                        self.chunk_buffer.clear();
+                        return Poll::Ready(Some(Err(Error::new(format!(
+                            "Error parsing chunk: {}",
+                            e
+                        )))));
+                    }
+                }
+            }
+        };
+
+        if self.start_decode.is_none() {
+            self.start_decode = Some(Instant::now());
+            let latency = self.start.elapsed().as_secs_f64();
+            self.state_manager_sender
+                .send(AtomaAtomaStateManagerEvent::UpdateNodeLatencyPerformance {
+                    timestamp: DateTime::<Utc>::from(std::time::SystemTime::now()), // Convert to chrono::DateTime<Utc>
+                    node_small_id: self.node_id,
+                    latency,
+                })
+                .map_err(|e| {
+                    error!(
+                        target = "atoma-service-streamer",
+                        level = "error",
+                        "Error updating node latency performance: {}",
+                        e
+                    );
+                    Error::new(format!("Error updating node latency performance: {}", e))
+                })?;
+        }
+
+        if self.endpoint == CHAT_COMPLETIONS_PATH {
+            let choices = match chunk.get(CHOICES).and_then(|choices| choices.as_array()) {
+                Some(choices) => choices,
+                None => {
+                    error!(
+                        target = "atoma-service-streamer",
+                        level = "error",
+                        "Error getting choices from chunk"
+                    );
+                    return Poll::Ready(Some(Err(Error::new(
+                        "Error getting choices from chunk",
+                    ))));
+                }
+            };
+
+            if choices.is_empty() {
+                if let Some(usage) = chunk.get(USAGE) {
+                    self.status = StreamStatus::Completed;
+                    self.handle_final_chunk(usage)?;
+                }
+            }
+        } else if let Some(usage) = chunk.get(USAGE) {
+            self.status = StreamStatus::Completed;
+            self.handle_final_chunk(usage)?;
+        }
+
+        Poll::Ready(Some(Ok(Event::default().json_data(&chunk)?)))
+    }
+}
\ No newline at end of file

From 300a4fc3551431be4cdc292b55eae3e234cfb215 Mon Sep 17 00:00:00 2001
From: Jorge Antonio <matroid@outlook.com>
Date: Fri, 10 Jan 2025 16:34:21 +0000
Subject: [PATCH 2/2] fmt

---
 atoma-proxy/src/server/streamer.rs | 55 +++++++++++++-----------------
 1 file changed, 24 insertions(+), 31 deletions(-)

diff --git a/atoma-proxy/src/server/streamer.rs b/atoma-proxy/src/server/streamer.rs
index 0f729738..b44cd83f 100644
--- a/atoma-proxy/src/server/streamer.rs
+++ b/atoma-proxy/src/server/streamer.rs
@@ -270,31 +270,29 @@ impl Stream for Streamer {
         }
 
         match self.stream.as_mut().poll_next(cx) {
-            Poll::Ready(Some(Ok(chunk))) => {
-                match self.handle_stream_chunk(chunk) {
-                    Poll::Ready(Some(Ok(event))) => Poll::Ready(Some(Ok(event))),
-                    Poll::Ready(Some(Err(e))) => {
-                        self.status = StreamStatus::Failed(e.to_string());
-                        if let Err(e) = update_state_manager(
-                            &self.state_manager_sender,
-                            self.stack_small_id,
-                            self.estimated_total_tokens,
-                            self.estimated_total_tokens,
-                            &self.endpoint,
-                        ) {
-                            error!(
-                                target = "atoma-service-streamer",
-                                level = "error",
-                                "Error updating stack num tokens: {}",
-                                e
-                            );
-                        }
-                        Poll::Ready(Some(Err(e)))
+            Poll::Ready(Some(Ok(chunk))) => match self.handle_stream_chunk(chunk) {
+                Poll::Ready(Some(Ok(event))) => Poll::Ready(Some(Ok(event))),
+                Poll::Ready(Some(Err(e))) => {
+                    self.status = StreamStatus::Failed(e.to_string());
+                    if let Err(e) = update_state_manager(
+                        &self.state_manager_sender,
+                        self.stack_small_id,
+                        self.estimated_total_tokens,
+                        self.estimated_total_tokens,
+                        &self.endpoint,
+                    ) {
+                        error!(
+                            target = "atoma-service-streamer",
+                            level = "error",
+                            "Error updating stack num tokens: {}",
+                            e
+                        );
                     }
-                    Poll::Pending => Poll::Pending,
-                    Poll::Ready(None) => Poll::Ready(None),
+                    Poll::Ready(Some(Err(e)))
                 }
-            }
+                Poll::Pending => Poll::Pending,
+                Poll::Ready(None) => Poll::Ready(None),
+            },
             Poll::Ready(Some(Err(e))) => {
                 self.status = StreamStatus::Failed(e.to_string());
                 Poll::Ready(None)
@@ -316,14 +314,11 @@ impl Stream for Streamer {
     }
 }
 
-
 impl Streamer {
     #[instrument(
         level = "info",
         skip(self, chunk),
-        fields(
-            endpoint = "handle_stream_chunk",
-        )
+        fields(endpoint = "handle_stream_chunk",)
     )]
     fn handle_stream_chunk(&mut self, chunk: Bytes) -> Poll<Option<Result<Event, Error>>> {
         if self.status != StreamStatus::Started {
@@ -459,9 +454,7 @@ impl Streamer {
                         level = "error",
                         "Error getting choices from chunk"
                     );
-                    return Poll::Ready(Some(Err(Error::new(
-                        "Error getting choices from chunk",
-                    ))));
+                    return Poll::Ready(Some(Err(Error::new("Error getting choices from chunk"))));
                 }
             };
 
@@ -478,4 +471,4 @@ impl Streamer {
 
         Poll::Ready(Some(Ok(Event::default().json_data(&chunk)?)))
     }
-}
\ No newline at end of file
+}