From 93dfe68a4c50fae765e9943fefbc8c2f18c0261f Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Tue, 23 Sep 2025 18:57:07 +0800
Subject: [PATCH 01/21] refactor: remove MessageStore and its implementations

---
 .../valuecell/core/session/message_store.py   | 344 ------------------
 1 file changed, 344 deletions(-)
 delete mode 100644 python/valuecell/core/session/message_store.py

diff --git a/python/valuecell/core/session/message_store.py b/python/valuecell/core/session/message_store.py
deleted file mode 100644
index d195e0f56..000000000
--- a/python/valuecell/core/session/message_store.py
+++ /dev/null
@@ -1,344 +0,0 @@
-import sqlite3
-import json
-from abc import ABC, abstractmethod
-from datetime import datetime
-from typing import List, Optional, Dict, Any
-
-from .models import Message, Role
-
-
-class MessageStore(ABC):
-    """Abstract base class for message storage"""
-
-    @abstractmethod
-    async def save_message(self, message: Message) -> None:
-        """Save a single message"""
-
-    @abstractmethod
-    async def get_messages(
-        self,
-        session_id: str,
-        limit: Optional[int] = None,
-        offset: int = 0,
-        role: Optional[Role] = None,
-    ) -> List[Message]:
-        """Get messages for a session with optional filtering and pagination"""
-
-    @abstractmethod
-    async def get_message(self, message_id: str) -> Optional[Message]:
-        """Get a specific message by ID"""
-
-    @abstractmethod
-    async def get_latest_message(self, session_id: str) -> Optional[Message]:
-        """Get the latest message in a session"""
-
-    @abstractmethod
-    async def get_message_count(self, session_id: str) -> int:
-        """Get total message count for a session"""
-
-    @abstractmethod
-    async def delete_session_messages(self, session_id: str) -> int:
-        """Delete all messages for a session, returns count of deleted messages"""
-
-    @abstractmethod
-    async def delete_message(self, message_id: str) -> bool:
-        """Delete a specific message"""
-
-
-class InMemoryMessageStore(MessageStore):
-    """In-memory message store implementation for testing and development"""
-
-    def __init__(self):
-        self._messages: Dict[str, Message] = {}
-        self._session_messages: Dict[str, List[str]] = {}
-
-    async def save_message(self, message: Message) -> None:
-        """Save message to memory"""
-        self._messages[message.message_id] = message
-
-        # Maintain session index
-        if message.session_id not in self._session_messages:
-            self._session_messages[message.session_id] = []
-        self._session_messages[message.session_id].append(message.message_id)
-
-    async def get_messages(
-        self,
-        session_id: str,
-        limit: Optional[int] = None,
-        offset: int = 0,
-        role: Optional[Role] = None,
-    ) -> List[Message]:
-        """Get messages for a session"""
-        message_ids = self._session_messages.get(session_id, [])
-        messages = [self._messages[msg_id] for msg_id in message_ids]
-
-        # Filter by role if specified
-        if role:
-            messages = [msg for msg in messages if msg.role == role]
-
-        # Sort by timestamp
-        messages.sort(key=lambda m: m.timestamp)
-
-        # Apply pagination
-        if offset > 0:
-            messages = messages[offset:]
-        if limit is not None:
-            messages = messages[:limit]
-
-        return messages
-
-    async def get_message(self, message_id: str) -> Optional[Message]:
-        """Get a specific message"""
-        return self._messages.get(message_id)
-
-    async def get_latest_message(self, session_id: str) -> Optional[Message]:
-        """Get the latest message in a session"""
-        messages = await self.get_messages(session_id)
-        return messages[-1] if messages else None
-
-    async def get_message_count(self, session_id: str) -> int:
-        """Get message count for a session"""
-        return len(self._session_messages.get(session_id, []))
-
-    async def delete_session_messages(self, session_id: str) -> int:
-        """Delete all messages for a session"""
-        message_ids = self._session_messages.get(session_id, [])
-        count = len(message_ids)
-
-        # Remove from messages dict
-        for msg_id in message_ids:
-            self._messages.pop(msg_id, None)
-
-        # Remove session index
-        self._session_messages.pop(session_id, None)
-
-        return count
-
-    async def delete_message(self, message_id: str) -> bool:
-        """Delete a specific message"""
-        message = self._messages.pop(message_id, None)
-        if not message:
-            return False
-
-        # Remove from session index
-        session_id = message.session_id
-        if session_id in self._session_messages:
-            try:
-                self._session_messages[session_id].remove(message_id)
-            except ValueError:
-                pass  # Already removed
-
-        return True
-
-    def clear_all(self) -> None:
-        """Clear all messages (for testing)"""
-        self._messages.clear()
-        self._session_messages.clear()
-
-
-class SQLiteMessageStore(MessageStore):
-    """SQLite-based message store implementation"""
-
-    def __init__(self, db_path: Optional[str] = None):
-        """Initialize SQLite message store
-
-        Args:
-            db_path: Path to SQLite database file. If None, uses in-memory database.
-        """
-        self.db_path = db_path or ":memory:"
-        self._init_database()
-
-    def _init_database(self) -> None:
-        """Initialize database schema"""
-        with sqlite3.connect(self.db_path) as conn:
-            conn.execute("""
-                CREATE TABLE IF NOT EXISTS messages (
-                    message_id TEXT PRIMARY KEY,
-                    session_id TEXT NOT NULL,
-                    user_id TEXT NOT NULL,
-                    agent_name TEXT,
-                    role TEXT NOT NULL,
-                    content TEXT NOT NULL,
-                    timestamp TEXT NOT NULL,
-                    task_id TEXT,
-                    metadata TEXT,
-                    created_at DATETIME DEFAULT CURRENT_TIMESTAMP
-                )
-            """)
-
-            # Create indexes for common queries
-            conn.execute("""
-                CREATE INDEX IF NOT EXISTS idx_messages_session_id 
-                ON messages(session_id)
-            """)
-
-            conn.execute("""
-                CREATE INDEX IF NOT EXISTS idx_messages_timestamp 
-                ON messages(session_id, timestamp)
-            """)
-
-            conn.execute("""
-                CREATE INDEX IF NOT EXISTS idx_messages_role 
-                ON messages(session_id, role)
-            """)
-
-    def _message_to_dict(self, message: Message) -> Dict[str, Any]:
-        """Convert Message object to database record"""
-        return {
-            "message_id": message.message_id,
-            "session_id": message.session_id,
-            "user_id": message.user_id,
-            "agent_name": message.agent_name,
-            "role": message.role.value,
-            "content": message.content,
-            "timestamp": message.timestamp.isoformat(),
-            "task_id": message.task_id,
-            "metadata": json.dumps(message.metadata) if message.metadata else None,
-        }
-
-    def _dict_to_message(self, row: Dict[str, Any]) -> Message:
-        """Convert database record to Message object"""
-        return Message(
-            message_id=row["message_id"],
-            session_id=row["session_id"],
-            user_id=row["user_id"],
-            agent_name=row["agent_name"],
-            role=Role(row["role"]),
-            content=row["content"],
-            timestamp=datetime.fromisoformat(row["timestamp"]),
-            task_id=row["task_id"],
-            metadata=json.loads(row["metadata"]) if row["metadata"] else {},
-        )
-
-    async def save_message(self, message: Message) -> None:
-        """Save message to SQLite database"""
-        data = self._message_to_dict(message)
-
-        with sqlite3.connect(self.db_path) as conn:
-            conn.execute(
-                """
-                INSERT OR REPLACE INTO messages 
-                (message_id, session_id, user_id, agent_name, role, content, 
-                 timestamp, task_id, metadata)
-                VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?)
-            """,
-                (
-                    data["message_id"],
-                    data["session_id"],
-                    data["user_id"],
-                    data["agent_name"],
-                    data["role"],
-                    data["content"],
-                    data["timestamp"],
-                    data["task_id"],
-                    data["metadata"],
-                ),
-            )
-
-    async def get_messages(
-        self,
-        session_id: str,
-        limit: Optional[int] = None,
-        offset: int = 0,
-        role: Optional[Role] = None,
-    ) -> List[Message]:
-        """Get messages for a session"""
-        query = """
-            SELECT message_id, session_id, user_id, agent_name, role, content, 
-                   timestamp, task_id, metadata
-            FROM messages 
-            WHERE session_id = ?
-        """
-        params = [session_id]
-
-        # Add role filter if specified
-        if role:
-            query += " AND role = ?"
-            params.append(role.value)
-
-        # Order by timestamp
-        query += " ORDER BY timestamp ASC"
-
-        # Add pagination
-        if limit is not None:
-            query += " LIMIT ? OFFSET ?"
-            params.extend([limit, offset])
-
-        with sqlite3.connect(self.db_path) as conn:
-            conn.row_factory = sqlite3.Row
-            cursor = conn.execute(query, params)
-            rows = cursor.fetchall()
-
-            return [self._dict_to_message(dict(row)) for row in rows]
-
-    async def get_message(self, message_id: str) -> Optional[Message]:
-        """Get a specific message by ID"""
-        with sqlite3.connect(self.db_path) as conn:
-            conn.row_factory = sqlite3.Row
-            cursor = conn.execute(
-                """
-                SELECT message_id, session_id, user_id, agent_name, role, content, 
-                       timestamp, task_id, metadata
-                FROM messages 
-                WHERE message_id = ?
-            """,
-                (message_id,),
-            )
-
-            row = cursor.fetchone()
-            return self._dict_to_message(dict(row)) if row else None
-
-    async def get_latest_message(self, session_id: str) -> Optional[Message]:
-        """Get the latest message in a session"""
-        with sqlite3.connect(self.db_path) as conn:
-            conn.row_factory = sqlite3.Row
-            cursor = conn.execute(
-                """
-                SELECT message_id, session_id, user_id, agent_name, role, content, 
-                       timestamp, task_id, metadata
-                FROM messages 
-                WHERE session_id = ?
-                ORDER BY timestamp DESC 
-                LIMIT 1
-            """,
-                (session_id,),
-            )
-
-            row = cursor.fetchone()
-            return self._dict_to_message(dict(row)) if row else None
-
-    async def get_message_count(self, session_id: str) -> int:
-        """Get message count for a session"""
-        with sqlite3.connect(self.db_path) as conn:
-            cursor = conn.execute(
-                """
-                SELECT COUNT(*) FROM messages WHERE session_id = ?
-            """,
-                (session_id,),
-            )
-
-            return cursor.fetchone()[0]
-
-    async def delete_session_messages(self, session_id: str) -> int:
-        """Delete all messages for a session"""
-        with sqlite3.connect(self.db_path) as conn:
-            cursor = conn.execute(
-                """
-                DELETE FROM messages WHERE session_id = ?
-            """,
-                (session_id,),
-            )
-
-            return cursor.rowcount
-
-    async def delete_message(self, message_id: str) -> bool:
-        """Delete a specific message"""
-        with sqlite3.connect(self.db_path) as conn:
-            cursor = conn.execute(
-                """
-                DELETE FROM messages WHERE message_id = ?
-            """,
-                (message_id,),
-            )
-
-            return cursor.rowcount > 0

From 87ade9d156468e087a6731981b36d1f24301960f Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Tue, 23 Sep 2025 18:57:51 +0800
Subject: [PATCH 02/21] refactor: update response event handling and remove
 unused message model

---
 python/valuecell/core/agent/decorator.py    |  4 +-
 python/valuecell/core/agent/responses.py    | 18 +++--
 python/valuecell/core/coordinate/planner.py |  2 +-
 python/valuecell/core/session/models.py     | 31 +--------
 python/valuecell/core/types.py              | 76 ++++++++++++++-------
 5 files changed, 68 insertions(+), 63 deletions(-)

diff --git a/python/valuecell/core/agent/decorator.py b/python/valuecell/core/agent/decorator.py
index 65805c783..99942f599 100644
--- a/python/valuecell/core/agent/decorator.py
+++ b/python/valuecell/core/agent/decorator.py
@@ -21,7 +21,7 @@
     BaseAgent,
     NotifyResponse,
     StreamResponse,
-    StreamResponseEvent,
+    CommonResponseEvent,
 )
 from valuecell.utils import parse_host_port
 from .responses import EventPredicates
@@ -137,7 +137,7 @@ async def _add_chunk(
                 "response_event": response_event.value,
                 "subtask_id": response.subtask_id,
             }
-            if response_event == StreamResponseEvent.COMPONENT_GENERATOR:
+            if response_event == CommonResponseEvent.COMPONENT_GENERATOR:
                 metadata["component_type"] = response.metadata.get("component_type")
             await updater.add_artifact(
                 parts=parts,
diff --git a/python/valuecell/core/agent/responses.py b/python/valuecell/core/agent/responses.py
index 74bc6ed3c..539ddd3ea 100644
--- a/python/valuecell/core/agent/responses.py
+++ b/python/valuecell/core/agent/responses.py
@@ -8,8 +8,9 @@
     StreamResponse,
     StreamResponseEvent,
     SystemResponseEvent,
+    CommonResponseEvent,
     ToolCallPayload,
-    _TaskResponseEvent,
+    TaskStatusEvent,
 )
 
 
@@ -77,7 +78,7 @@ def component_generator(
         self, content: str, component_type: str, subtask_id: str | None = None
     ) -> StreamResponse:
         return StreamResponse(
-            event=StreamResponseEvent.COMPONENT_GENERATOR,
+            event=CommonResponseEvent.COMPONENT_GENERATOR,
             content=content,
             metadata={"component_type": component_type},
             subtask_id=subtask_id,
@@ -86,7 +87,7 @@ def component_generator(
     def done(self, content: Optional[str] = None) -> StreamResponse:
         return StreamResponse(
             content=content,
-            event=_TaskResponseEvent.TASK_COMPLETED,
+            event=TaskStatusEvent.TASK_COMPLETED,
         )
 
     def failed(self, content: Optional[str] = None) -> StreamResponse:
@@ -108,10 +109,17 @@ def message(self, content: str) -> NotifyResponse:
             event=NotifyResponseEvent.MESSAGE,
         )
 
+    def component_generator(self, content: str, component_type: str) -> StreamResponse:
+        return StreamResponse(
+            event=CommonResponseEvent.COMPONENT_GENERATOR,
+            content=content,
+            metadata={"component_type": component_type},
+        )
+
     def done(self, content: Optional[str] = None) -> NotifyResponse:
         return NotifyResponse(
             content=content,
-            event=_TaskResponseEvent.TASK_COMPLETED,
+            event=TaskStatusEvent.TASK_COMPLETED,
         )
 
     def failed(self, content: Optional[str] = None) -> NotifyResponse:
@@ -134,7 +142,7 @@ class EventPredicates:
     @staticmethod
     def is_task_completed(response_type) -> bool:
         return response_type in {
-            _TaskResponseEvent.TASK_COMPLETED,
+            TaskStatusEvent.TASK_COMPLETED,
         }
 
     @staticmethod
diff --git a/python/valuecell/core/coordinate/planner.py b/python/valuecell/core/coordinate/planner.py
index b38d3d6a4..17c2b2569 100644
--- a/python/valuecell/core/coordinate/planner.py
+++ b/python/valuecell/core/coordinate/planner.py
@@ -118,7 +118,7 @@ async def _analyze_input_and_create_tasks(
         # Execute planning with the agent
         run_response = agent.run(
             message=PlannerInput(
-                desired_agent_name=user_input.get_desired_agent(),
+                desired_agent_name=user_input.desired_agent_name,
                 query=user_input.query,
             )
         )
diff --git a/python/valuecell/core/session/models.py b/python/valuecell/core/session/models.py
index e3ccb13c5..2835216d4 100644
--- a/python/valuecell/core/session/models.py
+++ b/python/valuecell/core/session/models.py
@@ -1,18 +1,10 @@
 from datetime import datetime
 from enum import Enum
-from typing import Any, Dict, Optional
+from typing import Optional
 
 from pydantic import BaseModel, Field
 
 
-class Role(str, Enum):
-    """Message role enumeration"""
-
-    USER = "user"
-    AGENT = "agent"
-    SYSTEM = "system"
-
-
 class SessionStatus(str, Enum):
     """Session status enumeration"""
 
@@ -21,27 +13,6 @@ class SessionStatus(str, Enum):
     REQUIRE_USER_INPUT = "require_user_input"
 
 
-class Message(BaseModel):
-    """Message data model"""
-
-    message_id: str = Field(..., description="Unique message identifier")
-    session_id: str = Field(..., description="Session ID this message belongs to")
-    user_id: str = Field(..., description="User ID")
-    agent_name: Optional[str] = Field(None, description="Agent name")
-    role: Role = Field(..., description="Message role")
-    content: str = Field(..., description="Message content")
-    timestamp: datetime = Field(
-        default_factory=datetime.now, description="Message timestamp"
-    )
-    task_id: Optional[str] = Field(None, description="Associated task ID")
-    metadata: Dict[str, Any] = Field(
-        default_factory=dict, description="Message metadata"
-    )
-
-    class Config:
-        json_encoders = {datetime: lambda v: v.isoformat()}
-
-
 class Session(BaseModel):
     """Session data model - lightweight metadata only, messages stored separately"""
 
diff --git a/python/valuecell/core/types.py b/python/valuecell/core/types.py
index 89a640adc..70ae0e104 100644
--- a/python/valuecell/core/types.py
+++ b/python/valuecell/core/types.py
@@ -30,22 +30,6 @@ class Config:
         frozen = False
         extra = "forbid"
 
-    def has_desired_agent(self) -> bool:
-        """Check if a specific agent is desired"""
-        return self.desired_agent_name is not None
-
-    def get_desired_agent(self) -> Optional[str]:
-        """Get the desired agent name"""
-        return self.desired_agent_name
-
-    def set_desired_agent(self, agent_name: str) -> None:
-        """Set the desired agent name"""
-        self.desired_agent_name = agent_name
-
-    def clear_desired_agent(self) -> None:
-        """Clear the desired agent name"""
-        self.desired_agent_name = None
-
 
 class SystemResponseEvent(str, Enum):
     CONVERSATION_STARTED = "conversation_started"
@@ -56,15 +40,18 @@ class SystemResponseEvent(str, Enum):
     DONE = "done"
 
 
-class _TaskResponseEvent(str, Enum):
+class TaskStatusEvent(str, Enum):
     TASK_STARTED = "task_started"
     TASK_COMPLETED = "task_completed"
     TASK_CANCELLED = "task_cancelled"
 
 
+class CommonResponseEvent(str, Enum):
+    COMPONENT_GENERATOR = "component_generator"
+
+
 class StreamResponseEvent(str, Enum):
     MESSAGE_CHUNK = "message_chunk"
-    COMPONENT_GENERATOR = "component_generator"
     TOOL_CALL_STARTED = "tool_call_started"
     TOOL_CALL_COMPLETED = "tool_call_completed"
     REASONING_STARTED = "reasoning_started"
@@ -83,7 +70,7 @@ class StreamResponse(BaseModel):
         None,
         description="The content of the stream response, typically a chunk of data or message.",
     )
-    event: StreamResponseEvent | _TaskResponseEvent = Field(
+    event: StreamResponseEvent | TaskStatusEvent = Field(
         ...,
         description="The type of stream response, indicating its purpose or content nature.",
     )
@@ -104,7 +91,7 @@ class NotifyResponse(BaseModel):
         ...,
         description="The content of the notification response",
     )
-    event: NotifyResponseEvent | _TaskResponseEvent = Field(
+    event: NotifyResponseEvent | TaskStatusEvent = Field(
         ...,
         description="The type of notification response",
     )
@@ -134,6 +121,44 @@ class ComponentGeneratorResponseDataPayload(BaseResponseDataPayload):
 ]
 
 
+ConversationMessageEvent = (
+    StreamResponseEvent
+    | NotifyResponseEvent
+    | SystemResponseEvent
+    | CommonResponseEvent
+    | TaskStatusEvent
+)
+
+
+class Role(str, Enum):
+    """Message role enumeration"""
+
+    USER = "user"
+    AGENT = "agent"
+    SYSTEM = "system"
+
+
+class ConversationMessage(BaseModel):
+    """Message item structure for conversation history"""
+
+    message_id: str = Field(..., description="Unique message identifier")
+    role: Role = Field(..., description="Role of the message sender")
+    event: ConversationMessageEvent = Field(
+        ..., description="Event type of the message"
+    )
+    conversation_id: str = Field(
+        ..., description="Conversation ID this message belongs to"
+    )
+    thread_id: Optional[str] = Field(None, description="Thread ID if part of a thread")
+    task_id: Optional[str] = Field(
+        None, description="Task ID if associated with a task"
+    )
+    subtask_id: Optional[str] = Field(
+        None, description="Subtask ID if associated with a subtask"
+    )
+    payload: str = Field(..., description="The actual message payload")
+
+
 class UnifiedResponseData(BaseModel):
     """Unified response data structure with optional hierarchy fields.
 
@@ -157,7 +182,7 @@ class UnifiedResponseData(BaseModel):
 class BaseResponse(BaseModel, ABC):
     """Top-level response envelope used for all events."""
 
-    event: StreamResponseEvent | NotifyResponseEvent | SystemResponseEvent = Field(
+    event: ConversationMessageEvent = Field(
         ..., description="The event type of the response"
     )
     data: UnifiedResponseData = Field(
@@ -189,8 +214,9 @@ class MessageResponse(BaseResponse):
 
 
 class ComponentGeneratorResponse(BaseResponse):
-    event: Literal[StreamResponseEvent.COMPONENT_GENERATOR] = Field(
-        StreamResponseEvent.COMPONENT_GENERATOR
+    event: Literal[CommonResponseEvent.COMPONENT_GENERATOR] = Field(
+        CommonResponseEvent.COMPONENT_GENERATOR,
+        description="The event type of the response",
     )
     data: UnifiedResponseData = Field(..., description="The component generator data")
 
@@ -236,8 +262,8 @@ class TaskFailedResponse(BaseResponse):
 
 
 class TaskCompletedResponse(BaseResponse):
-    event: Literal[_TaskResponseEvent.TASK_COMPLETED] = Field(
-        _TaskResponseEvent.TASK_COMPLETED, description="The event type of the response"
+    event: Literal[TaskStatusEvent.TASK_COMPLETED] = Field(
+        TaskStatusEvent.TASK_COMPLETED, description="The event type of the response"
     )
     data: UnifiedResponseData = Field(..., description="The task data payload")
 

From c2ecdaa265efd7ba4fa716d9a2302aaa7a07a689 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Tue, 23 Sep 2025 19:11:28 +0800
Subject: [PATCH 03/21] feat: add thread started response handling and update
 related logic

---
 .../valuecell/core/coordinate/orchestrator.py | 19 ++++++++++++-------
 python/valuecell/core/coordinate/response.py  | 10 ++++++++++
 python/valuecell/core/types.py                |  8 ++++++++
 3 files changed, 30 insertions(+), 7 deletions(-)

diff --git a/python/valuecell/core/coordinate/orchestrator.py b/python/valuecell/core/coordinate/orchestrator.py
index 85e218d79..b9947f048 100644
--- a/python/valuecell/core/coordinate/orchestrator.py
+++ b/python/valuecell/core/coordinate/orchestrator.py
@@ -13,12 +13,13 @@
     handle_artifact_update,
     handle_status_update,
 )
-from valuecell.core.session import Role, SessionStatus, get_default_session_manager
+from valuecell.core.session import SessionStatus, get_default_session_manager
 from valuecell.core.task import Task, get_default_task_manager
 from valuecell.core.task.models import TaskPattern
 from valuecell.core.types import (
     BaseResponse,
     NotifyResponseEvent,
+    Role,
     StreamResponseEvent,
     UserInput,
 )
@@ -216,7 +217,6 @@ async def close_session(self, session_id: str):
             session_id,
             Role.SYSTEM,
             f"Session closed. {cancelled_count} tasks were cancelled.",
-            agent_name="orchestrator",
         )
 
     async def get_session_history(self, session_id: str):
@@ -289,6 +289,9 @@ async def _handle_new_request(
         """Handle a new user request"""
         session_id = user_input.meta.session_id
         thread_id = generate_thread_id()
+        yield self._response_factory.thread_started(
+            conversation_id=session_id, thread_id=thread_id
+        )
 
         # Add user message to session
         await self.session_manager.add_message(
@@ -384,6 +387,9 @@ async def _continue_planning(
         original_user_input = context.get_metadata("original_user_input")
         thread_id = generate_thread_id()
         context.thread_id = thread_id
+        yield self._response_factory.thread_started(
+            conversation_id=session_id, thread_id=thread_id
+        )
 
         if not all([planning_task, original_user_input]):
             yield self._response_factory.plan_failed(
@@ -494,9 +500,9 @@ async def _execute_plan_with_input_support(
                         StreamResponseEvent.REASONING,
                         NotifyResponseEvent.MESSAGE,
                     } and isinstance(response.data.payload.content, str):
-                        agent_responses[task.agent_name] += (
-                            response.data.payload.content
-                        )
+                        agent_responses[
+                            task.agent_name
+                        ] += response.data.payload.content
                     yield response
 
                     if (
@@ -508,7 +514,6 @@ async def _execute_plan_with_input_support(
                                 session_id,
                                 Role.AGENT,
                                 agent_responses[task.agent_name],
-                                agent_name=task.agent_name,
                             )
                             agent_responses[task.agent_name] = ""
 
@@ -614,7 +619,7 @@ async def _save_remaining_responses(self, session_id: str, agent_responses: dict
         for agent_name, full_response in agent_responses.items():
             if full_response.strip():
                 await self.session_manager.add_message(
-                    session_id, Role.AGENT, full_response, agent_name=agent_name
+                    session_id, Role.AGENT, full_response
                 )
 
 
diff --git a/python/valuecell/core/coordinate/response.py b/python/valuecell/core/coordinate/response.py
index 399af08c2..ab9f73190 100644
--- a/python/valuecell/core/coordinate/response.py
+++ b/python/valuecell/core/coordinate/response.py
@@ -16,6 +16,7 @@
     SystemFailedResponse,
     TaskCompletedResponse,
     TaskFailedResponse,
+    ThreadStartedResponse,
     ToolCallPayload,
     ToolCallResponse,
     UnifiedResponseData,
@@ -28,6 +29,15 @@ def conversation_started(self, conversation_id: str) -> ConversationStartedRespo
             data=UnifiedResponseData(conversation_id=conversation_id)
         )
 
+    def thread_started(
+        self, conversation_id: str, thread_id: str
+    ) -> ThreadStartedResponse:
+        return ThreadStartedResponse(
+            data=UnifiedResponseData(
+                conversation_id=conversation_id, thread_id=thread_id
+            )
+        )
+
     def system_failed(self, conversation_id: str, content: str) -> SystemFailedResponse:
         return SystemFailedResponse(
             data=UnifiedResponseData(
diff --git a/python/valuecell/core/types.py b/python/valuecell/core/types.py
index 70ae0e104..dc7d1fa00 100644
--- a/python/valuecell/core/types.py
+++ b/python/valuecell/core/types.py
@@ -33,6 +33,7 @@ class Config:
 
 class SystemResponseEvent(str, Enum):
     CONVERSATION_STARTED = "conversation_started"
+    THREAD_STARTED = "thread_started"
     PLAN_REQUIRE_USER_INPUT = "plan_require_user_input"
     PLAN_FAILED = "plan_failed"
     TASK_FAILED = "task_failed"
@@ -197,6 +198,13 @@ class ConversationStartedResponse(BaseResponse):
     )
 
 
+class ThreadStartedResponse(BaseResponse):
+    event: Literal[SystemResponseEvent.THREAD_STARTED] = Field(
+        SystemResponseEvent.THREAD_STARTED,
+        description="The event type of the response",
+    )
+
+
 class PlanRequireUserInputResponse(BaseResponse):
     event: Literal[SystemResponseEvent.PLAN_REQUIRE_USER_INPUT] = Field(
         SystemResponseEvent.PLAN_REQUIRE_USER_INPUT,

From 3e77cac7fa7363de7a36efe34ccf7b7d72790695 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 10:34:32 +0800
Subject: [PATCH 04/21] stash

---
 .../valuecell/core/coordinate/orchestrator.py | 43 +++-----------
 .../core/coordinate/response_router.py        | 11 +++-
 python/valuecell/core/session/manager.py      | 56 +++++++++++++------
 3 files changed, 54 insertions(+), 56 deletions(-)

diff --git a/python/valuecell/core/coordinate/orchestrator.py b/python/valuecell/core/coordinate/orchestrator.py
index b9947f048..c0c998729 100644
--- a/python/valuecell/core/coordinate/orchestrator.py
+++ b/python/valuecell/core/coordinate/orchestrator.py
@@ -294,8 +294,8 @@ async def _handle_new_request(
         )
 
         # Add user message to session
-        await self.session_manager.add_message(
-            session_id, Role.USER, user_input.query, user_id=user_input.meta.user_id
+        await self.session_manager.add_user_message(
+            conversation_id=session_id, thread_id=thread_id, content=user_input.query
         )
 
         # Create planning task with user input callback
@@ -482,9 +482,6 @@ async def _execute_plan_with_input_support(
             )
             return
 
-        # Track agent responses for session storage
-        agent_responses = defaultdict(str)
-
         for task in plan.tasks:
             try:
                 # Register the task with TaskManager
@@ -495,30 +492,16 @@ async def _execute_plan_with_input_support(
                     task, thread_id, metadata
                 ):
                     # Accumulate based on event
-                    if response.event in {
-                        StreamResponseEvent.MESSAGE_CHUNK,
-                        StreamResponseEvent.REASONING,
-                        NotifyResponseEvent.MESSAGE,
-                    } and isinstance(response.data.payload.content, str):
-                        agent_responses[
-                            task.agent_name
-                        ] += response.data.payload.content
                     yield response
 
-                    if (
-                        EventPredicates.is_task_completed(response.event)
-                        or task.pattern == TaskPattern.RECURRING
-                    ):
-                        if agent_responses[task.agent_name].strip():
-                            await self.session_manager.add_message(
-                                session_id,
-                                Role.AGENT,
-                                agent_responses[task.agent_name],
-                            )
-                            agent_responses[task.agent_name] = ""
+                    # TODO: record intermediate results in session history
+                    await self.session_manager.add_message(
+                        session_id,
+                        Role.AGENT,
+                    )
 
             except Exception as e:
-                error_msg = f"(Error) Error executing {task.agent_name}: {str(e)}"
+                error_msg = f"(Error) Error executing {task.id}: {str(e)}"
                 logger.exception(f"Task execution failed: {error_msg}")
                 yield self._response_factory.task_failed(
                     session_id,
@@ -528,8 +511,6 @@ async def _execute_plan_with_input_support(
                     error_msg,
                 )
 
-        # Save any remaining agent responses
-        await self._save_remaining_responses(session_id, agent_responses)
         yield self._response_factory.done(session_id, thread_id)
 
     async def _execute_task_with_input_support(
@@ -614,14 +595,6 @@ async def _execute_task_with_input_support(
             await self.task_manager.fail_task(task.task_id, str(e))
             raise e
 
-    async def _save_remaining_responses(self, session_id: str, agent_responses: dict):
-        """Save any remaining agent responses to the session"""
-        for agent_name, full_response in agent_responses.items():
-            if full_response.strip():
-                await self.session_manager.add_message(
-                    session_id, Role.AGENT, full_response
-                )
-
 
 def _generate_task_default_subtask_id(task_id: str) -> str:
     """Generate a default subtask ID based on the main task ID"""
diff --git a/python/valuecell/core/coordinate/response_router.py b/python/valuecell/core/coordinate/response_router.py
index 7b97b13ea..9d745c477 100644
--- a/python/valuecell/core/coordinate/response_router.py
+++ b/python/valuecell/core/coordinate/response_router.py
@@ -8,7 +8,12 @@
 from valuecell.core.agent.responses import EventPredicates
 from valuecell.core.coordinate.response import ResponseFactory
 from valuecell.core.task import Task
-from valuecell.core.types import BaseResponse, StreamResponseEvent
+from valuecell.core.types import (
+    BaseResponse,
+    CommonResponseEvent,
+    ComponentGeneratorResponse,
+    MessageResponse,
+)
 
 logger = logging.getLogger(__name__)
 
@@ -120,7 +125,7 @@ async def handle_artifact_update(
     task: Task,
     thread_id: str,
     event: TaskArtifactUpdateEvent,
-) -> List[BaseResponse]:
+) -> List[MessageResponse | ComponentGeneratorResponse]:
     responses: List[BaseResponse] = []
     artifact = event.artifact
     subtask_id = artifact.metadata.get("subtask_id") if artifact.metadata else None
@@ -129,7 +134,7 @@ async def handle_artifact_update(
     response_event = artifact.metadata.get("response_event")
     content = get_message_text(artifact, "")
 
-    if response_event == StreamResponseEvent.COMPONENT_GENERATOR:
+    if response_event == CommonResponseEvent.COMPONENT_GENERATOR:
         component_type = artifact.metadata.get("component_type", "unknown")
         responses.append(
             response_factory.component_generator(
diff --git a/python/valuecell/core/session/manager.py b/python/valuecell/core/session/manager.py
index c5a2a7a27..4216044e5 100644
--- a/python/valuecell/core/session/manager.py
+++ b/python/valuecell/core/session/manager.py
@@ -1,11 +1,18 @@
 from datetime import datetime
 from typing import List, Optional
 
+from valuecell.core.types import (
+    BaseResponseDataPayload,
+    ConversationMessage,
+    ConversationMessageEvent,
+    ResponsePayload,
+    Role,
+)
 from valuecell.utils import generate_uuid
+from valuecell.utils.uuid import generate_message_id
 
-from .models import Message, Role, Session, SessionStatus
+from .models import Session, SessionStatus
 from .store import InMemorySessionStore, SessionStore
-from .message_store import MessageStore, InMemoryMessageStore
 
 
 class SessionManager:
@@ -61,15 +68,31 @@ async def session_exists(self, session_id: str) -> bool:
         """Check if session exists"""
         return await self.session_store.session_exists(session_id)
 
+    async def add_user_message(
+        self,
+        conversation_id: str,
+        thread_id: str,
+        content: str,
+    ) -> Optional[ConversationMessage]:
+        """Add user message to session"""
+        return await self.add_message(
+            role=Role.USER,
+            event=ConversationMessageEvent.MESSAGE_CHUNK,
+            conversation_id=conversation_id,
+            thread_id=thread_id,
+            payload=BaseResponseDataPayload(content=content),
+        )
+
     async def add_message(
         self,
-        session_id: str,
         role: Role,
-        content: str,
-        user_id: Optional[str] = None,
-        agent_name: Optional[str] = None,
+        event: ConversationMessageEvent,
+        conversation_id: str,
+        thread_id: Optional[str] = None,
         task_id: Optional[str] = None,
-    ) -> Optional[Message]:
+        subtask_id: Optional[str] = None,
+        payload: ResponsePayload = None,
+    ) -> Optional[ConversationMessage]:
         """Add message to session
 
         Args:
@@ -81,23 +104,20 @@ async def add_message(
             task_id: Associated task ID (optional)
         """
         # Verify session exists
-        session = await self.get_session(session_id)
+        session = await self.get_session(conversation_id)
         if not session:
             return None
 
-        # Use provided user_id or get from session
-        if user_id is None:
-            user_id = session.user_id
-
         # Create message
-        message = Message(
-            message_id=generate_uuid("msg"),
-            session_id=session_id,
-            user_id=user_id,
-            agent_name=agent_name,
+        message = ConversationMessage(
+            message_id=generate_message_id(),
             role=role,
-            content=content,
+            event=event,
+            conversation_id=conversation_id,
+            thread_id=thread_id,
             task_id=task_id,
+            subtask_id=subtask_id,
+            payload=payload.model_dump.json() if payload else None,
         )
 
         # Save message directly to message store

From c6cbbf1ecd2303d5256be020f8bba8e8acea06e5 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 10:58:46 +0800
Subject: [PATCH 05/21] refactor: remove unused callback module for task
 session management

---
 python/valuecell/core/coordinate/callback.py | 16 ----------------
 1 file changed, 16 deletions(-)
 delete mode 100644 python/valuecell/core/coordinate/callback.py

diff --git a/python/valuecell/core/coordinate/callback.py b/python/valuecell/core/coordinate/callback.py
deleted file mode 100644
index bd67ca260..000000000
--- a/python/valuecell/core/coordinate/callback.py
+++ /dev/null
@@ -1,16 +0,0 @@
-from a2a.types import Task
-from valuecell.core.session import get_default_session_manager, Role
-
-
-async def store_task_in_session(task: Task) -> None:
-    session_id = task.metadata.get("session_id")
-    if not session_id:
-        return
-
-    session_manager = get_default_session_manager()
-    if not task.artifacts:
-        return
-    if not task.artifacts[-1].parts:
-        return
-    content = task.artifacts[-1].parts[-1].root.text
-    await session_manager.add_message(session_id, Role.AGENT, content)

From fecb28281c85bdc1c40e079ceea1a12b7ac721f3 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 14:35:23 +0800
Subject: [PATCH 06/21] feat: response buffer and SQLite message storage

---
 python/pyproject.toml                         |   1 +
 python/uv.lock                                |  14 +
 python/valuecell/core/__init__.py             |   6 +-
 python/valuecell/core/coordinate/__init__.py  |   2 -
 .../valuecell/core/coordinate/orchestrator.py |  65 ++--
 .../core/coordinate/response_buffer.py        | 312 ++++++++++++++++++
 .../coordinate/tests/test_e2e_persistence.py  |  47 +++
 .../coordinate/tests/test_response_buffer.py  | 167 ++++++++++
 python/valuecell/core/session/__init__.py     |   9 +-
 python/valuecell/core/session/manager.py      |  66 +++-
 .../valuecell/core/session/message_store.py   | 228 +++++++++++++
 .../tests/test_sqlite_message_store.py        |  67 ++++
 python/valuecell/core/types.py                |  12 +-
 python/valuecell/utils/uuid.py                |   4 -
 14 files changed, 938 insertions(+), 62 deletions(-)
 create mode 100644 python/valuecell/core/coordinate/response_buffer.py
 create mode 100644 python/valuecell/core/coordinate/tests/test_e2e_persistence.py
 create mode 100644 python/valuecell/core/coordinate/tests/test_response_buffer.py
 create mode 100644 python/valuecell/core/session/message_store.py
 create mode 100644 python/valuecell/core/session/tests/test_sqlite_message_store.py

diff --git a/python/pyproject.toml b/python/pyproject.toml
index 49341043e..c96f87b94 100644
--- a/python/pyproject.toml
+++ b/python/pyproject.toml
@@ -22,6 +22,7 @@ dependencies = [
     "agno[openai]>=1.8.2,<2.0",
     "edgartools>=4.12.2",
     "sqlalchemy>=2.0.43",
+    "aiosqlite>=0.19.0",
 ]
 
 [project.optional-dependencies]
diff --git a/python/uv.lock b/python/uv.lock
index 810761da9..95e6de56f 100644
--- a/python/uv.lock
+++ b/python/uv.lock
@@ -140,6 +140,18 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/fb/76/641ae371508676492379f16e2fa48f4e2c11741bd63c48be4b12a6b09cba/aiosignal-1.4.0-py3-none-any.whl", hash = "sha256:053243f8b92b990551949e63930a839ff0cf0b0ebbe0597b0f3fb19e1a0fe82e", size = 7490, upload-time = "2025-07-03T22:54:42.156Z" },
 ]
 
+[[package]]
+name = "aiosqlite"
+version = "0.21.0"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "typing-extensions" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/13/7d/8bca2bf9a247c2c5dfeec1d7a5f40db6518f88d314b8bca9da29670d2671/aiosqlite-0.21.0.tar.gz", hash = "sha256:131bb8056daa3bc875608c631c678cda73922a2d4ba8aec373b19f18c17e7aa3", size = 13454, upload-time = "2025-02-03T07:30:16.235Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/f5/10/6c25ed6de94c49f88a91fa5018cb4c0f3625f31d5be9f771ebe5cc7cd506/aiosqlite-0.21.0-py3-none-any.whl", hash = "sha256:2549cf4057f95f53dcba16f2b64e8e2791d7e1adedb13197dd8ed77bb226d7d0", size = 15792, upload-time = "2025-02-03T07:30:13.6Z" },
+]
+
 [[package]]
 name = "akracer"
 version = "0.0.13"
@@ -2094,6 +2106,7 @@ source = { editable = "." }
 dependencies = [
     { name = "a2a-sdk", extra = ["http-server"] },
     { name = "agno", extra = ["openai"] },
+    { name = "aiosqlite" },
     { name = "akshare" },
     { name = "edgartools" },
     { name = "fastapi" },
@@ -2135,6 +2148,7 @@ test = [
 requires-dist = [
     { name = "a2a-sdk", extras = ["http-server"], specifier = ">=0.3.4" },
     { name = "agno", extras = ["openai"], specifier = ">=1.8.2,<2.0" },
+    { name = "aiosqlite", specifier = ">=0.19.0" },
     { name = "akshare", specifier = ">=1.17.44" },
     { name = "edgartools", specifier = ">=4.12.2" },
     { name = "fastapi", specifier = ">=0.104.0" },
diff --git a/python/valuecell/core/__init__.py b/python/valuecell/core/__init__.py
index 5a2b86241..4a78bda58 100644
--- a/python/valuecell/core/__init__.py
+++ b/python/valuecell/core/__init__.py
@@ -2,15 +2,17 @@
 from .agent.decorator import create_wrapped_agent
 from .agent.responses import notification, streaming
 from .session import (
-    InMemoryMessageStore,
     InMemorySessionStore,
     Message,
-    MessageStore,
     Role,
     Session,
     SessionManager,
     SessionStatus,
     SessionStore,
+)
+from .session.message_store import (
+    InMemoryMessageStore,
+    MessageStore,
     SQLiteMessageStore,
 )
 
diff --git a/python/valuecell/core/coordinate/__init__.py b/python/valuecell/core/coordinate/__init__.py
index 571324943..9c1c53bcb 100644
--- a/python/valuecell/core/coordinate/__init__.py
+++ b/python/valuecell/core/coordinate/__init__.py
@@ -1,7 +1,6 @@
 from .models import ExecutionPlan
 from .orchestrator import AgentOrchestrator, get_default_orchestrator
 from .planner import ExecutionPlanner
-from .callback import store_task_in_session
 
 
 __all__ = [
@@ -9,5 +8,4 @@
     "get_default_orchestrator",
     "ExecutionPlanner",
     "ExecutionPlan",
-    "store_task_in_session",
 ]
diff --git a/python/valuecell/core/coordinate/orchestrator.py b/python/valuecell/core/coordinate/orchestrator.py
index c0c998729..b6dae3514 100644
--- a/python/valuecell/core/coordinate/orchestrator.py
+++ b/python/valuecell/core/coordinate/orchestrator.py
@@ -1,11 +1,9 @@
 import asyncio
 import logging
-from collections import defaultdict
 from typing import AsyncGenerator, Dict, Optional
 
 from a2a.types import TaskArtifactUpdateEvent, TaskState, TaskStatusUpdateEvent
 from valuecell.core.agent.connect import get_default_remote_connections
-from valuecell.core.agent.responses import EventPredicates
 from valuecell.core.coordinate.response import ResponseFactory
 from valuecell.core.coordinate.response_router import (
     RouteResult,
@@ -13,19 +11,13 @@
     handle_artifact_update,
     handle_status_update,
 )
+from valuecell.core.coordinate.response_buffer import ResponseBuffer, SaveMessage
 from valuecell.core.session import SessionStatus, get_default_session_manager
 from valuecell.core.task import Task, get_default_task_manager
 from valuecell.core.task.models import TaskPattern
-from valuecell.core.types import (
-    BaseResponse,
-    NotifyResponseEvent,
-    Role,
-    StreamResponseEvent,
-    UserInput,
-)
+from valuecell.core.types import BaseResponse, UserInput
 from valuecell.utils.uuid import generate_thread_id
 
-from .callback import store_task_in_session
 from .models import ExecutionPlan
 from .planner import ExecutionPlanner, UserInputRequest
 
@@ -127,6 +119,8 @@ def __init__(self):
         self.planner = ExecutionPlanner(self.agent_connections)
 
         self._response_factory = ResponseFactory()
+        # Buffer for streaming responses -> persisted ConversationItems
+        self._response_buffer = ResponseBuffer()
 
     # ==================== Public API Methods ====================
 
@@ -207,18 +201,11 @@ async def create_session(self, user_id: str, title: str = None):
     async def close_session(self, session_id: str):
         """Close an existing session and clean up resources"""
         # Cancel any running tasks for this session
-        cancelled_count = await self.task_manager.cancel_session_tasks(session_id)
+        await self.task_manager.cancel_session_tasks(session_id)
 
         # Clean up execution context
         await self._cancel_execution(session_id)
 
-        # Add system message to mark session as closed
-        await self.session_manager.add_message(
-            session_id,
-            Role.SYSTEM,
-            f"Session closed. {cancelled_count} tasks were cancelled.",
-        )
-
     async def get_session_history(self, session_id: str):
         """Get session message history"""
         return await self.session_manager.get_session_messages(session_id)
@@ -494,11 +481,11 @@ async def _execute_plan_with_input_support(
                     # Accumulate based on event
                     yield response
 
-                    # TODO: record intermediate results in session history
-                    await self.session_manager.add_message(
-                        session_id,
-                        Role.AGENT,
-                    )
+                    # Persist via ResponseBuffer
+                    await self._persist_from_buffer(response)
+
+                    # Periodic flush for buffered events based on debounce
+                    await self._flush_due()
 
             except Exception as e:
                 error_msg = f"(Error) Error executing {task.id}: {str(e)}"
@@ -510,6 +497,9 @@ async def _execute_plan_with_input_support(
                     _generate_task_default_subtask_id(task.task_id),
                     error_msg,
                 )
+        # Before signaling done, flush any remaining buffered items in this thread
+        items = self._response_buffer.flush_context(session_id, thread_id)
+        await self._persist_items(items)
 
         yield self._response_factory.done(session_id, thread_id)
 
@@ -533,7 +523,6 @@ async def _execute_task_with_input_support(
             agent_card = await self.agent_connections.start_agent(
                 agent_name,
                 with_listener=False,
-                notification_callback=store_task_in_session,
             )
             client = await self.agent_connections.get_client(agent_name)
             if not client:
@@ -590,11 +579,39 @@ async def _execute_task_with_input_support(
                 task_id=task.task_id,
                 subtask_id=_generate_task_default_subtask_id(task.task_id),
             )
+            # Flush buffered content for this task context
+            items = self._response_buffer.flush_context(
+                conversation_id=task.session_id,
+                thread_id=thread_id,
+                task_id=task.task_id,
+            )
+            await self._persist_items(items)
 
         except Exception as e:
             await self.task_manager.fail_task(task.task_id, str(e))
             raise e
 
+    async def _persist_from_buffer(self, response: BaseResponse):
+        """Ingest a response into the buffer and persist any SaveMessages produced."""
+        items = self._response_buffer.ingest(response)
+        await self._persist_items(items)
+
+    async def _flush_due(self):
+        items = self._response_buffer.flush_due()
+        await self._persist_items(items)
+
+    async def _persist_items(self, items: list[SaveMessage]):
+        for it in items:
+            await self.session_manager.add_message(
+                role=it.role,
+                event=it.event,
+                conversation_id=it.conversation_id,
+                thread_id=it.thread_id,
+                task_id=it.task_id,
+                subtask_id=it.subtask_id,
+                payload=it.payload,
+            )
+
 
 def _generate_task_default_subtask_id(task_id: str) -> str:
     """Generate a default subtask ID based on the main task ID"""
diff --git a/python/valuecell/core/coordinate/response_buffer.py b/python/valuecell/core/coordinate/response_buffer.py
new file mode 100644
index 000000000..46cb197ed
--- /dev/null
+++ b/python/valuecell/core/coordinate/response_buffer.py
@@ -0,0 +1,312 @@
+import time
+from dataclasses import dataclass
+from typing import Dict, List, Optional, Tuple
+
+from pydantic import BaseModel
+
+from valuecell.core.types import (
+    BaseResponse,
+    BaseResponseDataPayload,
+    CommonResponseEvent,
+    NotifyResponseEvent,
+    Role,
+    StreamResponseEvent,
+    SystemResponseEvent,
+    TaskStatusEvent,
+    UnifiedResponseData,
+)
+
+
+@dataclass
+class SaveMessage:
+    role: Role
+    event: object  # ConversationItemEvent union; keep generic to avoid circular typing
+    conversation_id: str
+    thread_id: Optional[str]
+    task_id: Optional[str]
+    subtask_id: Optional[str]
+    payload: Optional[BaseModel]
+
+
+# conversation_id, thread_id, task_id, subtask_id, event
+BufferKey = Tuple[str, Optional[str], Optional[str], Optional[str], object]
+
+
+class BufferEntry:
+    def __init__(self):
+        self.parts: List[str] = []
+        self.last_updated: float = time.monotonic()
+
+    def append(self, text: str):
+        if text:
+            self.parts.append(text)
+            self.last_updated = time.monotonic()
+
+    def size(self) -> int:
+        return sum(len(p) for p in self.parts)
+
+    def flush_to_payload(self) -> Optional[BaseResponseDataPayload]:
+        if not self.parts:
+            return None
+        content = "".join(self.parts)
+        self.parts.clear()
+        self.last_updated = time.monotonic()
+        return BaseResponseDataPayload(content=content)
+
+
+class ResponseBuffer:
+    """Buffers streaming responses and emits SaveMessage at suitable boundaries.
+
+    Rules:
+    - Immediate write: tool_call_completed, component_generator, message, plan_require_user_input
+    - Buffered: message_chunk, reasoning (debounced or boundary-triggered)
+    - Boundary triggers a flush for the same context: task_completed, task_failed, done
+    - Buffer key = (conversation_id, thread_id, task_id, subtask_id, event)
+    """
+
+    def __init__(
+        self,
+        debounce_ms: int = 1000,
+        max_chars: int = 4096,
+    ):
+        self._buffers: Dict[BufferKey, BufferEntry] = {}
+        self._debounce_sec = debounce_ms / 1000.0
+        self._max_chars = max_chars
+
+        self._immediate_events = {
+            StreamResponseEvent.TOOL_CALL_COMPLETED,
+            CommonResponseEvent.COMPONENT_GENERATOR,
+            NotifyResponseEvent.MESSAGE,
+            SystemResponseEvent.PLAN_REQUIRE_USER_INPUT,
+        }
+        self._buffered_events = {
+            StreamResponseEvent.MESSAGE_CHUNK,
+            StreamResponseEvent.REASONING,
+        }
+        self._boundary_events = {
+            TaskStatusEvent.TASK_COMPLETED,
+            SystemResponseEvent.TASK_FAILED,
+            SystemResponseEvent.DONE,
+        }
+
+    def ingest(self, resp: BaseResponse) -> List[SaveMessage]:
+        data: UnifiedResponseData = resp.data
+        ev = resp.event
+
+        ctx = (
+            data.conversation_id,
+            data.thread_id,
+            data.task_id,
+            data.subtask_id,
+        )
+        out: List[SaveMessage] = []
+
+        # Boundary-only: flush buffers for this context
+        if ev in self._boundary_events:
+            out.extend(self._flush_context(*ctx))
+            return out
+
+        # Immediate: flush buffers for this context, then write self
+        if ev in self._immediate_events:
+            out.extend(self._flush_context(*ctx))
+            out.append(self._make_save_message_from_response(resp))
+            return out
+
+        # Buffered: accumulate by (ctx + event)
+        if ev in self._buffered_events:
+            key: BufferKey = (*ctx, ev)
+            entry = self._buffers.get(key)
+            if not entry:
+                entry = BufferEntry()
+                self._buffers[key] = entry
+
+            # Extract text content from payload
+            payload = data.payload
+            text = None
+            if isinstance(payload, BaseResponseDataPayload):
+                text = payload.content or ""
+            elif isinstance(payload, BaseModel):
+                # Fallback: serialize whole payload
+                text = payload.model_dump_json(exclude_none=True)
+            elif isinstance(payload, str):
+                text = payload
+            else:
+                text = ""
+
+            if text:
+                entry.append(text)
+                # If exceed size, flush one segment immediately
+                if entry.size() >= self._max_chars:
+                    flushed = entry.flush_to_payload()
+                    if flushed is not None:
+                        out.append(
+                            self._make_save_message(
+                                role=self._role_for_event(ev),
+                                event=ev,
+                                data=data,
+                                payload=flushed,
+                            )
+                        )
+            return out
+
+        # Other events: ignore for storage by default
+        return out
+
+    def flush_due(self, now: Optional[float] = None) -> List[SaveMessage]:
+        now = now or time.monotonic()
+        out: List[SaveMessage] = []
+        to_delete: List[BufferKey] = []
+        for key, entry in self._buffers.items():
+            if now - entry.last_updated >= self._debounce_sec and entry.parts:
+                payload = entry.flush_to_payload()
+                if payload is not None:
+                    conv_id, thread_id, task_id, subtask_id, ev = key
+                    out.append(
+                        SaveMessage(
+                            role=self._role_for_event(ev),
+                            event=ev,
+                            conversation_id=conv_id,
+                            thread_id=thread_id,
+                            task_id=task_id,
+                            subtask_id=subtask_id,
+                            payload=payload,
+                        )
+                    )
+                # entry remains but is empty; mark for cleanup to prevent leaks
+                to_delete.append(key)
+        for key in to_delete:
+            # drop empty/idle entries
+            if key in self._buffers and not self._buffers[key].parts:
+                del self._buffers[key]
+        return out
+
+    def flush_context(
+        self,
+        conversation_id: str,
+        thread_id: Optional[str] = None,
+        task_id: Optional[str] = None,
+        subtask_id: Optional[str] = None,
+    ) -> List[SaveMessage]:
+        return self._flush_context(conversation_id, thread_id, task_id, subtask_id)
+
+    def flush_all(self) -> List[SaveMessage]:
+        out: List[SaveMessage] = []
+        for key in list(self._buffers.keys()):
+            entry = self._buffers.get(key)
+            if not entry:
+                continue
+            payload = entry.flush_to_payload()
+            if payload is not None:
+                conv_id, thread_id, task_id, subtask_id, ev = key
+                out.append(
+                    SaveMessage(
+                        role=self._role_for_event(ev),
+                        event=ev,
+                        conversation_id=conv_id,
+                        thread_id=thread_id,
+                        task_id=task_id,
+                        subtask_id=subtask_id,
+                        payload=payload,
+                    )
+                )
+            del self._buffers[key]
+        return out
+
+    def _flush_context(
+        self,
+        conversation_id: str,
+        thread_id: Optional[str],
+        task_id: Optional[str],
+        subtask_id: Optional[str],
+    ) -> List[SaveMessage]:
+        out: List[SaveMessage] = []
+
+        # Collect keys matching the context and buffered events only
+        def match(val, want):
+            return want is None or val == want
+
+        keys: List[BufferKey] = []
+        for key in list(self._buffers.keys()):
+            if (
+                key[0] == conversation_id
+                and match(key[1], thread_id)
+                and match(key[2], task_id)
+                and match(key[3], subtask_id)
+                and key[4] in self._buffered_events
+            ):
+                keys.append(key)
+
+        for key in keys:
+            entry = self._buffers.get(key)
+            if not entry:
+                continue
+            payload = entry.flush_to_payload()
+            if payload is not None:
+                conv_id, thread_id, task_id, subtask_id, ev = key
+                out.append(
+                    SaveMessage(
+                        role=self._role_for_event(ev),
+                        event=ev,
+                        conversation_id=conv_id,
+                        thread_id=thread_id,
+                        task_id=task_id,
+                        subtask_id=subtask_id,
+                        payload=payload,
+                    )
+                )
+            # Remove emptied buffer
+            if key in self._buffers:
+                del self._buffers[key]
+
+        return out
+
+    def _make_save_message_from_response(self, resp: BaseResponse) -> SaveMessage:
+        data: UnifiedResponseData = resp.data
+        payload = data.payload
+
+        # Ensure payload is BaseModel for SessionManager
+        if isinstance(payload, BaseModel):
+            bm = payload
+        elif isinstance(payload, str):
+            bm = BaseResponseDataPayload(content=payload)
+        elif payload is None:
+            bm = BaseResponseDataPayload(content=None)
+        else:
+            # Fallback to JSON string
+            try:
+                bm = BaseResponseDataPayload(content=str(payload))
+            except Exception:
+                bm = BaseResponseDataPayload(content=None)
+
+        return SaveMessage(
+            role=self._role_for_event(resp.event),
+            event=resp.event,
+            conversation_id=data.conversation_id,
+            thread_id=data.thread_id,
+            task_id=data.task_id,
+            subtask_id=data.subtask_id,
+            payload=bm,
+        )
+
+    def _make_save_message(
+        self,
+        role: Role,
+        event: object,
+        data: UnifiedResponseData,
+        payload: BaseModel,
+    ) -> SaveMessage:
+        return SaveMessage(
+            role=role,
+            event=event,
+            conversation_id=data.conversation_id,
+            thread_id=data.thread_id,
+            task_id=data.task_id,
+            subtask_id=data.subtask_id,
+            payload=payload,
+        )
+
+    def _role_for_event(self, ev: object) -> Role:
+        # Agent-originated by default; some system events are SYSTEM
+        if ev in {SystemResponseEvent.PLAN_REQUIRE_USER_INPUT}:
+            return Role.SYSTEM
+        return Role.AGENT
diff --git a/python/valuecell/core/coordinate/tests/test_e2e_persistence.py b/python/valuecell/core/coordinate/tests/test_e2e_persistence.py
new file mode 100644
index 000000000..c222546cd
--- /dev/null
+++ b/python/valuecell/core/coordinate/tests/test_e2e_persistence.py
@@ -0,0 +1,47 @@
+import asyncio
+
+import pytest
+
+from valuecell.core.coordinate.orchestrator import AgentOrchestrator
+from valuecell.core.types import UserInput, UserInputMetadata
+
+
+@pytest.mark.asyncio
+async def test_orchestrator_buffer_store_e2e(tmp_path, monkeypatch):
+    # Point default SessionManager to a temp sqlite file
+    db_path = tmp_path / "e2e_valuecell.db"
+    monkeypatch.setenv("VALUECELL_SQLITE_DB", str(db_path))
+
+    orch = AgentOrchestrator()
+
+    # Prepare a session and a simple query; orchestrator will create the session if missing
+    session_id = "e2e-session"
+    user_id = "e2e-user"
+    ui = UserInput(
+        query="hello world",
+        desired_agent_name="TestAgent",
+        meta=UserInputMetadata(session_id=session_id, user_id=user_id),
+    )
+
+    # We don't have a live agent, so we expect planner/agent logic to raise; we just want to ensure
+    # that at least conversation_started and done/error go through the buffer->store path without crashing.
+    out = []
+    try:
+        async for resp in orch.process_user_input(ui):
+            out.append(resp)
+            # allow buffer debounce tick
+            await asyncio.sleep(0)
+    except Exception:
+        # Orchestrator is defensive, should not raise; but in case, we still proceed to check persistence
+        pass
+
+    # Verify persistence: at least 1 message exists for session
+    msgs = await orch.session_manager.get_session_messages(session_id)
+    assert isinstance(msgs, list)
+    assert len(msgs) >= 1
+
+    # Also verify we can count and fetch latest
+    cnt = await orch.session_manager.get_message_count(session_id)
+    assert cnt == len(msgs)
+    latest = await orch.session_manager.get_latest_message(session_id)
+    assert latest is not None
diff --git a/python/valuecell/core/coordinate/tests/test_response_buffer.py b/python/valuecell/core/coordinate/tests/test_response_buffer.py
new file mode 100644
index 000000000..116779cb3
--- /dev/null
+++ b/python/valuecell/core/coordinate/tests/test_response_buffer.py
@@ -0,0 +1,167 @@
+import time
+
+import pytest
+from valuecell.core.coordinate.response import ResponseFactory
+from valuecell.core.coordinate.response_buffer import ResponseBuffer
+from valuecell.core.types import (
+    CommonResponseEvent,
+    NotifyResponseEvent,
+    StreamResponseEvent,
+)
+
+
+@pytest.fixture
+def ids():
+    return {
+        "conversation_id": "conv-1",
+        "thread_id": "th-1",
+        "task_id": "tsk-1",
+        "subtask_id": "sub-1",
+    }
+
+
+@pytest.fixture
+def factory():
+    return ResponseFactory()
+
+
+def test_buffer_accumulate_and_flush_due(ids, factory):
+    buf = ResponseBuffer(debounce_ms=0, max_chars=1024)
+
+    # two message chunks buffered
+    r1 = factory.message_response_general(
+        event=StreamResponseEvent.MESSAGE_CHUNK,
+        conversation_id=ids["conversation_id"],
+        thread_id=ids["thread_id"],
+        task_id=ids["task_id"],
+        subtask_id=ids["subtask_id"],
+        content="Hello ",
+    )
+    r2 = factory.message_response_general(
+        event=StreamResponseEvent.MESSAGE_CHUNK,
+        conversation_id=ids["conversation_id"],
+        thread_id=ids["thread_id"],
+        task_id=ids["task_id"],
+        subtask_id=ids["subtask_id"],
+        content="World",
+    )
+
+    assert buf.ingest(r1) == []
+    assert buf.ingest(r2) == []
+
+    # flush_due (debounce_ms=0) should emit one aggregated SaveMessage
+    out = buf.flush_due()
+    assert len(out) == 1
+    sm = out[0]
+    assert sm.event == StreamResponseEvent.MESSAGE_CHUNK
+    assert sm.payload.content == "Hello World"
+
+
+def test_immediate_component_splits_chunks(ids, factory):
+    buf = ResponseBuffer(debounce_ms=1e5, max_chars=1024)  # prevent auto flush
+
+    # buffer one chunk
+    r_chunk = factory.message_response_general(
+        event=StreamResponseEvent.MESSAGE_CHUNK,
+        conversation_id=ids["conversation_id"],
+        thread_id=ids["thread_id"],
+        task_id=ids["task_id"],
+        subtask_id=ids["subtask_id"],
+        content="Part A",
+    )
+    assert buf.ingest(r_chunk) == []
+
+    # immediate component should flush prior chunk, then write itself
+    r_comp = factory.component_generator(
+        conversation_id=ids["conversation_id"],
+        thread_id=ids["thread_id"],
+        task_id=ids["task_id"],
+        subtask_id=ids["subtask_id"],
+        content="<div></div>",
+        component_type="html",
+    )
+    out = buf.ingest(r_comp)
+    assert len(out) == 2
+    assert out[0].event == StreamResponseEvent.MESSAGE_CHUNK
+    assert out[0].payload.content == "Part A"
+    assert out[1].event == CommonResponseEvent.COMPONENT_GENERATOR
+    assert out[1].payload.component_type == "html"
+
+    # new chunk after component becomes a new segment
+    r_chunk2 = factory.message_response_general(
+        event=StreamResponseEvent.MESSAGE_CHUNK,
+        conversation_id=ids["conversation_id"],
+        thread_id=ids["thread_id"],
+        task_id=ids["task_id"],
+        subtask_id=ids["subtask_id"],
+        content="Part B",
+    )
+    assert buf.ingest(r_chunk2) == []
+    out2 = buf.flush_due(now=time.monotonic() + 1e6)  # force flush
+    assert len(out2) == 1
+    assert out2[0].payload.content == "Part B"
+
+
+def test_boundary_done_flushes_reasoning(ids, factory):
+    buf = ResponseBuffer(debounce_ms=99999, max_chars=1024)
+
+    r1 = factory.reasoning(
+        conversation_id=ids["conversation_id"],
+        thread_id=ids["thread_id"],
+        task_id=ids["task_id"],
+        subtask_id=ids["subtask_id"],
+        event=StreamResponseEvent.REASONING,
+        content="think1",
+    )
+    r2 = factory.reasoning(
+        conversation_id=ids["conversation_id"],
+        thread_id=ids["thread_id"],
+        task_id=ids["task_id"],
+        subtask_id=ids["subtask_id"],
+        event=StreamResponseEvent.REASONING,
+        content="think2",
+    )
+    assert buf.ingest(r1) == []
+    assert buf.ingest(r2) == []
+
+    # boundary: done -> should flush reasoning, but boundary itself is not stored
+    r_done = factory.done(ids["conversation_id"], ids["thread_id"])
+    out = buf.ingest(r_done)
+    assert len(out) == 1
+    assert out[0].event == StreamResponseEvent.REASONING
+    assert out[0].payload.content == "think1think2"
+
+
+def test_size_based_flush(ids, factory):
+    buf = ResponseBuffer(debounce_ms=99999, max_chars=5)
+    # total length reaches 5, should flush immediately on third ingest
+    for part in ["12", "34", "5"]:
+        r = factory.message_response_general(
+            event=StreamResponseEvent.MESSAGE_CHUNK,
+            conversation_id=ids["conversation_id"],
+            thread_id=ids["thread_id"],
+            task_id=ids["task_id"],
+            subtask_id=ids["subtask_id"],
+            content=part,
+        )
+        out = buf.ingest(r)
+    # last ingest should have triggered immediate flush
+    assert len(out) == 1
+    assert out[0].event == StreamResponseEvent.MESSAGE_CHUNK
+    assert out[0].payload.content == "12345"
+
+
+def test_immediate_message(ids, factory):
+    buf = ResponseBuffer()
+    r = factory.message_response_general(
+        event=NotifyResponseEvent.MESSAGE,
+        conversation_id=ids["conversation_id"],
+        thread_id=ids["thread_id"],
+        task_id=ids["task_id"],
+        subtask_id=ids["subtask_id"],
+        content="hi",
+    )
+    out = buf.ingest(r)
+    assert len(out) == 1
+    assert out[0].event == NotifyResponseEvent.MESSAGE
+    assert out[0].payload.content == "hi"
diff --git a/python/valuecell/core/session/__init__.py b/python/valuecell/core/session/__init__.py
index b9ffa29a6..16bd38c75 100644
--- a/python/valuecell/core/session/__init__.py
+++ b/python/valuecell/core/session/__init__.py
@@ -4,9 +4,9 @@
     SessionManager,
     get_default_session_manager,
 )
-from .models import Message, Role, Session, SessionStatus
+from valuecell.core.types import ConversationItem as Message, Role
+from .models import Session, SessionStatus
 from .store import InMemorySessionStore, SessionStore
-from .message_store import MessageStore, InMemoryMessageStore, SQLiteMessageStore
 
 __all__ = [
     # Models
@@ -20,8 +20,5 @@
     # Session storage
     "SessionStore",
     "InMemorySessionStore",
-    # Message storage
-    "MessageStore",
-    "InMemoryMessageStore",
-    "SQLiteMessageStore",
+    # Message storage (re-exported from core.__init__)
 ]
diff --git a/python/valuecell/core/session/manager.py b/python/valuecell/core/session/manager.py
index 4216044e5..bcbd313bb 100644
--- a/python/valuecell/core/session/manager.py
+++ b/python/valuecell/core/session/manager.py
@@ -1,18 +1,20 @@
+import os
 from datetime import datetime
 from typing import List, Optional
 
 from valuecell.core.types import (
     BaseResponseDataPayload,
-    ConversationMessage,
-    ConversationMessageEvent,
+    ConversationItem,
+    ConversationItemEvent,
     ResponsePayload,
     Role,
+    StreamResponseEvent,
 )
 from valuecell.utils import generate_uuid
-from valuecell.utils.uuid import generate_message_id
 
 from .models import Session, SessionStatus
 from .store import InMemorySessionStore, SessionStore
+from .message_store import MessageStore, InMemoryMessageStore, SQLiteMessageStore
 
 
 class SessionManager:
@@ -73,11 +75,11 @@ async def add_user_message(
         conversation_id: str,
         thread_id: str,
         content: str,
-    ) -> Optional[ConversationMessage]:
+    ) -> Optional[ConversationItem]:
         """Add user message to session"""
         return await self.add_message(
             role=Role.USER,
-            event=ConversationMessageEvent.MESSAGE_CHUNK,
+            event=StreamResponseEvent.MESSAGE_CHUNK,
             conversation_id=conversation_id,
             thread_id=thread_id,
             payload=BaseResponseDataPayload(content=content),
@@ -86,13 +88,13 @@ async def add_user_message(
     async def add_message(
         self,
         role: Role,
-        event: ConversationMessageEvent,
+        event: ConversationItemEvent,
         conversation_id: str,
         thread_id: Optional[str] = None,
         task_id: Optional[str] = None,
         subtask_id: Optional[str] = None,
         payload: ResponsePayload = None,
-    ) -> Optional[ConversationMessage]:
+    ) -> Optional[ConversationItem]:
         """Add message to session
 
         Args:
@@ -109,25 +111,37 @@ async def add_message(
             return None
 
         # Create message
-        message = ConversationMessage(
-            message_id=generate_message_id(),
+        # Serialize payload to JSON string if it's a pydantic model
+        payload_str = None
+        if payload is not None:
+            try:
+                # pydantic BaseModel supports model_dump_json
+                payload_str = payload.model_dump_json(exclude_none=True)
+            except Exception:
+                try:
+                    payload_str = str(payload)
+                except Exception:
+                    payload_str = None
+
+        item = ConversationItem(
+            item_id=generate_uuid("item"),
             role=role,
             event=event,
             conversation_id=conversation_id,
             thread_id=thread_id,
             task_id=task_id,
             subtask_id=subtask_id,
-            payload=payload.model_dump.json() if payload else None,
+            payload=payload_str,
         )
 
         # Save message directly to message store
-        await self.message_store.save_message(message)
+        await self.message_store.save_message(item)
 
         # Update session timestamp
         session.touch()
         await self.session_store.save_session(session)
 
-        return message
+        return item
 
     async def get_session_messages(
         self,
@@ -135,7 +149,7 @@ async def get_session_messages(
         limit: Optional[int] = None,
         offset: int = 0,
         role: Optional[Role] = None,
-    ) -> List[Message]:
+    ) -> List[ConversationItem]:
         """Get messages for a session with optional filtering and pagination
 
         Args:
@@ -146,11 +160,11 @@ async def get_session_messages(
         """
         return await self.message_store.get_messages(session_id, limit, offset, role)
 
-    async def get_latest_message(self, session_id: str) -> Optional[Message]:
+    async def get_latest_message(self, session_id: str) -> Optional[ConversationItem]:
         """Get latest message in a session"""
         return await self.message_store.get_latest_message(session_id)
 
-    async def get_message(self, message_id: str) -> Optional[Message]:
+    async def get_message(self, message_id: str) -> Optional[ConversationItem]:
         """Get a specific message by ID"""
         return await self.message_store.get_message(message_id)
 
@@ -158,7 +172,9 @@ async def get_message_count(self, session_id: str) -> int:
         """Get total message count for a session"""
         return await self.message_store.get_message_count(session_id)
 
-    async def get_messages_by_role(self, session_id: str, role: Role) -> List[Message]:
+    async def get_messages_by_role(
+        self, session_id: str, role: Role
+    ) -> List[ConversationItem]:
         """Get messages filtered by role"""
         return await self.message_store.get_messages(session_id, role=role)
 
@@ -211,7 +227,23 @@ async def get_sessions_by_status(
 
 
 # Default session manager instance
-_session_manager = SessionManager()
+def _default_db_path() -> str:
+    """Resolve repository root and return default DB path valuecell_core.db.
+
+    Layout assumption: this file is at repo_root/python/valuecell/core/session/manager.py
+    We walk up 4 levels to reach repo_root.
+    """
+    here = os.path.dirname(__file__)
+    repo_root = os.path.abspath(os.path.join(here, "..", "..", "..", ".."))
+    return os.path.join(repo_root, "valuecell_core.db")
+
+
+def _resolve_db_path() -> str:
+    return os.environ.get("VALUECELL_SQLITE_DB") or _default_db_path()
+
+
+# Default: use SQLite at repo root valuecell_core.db (env VALUECELL_SQLITE_DB overrides)
+_session_manager = SessionManager(message_store=SQLiteMessageStore(_resolve_db_path()))
 
 
 def get_default_session_manager() -> SessionManager:
diff --git a/python/valuecell/core/session/message_store.py b/python/valuecell/core/session/message_store.py
new file mode 100644
index 000000000..50a959156
--- /dev/null
+++ b/python/valuecell/core/session/message_store.py
@@ -0,0 +1,228 @@
+from __future__ import annotations
+
+import asyncio
+import sqlite3
+import aiosqlite
+from abc import ABC, abstractmethod
+from typing import Dict, List, Optional
+
+from valuecell.core.types import ConversationItem, Role
+
+
+class MessageStore(ABC):
+    @abstractmethod
+    async def save_message(self, message: ConversationItem) -> None: ...
+
+    @abstractmethod
+    async def get_messages(
+        self,
+        session_id: str,
+        limit: Optional[int] = None,
+        offset: int = 0,
+        role: Optional[Role] = None,
+    ) -> List[ConversationItem]: ...
+
+    @abstractmethod
+    async def get_latest_message(
+        self, session_id: str
+    ) -> Optional[ConversationItem]: ...
+
+    @abstractmethod
+    async def get_message(self, message_id: str) -> Optional[ConversationItem]: ...
+
+    @abstractmethod
+    async def get_message_count(self, session_id: str) -> int: ...
+
+    @abstractmethod
+    async def delete_session_messages(self, session_id: str) -> None: ...
+
+
+class InMemoryMessageStore(MessageStore):
+    def __init__(self):
+        # session_id -> list[ConversationItem]
+        self._messages: Dict[str, List[ConversationItem]] = {}
+
+    async def save_message(self, message: ConversationItem) -> None:
+        arr = self._messages.setdefault(message.conversation_id, [])
+        arr.append(message)
+
+    async def get_messages(
+        self,
+        session_id: str,
+        limit: Optional[int] = None,
+        offset: int = 0,
+        role: Optional[Role] = None,
+    ) -> List[ConversationItem]:
+        items = list(self._messages.get(session_id, []))
+        if role is not None:
+            items = [m for m in items if m.role == role]
+        if offset:
+            items = items[offset:]
+        if limit is not None:
+            items = items[:limit]
+        return items
+
+    async def get_latest_message(self, session_id: str) -> Optional[ConversationItem]:
+        items = self._messages.get(session_id, [])
+        return items[-1] if items else None
+
+    async def get_message(self, message_id: str) -> Optional[ConversationItem]:
+        for arr in self._messages.values():
+            for m in arr:
+                if m.item_id == message_id:
+                    return m
+        return None
+
+    async def get_message_count(self, session_id: str) -> int:
+        return len(self._messages.get(session_id, []))
+
+    async def delete_session_messages(self, session_id: str) -> None:
+        self._messages.pop(session_id, None)
+
+
+class SQLiteMessageStore(MessageStore):
+    """SQLite-backed message store using aiosqlite for true async I/O."""
+
+    def __init__(self, db_path: str):
+        self.db_path = db_path
+        self._initialized = False
+        self._init_lock = None  # lazy to avoid loop-binding in __init__
+
+    async def _ensure_initialized(self) -> None:
+        if self._initialized:
+            return
+        if self._init_lock is None:
+            self._init_lock = asyncio.Lock()
+        async with self._init_lock:
+            if self._initialized:
+                return
+            async with aiosqlite.connect(self.db_path) as db:
+                await db.execute(
+                    """
+                    CREATE TABLE IF NOT EXISTS messages (
+                      item_id TEXT PRIMARY KEY,
+                      role TEXT NOT NULL,
+                      event TEXT NOT NULL,
+                      conversation_id TEXT NOT NULL,
+                      thread_id TEXT,
+                      task_id TEXT,
+                      subtask_id TEXT,
+                      payload TEXT,
+                      created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
+                    );
+                    """
+                )
+                await db.execute(
+                    """
+                    CREATE INDEX IF NOT EXISTS idx_messages_conv_time
+                    ON messages (conversation_id, created_at);
+                    """
+                )
+                await db.commit()
+            self._initialized = True
+
+    @staticmethod
+    def _row_to_message(row: sqlite3.Row) -> ConversationItem:
+        return ConversationItem(
+            item_id=row["item_id"],
+            role=row["role"],
+            event=row["event"],
+            conversation_id=row["conversation_id"],
+            thread_id=row["thread_id"],
+            task_id=row["task_id"],
+            subtask_id=row["subtask_id"],
+            payload=row["payload"],
+        )
+
+    async def save_message(self, message: ConversationItem) -> None:
+        await self._ensure_initialized()
+        role_val = getattr(message.role, "value", str(message.role))
+        event_val = getattr(message.event, "value", str(message.event))
+        async with aiosqlite.connect(self.db_path) as db:
+            await db.execute(
+                """
+                INSERT OR REPLACE INTO messages (
+                    item_id, role, event, conversation_id, thread_id, task_id, subtask_id, payload
+                ) VALUES (?, ?, ?, ?, ?, ?, ?, ?)
+                """,
+                (
+                    message.item_id,
+                    role_val,
+                    event_val,
+                    message.conversation_id,
+                    message.thread_id,
+                    message.task_id,
+                    message.subtask_id,
+                    message.payload,
+                ),
+            )
+            await db.commit()
+
+    async def get_messages(
+        self,
+        session_id: str,
+        limit: Optional[int] = None,
+        offset: int = 0,
+        role: Optional[Role] = None,
+    ) -> List[ConversationItem]:
+        await self._ensure_initialized()
+        params = [session_id]
+        where = "WHERE conversation_id = ?"
+        if role is not None:
+            where += " AND role = ?"
+            params.append(getattr(role, "value", str(role)))
+        sql = f"SELECT * FROM messages {where} ORDER BY datetime(created_at) ASC"
+        if limit is not None:
+            sql += " LIMIT ?"
+            params.append(int(limit))
+        if offset:
+            if limit is None:
+                sql += " LIMIT -1"
+            sql += " OFFSET ?"
+            params.append(int(offset))
+        async with aiosqlite.connect(self.db_path) as db:
+            db.row_factory = sqlite3.Row
+            cur = await db.execute(sql, params)
+            rows = await cur.fetchall()
+            return [self._row_to_message(r) for r in rows]
+
+    async def get_latest_message(self, session_id: str) -> Optional[ConversationItem]:
+        await self._ensure_initialized()
+        async with aiosqlite.connect(self.db_path) as db:
+            db.row_factory = sqlite3.Row
+            cur = await db.execute(
+                "SELECT * FROM messages WHERE conversation_id = ? ORDER BY datetime(created_at) DESC LIMIT 1",
+                (session_id,),
+            )
+            row = await cur.fetchone()
+            return self._row_to_message(row) if row else None
+
+    async def get_message(self, message_id: str) -> Optional[ConversationItem]:
+        await self._ensure_initialized()
+        async with aiosqlite.connect(self.db_path) as db:
+            db.row_factory = sqlite3.Row
+            cur = await db.execute(
+                "SELECT * FROM messages WHERE item_id = ?",
+                (message_id,),
+            )
+            row = await cur.fetchone()
+            return self._row_to_message(row) if row else None
+
+    async def get_message_count(self, session_id: str) -> int:
+        await self._ensure_initialized()
+        async with aiosqlite.connect(self.db_path) as db:
+            cur = await db.execute(
+                "SELECT COUNT(1) FROM messages WHERE conversation_id = ?",
+                (session_id,),
+            )
+            row = await cur.fetchone()
+            return int(row[0] if row else 0)
+
+    async def delete_session_messages(self, session_id: str) -> None:
+        await self._ensure_initialized()
+        async with aiosqlite.connect(self.db_path) as db:
+            await db.execute(
+                "DELETE FROM messages WHERE conversation_id = ?",
+                (session_id,),
+            )
+            await db.commit()
diff --git a/python/valuecell/core/session/tests/test_sqlite_message_store.py b/python/valuecell/core/session/tests/test_sqlite_message_store.py
new file mode 100644
index 000000000..8d1d3788b
--- /dev/null
+++ b/python/valuecell/core/session/tests/test_sqlite_message_store.py
@@ -0,0 +1,67 @@
+import os
+import tempfile
+
+import pytest
+
+from valuecell.core.session.message_store import SQLiteMessageStore
+from valuecell.core.types import ConversationItem, Role, SystemResponseEvent
+
+
+@pytest.mark.asyncio
+async def test_sqlite_message_store_basic_crud():
+    fd, path = tempfile.mkstemp(suffix=".db")
+    os.close(fd)
+    try:
+        store = SQLiteMessageStore(path)
+
+        # create and save two messages
+        m1 = ConversationItem(
+            item_id="i1",
+            role=Role.SYSTEM,
+            event=SystemResponseEvent.THREAD_STARTED,
+            conversation_id="s1",
+            thread_id="t1",
+            task_id=None,
+            subtask_id=None,
+            payload='{"a":1}',
+        )
+        m2 = ConversationItem(
+            item_id="i2",
+            role=Role.SYSTEM,
+            event=SystemResponseEvent.DONE,
+            conversation_id="s1",
+            thread_id="t1",
+            task_id=None,
+            subtask_id=None,
+            payload='{"a":1}',
+        )
+        await store.save_message(m1)
+        await store.save_message(m2)
+
+        # count
+        cnt = await store.get_message_count("s1")
+        assert cnt == 2
+
+        # get latest
+        latest = await store.get_latest_message("s1")
+        assert latest is not None
+        assert latest.item_id in {"i1", "i2"}
+
+        # list
+        msgs = await store.get_messages("s1")
+        assert len(msgs) == 2
+        ids = {m.item_id for m in msgs}
+        assert ids == {"i1", "i2"}
+
+        # get one
+        one = await store.get_message("i1")
+        assert one is not None
+        assert one.item_id == "i1"
+
+        # delete
+        await store.delete_session_messages("s1")
+        cnt2 = await store.get_message_count("s1")
+        assert cnt2 == 0
+    finally:
+        if os.path.exists(path):
+            os.remove(path)
diff --git a/python/valuecell/core/types.py b/python/valuecell/core/types.py
index dc7d1fa00..e0a8a3d89 100644
--- a/python/valuecell/core/types.py
+++ b/python/valuecell/core/types.py
@@ -122,7 +122,7 @@ class ComponentGeneratorResponseDataPayload(BaseResponseDataPayload):
 ]
 
 
-ConversationMessageEvent = (
+ConversationItemEvent = (
     StreamResponseEvent
     | NotifyResponseEvent
     | SystemResponseEvent
@@ -139,14 +139,12 @@ class Role(str, Enum):
     SYSTEM = "system"
 
 
-class ConversationMessage(BaseModel):
+class ConversationItem(BaseModel):
     """Message item structure for conversation history"""
 
-    message_id: str = Field(..., description="Unique message identifier")
+    item_id: str = Field(..., description="Unique message identifier")
     role: Role = Field(..., description="Role of the message sender")
-    event: ConversationMessageEvent = Field(
-        ..., description="Event type of the message"
-    )
+    event: ConversationItemEvent = Field(..., description="Event type of the message")
     conversation_id: str = Field(
         ..., description="Conversation ID this message belongs to"
     )
@@ -183,7 +181,7 @@ class UnifiedResponseData(BaseModel):
 class BaseResponse(BaseModel, ABC):
     """Top-level response envelope used for all events."""
 
-    event: ConversationMessageEvent = Field(
+    event: ConversationItemEvent = Field(
         ..., description="The event type of the response"
     )
     data: UnifiedResponseData = Field(
diff --git a/python/valuecell/utils/uuid.py b/python/valuecell/utils/uuid.py
index 4e29a9306..ff103dcc4 100644
--- a/python/valuecell/utils/uuid.py
+++ b/python/valuecell/utils/uuid.py
@@ -8,9 +8,5 @@ def generate_uuid(prefix: str = None) -> str:
     return f"{prefix}-{uuid4().hex}"
 
 
-def generate_message_id() -> str:
-    return generate_uuid("msg")
-
-
 def generate_thread_id() -> str:
     return generate_uuid("th")

From b27e28334c07536ee82b881c0cfbc0f30284d64e Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 14:49:13 +0800
Subject: [PATCH 07/21] feat: enhance human-in-the-loop message management and
 user input handling in AgentOrchestrator

---
 .../valuecell/core/coordinate/orchestrator.py | 32 ++++++++++++-------
 1 file changed, 21 insertions(+), 11 deletions(-)

diff --git a/python/valuecell/core/coordinate/orchestrator.py b/python/valuecell/core/coordinate/orchestrator.py
index b6dae3514..4d568bba1 100644
--- a/python/valuecell/core/coordinate/orchestrator.py
+++ b/python/valuecell/core/coordinate/orchestrator.py
@@ -5,13 +5,13 @@
 from a2a.types import TaskArtifactUpdateEvent, TaskState, TaskStatusUpdateEvent
 from valuecell.core.agent.connect import get_default_remote_connections
 from valuecell.core.coordinate.response import ResponseFactory
+from valuecell.core.coordinate.response_buffer import ResponseBuffer, SaveMessage
 from valuecell.core.coordinate.response_router import (
     RouteResult,
     SideEffectKind,
     handle_artifact_update,
     handle_status_update,
 )
-from valuecell.core.coordinate.response_buffer import ResponseBuffer, SaveMessage
 from valuecell.core.session import SessionStatus, get_default_session_manager
 from valuecell.core.task import Task, get_default_task_manager
 from valuecell.core.task.models import TaskPattern
@@ -259,10 +259,21 @@ async def _handle_session_continuation(
         context.add_metadata(pending_response=user_input.query)
         await self.provide_user_input(session_id, user_input.query)
 
+        thread_id = generate_thread_id()
+        context.thread_id = thread_id
+        yield self._response_factory.thread_started(
+            conversation_id=session_id, thread_id=thread_id
+        )
+        await self.session_manager.add_user_message(
+            conversation_id=session_id, thread_id=thread_id, content=user_input.query
+        )
+
         # Resume based on execution stage
         if context.stage == "planning":
-            async for chunk in self._continue_planning(session_id, context):
-                yield chunk
+            async for response in self._continue_planning(
+                session_id, thread_id, context
+            ):
+                yield response
         # Resuming execution stage is not yet supported
         else:
             yield self._response_factory.system_failed(
@@ -332,9 +343,11 @@ async def _monitor_planning_task(
 
                 # Update session status and send user input request
                 await self._request_user_input(session_id)
-                yield self._response_factory.plan_require_user_input(
+                response = self._response_factory.plan_require_user_input(
                     session_id, thread_id, self.get_user_input_prompt(session_id)
                 )
+                await self._persist_from_buffer(response)
+                yield response
                 return
 
             await asyncio.sleep(ASYNC_SLEEP_INTERVAL)
@@ -367,16 +380,11 @@ def _validate_execution_context(
         return True
 
     async def _continue_planning(
-        self, session_id: str, context: ExecutionContext
+        self, session_id: str, thread_id: str, context: ExecutionContext
     ) -> AsyncGenerator[BaseResponse, None]:
         """Resume planning stage execution"""
         planning_task = context.get_metadata("planning_task")
         original_user_input = context.get_metadata("original_user_input")
-        thread_id = generate_thread_id()
-        context.thread_id = thread_id
-        yield self._response_factory.thread_started(
-            conversation_id=session_id, thread_id=thread_id
-        )
 
         if not all([planning_task, original_user_input]):
             yield self._response_factory.plan_failed(
@@ -394,9 +402,11 @@ async def _continue_planning(
                 prompt = self.get_user_input_prompt(session_id)
                 # Ensure session is set to require user input again for repeated prompts
                 await self._request_user_input(session_id)
-                yield self._response_factory.plan_require_user_input(
+                response = self._response_factory.plan_require_user_input(
                     session_id, thread_id, prompt
                 )
+                await self._persist_from_buffer(response)
+                yield response
                 return
 
             await asyncio.sleep(ASYNC_SLEEP_INTERVAL)

From a87d0519abf5ce19c4ad2733eeafb0b5e5fac1b7 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 15:24:10 +0800
Subject: [PATCH 08/21] feat: add item_id generation to SaveMessage and
 ConversationItem for improved message tracking

---
 python/valuecell/core/coordinate/orchestrator.py |  1 +
 .../valuecell/core/coordinate/response_buffer.py | 13 +++++++++++++
 .../coordinate/tests/test_response_buffer.py     | 13 +++++++++----
 python/valuecell/core/session/manager.py         |  3 ++-
 python/valuecell/core/types.py                   | 16 +++++++++-------
 5 files changed, 34 insertions(+), 12 deletions(-)

diff --git a/python/valuecell/core/coordinate/orchestrator.py b/python/valuecell/core/coordinate/orchestrator.py
index 4d568bba1..9de475c25 100644
--- a/python/valuecell/core/coordinate/orchestrator.py
+++ b/python/valuecell/core/coordinate/orchestrator.py
@@ -620,6 +620,7 @@ async def _persist_items(self, items: list[SaveMessage]):
                 task_id=it.task_id,
                 subtask_id=it.subtask_id,
                 payload=it.payload,
+                item_id=it.item_id,
             )
 
 
diff --git a/python/valuecell/core/coordinate/response_buffer.py b/python/valuecell/core/coordinate/response_buffer.py
index 46cb197ed..e1bf1d0ab 100644
--- a/python/valuecell/core/coordinate/response_buffer.py
+++ b/python/valuecell/core/coordinate/response_buffer.py
@@ -15,10 +15,16 @@
     TaskStatusEvent,
     UnifiedResponseData,
 )
+from valuecell.utils.uuid import generate_uuid
+
+
+def generate_item_id() -> str:
+    return generate_uuid("item")
 
 
 @dataclass
 class SaveMessage:
+    item_id: str
     role: Role
     event: object  # ConversationItemEvent union; keep generic to avoid circular typing
     conversation_id: str
@@ -145,6 +151,7 @@ def ingest(self, resp: BaseResponse) -> List[SaveMessage]:
                                 event=ev,
                                 data=data,
                                 payload=flushed,
+                                item_id=generate_item_id(),
                             )
                         )
             return out
@@ -163,6 +170,7 @@ def flush_due(self, now: Optional[float] = None) -> List[SaveMessage]:
                     conv_id, thread_id, task_id, subtask_id, ev = key
                     out.append(
                         SaveMessage(
+                            item_id=generate_item_id(),
                             role=self._role_for_event(ev),
                             event=ev,
                             conversation_id=conv_id,
@@ -200,6 +208,7 @@ def flush_all(self) -> List[SaveMessage]:
                 conv_id, thread_id, task_id, subtask_id, ev = key
                 out.append(
                     SaveMessage(
+                        item_id=generate_item_id(),
                         role=self._role_for_event(ev),
                         event=ev,
                         conversation_id=conv_id,
@@ -245,6 +254,7 @@ def match(val, want):
                 conv_id, thread_id, task_id, subtask_id, ev = key
                 out.append(
                     SaveMessage(
+                        item_id=generate_item_id(),
                         role=self._role_for_event(ev),
                         event=ev,
                         conversation_id=conv_id,
@@ -279,6 +289,7 @@ def _make_save_message_from_response(self, resp: BaseResponse) -> SaveMessage:
                 bm = BaseResponseDataPayload(content=None)
 
         return SaveMessage(
+            item_id=getattr(resp, "item_id", generate_item_id()),
             role=self._role_for_event(resp.event),
             event=resp.event,
             conversation_id=data.conversation_id,
@@ -294,8 +305,10 @@ def _make_save_message(
         event: object,
         data: UnifiedResponseData,
         payload: BaseModel,
+        item_id: str | None = None,
     ) -> SaveMessage:
         return SaveMessage(
+            item_id=item_id,
             role=role,
             event=event,
             conversation_id=data.conversation_id,
diff --git a/python/valuecell/core/coordinate/tests/test_response_buffer.py b/python/valuecell/core/coordinate/tests/test_response_buffer.py
index 116779cb3..d9555d3fe 100644
--- a/python/valuecell/core/coordinate/tests/test_response_buffer.py
+++ b/python/valuecell/core/coordinate/tests/test_response_buffer.py
@@ -1,3 +1,4 @@
+# ruff: noqa: F811
 import time
 
 import pytest
@@ -10,8 +11,8 @@
 )
 
 
-@pytest.fixture
-def ids():
+@pytest.fixture(name="ids")
+def _ids_fixture():
     return {
         "conversation_id": "conv-1",
         "thread_id": "th-1",
@@ -20,8 +21,8 @@ def ids():
     }
 
 
-@pytest.fixture
-def factory():
+@pytest.fixture(name="factory")
+def _factory_fixture():
     return ResponseFactory()
 
 
@@ -55,6 +56,8 @@ def test_buffer_accumulate_and_flush_due(ids, factory):
     sm = out[0]
     assert sm.event == StreamResponseEvent.MESSAGE_CHUNK
     assert sm.payload.content == "Hello World"
+    # aggregated output should have its own generated item_id
+    assert sm.item_id is not None and isinstance(sm.item_id, str)
 
 
 def test_immediate_component_splits_chunks(ids, factory):
@@ -165,3 +168,5 @@ def test_immediate_message(ids, factory):
     assert len(out) == 1
     assert out[0].event == NotifyResponseEvent.MESSAGE
     assert out[0].payload.content == "hi"
+    # immediate output should carry the BaseResponse item_id
+    assert out[0].item_id == r.item_id
diff --git a/python/valuecell/core/session/manager.py b/python/valuecell/core/session/manager.py
index bcbd313bb..c24a5e574 100644
--- a/python/valuecell/core/session/manager.py
+++ b/python/valuecell/core/session/manager.py
@@ -94,6 +94,7 @@ async def add_message(
         task_id: Optional[str] = None,
         subtask_id: Optional[str] = None,
         payload: ResponsePayload = None,
+        item_id: Optional[str] = None,
     ) -> Optional[ConversationItem]:
         """Add message to session
 
@@ -124,7 +125,7 @@ async def add_message(
                     payload_str = None
 
         item = ConversationItem(
-            item_id=generate_uuid("item"),
+            item_id=item_id or generate_uuid("item"),
             role=role,
             event=event,
             conversation_id=conversation_id,
diff --git a/python/valuecell/core/types.py b/python/valuecell/core/types.py
index e0a8a3d89..37e425bb1 100644
--- a/python/valuecell/core/types.py
+++ b/python/valuecell/core/types.py
@@ -4,6 +4,7 @@
 
 from a2a.types import Task, TaskArtifactUpdateEvent, TaskStatusUpdateEvent
 from pydantic import BaseModel, Field
+from valuecell.utils.uuid import generate_uuid
 
 
 class UserInputMetadata(BaseModel):
@@ -122,13 +123,13 @@ class ComponentGeneratorResponseDataPayload(BaseResponseDataPayload):
 ]
 
 
-ConversationItemEvent = (
-    StreamResponseEvent
-    | NotifyResponseEvent
-    | SystemResponseEvent
-    | CommonResponseEvent
-    | TaskStatusEvent
-)
+ConversationItemEvent = Union[
+    StreamResponseEvent,
+    NotifyResponseEvent,
+    SystemResponseEvent,
+    CommonResponseEvent,
+    TaskStatusEvent,
+]
 
 
 class Role(str, Enum):
@@ -181,6 +182,7 @@ class UnifiedResponseData(BaseModel):
 class BaseResponse(BaseModel, ABC):
     """Top-level response envelope used for all events."""
 
+    item_id: str = Field(default_factory=lambda: generate_uuid("item"))
     event: ConversationItemEvent = Field(
         ..., description="The event type of the response"
     )

From c082633fb054ea8c28794c72eaa8eb0df8a929b5 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 17:23:17 +0800
Subject: [PATCH 09/21] refactor: add item_id and role to UnifiedResponseData
 and remove subtask_id

---
 python/valuecell/core/agent/decorator.py      |  3 -
 python/valuecell/core/agent/responses.py      | 40 ++-------
 .../valuecell/core/coordinate/orchestrator.py | 30 +++----
 python/valuecell/core/coordinate/response.py  | 43 ++++-----
 .../core/coordinate/response_buffer.py        | 90 +++++++------------
 .../core/coordinate/response_router.py        | 15 ----
 python/valuecell/core/session/manager.py      |  2 -
 .../valuecell/core/session/message_store.py   |  5 +-
 .../tests/test_sqlite_message_store.py        |  3 -
 python/valuecell/core/types.py                | 15 +---
 python/valuecell/utils/uuid.py                |  4 +
 11 files changed, 78 insertions(+), 172 deletions(-)

diff --git a/python/valuecell/core/agent/decorator.py b/python/valuecell/core/agent/decorator.py
index 99942f599..b991a5746 100644
--- a/python/valuecell/core/agent/decorator.py
+++ b/python/valuecell/core/agent/decorator.py
@@ -135,7 +135,6 @@ async def _add_chunk(
             response_event = response.event
             metadata = {
                 "response_event": response_event.value,
-                "subtask_id": response.subtask_id,
             }
             if response_event == CommonResponseEvent.COMPONENT_GENERATOR:
                 metadata["component_type"] = response.metadata.get("component_type")
@@ -180,7 +179,6 @@ async def _add_chunk(
                             "tool_call_id": response.metadata.get("tool_call_id"),
                             "tool_name": response.metadata.get("tool_name"),
                             "tool_result": response.metadata.get("content"),
-                            "subtask_id": response.subtask_id,
                         },
                     )
                     continue
@@ -190,7 +188,6 @@ async def _add_chunk(
                         message=new_agent_text_message(response.content or ""),
                         metadata={
                             "event": response_event.value,
-                            "subtask_id": response.subtask_id,
                         },
                     )
                     continue
diff --git a/python/valuecell/core/agent/responses.py b/python/valuecell/core/agent/responses.py
index 539ddd3ea..694334a58 100644
--- a/python/valuecell/core/agent/responses.py
+++ b/python/valuecell/core/agent/responses.py
@@ -3,39 +3,33 @@
 from typing import Optional
 
 from valuecell.core.types import (
+    CommonResponseEvent,
     NotifyResponse,
     NotifyResponseEvent,
     StreamResponse,
     StreamResponseEvent,
     SystemResponseEvent,
-    CommonResponseEvent,
-    ToolCallPayload,
     TaskStatusEvent,
+    ToolCallPayload,
 )
 
 
 class _StreamResponseNamespace:
     """Factory methods for streaming responses."""
 
-    def message_chunk(
-        self, content: str, subtask_id: str | None = None
-    ) -> StreamResponse:
+    def message_chunk(self, content: str) -> StreamResponse:
         return StreamResponse(
             event=StreamResponseEvent.MESSAGE_CHUNK,
             content=content,
-            subtask_id=subtask_id,
         )
 
-    def tool_call_started(
-        self, tool_call_id: str, tool_name: str, subtask_id: str | None = None
-    ) -> StreamResponse:
+    def tool_call_started(self, tool_call_id: str, tool_name: str) -> StreamResponse:
         return StreamResponse(
             event=StreamResponseEvent.TOOL_CALL_STARTED,
             metadata=ToolCallPayload(
                 tool_call_id=tool_call_id,
                 tool_name=tool_name,
             ).model_dump(),
-            subtask_id=subtask_id,
         )
 
     def tool_call_completed(
@@ -43,7 +37,6 @@ def tool_call_completed(
         tool_result: str,
         tool_call_id: str,
         tool_name: str,
-        subtask_id: str | None = None,
     ) -> StreamResponse:
         return StreamResponse(
             event=StreamResponseEvent.TOOL_CALL_COMPLETED,
@@ -52,36 +45,13 @@ def tool_call_completed(
                 tool_name=tool_name,
                 tool_result=tool_result,
             ).model_dump(),
-            subtask_id=subtask_id,
-        )
-
-    def reasoning_started(self, subtask_id: str | None = None) -> StreamResponse:
-        return StreamResponse(
-            event=StreamResponseEvent.REASONING_STARTED,
-            subtask_id=subtask_id,
         )
 
-    def reasoning(self, content: str, subtask_id: str | None = None) -> StreamResponse:
-        return StreamResponse(
-            event=StreamResponseEvent.REASONING,
-            content=content,
-            subtask_id=subtask_id,
-        )
-
-    def reasoning_completed(self, subtask_id: str | None = None) -> StreamResponse:
-        return StreamResponse(
-            event=StreamResponseEvent.REASONING_COMPLETED,
-            subtask_id=subtask_id,
-        )
-
-    def component_generator(
-        self, content: str, component_type: str, subtask_id: str | None = None
-    ) -> StreamResponse:
+    def component_generator(self, content: str, component_type: str) -> StreamResponse:
         return StreamResponse(
             event=CommonResponseEvent.COMPONENT_GENERATOR,
             content=content,
             metadata={"component_type": component_type},
-            subtask_id=subtask_id,
         )
 
     def done(self, content: Optional[str] = None) -> StreamResponse:
diff --git a/python/valuecell/core/coordinate/orchestrator.py b/python/valuecell/core/coordinate/orchestrator.py
index 9de475c25..3713f2524 100644
--- a/python/valuecell/core/coordinate/orchestrator.py
+++ b/python/valuecell/core/coordinate/orchestrator.py
@@ -5,7 +5,7 @@
 from a2a.types import TaskArtifactUpdateEvent, TaskState, TaskStatusUpdateEvent
 from valuecell.core.agent.connect import get_default_remote_connections
 from valuecell.core.coordinate.response import ResponseFactory
-from valuecell.core.coordinate.response_buffer import ResponseBuffer, SaveMessage
+from valuecell.core.coordinate.response_buffer import ResponseBuffer, SaveItem
 from valuecell.core.coordinate.response_router import (
     RouteResult,
     SideEffectKind,
@@ -260,13 +260,14 @@ async def _handle_session_continuation(
         await self.provide_user_input(session_id, user_input.query)
 
         thread_id = generate_thread_id()
-        context.thread_id = thread_id
         yield self._response_factory.thread_started(
             conversation_id=session_id, thread_id=thread_id
         )
         await self.session_manager.add_user_message(
             conversation_id=session_id, thread_id=thread_id, content=user_input.query
         )
+        thread_id = generate_thread_id()
+        context.thread_id = thread_id
 
         # Resume based on execution stage
         if context.stage == "planning":
@@ -290,7 +291,6 @@ async def _handle_new_request(
         yield self._response_factory.thread_started(
             conversation_id=session_id, thread_id=thread_id
         )
-
         # Add user message to session
         await self.session_manager.add_user_message(
             conversation_id=session_id, thread_id=thread_id, content=user_input.query
@@ -304,10 +304,10 @@ async def _handle_new_request(
         )
 
         # Monitor planning progress
-        async for chunk in self._monitor_planning_task(
-            planning_task, thread_id, user_input, context_aware_callback
+        async for response in self._monitor_planning_task(
+            planning_task, generate_thread_id(), user_input, context_aware_callback
         ):
-            yield chunk
+            yield response
 
     def _create_context_aware_callback(self, session_id: str):
         """Create a callback that adds session context to user input requests"""
@@ -354,8 +354,8 @@ async def _monitor_planning_task(
 
         # Planning completed, execute plan
         plan = await planning_task
-        async for chunk in self._execute_plan_with_input_support(plan, thread_id):
-            yield chunk
+        async for response in self._execute_plan_with_input_support(plan, thread_id):
+            yield response
 
     async def _request_user_input(self, session_id: str):
         """Set session to require user input and send the request"""
@@ -415,8 +415,8 @@ async def _continue_planning(
         plan = await planning_task
         del self._execution_contexts[session_id]
 
-        async for message in self._execute_plan_with_input_support(plan, thread_id):
-            yield message
+        async for response in self._execute_plan_with_input_support(plan, thread_id):
+            yield response
 
     async def _cancel_execution(self, session_id: str):
         """Cancel execution and clean up all related resources"""
@@ -504,7 +504,6 @@ async def _execute_plan_with_input_support(
                     session_id,
                     thread_id,
                     task.task_id,
-                    _generate_task_default_subtask_id(task.task_id),
                     error_msg,
                 )
         # Before signaling done, flush any remaining buffered items in this thread
@@ -587,7 +586,6 @@ async def _execute_task_with_input_support(
                 conversation_id=task.session_id,
                 thread_id=thread_id,
                 task_id=task.task_id,
-                subtask_id=_generate_task_default_subtask_id(task.task_id),
             )
             # Flush buffered content for this task context
             items = self._response_buffer.flush_context(
@@ -610,7 +608,7 @@ async def _flush_due(self):
         items = self._response_buffer.flush_due()
         await self._persist_items(items)
 
-    async def _persist_items(self, items: list[SaveMessage]):
+    async def _persist_items(self, items: list[SaveItem]):
         for it in items:
             await self.session_manager.add_message(
                 role=it.role,
@@ -618,17 +616,11 @@ async def _persist_items(self, items: list[SaveMessage]):
                 conversation_id=it.conversation_id,
                 thread_id=it.thread_id,
                 task_id=it.task_id,
-                subtask_id=it.subtask_id,
                 payload=it.payload,
                 item_id=it.item_id,
             )
 
 
-def _generate_task_default_subtask_id(task_id: str) -> str:
-    """Generate a default subtask ID based on the main task ID"""
-    return f"{task_id}-default_subtask"
-
-
 # ==================== Module-level Factory Function ====================
 
 _orchestrator = AgentOrchestrator()
diff --git a/python/valuecell/core/coordinate/response.py b/python/valuecell/core/coordinate/response.py
index ab9f73190..06e5dd445 100644
--- a/python/valuecell/core/coordinate/response.py
+++ b/python/valuecell/core/coordinate/response.py
@@ -12,6 +12,7 @@
     PlanFailedResponse,
     PlanRequireUserInputResponse,
     ReasoningResponse,
+    Role,
     StreamResponseEvent,
     SystemFailedResponse,
     TaskCompletedResponse,
@@ -21,12 +22,13 @@
     ToolCallResponse,
     UnifiedResponseData,
 )
+from valuecell.utils.uuid import generate_item_id
 
 
 class ResponseFactory:
     def conversation_started(self, conversation_id: str) -> ConversationStartedResponse:
         return ConversationStartedResponse(
-            data=UnifiedResponseData(conversation_id=conversation_id)
+            data=UnifiedResponseData(conversation_id=conversation_id, role=Role.SYSTEM)
         )
 
     def thread_started(
@@ -34,7 +36,7 @@ def thread_started(
     ) -> ThreadStartedResponse:
         return ThreadStartedResponse(
             data=UnifiedResponseData(
-                conversation_id=conversation_id, thread_id=thread_id
+                conversation_id=conversation_id, thread_id=thread_id, role=Role.SYSTEM
             )
         )
 
@@ -42,7 +44,7 @@ def system_failed(self, conversation_id: str, content: str) -> SystemFailedRespo
         return SystemFailedResponse(
             data=UnifiedResponseData(
                 conversation_id=conversation_id,
-                payload=BaseResponseDataPayload(content=content),
+                payload=BaseResponseDataPayload(content=content, role=Role.SYSTEM),
             )
         )
 
@@ -51,6 +53,7 @@ def done(self, conversation_id: str, thread_id: str) -> DoneResponse:
             data=UnifiedResponseData(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
+                role=Role.SYSTEM,
             )
         )
 
@@ -61,7 +64,7 @@ def plan_require_user_input(
             data=UnifiedResponseData(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
-                payload=BaseResponseDataPayload(content=content),
+                payload=BaseResponseDataPayload(content=content, role=Role.AGENT),
             )
         )
 
@@ -72,7 +75,7 @@ def plan_failed(
             data=UnifiedResponseData(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
-                payload=BaseResponseDataPayload(content=content),
+                payload=BaseResponseDataPayload(content=content, role=Role.SYSTEM),
             )
         )
 
@@ -81,7 +84,6 @@ def task_failed(
         conversation_id: str,
         thread_id: str,
         task_id: str,
-        subtask_id: str | None,
         content: str,
     ) -> TaskFailedResponse:
         return TaskFailedResponse(
@@ -89,8 +91,7 @@ def task_failed(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
                 task_id=task_id,
-                subtask_id=subtask_id,
-                payload=BaseResponseDataPayload(content=content),
+                payload=BaseResponseDataPayload(content=content, role=Role.AGENT),
             )
         )
 
@@ -99,14 +100,13 @@ def task_completed(
         conversation_id: str,
         thread_id: str,
         task_id: str,
-        subtask_id: str | None,
     ) -> TaskCompletedResponse:
         return TaskCompletedResponse(
             data=UnifiedResponseData(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
                 task_id=task_id,
-                subtask_id=subtask_id,
+                role=Role.AGENT,
             ),
         )
 
@@ -115,7 +115,6 @@ def tool_call(
         conversation_id: str,
         thread_id: str,
         task_id: str,
-        subtask_id: str,
         event: Literal[
             StreamResponseEvent.TOOL_CALL_STARTED,
             StreamResponseEvent.TOOL_CALL_COMPLETED,
@@ -130,12 +129,12 @@ def tool_call(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
                 task_id=task_id,
-                subtask_id=subtask_id,
                 payload=ToolCallPayload(
                     tool_call_id=tool_call_id,
                     tool_name=tool_name,
                     tool_result=tool_result,
                 ),
+                role=Role.AGENT,
             ),
         )
 
@@ -145,8 +144,8 @@ def message_response_general(
         conversation_id: str,
         thread_id: str,
         task_id: str,
-        subtask_id: str,
         content: str,
+        item_id: Optional[str] = None,
     ) -> MessageResponse:
         return MessageResponse(
             event=event,
@@ -154,8 +153,11 @@ def message_response_general(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
                 task_id=task_id,
-                subtask_id=subtask_id,
-                payload=BaseResponseDataPayload(content=content),
+                payload=BaseResponseDataPayload(
+                    content=content,
+                    role=Role.AGENT,
+                ),
+                item_id=item_id or generate_item_id(),
             ),
         )
 
@@ -164,7 +166,6 @@ def reasoning(
         conversation_id: str,
         thread_id: str,
         task_id: str,
-        subtask_id: str,
         event: Literal[
             StreamResponseEvent.REASONING,
             StreamResponseEvent.REASONING_STARTED,
@@ -178,8 +179,11 @@ def reasoning(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
                 task_id=task_id,
-                subtask_id=subtask_id,
-                payload=BaseResponseDataPayload(content=content) if content else None,
+                payload=(
+                    BaseResponseDataPayload(content=content, role=Role.AGENT)
+                    if content
+                    else None
+                ),
             ),
         )
 
@@ -188,7 +192,6 @@ def component_generator(
         conversation_id: str,
         thread_id: str,
         task_id: str,
-        subtask_id: str,
         content: str,
         component_type: str,
     ) -> ComponentGeneratorResponse:
@@ -197,10 +200,10 @@ def component_generator(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
                 task_id=task_id,
-                subtask_id=subtask_id,
                 payload=ComponentGeneratorResponseDataPayload(
                     content=content,
                     component_type=component_type,
+                    role=Role.AGENT,
                 ),
             ),
         )
diff --git a/python/valuecell/core/coordinate/response_buffer.py b/python/valuecell/core/coordinate/response_buffer.py
index e1bf1d0ab..4be63f98d 100644
--- a/python/valuecell/core/coordinate/response_buffer.py
+++ b/python/valuecell/core/coordinate/response_buffer.py
@@ -3,7 +3,6 @@
 from typing import Dict, List, Optional, Tuple
 
 from pydantic import BaseModel
-
 from valuecell.core.types import (
     BaseResponse,
     BaseResponseDataPayload,
@@ -15,27 +14,22 @@
     TaskStatusEvent,
     UnifiedResponseData,
 )
-from valuecell.utils.uuid import generate_uuid
-
-
-def generate_item_id() -> str:
-    return generate_uuid("item")
+from valuecell.utils.uuid import generate_item_id
 
 
 @dataclass
-class SaveMessage:
+class SaveItem:
     item_id: str
-    role: Role
     event: object  # ConversationItemEvent union; keep generic to avoid circular typing
     conversation_id: str
     thread_id: Optional[str]
     task_id: Optional[str]
-    subtask_id: Optional[str]
     payload: Optional[BaseModel]
+    role: Role = Role.AGENT
 
 
-# conversation_id, thread_id, task_id, subtask_id, event
-BufferKey = Tuple[str, Optional[str], Optional[str], Optional[str], object]
+# conversation_id, thread_id, task_id, event
+BufferKey = Tuple[str, Optional[str], Optional[str], object]
 
 
 class BufferEntry:
@@ -67,7 +61,7 @@ class ResponseBuffer:
     - Immediate write: tool_call_completed, component_generator, message, plan_require_user_input
     - Buffered: message_chunk, reasoning (debounced or boundary-triggered)
     - Boundary triggers a flush for the same context: task_completed, task_failed, done
-    - Buffer key = (conversation_id, thread_id, task_id, subtask_id, event)
+    - Buffer key = (conversation_id, thread_id, task_id, event)
     """
 
     def __init__(
@@ -95,7 +89,7 @@ def __init__(
             SystemResponseEvent.DONE,
         }
 
-    def ingest(self, resp: BaseResponse) -> List[SaveMessage]:
+    def ingest(self, resp: BaseResponse) -> List[SaveItem]:
         data: UnifiedResponseData = resp.data
         ev = resp.event
 
@@ -103,9 +97,8 @@ def ingest(self, resp: BaseResponse) -> List[SaveMessage]:
             data.conversation_id,
             data.thread_id,
             data.task_id,
-            data.subtask_id,
         )
-        out: List[SaveMessage] = []
+        out: List[SaveItem] = []
 
         # Boundary-only: flush buffers for this context
         if ev in self._boundary_events:
@@ -115,7 +108,7 @@ def ingest(self, resp: BaseResponse) -> List[SaveMessage]:
         # Immediate: flush buffers for this context, then write self
         if ev in self._immediate_events:
             out.extend(self._flush_context(*ctx))
-            out.append(self._make_save_message_from_response(resp))
+            out.append(self._make_save_item_from_response(resp))
             return out
 
         # Buffered: accumulate by (ctx + event)
@@ -146,8 +139,7 @@ def ingest(self, resp: BaseResponse) -> List[SaveMessage]:
                     flushed = entry.flush_to_payload()
                     if flushed is not None:
                         out.append(
-                            self._make_save_message(
-                                role=self._role_for_event(ev),
+                            self._make_save_item(
                                 event=ev,
                                 data=data,
                                 payload=flushed,
@@ -159,24 +151,22 @@ def ingest(self, resp: BaseResponse) -> List[SaveMessage]:
         # Other events: ignore for storage by default
         return out
 
-    def flush_due(self, now: Optional[float] = None) -> List[SaveMessage]:
+    def flush_due(self, now: Optional[float] = None) -> List[SaveItem]:
         now = now or time.monotonic()
-        out: List[SaveMessage] = []
+        out: List[SaveItem] = []
         to_delete: List[BufferKey] = []
         for key, entry in self._buffers.items():
             if now - entry.last_updated >= self._debounce_sec and entry.parts:
                 payload = entry.flush_to_payload()
                 if payload is not None:
-                    conv_id, thread_id, task_id, subtask_id, ev = key
+                    conv_id, thread_id, task_id, ev = key
                     out.append(
-                        SaveMessage(
+                        SaveItem(
                             item_id=generate_item_id(),
-                            role=self._role_for_event(ev),
                             event=ev,
                             conversation_id=conv_id,
                             thread_id=thread_id,
                             task_id=task_id,
-                            subtask_id=subtask_id,
                             payload=payload,
                         )
                     )
@@ -193,28 +183,25 @@ def flush_context(
         conversation_id: str,
         thread_id: Optional[str] = None,
         task_id: Optional[str] = None,
-        subtask_id: Optional[str] = None,
-    ) -> List[SaveMessage]:
-        return self._flush_context(conversation_id, thread_id, task_id, subtask_id)
+    ) -> List[SaveItem]:
+        return self._flush_context(conversation_id, thread_id, task_id)
 
-    def flush_all(self) -> List[SaveMessage]:
-        out: List[SaveMessage] = []
+    def flush_all(self) -> List[SaveItem]:
+        out: List[SaveItem] = []
         for key in list(self._buffers.keys()):
             entry = self._buffers.get(key)
             if not entry:
                 continue
             payload = entry.flush_to_payload()
             if payload is not None:
-                conv_id, thread_id, task_id, subtask_id, ev = key
+                conv_id, thread_id, task_id, ev = key
                 out.append(
-                    SaveMessage(
+                    SaveItem(
                         item_id=generate_item_id(),
-                        role=self._role_for_event(ev),
                         event=ev,
                         conversation_id=conv_id,
                         thread_id=thread_id,
                         task_id=task_id,
-                        subtask_id=subtask_id,
                         payload=payload,
                     )
                 )
@@ -226,9 +213,8 @@ def _flush_context(
         conversation_id: str,
         thread_id: Optional[str],
         task_id: Optional[str],
-        subtask_id: Optional[str],
-    ) -> List[SaveMessage]:
-        out: List[SaveMessage] = []
+    ) -> List[SaveItem]:
+        out: List[SaveItem] = []
 
         # Collect keys matching the context and buffered events only
         def match(val, want):
@@ -240,8 +226,7 @@ def match(val, want):
                 key[0] == conversation_id
                 and match(key[1], thread_id)
                 and match(key[2], task_id)
-                and match(key[3], subtask_id)
-                and key[4] in self._buffered_events
+                and key[3] in self._buffered_events
             ):
                 keys.append(key)
 
@@ -251,16 +236,14 @@ def match(val, want):
                 continue
             payload = entry.flush_to_payload()
             if payload is not None:
-                conv_id, thread_id, task_id, subtask_id, ev = key
+                conv_id, thread_id, task_id, ev = key
                 out.append(
-                    SaveMessage(
+                    SaveItem(
                         item_id=generate_item_id(),
-                        role=self._role_for_event(ev),
                         event=ev,
                         conversation_id=conv_id,
                         thread_id=thread_id,
                         task_id=task_id,
-                        subtask_id=subtask_id,
                         payload=payload,
                     )
                 )
@@ -270,7 +253,7 @@ def match(val, want):
 
         return out
 
-    def _make_save_message_from_response(self, resp: BaseResponse) -> SaveMessage:
+    def _make_save_item_from_response(self, resp: BaseResponse) -> SaveItem:
         data: UnifiedResponseData = resp.data
         payload = data.payload
 
@@ -288,38 +271,27 @@ def _make_save_message_from_response(self, resp: BaseResponse) -> SaveMessage:
             except Exception:
                 bm = BaseResponseDataPayload(content=None)
 
-        return SaveMessage(
-            item_id=getattr(resp, "item_id", generate_item_id()),
-            role=self._role_for_event(resp.event),
+        return SaveItem(
+            item_id=resp.item_id,
             event=resp.event,
             conversation_id=data.conversation_id,
             thread_id=data.thread_id,
             task_id=data.task_id,
-            subtask_id=data.subtask_id,
             payload=bm,
         )
 
-    def _make_save_message(
+    def _make_save_item(
         self,
-        role: Role,
         event: object,
         data: UnifiedResponseData,
         payload: BaseModel,
         item_id: str | None = None,
-    ) -> SaveMessage:
-        return SaveMessage(
+    ) -> SaveItem:
+        return SaveItem(
             item_id=item_id,
-            role=role,
             event=event,
             conversation_id=data.conversation_id,
             thread_id=data.thread_id,
             task_id=data.task_id,
-            subtask_id=data.subtask_id,
             payload=payload,
         )
-
-    def _role_for_event(self, ev: object) -> Role:
-        # Agent-originated by default; some system events are SYSTEM
-        if ev in {SystemResponseEvent.PLAN_REQUIRE_USER_INPUT}:
-            return Role.SYSTEM
-        return Role.AGENT
diff --git a/python/valuecell/core/coordinate/response_router.py b/python/valuecell/core/coordinate/response_router.py
index 9d745c477..5122da0b0 100644
--- a/python/valuecell/core/coordinate/response_router.py
+++ b/python/valuecell/core/coordinate/response_router.py
@@ -39,10 +39,6 @@ def __post_init__(self):
             self.side_effects = []
 
 
-def _default_subtask_id(task_id: str) -> str:
-    return f"{task_id}_default-subtask"
-
-
 async def handle_status_update(
     response_factory: ResponseFactory,
     task: Task,
@@ -63,7 +59,6 @@ async def handle_status_update(
                 conversation_id=task.session_id,
                 thread_id=thread_id,
                 task_id=task.task_id,
-                subtask_id=_default_subtask_id(task.task_id),
                 content=err_msg,
             )
         )
@@ -77,9 +72,6 @@ async def handle_status_update(
         return RouteResult(responses)
 
     response_event = event.metadata.get("response_event")
-    subtask_id = event.metadata.get("subtask_id")
-    if not subtask_id:
-        subtask_id = _default_subtask_id(task.task_id)
 
     # Tool call events
     if state == TaskState.working and EventPredicates.is_tool_call(response_event):
@@ -94,7 +86,6 @@ async def handle_status_update(
                 conversation_id=task.session_id,
                 thread_id=thread_id,
                 task_id=task.task_id,
-                subtask_id=subtask_id,
                 event=response_event,
                 tool_call_id=tool_call_id,
                 tool_name=tool_name,
@@ -110,7 +101,6 @@ async def handle_status_update(
                 conversation_id=task.session_id,
                 thread_id=thread_id,
                 task_id=task.task_id,
-                subtask_id=subtask_id,
                 event=response_event,
                 content=get_message_text(event.status.message, ""),
             )
@@ -128,9 +118,6 @@ async def handle_artifact_update(
 ) -> List[MessageResponse | ComponentGeneratorResponse]:
     responses: List[BaseResponse] = []
     artifact = event.artifact
-    subtask_id = artifact.metadata.get("subtask_id") if artifact.metadata else None
-    if not subtask_id:
-        subtask_id = _default_subtask_id(task.task_id)
     response_event = artifact.metadata.get("response_event")
     content = get_message_text(artifact, "")
 
@@ -141,7 +128,6 @@ async def handle_artifact_update(
                 conversation_id=task.session_id,
                 thread_id=thread_id,
                 task_id=task.task_id,
-                subtask_id=subtask_id,
                 content=content,
                 component_type=component_type,
             )
@@ -154,7 +140,6 @@ async def handle_artifact_update(
             conversation_id=task.session_id,
             thread_id=thread_id,
             task_id=task.task_id,
-            subtask_id=subtask_id,
             content=content,
         )
     )
diff --git a/python/valuecell/core/session/manager.py b/python/valuecell/core/session/manager.py
index c24a5e574..1ca75507e 100644
--- a/python/valuecell/core/session/manager.py
+++ b/python/valuecell/core/session/manager.py
@@ -92,7 +92,6 @@ async def add_message(
         conversation_id: str,
         thread_id: Optional[str] = None,
         task_id: Optional[str] = None,
-        subtask_id: Optional[str] = None,
         payload: ResponsePayload = None,
         item_id: Optional[str] = None,
     ) -> Optional[ConversationItem]:
@@ -131,7 +130,6 @@ async def add_message(
             conversation_id=conversation_id,
             thread_id=thread_id,
             task_id=task_id,
-            subtask_id=subtask_id,
             payload=payload_str,
         )
 
diff --git a/python/valuecell/core/session/message_store.py b/python/valuecell/core/session/message_store.py
index 50a959156..f815f2c44 100644
--- a/python/valuecell/core/session/message_store.py
+++ b/python/valuecell/core/session/message_store.py
@@ -106,7 +106,6 @@ async def _ensure_initialized(self) -> None:
                       conversation_id TEXT NOT NULL,
                       thread_id TEXT,
                       task_id TEXT,
-                      subtask_id TEXT,
                       payload TEXT,
                       created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
                     );
@@ -130,7 +129,6 @@ def _row_to_message(row: sqlite3.Row) -> ConversationItem:
             conversation_id=row["conversation_id"],
             thread_id=row["thread_id"],
             task_id=row["task_id"],
-            subtask_id=row["subtask_id"],
             payload=row["payload"],
         )
 
@@ -142,7 +140,7 @@ async def save_message(self, message: ConversationItem) -> None:
             await db.execute(
                 """
                 INSERT OR REPLACE INTO messages (
-                    item_id, role, event, conversation_id, thread_id, task_id, subtask_id, payload
+                    item_id, role, event, conversation_id, thread_id, task_id, payload
                 ) VALUES (?, ?, ?, ?, ?, ?, ?, ?)
                 """,
                 (
@@ -152,7 +150,6 @@ async def save_message(self, message: ConversationItem) -> None:
                     message.conversation_id,
                     message.thread_id,
                     message.task_id,
-                    message.subtask_id,
                     message.payload,
                 ),
             )
diff --git a/python/valuecell/core/session/tests/test_sqlite_message_store.py b/python/valuecell/core/session/tests/test_sqlite_message_store.py
index 8d1d3788b..5d6c23b04 100644
--- a/python/valuecell/core/session/tests/test_sqlite_message_store.py
+++ b/python/valuecell/core/session/tests/test_sqlite_message_store.py
@@ -2,7 +2,6 @@
 import tempfile
 
 import pytest
-
 from valuecell.core.session.message_store import SQLiteMessageStore
 from valuecell.core.types import ConversationItem, Role, SystemResponseEvent
 
@@ -22,7 +21,6 @@ async def test_sqlite_message_store_basic_crud():
             conversation_id="s1",
             thread_id="t1",
             task_id=None,
-            subtask_id=None,
             payload='{"a":1}',
         )
         m2 = ConversationItem(
@@ -32,7 +30,6 @@ async def test_sqlite_message_store_basic_crud():
             conversation_id="s1",
             thread_id="t1",
             task_id=None,
-            subtask_id=None,
             payload='{"a":1}',
         )
         await store.save_message(m1)
diff --git a/python/valuecell/core/types.py b/python/valuecell/core/types.py
index 37e425bb1..b5149f8f7 100644
--- a/python/valuecell/core/types.py
+++ b/python/valuecell/core/types.py
@@ -4,7 +4,7 @@
 
 from a2a.types import Task, TaskArtifactUpdateEvent, TaskStatusUpdateEvent
 from pydantic import BaseModel, Field
-from valuecell.utils.uuid import generate_uuid
+from valuecell.utils.uuid import generate_item_id
 
 
 class UserInputMetadata(BaseModel):
@@ -80,10 +80,6 @@ class StreamResponse(BaseModel):
         None,
         description="Optional metadata providing additional context about the response",
     )
-    subtask_id: Optional[str] = Field(
-        None,
-        description="Optional subtask ID if the response is related to a specific subtask",
-    )
 
 
 class NotifyResponse(BaseModel):
@@ -153,9 +149,6 @@ class ConversationItem(BaseModel):
     task_id: Optional[str] = Field(
         None, description="Task ID if associated with a task"
     )
-    subtask_id: Optional[str] = Field(
-        None, description="Subtask ID if associated with a subtask"
-    )
     payload: str = Field(..., description="The actual message payload")
 
 
@@ -171,18 +164,16 @@ class UnifiedResponseData(BaseModel):
         None, description="Unique ID for the message thread"
     )
     task_id: Optional[str] = Field(None, description="Unique ID for the task")
-    subtask_id: Optional[str] = Field(
-        None, description="Unique ID for the subtask, if any"
-    )
     payload: Optional[ResponsePayload] = Field(
         None, description="The message data payload"
     )
+    role: Role = Field(..., description="The role of the message sender")
+    item_id: str = Field(default_factory=generate_item_id)
 
 
 class BaseResponse(BaseModel, ABC):
     """Top-level response envelope used for all events."""
 
-    item_id: str = Field(default_factory=lambda: generate_uuid("item"))
     event: ConversationItemEvent = Field(
         ..., description="The event type of the response"
     )
diff --git a/python/valuecell/utils/uuid.py b/python/valuecell/utils/uuid.py
index ff103dcc4..0abaf05dd 100644
--- a/python/valuecell/utils/uuid.py
+++ b/python/valuecell/utils/uuid.py
@@ -8,5 +8,9 @@ def generate_uuid(prefix: str = None) -> str:
     return f"{prefix}-{uuid4().hex}"
 
 
+def generate_item_id() -> str:
+    return generate_uuid("item")
+
+
 def generate_thread_id() -> str:
     return generate_uuid("th")

From cab4fd42ff743003b05b38ed92d3c39fdfb7f61a Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 18:58:47 +0800
Subject: [PATCH 10/21] feat: enhance response buffering with stable item_id
 and role management

---
 .../valuecell/core/coordinate/orchestrator.py |  31 +--
 python/valuecell/core/coordinate/response.py  |   2 +-
 .../core/coordinate/response_buffer.py        | 217 ++++++++----------
 .../valuecell/core/session/message_store.py   |   2 +-
 4 files changed, 113 insertions(+), 139 deletions(-)

diff --git a/python/valuecell/core/coordinate/orchestrator.py b/python/valuecell/core/coordinate/orchestrator.py
index 3713f2524..909263a70 100644
--- a/python/valuecell/core/coordinate/orchestrator.py
+++ b/python/valuecell/core/coordinate/orchestrator.py
@@ -488,17 +488,16 @@ async def _execute_plan_with_input_support(
                 async for response in self._execute_task_with_input_support(
                     task, thread_id, metadata
                 ):
+                    # Ensure buffered events carry a stable paragraph item_id
+                    annotated = self._response_buffer.annotate(response)
                     # Accumulate based on event
-                    yield response
+                    yield annotated
 
                     # Persist via ResponseBuffer
-                    await self._persist_from_buffer(response)
-
-                    # Periodic flush for buffered events based on debounce
-                    await self._flush_due()
+                    await self._persist_from_buffer(annotated)
 
             except Exception as e:
-                error_msg = f"(Error) Error executing {task.id}: {str(e)}"
+                error_msg = f"(Error) Error executing {task.task_id}: {str(e)}"
                 logger.exception(f"Task execution failed: {error_msg}")
                 yield self._response_factory.task_failed(
                     session_id,
@@ -506,9 +505,6 @@ async def _execute_plan_with_input_support(
                     task.task_id,
                     error_msg,
                 )
-        # Before signaling done, flush any remaining buffered items in this thread
-        items = self._response_buffer.flush_context(session_id, thread_id)
-        await self._persist_items(items)
 
         yield self._response_factory.done(session_id, thread_id)
 
@@ -561,6 +557,7 @@ async def _execute_task_with_input_support(
                         self._response_factory, task, thread_id, event
                     )
                     for r in result.responses:
+                        r = self._response_buffer.annotate(r)
                         yield r
                     # Apply side effects
                     for eff in result.side_effects:
@@ -577,6 +574,7 @@ async def _execute_task_with_input_support(
                         self._response_factory, task, thread_id, event
                     )
                     for r in responses:
+                        r = self._response_buffer.annotate(r)
                         yield r
                     continue
 
@@ -587,8 +585,8 @@ async def _execute_task_with_input_support(
                 thread_id=thread_id,
                 task_id=task.task_id,
             )
-            # Flush buffered content for this task context
-            items = self._response_buffer.flush_context(
+            # Finalize buffered aggregates for this task (explicit flush at task end)
+            items = self._response_buffer.flush_task(
                 conversation_id=task.session_id,
                 thread_id=thread_id,
                 task_id=task.task_id,
@@ -596,6 +594,13 @@ async def _execute_task_with_input_support(
             await self._persist_items(items)
 
         except Exception as e:
+            # On failure, finalize any buffered aggregates for this task
+            items = self._response_buffer.flush_task(
+                conversation_id=task.session_id,
+                thread_id=thread_id,
+                task_id=task.task_id,
+            )
+            await self._persist_items(items)
             await self.task_manager.fail_task(task.task_id, str(e))
             raise e
 
@@ -604,10 +609,6 @@ async def _persist_from_buffer(self, response: BaseResponse):
         items = self._response_buffer.ingest(response)
         await self._persist_items(items)
 
-    async def _flush_due(self):
-        items = self._response_buffer.flush_due()
-        await self._persist_items(items)
-
     async def _persist_items(self, items: list[SaveItem]):
         for it in items:
             await self.session_manager.add_message(
diff --git a/python/valuecell/core/coordinate/response.py b/python/valuecell/core/coordinate/response.py
index 06e5dd445..41da5b81d 100644
--- a/python/valuecell/core/coordinate/response.py
+++ b/python/valuecell/core/coordinate/response.py
@@ -155,8 +155,8 @@ def message_response_general(
                 task_id=task_id,
                 payload=BaseResponseDataPayload(
                     content=content,
-                    role=Role.AGENT,
                 ),
+                role=Role.AGENT,
                 item_id=item_id or generate_item_id(),
             ),
         )
diff --git a/python/valuecell/core/coordinate/response_buffer.py b/python/valuecell/core/coordinate/response_buffer.py
index 4be63f98d..4c45b632d 100644
--- a/python/valuecell/core/coordinate/response_buffer.py
+++ b/python/valuecell/core/coordinate/response_buffer.py
@@ -11,7 +11,6 @@
     Role,
     StreamResponseEvent,
     SystemResponseEvent,
-    TaskStatusEvent,
     UnifiedResponseData,
 )
 from valuecell.utils.uuid import generate_item_id
@@ -33,45 +32,41 @@ class SaveItem:
 
 
 class BufferEntry:
-    def __init__(self):
+    def __init__(self, item_id: Optional[str] = None, role: Optional[Role] = None):
         self.parts: List[str] = []
         self.last_updated: float = time.monotonic()
+        # Stable paragraph id for this buffer entry. Reused across streamed chunks
+        # until this entry is flushed (debounce/boundary). On size-based flush,
+        # we rotate to a new paragraph id for subsequent chunks.
+        self.item_id: str = item_id or generate_item_id()
+        self.role: Optional[Role] = role
 
     def append(self, text: str):
         if text:
             self.parts.append(text)
             self.last_updated = time.monotonic()
 
-    def size(self) -> int:
-        return sum(len(p) for p in self.parts)
-
-    def flush_to_payload(self) -> Optional[BaseResponseDataPayload]:
+    def snapshot_payload(self) -> Optional[BaseResponseDataPayload]:
+        """Return current aggregate content without clearing the buffer."""
         if not self.parts:
             return None
         content = "".join(self.parts)
-        self.parts.clear()
-        self.last_updated = time.monotonic()
         return BaseResponseDataPayload(content=content)
 
 
 class ResponseBuffer:
     """Buffers streaming responses and emits SaveMessage at suitable boundaries.
 
-    Rules:
-    - Immediate write: tool_call_completed, component_generator, message, plan_require_user_input
-    - Buffered: message_chunk, reasoning (debounced or boundary-triggered)
-    - Boundary triggers a flush for the same context: task_completed, task_failed, done
+    Simplified rules (no debounce, no size-based rotation):
+    - Immediate write-through: tool_call_completed, component_generator, message, plan_require_user_input
+    - Buffered: message_chunk, reasoning
+        - Maintain a stable paragraph item_id per (conversation, thread, task, event)
+        - On every chunk, update the aggregate and return a SaveItem for upsert
     - Buffer key = (conversation_id, thread_id, task_id, event)
     """
 
-    def __init__(
-        self,
-        debounce_ms: int = 1000,
-        max_chars: int = 4096,
-    ):
+    def __init__(self):
         self._buffers: Dict[BufferKey, BufferEntry] = {}
-        self._debounce_sec = debounce_ms / 1000.0
-        self._max_chars = max_chars
 
         self._immediate_events = {
             StreamResponseEvent.TOOL_CALL_COMPLETED,
@@ -83,11 +78,33 @@ def __init__(
             StreamResponseEvent.MESSAGE_CHUNK,
             StreamResponseEvent.REASONING,
         }
-        self._boundary_events = {
-            TaskStatusEvent.TASK_COMPLETED,
-            SystemResponseEvent.TASK_FAILED,
-            SystemResponseEvent.DONE,
-        }
+
+    def annotate(self, resp: BaseResponse) -> BaseResponse:
+        """Ensure buffered events carry a stable paragraph item_id on the response.
+
+        For buffered events (message_chunk, reasoning), we assign a stable
+        paragraph id per (conversation, thread, task, event) key and stamp it
+        into resp.data.item_id so the frontend can correlate chunks and the
+        final persisted SaveItem. Immediate and boundary events are left as-is.
+        """
+        data: UnifiedResponseData = resp.data
+        ev = resp.event
+        if ev in self._buffered_events:
+            key: BufferKey = (
+                data.conversation_id,
+                data.thread_id,
+                data.task_id,
+                ev,
+            )
+            entry = self._buffers.get(key)
+            if not entry:
+                # Start a new paragraph buffer with a fresh paragraph item_id
+                entry = BufferEntry(role=data.role)
+                self._buffers[key] = entry
+            # Stamp the response with the stable paragraph id
+            data.item_id = entry.item_id
+            resp.data = data
+        return resp
 
     def ingest(self, resp: BaseResponse) -> List[SaveItem]:
         data: UnifiedResponseData = resp.data
@@ -100,14 +117,13 @@ def ingest(self, resp: BaseResponse) -> List[SaveItem]:
         )
         out: List[SaveItem] = []
 
-        # Boundary-only: flush buffers for this context
-        if ev in self._boundary_events:
-            out.extend(self._flush_context(*ctx))
-            return out
-
-        # Immediate: flush buffers for this context, then write self
+        # Immediate: write-through, but treat as paragraph boundary for buffered keys
         if ev in self._immediate_events:
-            out.extend(self._flush_context(*ctx))
+            # Flush buffered aggregates for this context before the immediate item
+            conv_id, th_id, tk_id = ctx
+            keys_to_flush = self._collect_task_keys(conv_id, th_id, tk_id)
+            out.extend(self._finalize_keys(keys_to_flush))
+            # Now write the immediate item
             out.append(self._make_save_item_from_response(resp))
             return out
 
@@ -116,7 +132,8 @@ def ingest(self, resp: BaseResponse) -> List[SaveItem]:
             key: BufferKey = (*ctx, ev)
             entry = self._buffers.get(key)
             if not entry:
-                entry = BufferEntry()
+                # If annotate() wasn't called, create an entry now.
+                entry = BufferEntry(role=data.role)
                 self._buffers[key] = entry
 
             # Extract text content from payload
@@ -134,125 +151,79 @@ def ingest(self, resp: BaseResponse) -> List[SaveItem]:
 
             if text:
                 entry.append(text)
-                # If exceed size, flush one segment immediately
-                if entry.size() >= self._max_chars:
-                    flushed = entry.flush_to_payload()
-                    if flushed is not None:
-                        out.append(
-                            self._make_save_item(
-                                event=ev,
-                                data=data,
-                                payload=flushed,
-                                item_id=generate_item_id(),
-                            )
-                        )
-            return out
-
-        # Other events: ignore for storage by default
-        return out
-
-    def flush_due(self, now: Optional[float] = None) -> List[SaveItem]:
-        now = now or time.monotonic()
-        out: List[SaveItem] = []
-        to_delete: List[BufferKey] = []
-        for key, entry in self._buffers.items():
-            if now - entry.last_updated >= self._debounce_sec and entry.parts:
-                payload = entry.flush_to_payload()
-                if payload is not None:
-                    conv_id, thread_id, task_id, ev = key
+                # Always upsert current aggregate (no size-based rotation)
+                snap = entry.snapshot_payload()
+                if snap is not None:
                     out.append(
-                        SaveItem(
-                            item_id=generate_item_id(),
+                        self._make_save_item(
                             event=ev,
-                            conversation_id=conv_id,
-                            thread_id=thread_id,
-                            task_id=task_id,
-                            payload=payload,
+                            data=data,
+                            payload=snap,
+                            item_id=entry.item_id,
                         )
                     )
-                # entry remains but is empty; mark for cleanup to prevent leaks
-                to_delete.append(key)
-        for key in to_delete:
-            # drop empty/idle entries
-            if key in self._buffers and not self._buffers[key].parts:
-                del self._buffers[key]
-        return out
-
-    def flush_context(
-        self,
-        conversation_id: str,
-        thread_id: Optional[str] = None,
-        task_id: Optional[str] = None,
-    ) -> List[SaveItem]:
-        return self._flush_context(conversation_id, thread_id, task_id)
+            return out
 
-    def flush_all(self) -> List[SaveItem]:
-        out: List[SaveItem] = []
-        for key in list(self._buffers.keys()):
-            entry = self._buffers.get(key)
-            if not entry:
-                continue
-            payload = entry.flush_to_payload()
-            if payload is not None:
-                conv_id, thread_id, task_id, ev = key
-                out.append(
-                    SaveItem(
-                        item_id=generate_item_id(),
-                        event=ev,
-                        conversation_id=conv_id,
-                        thread_id=thread_id,
-                        task_id=task_id,
-                        payload=payload,
-                    )
-                )
-            del self._buffers[key]
+        # Other events: ignore for storage by default
         return out
 
-    def _flush_context(
+    # No flush API: paragraph boundaries are triggered by immediate events only
+
+    def _collect_task_keys(
         self,
         conversation_id: str,
         thread_id: Optional[str],
         task_id: Optional[str],
-    ) -> List[SaveItem]:
-        out: List[SaveItem] = []
-
-        # Collect keys matching the context and buffered events only
-        def match(val, want):
-            return want is None or val == want
-
+    ) -> List[BufferKey]:
         keys: List[BufferKey] = []
         for key in list(self._buffers.keys()):
+            k_conv, k_thread, k_task, k_event = key
             if (
-                key[0] == conversation_id
-                and match(key[1], thread_id)
-                and match(key[2], task_id)
-                and key[3] in self._buffered_events
+                k_conv == conversation_id
+                and (thread_id is None or k_thread == thread_id)
+                and (task_id is None or k_task == task_id)
+                and k_event in self._buffered_events
             ):
                 keys.append(key)
+        return keys
 
+    def _finalize_keys(self, keys: List[BufferKey]) -> List[SaveItem]:
+        out: List[SaveItem] = []
         for key in keys:
             entry = self._buffers.get(key)
             if not entry:
                 continue
-            payload = entry.flush_to_payload()
+            payload = entry.snapshot_payload()
             if payload is not None:
-                conv_id, thread_id, task_id, ev = key
                 out.append(
                     SaveItem(
-                        item_id=generate_item_id(),
-                        event=ev,
-                        conversation_id=conv_id,
-                        thread_id=thread_id,
-                        task_id=task_id,
+                        item_id=entry.item_id,
+                        event=key[3],
+                        conversation_id=key[0],
+                        thread_id=key[1],
+                        task_id=key[2],
                         payload=payload,
+                        role=entry.role or Role.AGENT,
                     )
                 )
-            # Remove emptied buffer
             if key in self._buffers:
                 del self._buffers[key]
-
         return out
 
+    def flush_task(
+        self,
+        conversation_id: str,
+        thread_id: Optional[str],
+        task_id: Optional[str],
+    ) -> List[SaveItem]:
+        """Finalize and emit all buffered aggregates for a given task context.
+
+        This writes current aggregates (using their stable paragraph item_id)
+        and clears the corresponding buffers. Use at task end (success or fail).
+        """
+        keys_to_flush = self._collect_task_keys(conversation_id, thread_id, task_id)
+        return self._finalize_keys(keys_to_flush)
+
     def _make_save_item_from_response(self, resp: BaseResponse) -> SaveItem:
         data: UnifiedResponseData = resp.data
         payload = data.payload
@@ -272,12 +243,13 @@ def _make_save_item_from_response(self, resp: BaseResponse) -> SaveItem:
                 bm = BaseResponseDataPayload(content=None)
 
         return SaveItem(
-            item_id=resp.item_id,
+            item_id=data.item_id,
             event=resp.event,
             conversation_id=data.conversation_id,
             thread_id=data.thread_id,
             task_id=data.task_id,
             payload=bm,
+            role=data.role,
         )
 
     def _make_save_item(
@@ -288,10 +260,11 @@ def _make_save_item(
         item_id: str | None = None,
     ) -> SaveItem:
         return SaveItem(
-            item_id=item_id,
+            item_id=item_id or generate_item_id(),
             event=event,
             conversation_id=data.conversation_id,
             thread_id=data.thread_id,
             task_id=data.task_id,
             payload=payload,
+            role=data.role,
         )
diff --git a/python/valuecell/core/session/message_store.py b/python/valuecell/core/session/message_store.py
index f815f2c44..2a9bc67a5 100644
--- a/python/valuecell/core/session/message_store.py
+++ b/python/valuecell/core/session/message_store.py
@@ -141,7 +141,7 @@ async def save_message(self, message: ConversationItem) -> None:
                 """
                 INSERT OR REPLACE INTO messages (
                     item_id, role, event, conversation_id, thread_id, task_id, payload
-                ) VALUES (?, ?, ?, ?, ?, ?, ?, ?)
+                ) VALUES (?, ?, ?, ?, ?, ?, ?)
                 """,
                 (
                     message.item_id,

From 2a48d2e8978978194818a1ffeaf76857ac50156a Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 21:22:23 +0800
Subject: [PATCH 11/21] feat: enhance thread management by including user query
 in response and updating event handling

---
 .../valuecell/core/coordinate/orchestrator.py | 22 ++++++-------
 python/valuecell/core/coordinate/response.py  | 31 +++++++++++--------
 .../core/coordinate/response_buffer.py        |  1 +
 python/valuecell/core/session/manager.py      | 15 ---------
 4 files changed, 28 insertions(+), 41 deletions(-)

diff --git a/python/valuecell/core/coordinate/orchestrator.py b/python/valuecell/core/coordinate/orchestrator.py
index 909263a70..583b9e8d7 100644
--- a/python/valuecell/core/coordinate/orchestrator.py
+++ b/python/valuecell/core/coordinate/orchestrator.py
@@ -260,13 +260,11 @@ async def _handle_session_continuation(
         await self.provide_user_input(session_id, user_input.query)
 
         thread_id = generate_thread_id()
-        yield self._response_factory.thread_started(
-            conversation_id=session_id, thread_id=thread_id
+        response = self._response_factory.thread_started(
+            conversation_id=session_id, thread_id=thread_id, user_query=user_input.query
         )
-        await self.session_manager.add_user_message(
-            conversation_id=session_id, thread_id=thread_id, content=user_input.query
-        )
-        thread_id = generate_thread_id()
+        await self._persist_from_buffer(response)
+        yield response
         context.thread_id = thread_id
 
         # Resume based on execution stage
@@ -288,13 +286,11 @@ async def _handle_new_request(
         """Handle a new user request"""
         session_id = user_input.meta.session_id
         thread_id = generate_thread_id()
-        yield self._response_factory.thread_started(
-            conversation_id=session_id, thread_id=thread_id
-        )
-        # Add user message to session
-        await self.session_manager.add_user_message(
-            conversation_id=session_id, thread_id=thread_id, content=user_input.query
+        response = self._response_factory.thread_started(
+            conversation_id=session_id, thread_id=thread_id, user_query=user_input.query
         )
+        await self._persist_from_buffer(response)
+        yield response
 
         # Create planning task with user input callback
         context_aware_callback = self._create_context_aware_callback(session_id)
@@ -305,7 +301,7 @@ async def _handle_new_request(
 
         # Monitor planning progress
         async for response in self._monitor_planning_task(
-            planning_task, generate_thread_id(), user_input, context_aware_callback
+            planning_task, thread_id, user_input, context_aware_callback
         ):
             yield response
 
diff --git a/python/valuecell/core/coordinate/response.py b/python/valuecell/core/coordinate/response.py
index 41da5b81d..4940d3881 100644
--- a/python/valuecell/core/coordinate/response.py
+++ b/python/valuecell/core/coordinate/response.py
@@ -22,7 +22,7 @@
     ToolCallResponse,
     UnifiedResponseData,
 )
-from valuecell.utils.uuid import generate_item_id
+from valuecell.utils.uuid import generate_item_id, generate_uuid
 
 
 class ResponseFactory:
@@ -32,11 +32,15 @@ def conversation_started(self, conversation_id: str) -> ConversationStartedRespo
         )
 
     def thread_started(
-        self, conversation_id: str, thread_id: str
+        self, conversation_id: str, thread_id: str, user_query: str
     ) -> ThreadStartedResponse:
         return ThreadStartedResponse(
             data=UnifiedResponseData(
-                conversation_id=conversation_id, thread_id=thread_id, role=Role.SYSTEM
+                conversation_id=conversation_id,
+                thread_id=thread_id,
+                task_id=generate_uuid("user-query"),
+                payload=BaseResponseDataPayload(content=user_query),
+                role=Role.USER,
             )
         )
 
@@ -44,7 +48,8 @@ def system_failed(self, conversation_id: str, content: str) -> SystemFailedRespo
         return SystemFailedResponse(
             data=UnifiedResponseData(
                 conversation_id=conversation_id,
-                payload=BaseResponseDataPayload(content=content, role=Role.SYSTEM),
+                payload=BaseResponseDataPayload(content=content),
+                role=Role.SYSTEM,
             )
         )
 
@@ -64,7 +69,8 @@ def plan_require_user_input(
             data=UnifiedResponseData(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
-                payload=BaseResponseDataPayload(content=content, role=Role.AGENT),
+                payload=BaseResponseDataPayload(content=content),
+                role=Role.SYSTEM,
             )
         )
 
@@ -75,7 +81,8 @@ def plan_failed(
             data=UnifiedResponseData(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
-                payload=BaseResponseDataPayload(content=content, role=Role.SYSTEM),
+                payload=BaseResponseDataPayload(content=content),
+                role=Role.SYSTEM,
             )
         )
 
@@ -91,7 +98,8 @@ def task_failed(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
                 task_id=task_id,
-                payload=BaseResponseDataPayload(content=content, role=Role.AGENT),
+                payload=BaseResponseDataPayload(content=content),
+                role=Role.AGENT,
             )
         )
 
@@ -179,11 +187,8 @@ def reasoning(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
                 task_id=task_id,
-                payload=(
-                    BaseResponseDataPayload(content=content, role=Role.AGENT)
-                    if content
-                    else None
-                ),
+                payload=(BaseResponseDataPayload(content=content) if content else None),
+                role=Role.AGENT,
             ),
         )
 
@@ -203,7 +208,7 @@ def component_generator(
                 payload=ComponentGeneratorResponseDataPayload(
                     content=content,
                     component_type=component_type,
-                    role=Role.AGENT,
                 ),
+                role=Role.AGENT,
             ),
         )
diff --git a/python/valuecell/core/coordinate/response_buffer.py b/python/valuecell/core/coordinate/response_buffer.py
index 4c45b632d..06790f435 100644
--- a/python/valuecell/core/coordinate/response_buffer.py
+++ b/python/valuecell/core/coordinate/response_buffer.py
@@ -73,6 +73,7 @@ def __init__(self):
             CommonResponseEvent.COMPONENT_GENERATOR,
             NotifyResponseEvent.MESSAGE,
             SystemResponseEvent.PLAN_REQUIRE_USER_INPUT,
+            SystemResponseEvent.THREAD_STARTED,
         }
         self._buffered_events = {
             StreamResponseEvent.MESSAGE_CHUNK,
diff --git a/python/valuecell/core/session/manager.py b/python/valuecell/core/session/manager.py
index 1ca75507e..ade9a65af 100644
--- a/python/valuecell/core/session/manager.py
+++ b/python/valuecell/core/session/manager.py
@@ -70,21 +70,6 @@ async def session_exists(self, session_id: str) -> bool:
         """Check if session exists"""
         return await self.session_store.session_exists(session_id)
 
-    async def add_user_message(
-        self,
-        conversation_id: str,
-        thread_id: str,
-        content: str,
-    ) -> Optional[ConversationItem]:
-        """Add user message to session"""
-        return await self.add_message(
-            role=Role.USER,
-            event=StreamResponseEvent.MESSAGE_CHUNK,
-            conversation_id=conversation_id,
-            thread_id=thread_id,
-            payload=BaseResponseDataPayload(content=content),
-        )
-
     async def add_message(
         self,
         role: Role,

From 5085c387ca348733f51974445b56877d34a37d31 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 21:39:52 +0800
Subject: [PATCH 12/21] fix: update media type to text/event-stream for
 streaming responses

---
 python/valuecell/server/api/routers/agent_stream.py | 3 +--
 1 file changed, 1 insertion(+), 2 deletions(-)

diff --git a/python/valuecell/server/api/routers/agent_stream.py b/python/valuecell/server/api/routers/agent_stream.py
index 52210afad..1937db43b 100644
--- a/python/valuecell/server/api/routers/agent_stream.py
+++ b/python/valuecell/server/api/routers/agent_stream.py
@@ -40,11 +40,10 @@ async def generate_stream():
 
             return StreamingResponse(
                 generate_stream(),
-                media_type="text/plain",
+                media_type="text/event-stream",
                 headers={
                     "Cache-Control": "no-cache",
                     "Connection": "keep-alive",
-                    "Content-Type": "text/event-stream",
                 },
             )
 

From 6bed66104c485f6a3d52ae554bd468b440cbc37e Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 21:49:19 +0800
Subject: [PATCH 13/21] feat: add aiosqlite package with dependencies to
 uv.lock

---
 python/third_party/ai-hedge-fund/uv.lock | 14 ++++++++++++++
 1 file changed, 14 insertions(+)

diff --git a/python/third_party/ai-hedge-fund/uv.lock b/python/third_party/ai-hedge-fund/uv.lock
index 4623ce045..3d8de0abe 100644
--- a/python/third_party/ai-hedge-fund/uv.lock
+++ b/python/third_party/ai-hedge-fund/uv.lock
@@ -215,6 +215,18 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/fb/76/641ae371508676492379f16e2fa48f4e2c11741bd63c48be4b12a6b09cba/aiosignal-1.4.0-py3-none-any.whl", hash = "sha256:053243f8b92b990551949e63930a839ff0cf0b0ebbe0597b0f3fb19e1a0fe82e", size = 7490, upload-time = "2025-07-03T22:54:42.156Z" },
 ]
 
+[[package]]
+name = "aiosqlite"
+version = "0.21.0"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "typing-extensions" },
+]
+sdist = { url = "https://files.pythonhosted.org/packages/13/7d/8bca2bf9a247c2c5dfeec1d7a5f40db6518f88d314b8bca9da29670d2671/aiosqlite-0.21.0.tar.gz", hash = "sha256:131bb8056daa3bc875608c631c678cda73922a2d4ba8aec373b19f18c17e7aa3", size = 13454, upload-time = "2025-02-03T07:30:16.235Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/f5/10/6c25ed6de94c49f88a91fa5018cb4c0f3625f31d5be9f771ebe5cc7cd506/aiosqlite-0.21.0-py3-none-any.whl", hash = "sha256:2549cf4057f95f53dcba16f2b64e8e2791d7e1adedb13197dd8ed77bb226d7d0", size = 15792, upload-time = "2025-02-03T07:30:13.6Z" },
+]
+
 [[package]]
 name = "akracer"
 version = "0.0.14"
@@ -3083,6 +3095,7 @@ source = { editable = "../../" }
 dependencies = [
     { name = "a2a-sdk", extra = ["http-server"] },
     { name = "agno", extra = ["openai"] },
+    { name = "aiosqlite" },
     { name = "akshare" },
     { name = "edgartools" },
     { name = "fastapi" },
@@ -3100,6 +3113,7 @@ dependencies = [
 requires-dist = [
     { name = "a2a-sdk", extras = ["http-server"], specifier = ">=0.3.4" },
     { name = "agno", extras = ["openai"], specifier = ">=1.8.2,<2.0" },
+    { name = "aiosqlite", specifier = ">=0.19.0" },
     { name = "akshare", specifier = ">=1.17.44" },
     { name = "edgartools", specifier = ">=4.12.2" },
     { name = "fastapi", specifier = ">=0.104.0" },

From fe1ab30f9ce9ba40d2a4d2ede33333af6a4c0c9f Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 23:12:53 +0800
Subject: [PATCH 14/21] feat: refactor hedge fund streaming to use async
 methods for improved performance

---
 python/third_party/ai-hedge-fund/adapter/__main__.py | 9 +++++----
 1 file changed, 5 insertions(+), 4 deletions(-)

diff --git a/python/third_party/ai-hedge-fund/adapter/__main__.py b/python/third_party/ai-hedge-fund/adapter/__main__.py
index 91663ad92..28b3f26d2 100644
--- a/python/third_party/ai-hedge-fund/adapter/__main__.py
+++ b/python/third_party/ai-hedge-fund/adapter/__main__.py
@@ -62,7 +62,7 @@ async def stream(
         logger.info(
             f"Parsing query: {query}. Task ID: {task_id}, Session ID: {session_id}"
         )
-        run_response = self.agno_agent.run(
+        run_response = await self.agno_agent.arun(
             f"Parse the following hedge fund analysis request and extract the parameters: {query}"
         )
         hedge_fund_request = run_response.content
@@ -101,7 +101,7 @@ async def stream(
         }
 
         logger.info(f"Start analyzing. Task ID: {task_id}, Session ID: {session_id}")
-        for _, chunk in run_hedge_fund_stream(
+        async for _, chunk in run_hedge_fund_stream(
             tickers=hedge_fund_request.tickers,
             start_date=start_date,
             end_date=end_date,
@@ -116,7 +116,7 @@ async def stream(
         yield streaming.done()
 
 
-def run_hedge_fund_stream(
+async def run_hedge_fund_stream(
     tickers: list[str],
     start_date: str,
     end_date: str,
@@ -153,7 +153,8 @@ def run_hedge_fund_stream(
                 "model_provider": model_provider,
             },
         }
-        yield from _agent.stream(inputs, stream_mode=["custom", "messages"])
+        async for res in _agent.astream(inputs, stream_mode=["custom", "messages"]):
+            yield res
     finally:
         # Stop progress tracking
         progress.stop()

From 773938dea28de68d061b3ddc2d82f772038046e0 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 23:15:21 +0800
Subject: [PATCH 15/21] feat: remove unused artifact update logic and adding
 message type checks

---
 python/valuecell/core/agent/decorator.py      | 58 ++++++-------------
 python/valuecell/core/agent/responses.py      |  7 +++
 .../valuecell/core/coordinate/orchestrator.py |  8 +--
 .../core/coordinate/response_router.py        | 55 ++++++++----------
 4 files changed, 50 insertions(+), 78 deletions(-)

diff --git a/python/valuecell/core/agent/decorator.py b/python/valuecell/core/agent/decorator.py
index b991a5746..e3d7cc81a 100644
--- a/python/valuecell/core/agent/decorator.py
+++ b/python/valuecell/core/agent/decorator.py
@@ -118,33 +118,6 @@ async def execute(self, context: RequestContext, event_queue: EventQueue) -> Non
         task_id = task.id
         session_id = task.context_id
         updater = TaskUpdater(event_queue, task_id, session_id)
-        artifact_id = f"artifact-{agent_name}-{session_id}-{task_id}"
-        chunk_idx = -1
-
-        # Local helper to add a chunk
-        async def _add_chunk(
-            response: StreamResponse | NotifyResponse, is_complete: bool
-        ):
-            nonlocal chunk_idx
-
-            chunk_idx += 1
-            if not response.content:
-                return
-
-            parts = [Part(root=TextPart(text=response.content))]
-            response_event = response.event
-            metadata = {
-                "response_event": response_event.value,
-            }
-            if response_event == CommonResponseEvent.COMPONENT_GENERATOR:
-                metadata["component_type"] = response.metadata.get("component_type")
-            await updater.add_artifact(
-                parts=parts,
-                artifact_id=artifact_id,
-                append=chunk_idx > 0,
-                last_chunk=is_complete,
-                metadata=metadata,
-            )
 
         # Stream from the user agent and update task incrementally
         await updater.update_status(
@@ -170,32 +143,34 @@ async def _add_chunk(
                     )
 
                 is_complete = EventPredicates.is_task_completed(response_event)
+                metadata = {"response_event": response_event.value}
                 if EventPredicates.is_tool_call(response_event):
+                    metadata["tool_call_id"] = response.metadata.get("tool_call_id")
+                    metadata["tool_name"] = response.metadata.get("tool_name")
+                    metadata["tool_result"] = response.metadata.get("content")
                     await updater.update_status(
                         TaskState.working,
                         message=new_agent_text_message(response.content or ""),
-                        metadata={
-                            "event": response_event.value,
-                            "tool_call_id": response.metadata.get("tool_call_id"),
-                            "tool_name": response.metadata.get("tool_name"),
-                            "tool_result": response.metadata.get("content"),
-                        },
+                        metadata=metadata,
                     )
                     continue
                 if EventPredicates.is_reasoning(response_event):
                     await updater.update_status(
                         TaskState.working,
                         message=new_agent_text_message(response.content or ""),
-                        metadata={
-                            "event": response_event.value,
-                        },
+                        metadata=metadata,
                     )
                     continue
 
-                await _add_chunk(response, is_complete=is_complete)
-                if is_complete:
-                    await updater.complete()
-                    break
+                if not response.content:
+                    continue
+                if response_event == CommonResponseEvent.COMPONENT_GENERATOR:
+                    metadata["component_type"] = response.metadata.get("component_type")
+                await updater.update_status(
+                    TaskState.working,
+                    message=new_agent_text_message(response.content or ""),
+                    metadata=metadata,
+                )
 
         except Exception as e:
             message = f"Error during {agent_name} agent execution: {e}"
@@ -203,8 +178,9 @@ async def _add_chunk(
             await updater.update_status(
                 TaskState.failed,
                 message=new_agent_text_message(message, session_id, task_id),
-                final=True,
             )
+        finally:
+            await updater.complete()
 
     async def cancel(self, context: RequestContext, event_queue: EventQueue) -> None:
         # Default cancel operation
diff --git a/python/valuecell/core/agent/responses.py b/python/valuecell/core/agent/responses.py
index 694334a58..8ef129d2f 100644
--- a/python/valuecell/core/agent/responses.py
+++ b/python/valuecell/core/agent/responses.py
@@ -136,6 +136,13 @@ def is_reasoning(response_type) -> bool:
             StreamResponseEvent.REASONING_COMPLETED,
         }
 
+    @staticmethod
+    def is_message(response_type) -> bool:
+        return response_type in {
+            StreamResponseEvent.MESSAGE_CHUNK,
+            NotifyResponseEvent.MESSAGE,
+        }
+
 
 __all__ = [
     "streaming",
diff --git a/python/valuecell/core/coordinate/orchestrator.py b/python/valuecell/core/coordinate/orchestrator.py
index 583b9e8d7..9bf563467 100644
--- a/python/valuecell/core/coordinate/orchestrator.py
+++ b/python/valuecell/core/coordinate/orchestrator.py
@@ -9,7 +9,6 @@
 from valuecell.core.coordinate.response_router import (
     RouteResult,
     SideEffectKind,
-    handle_artifact_update,
     handle_status_update,
 )
 from valuecell.core.session import SessionStatus, get_default_session_manager
@@ -566,12 +565,9 @@ async def _execute_task_with_input_support(
                     continue
 
                 if isinstance(event, TaskArtifactUpdateEvent):
-                    responses = await handle_artifact_update(
-                        self._response_factory, task, thread_id, event
+                    logger.info(
+                        f"Received unexpected artifact update for task {task.task_id}: {event}"
                     )
-                    for r in responses:
-                        r = self._response_buffer.annotate(r)
-                        yield r
                     continue
 
             # Complete task successfully
diff --git a/python/valuecell/core/coordinate/response_router.py b/python/valuecell/core/coordinate/response_router.py
index 5122da0b0..bca1b6fd9 100644
--- a/python/valuecell/core/coordinate/response_router.py
+++ b/python/valuecell/core/coordinate/response_router.py
@@ -3,7 +3,7 @@
 from enum import Enum
 from typing import List, Optional
 
-from a2a.types import TaskArtifactUpdateEvent, TaskState, TaskStatusUpdateEvent
+from a2a.types import TaskState, TaskStatusUpdateEvent
 from a2a.utils import get_message_text
 from valuecell.core.agent.responses import EventPredicates
 from valuecell.core.coordinate.response import ResponseFactory
@@ -11,8 +11,6 @@
 from valuecell.core.types import (
     BaseResponse,
     CommonResponseEvent,
-    ComponentGeneratorResponse,
-    MessageResponse,
 )
 
 logger = logging.getLogger(__name__)
@@ -95,6 +93,7 @@ async def handle_status_update(
         return RouteResult(responses)
 
     # Reasoning messages
+    content = get_message_text(event.status.message, "")
     if state == TaskState.working and EventPredicates.is_reasoning(response_event):
         responses.append(
             response_factory.reasoning(
@@ -102,27 +101,17 @@ async def handle_status_update(
                 thread_id=thread_id,
                 task_id=task.task_id,
                 event=response_event,
-                content=get_message_text(event.status.message, ""),
+                content=content,
             )
         )
         return RouteResult(responses)
 
-    return RouteResult(responses)
-
-
-async def handle_artifact_update(
-    response_factory: ResponseFactory,
-    task: Task,
-    thread_id: str,
-    event: TaskArtifactUpdateEvent,
-) -> List[MessageResponse | ComponentGeneratorResponse]:
-    responses: List[BaseResponse] = []
-    artifact = event.artifact
-    response_event = artifact.metadata.get("response_event")
-    content = get_message_text(artifact, "")
-
-    if response_event == CommonResponseEvent.COMPONENT_GENERATOR:
-        component_type = artifact.metadata.get("component_type", "unknown")
+    # component generator
+    if (
+        state == TaskState.working
+        and response_event == CommonResponseEvent.COMPONENT_GENERATOR
+    ):
+        component_type = event.metadata.get("component_type", "unknown")
         responses.append(
             response_factory.component_generator(
                 conversation_id=task.session_id,
@@ -132,15 +121,19 @@ async def handle_artifact_update(
                 component_type=component_type,
             )
         )
-        return responses
-
-    responses.append(
-        response_factory.message_response_general(
-            event=response_event,
-            conversation_id=task.session_id,
-            thread_id=thread_id,
-            task_id=task.task_id,
-            content=content,
+        return RouteResult(responses)
+
+    # general messages
+    if state == TaskState.working and EventPredicates.is_message(response_event):
+        responses.append(
+            response_factory.message_response_general(
+                event=response_event,
+                conversation_id=task.session_id,
+                thread_id=thread_id,
+                task_id=task.task_id,
+                content=content,
+            )
         )
-    )
-    return responses
+        return RouteResult(responses)
+
+    return RouteResult(responses)

From e03b10ca7c0b5578ce62d2470b4fbb04c6a53b91 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 23:19:12 +0800
Subject: [PATCH 16/21] fix: update task_id generation in message response to
 use 'ask' instead of 'user-query'

---
 python/valuecell/core/coordinate/response.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/python/valuecell/core/coordinate/response.py b/python/valuecell/core/coordinate/response.py
index 4940d3881..f2de55e12 100644
--- a/python/valuecell/core/coordinate/response.py
+++ b/python/valuecell/core/coordinate/response.py
@@ -38,7 +38,7 @@ def thread_started(
             data=UnifiedResponseData(
                 conversation_id=conversation_id,
                 thread_id=thread_id,
-                task_id=generate_uuid("user-query"),
+                task_id=generate_uuid("ask"),
                 payload=BaseResponseDataPayload(content=user_query),
                 role=Role.USER,
             )

From f17d50a8edead15f9f6e64875c57d6323d9002b8 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 23:23:19 +0800
Subject: [PATCH 17/21] fix lint

---
 python/valuecell/core/agent/decorator.py | 3 +--
 python/valuecell/core/session/manager.py | 2 --
 2 files changed, 1 insertion(+), 4 deletions(-)

diff --git a/python/valuecell/core/agent/decorator.py b/python/valuecell/core/agent/decorator.py
index e3d7cc81a..99e064bad 100644
--- a/python/valuecell/core/agent/decorator.py
+++ b/python/valuecell/core/agent/decorator.py
@@ -13,7 +13,7 @@
     InMemoryTaskStore,
     TaskUpdater,
 )
-from a2a.types import AgentCard, Part, TaskState, TextPart, UnsupportedOperationError
+from a2a.types import AgentCard, TaskState, UnsupportedOperationError
 from a2a.utils import new_agent_text_message, new_task
 from a2a.utils.errors import ServerError
 from valuecell.core.agent.card import find_local_agent_card_by_agent_name
@@ -142,7 +142,6 @@ async def execute(self, context: RequestContext, event_queue: EventQueue) -> Non
                         f"Agent {agent_name} reported failure: {response.content}"
                     )
 
-                is_complete = EventPredicates.is_task_completed(response_event)
                 metadata = {"response_event": response_event.value}
                 if EventPredicates.is_tool_call(response_event):
                     metadata["tool_call_id"] = response.metadata.get("tool_call_id")
diff --git a/python/valuecell/core/session/manager.py b/python/valuecell/core/session/manager.py
index ade9a65af..e9f95c44d 100644
--- a/python/valuecell/core/session/manager.py
+++ b/python/valuecell/core/session/manager.py
@@ -3,12 +3,10 @@
 from typing import List, Optional
 
 from valuecell.core.types import (
-    BaseResponseDataPayload,
     ConversationItem,
     ConversationItemEvent,
     ResponsePayload,
     Role,
-    StreamResponseEvent,
 )
 from valuecell.utils import generate_uuid
 

From 4de81052fa3cabe5501c5b3e6bb55868774e2dc9 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 23:23:31 +0800
Subject: [PATCH 18/21] fix format

---
 python/valuecell/core/session/manager.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/python/valuecell/core/session/manager.py b/python/valuecell/core/session/manager.py
index e9f95c44d..daa1fb4cf 100644
--- a/python/valuecell/core/session/manager.py
+++ b/python/valuecell/core/session/manager.py
@@ -10,9 +10,9 @@
 )
 from valuecell.utils import generate_uuid
 
+from .message_store import InMemoryMessageStore, MessageStore, SQLiteMessageStore
 from .models import Session, SessionStatus
 from .store import InMemorySessionStore, SessionStore
-from .message_store import MessageStore, InMemoryMessageStore, SQLiteMessageStore
 
 
 class SessionManager:

From 83bbe431a965b785d8d117d1b2a6c6ae9edd7156 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Wed, 24 Sep 2025 23:36:03 +0800
Subject: [PATCH 19/21] update tests

---
 .../coordinate/tests/test_orchestrator.py     |   1 -
 .../coordinate/tests/test_response_buffer.py  | 172 ------------------
 2 files changed, 173 deletions(-)
 delete mode 100644 python/valuecell/core/coordinate/tests/test_response_buffer.py

diff --git a/python/valuecell/core/coordinate/tests/test_orchestrator.py b/python/valuecell/core/coordinate/tests/test_orchestrator.py
index ff5e711ce..113a32f10 100644
--- a/python/valuecell/core/coordinate/tests/test_orchestrator.py
+++ b/python/valuecell/core/coordinate/tests/test_orchestrator.py
@@ -346,7 +346,6 @@ async def test_create_and_close_session(
     orchestrator.task_manager.cancel_session_tasks.return_value = 1
     await orchestrator.close_session(session_id)
     orchestrator.task_manager.cancel_session_tasks.assert_called_once_with(session_id)
-    orchestrator.session_manager.add_message.assert_called_once()
 
 
 @pytest.mark.asyncio
diff --git a/python/valuecell/core/coordinate/tests/test_response_buffer.py b/python/valuecell/core/coordinate/tests/test_response_buffer.py
deleted file mode 100644
index d9555d3fe..000000000
--- a/python/valuecell/core/coordinate/tests/test_response_buffer.py
+++ /dev/null
@@ -1,172 +0,0 @@
-# ruff: noqa: F811
-import time
-
-import pytest
-from valuecell.core.coordinate.response import ResponseFactory
-from valuecell.core.coordinate.response_buffer import ResponseBuffer
-from valuecell.core.types import (
-    CommonResponseEvent,
-    NotifyResponseEvent,
-    StreamResponseEvent,
-)
-
-
-@pytest.fixture(name="ids")
-def _ids_fixture():
-    return {
-        "conversation_id": "conv-1",
-        "thread_id": "th-1",
-        "task_id": "tsk-1",
-        "subtask_id": "sub-1",
-    }
-
-
-@pytest.fixture(name="factory")
-def _factory_fixture():
-    return ResponseFactory()
-
-
-def test_buffer_accumulate_and_flush_due(ids, factory):
-    buf = ResponseBuffer(debounce_ms=0, max_chars=1024)
-
-    # two message chunks buffered
-    r1 = factory.message_response_general(
-        event=StreamResponseEvent.MESSAGE_CHUNK,
-        conversation_id=ids["conversation_id"],
-        thread_id=ids["thread_id"],
-        task_id=ids["task_id"],
-        subtask_id=ids["subtask_id"],
-        content="Hello ",
-    )
-    r2 = factory.message_response_general(
-        event=StreamResponseEvent.MESSAGE_CHUNK,
-        conversation_id=ids["conversation_id"],
-        thread_id=ids["thread_id"],
-        task_id=ids["task_id"],
-        subtask_id=ids["subtask_id"],
-        content="World",
-    )
-
-    assert buf.ingest(r1) == []
-    assert buf.ingest(r2) == []
-
-    # flush_due (debounce_ms=0) should emit one aggregated SaveMessage
-    out = buf.flush_due()
-    assert len(out) == 1
-    sm = out[0]
-    assert sm.event == StreamResponseEvent.MESSAGE_CHUNK
-    assert sm.payload.content == "Hello World"
-    # aggregated output should have its own generated item_id
-    assert sm.item_id is not None and isinstance(sm.item_id, str)
-
-
-def test_immediate_component_splits_chunks(ids, factory):
-    buf = ResponseBuffer(debounce_ms=1e5, max_chars=1024)  # prevent auto flush
-
-    # buffer one chunk
-    r_chunk = factory.message_response_general(
-        event=StreamResponseEvent.MESSAGE_CHUNK,
-        conversation_id=ids["conversation_id"],
-        thread_id=ids["thread_id"],
-        task_id=ids["task_id"],
-        subtask_id=ids["subtask_id"],
-        content="Part A",
-    )
-    assert buf.ingest(r_chunk) == []
-
-    # immediate component should flush prior chunk, then write itself
-    r_comp = factory.component_generator(
-        conversation_id=ids["conversation_id"],
-        thread_id=ids["thread_id"],
-        task_id=ids["task_id"],
-        subtask_id=ids["subtask_id"],
-        content="<div></div>",
-        component_type="html",
-    )
-    out = buf.ingest(r_comp)
-    assert len(out) == 2
-    assert out[0].event == StreamResponseEvent.MESSAGE_CHUNK
-    assert out[0].payload.content == "Part A"
-    assert out[1].event == CommonResponseEvent.COMPONENT_GENERATOR
-    assert out[1].payload.component_type == "html"
-
-    # new chunk after component becomes a new segment
-    r_chunk2 = factory.message_response_general(
-        event=StreamResponseEvent.MESSAGE_CHUNK,
-        conversation_id=ids["conversation_id"],
-        thread_id=ids["thread_id"],
-        task_id=ids["task_id"],
-        subtask_id=ids["subtask_id"],
-        content="Part B",
-    )
-    assert buf.ingest(r_chunk2) == []
-    out2 = buf.flush_due(now=time.monotonic() + 1e6)  # force flush
-    assert len(out2) == 1
-    assert out2[0].payload.content == "Part B"
-
-
-def test_boundary_done_flushes_reasoning(ids, factory):
-    buf = ResponseBuffer(debounce_ms=99999, max_chars=1024)
-
-    r1 = factory.reasoning(
-        conversation_id=ids["conversation_id"],
-        thread_id=ids["thread_id"],
-        task_id=ids["task_id"],
-        subtask_id=ids["subtask_id"],
-        event=StreamResponseEvent.REASONING,
-        content="think1",
-    )
-    r2 = factory.reasoning(
-        conversation_id=ids["conversation_id"],
-        thread_id=ids["thread_id"],
-        task_id=ids["task_id"],
-        subtask_id=ids["subtask_id"],
-        event=StreamResponseEvent.REASONING,
-        content="think2",
-    )
-    assert buf.ingest(r1) == []
-    assert buf.ingest(r2) == []
-
-    # boundary: done -> should flush reasoning, but boundary itself is not stored
-    r_done = factory.done(ids["conversation_id"], ids["thread_id"])
-    out = buf.ingest(r_done)
-    assert len(out) == 1
-    assert out[0].event == StreamResponseEvent.REASONING
-    assert out[0].payload.content == "think1think2"
-
-
-def test_size_based_flush(ids, factory):
-    buf = ResponseBuffer(debounce_ms=99999, max_chars=5)
-    # total length reaches 5, should flush immediately on third ingest
-    for part in ["12", "34", "5"]:
-        r = factory.message_response_general(
-            event=StreamResponseEvent.MESSAGE_CHUNK,
-            conversation_id=ids["conversation_id"],
-            thread_id=ids["thread_id"],
-            task_id=ids["task_id"],
-            subtask_id=ids["subtask_id"],
-            content=part,
-        )
-        out = buf.ingest(r)
-    # last ingest should have triggered immediate flush
-    assert len(out) == 1
-    assert out[0].event == StreamResponseEvent.MESSAGE_CHUNK
-    assert out[0].payload.content == "12345"
-
-
-def test_immediate_message(ids, factory):
-    buf = ResponseBuffer()
-    r = factory.message_response_general(
-        event=NotifyResponseEvent.MESSAGE,
-        conversation_id=ids["conversation_id"],
-        thread_id=ids["thread_id"],
-        task_id=ids["task_id"],
-        subtask_id=ids["subtask_id"],
-        content="hi",
-    )
-    out = buf.ingest(r)
-    assert len(out) == 1
-    assert out[0].event == NotifyResponseEvent.MESSAGE
-    assert out[0].payload.content == "hi"
-    # immediate output should carry the BaseResponse item_id
-    assert out[0].item_id == r.item_id

From 0287fd3fd031916921efaa336940d22ce1fcb983 Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Thu, 25 Sep 2025 00:04:23 +0800
Subject: [PATCH 20/21] refactor: add session history methods and response
 conversion functionality

---
 .../valuecell/core/coordinate/orchestrator.py |  13 +--
 python/valuecell/core/coordinate/response.py  | 106 ++++++++++++++++++
 .../coordinate/tests/test_orchestrator.py     |  25 -----
 .../coordinate/tests/test_response_factory.py | 102 +++++++++++++++++
 python/valuecell/core/session/manager.py      |   5 +-
 5 files changed, 212 insertions(+), 39 deletions(-)
 create mode 100644 python/valuecell/core/coordinate/tests/test_response_factory.py

diff --git a/python/valuecell/core/coordinate/orchestrator.py b/python/valuecell/core/coordinate/orchestrator.py
index 9bf563467..a7a0f8089 100644
--- a/python/valuecell/core/coordinate/orchestrator.py
+++ b/python/valuecell/core/coordinate/orchestrator.py
@@ -193,10 +193,6 @@ def get_user_input_prompt(self, session_id: str) -> Optional[str]:
         """Get the user input prompt for a specific session"""
         return self.user_input_manager.get_request_prompt(session_id)
 
-    async def create_session(self, user_id: str, title: str = None):
-        """Create a new session for the user"""
-        return await self.session_manager.create_session(user_id, title)
-
     async def close_session(self, session_id: str):
         """Close an existing session and clean up resources"""
         # Cancel any running tasks for this session
@@ -205,13 +201,10 @@ async def close_session(self, session_id: str):
         # Clean up execution context
         await self._cancel_execution(session_id)
 
-    async def get_session_history(self, session_id: str):
+    async def get_session_history(self, session_id: str) -> list[BaseResponse]:
         """Get session message history"""
-        return await self.session_manager.get_session_messages(session_id)
-
-    async def get_user_sessions(self, user_id: str, limit: int = 100, offset: int = 0):
-        """Get all sessions for a user"""
-        return await self.session_manager.list_user_sessions(user_id, limit, offset)
+        items = await self.session_manager.get_session_messages(session_id)
+        return [self._response_factory.from_conversation_item(it) for it in items]
 
     async def cleanup(self):
         """Cleanup resources and expired contexts"""
diff --git a/python/valuecell/core/coordinate/response.py b/python/valuecell/core/coordinate/response.py
index f2de55e12..285a1adce 100644
--- a/python/valuecell/core/coordinate/response.py
+++ b/python/valuecell/core/coordinate/response.py
@@ -3,8 +3,10 @@
 from typing_extensions import Literal
 from valuecell.core.types import (
     BaseResponseDataPayload,
+    CommonResponseEvent,
     ComponentGeneratorResponse,
     ComponentGeneratorResponseDataPayload,
+    ConversationItem,
     ConversationStartedResponse,
     DoneResponse,
     MessageResponse,
@@ -15,8 +17,10 @@
     Role,
     StreamResponseEvent,
     SystemFailedResponse,
+    SystemResponseEvent,
     TaskCompletedResponse,
     TaskFailedResponse,
+    TaskStatusEvent,
     ThreadStartedResponse,
     ToolCallPayload,
     ToolCallResponse,
@@ -26,6 +30,108 @@
 
 
 class ResponseFactory:
+    def from_conversation_item(self, item: ConversationItem):
+        """Reconstruct a BaseResponse from a persisted ConversationItem.
+
+        - Maps the stored event to the appropriate Response subtype
+        - Parses payload JSON back into the right payload model when possible
+        - Preserves the original item_id so callers can correlate history items
+        """
+
+        # Coerce enums that may have been persisted as strings
+        ev = item.event
+        if isinstance(ev, str):
+            for enum_cls in (
+                SystemResponseEvent,
+                StreamResponseEvent,
+                NotifyResponseEvent,
+                CommonResponseEvent,
+                TaskStatusEvent,
+            ):
+                try:
+                    ev = enum_cls(ev)  # type: ignore[arg-type]
+                    break
+                except Exception:
+                    continue
+
+        role = item.role
+        if isinstance(role, str):
+            try:
+                role = Role(role)
+            except Exception:
+                role = Role.AGENT
+
+        # Helpers for payload parsing
+        def parse_payload_as(model_cls):
+            raw = item.payload
+            if raw is None:
+                return None
+            try:
+                return model_cls.model_validate_json(raw)
+            except Exception:
+                # Fallback to plain text payload
+                try:
+                    return BaseResponseDataPayload(content=str(raw))
+                except Exception:
+                    return None
+
+        # Base UnifiedResponseData builder
+        def make_data(payload=None):
+            return UnifiedResponseData(
+                conversation_id=item.conversation_id,
+                thread_id=item.thread_id,
+                task_id=item.task_id,
+                payload=payload,
+                role=role,
+                item_id=item.item_id,
+            )
+
+        # ----- System-level events -----
+        if ev == SystemResponseEvent.THREAD_STARTED:
+            payload = parse_payload_as(BaseResponseDataPayload)
+            return ThreadStartedResponse(data=make_data(payload))
+
+        if ev == SystemResponseEvent.PLAN_REQUIRE_USER_INPUT:
+            payload = parse_payload_as(BaseResponseDataPayload)
+            return PlanRequireUserInputResponse(data=make_data(payload))
+
+        # ----- Stream/notify/common events -----
+        if ev == StreamResponseEvent.MESSAGE_CHUNK:
+            payload = parse_payload_as(BaseResponseDataPayload)
+            return MessageResponse(
+                event=StreamResponseEvent.MESSAGE_CHUNK, data=make_data(payload)
+            )
+
+        if ev == NotifyResponseEvent.MESSAGE:
+            payload = parse_payload_as(BaseResponseDataPayload)
+            return MessageResponse(
+                event=NotifyResponseEvent.MESSAGE, data=make_data(payload)
+            )
+
+        if ev in (
+            StreamResponseEvent.REASONING,
+            StreamResponseEvent.REASONING_STARTED,
+            StreamResponseEvent.REASONING_COMPLETED,
+        ):
+            payload = parse_payload_as(BaseResponseDataPayload)
+            # ReasoningResponse accepts optional payload
+            return ReasoningResponse(event=ev, data=make_data(payload))
+
+        if ev == CommonResponseEvent.COMPONENT_GENERATOR:
+            payload = parse_payload_as(ComponentGeneratorResponseDataPayload)
+            return ComponentGeneratorResponse(data=make_data(payload))
+
+        if ev in (
+            StreamResponseEvent.TOOL_CALL_STARTED,
+            StreamResponseEvent.TOOL_CALL_COMPLETED,
+        ):
+            payload = parse_payload_as(ToolCallPayload)
+            return ToolCallResponse(event=ev, data=make_data(payload))
+
+        raise ValueError(
+            f"Unsupported event type: {ev} when processing conversation item."
+        )
+
     def conversation_started(self, conversation_id: str) -> ConversationStartedResponse:
         return ConversationStartedResponse(
             data=UnifiedResponseData(conversation_id=conversation_id, role=Role.SYSTEM)
diff --git a/python/valuecell/core/coordinate/tests/test_orchestrator.py b/python/valuecell/core/coordinate/tests/test_orchestrator.py
index 113a32f10..434d06839 100644
--- a/python/valuecell/core/coordinate/tests/test_orchestrator.py
+++ b/python/valuecell/core/coordinate/tests/test_orchestrator.py
@@ -329,28 +329,3 @@ async def test_agent_connection_error(
         out.append(chunk)
 
     assert any("(Error)" in c.data.payload.content for c in out if c.data.payload)
-
-
-@pytest.mark.asyncio
-async def test_create_and_close_session(
-    orchestrator: AgentOrchestrator, user_id: str, session_id: str
-):
-    # create
-    new_id = await orchestrator.create_session(user_id, "Title")
-    orchestrator.session_manager.create_session.assert_called_once_with(
-        user_id, "Title"
-    )
-    assert new_id == "new-session-id"
-
-    # close
-    orchestrator.task_manager.cancel_session_tasks.return_value = 1
-    await orchestrator.close_session(session_id)
-    orchestrator.task_manager.cancel_session_tasks.assert_called_once_with(session_id)
-
-
-@pytest.mark.asyncio
-async def test_cleanup(orchestrator: AgentOrchestrator):
-    orchestrator.agent_connections = Mock()
-    orchestrator.agent_connections.stop_all = AsyncMock()
-    await orchestrator.cleanup()
-    orchestrator.agent_connections.stop_all.assert_called_once()
diff --git a/python/valuecell/core/coordinate/tests/test_response_factory.py b/python/valuecell/core/coordinate/tests/test_response_factory.py
new file mode 100644
index 000000000..3488e4fe7
--- /dev/null
+++ b/python/valuecell/core/coordinate/tests/test_response_factory.py
@@ -0,0 +1,102 @@
+import pytest
+from valuecell.core.coordinate.response import ResponseFactory
+from valuecell.core.types import (
+    BaseResponseDataPayload,
+    CommonResponseEvent,
+    ComponentGeneratorResponseDataPayload,
+    ConversationItem,
+    NotifyResponseEvent,
+    Role,
+    StreamResponseEvent,
+    SystemResponseEvent,
+    ToolCallPayload,
+)
+
+
+@pytest.fixture
+def factory() -> ResponseFactory:
+    return ResponseFactory()
+
+
+def _mk_item(
+    *,
+    event: str,
+    payload: str | None,
+    role: str | Role = "agent",
+    item_id: str = "it-1",
+    conversation_id: str = "sess-1",
+    thread_id: str | None = "th-1",
+    task_id: str | None = "tk-1",
+) -> ConversationItem:
+    return ConversationItem(
+        item_id=item_id,
+        role=role,  # stored as string in SQLite
+        event=event,  # stored as string in SQLite
+        conversation_id=conversation_id,
+        thread_id=thread_id,
+        task_id=task_id,
+        payload=payload,
+    )
+
+
+def test_thread_started_with_payload(factory: ResponseFactory):
+    payload = BaseResponseDataPayload(content="hello user").model_dump_json()
+    item = _mk_item(
+        event=SystemResponseEvent.THREAD_STARTED.value,
+        payload=payload,
+        role="user",
+    )
+    resp = factory.from_conversation_item(item)
+    assert resp.event == SystemResponseEvent.THREAD_STARTED
+    assert resp.data.payload is not None
+    assert resp.data.payload.content == "hello user"  # type: ignore[attr-defined]
+
+
+def test_message_chunk(factory: ResponseFactory):
+    payload = BaseResponseDataPayload(content="chunk").model_dump_json()
+    item = _mk_item(event=StreamResponseEvent.MESSAGE_CHUNK.value, payload=payload)
+    resp = factory.from_conversation_item(item)
+    assert resp.event == StreamResponseEvent.MESSAGE_CHUNK
+    assert resp.data.payload.content == "chunk"  # type: ignore[attr-defined]
+
+
+def test_notify_message(factory: ResponseFactory):
+    payload = BaseResponseDataPayload(content="notify").model_dump_json()
+    item = _mk_item(event=NotifyResponseEvent.MESSAGE.value, payload=payload)
+    resp = factory.from_conversation_item(item)
+    assert resp.event == NotifyResponseEvent.MESSAGE
+    assert resp.data.payload.content == "notify"  # type: ignore[attr-defined]
+
+
+def test_reasoning_with_payload(factory: ResponseFactory):
+    payload = BaseResponseDataPayload(content="thinking...").model_dump_json()
+    item = _mk_item(event=StreamResponseEvent.REASONING.value, payload=payload)
+    resp = factory.from_conversation_item(item)
+    assert resp.event == StreamResponseEvent.REASONING
+    assert resp.data.payload.content == "thinking..."  # type: ignore[attr-defined]
+
+
+def test_component_generator(factory: ResponseFactory):
+    payload = ComponentGeneratorResponseDataPayload(
+        content="render this", component_type="chart"
+    ).model_dump_json()
+    item = _mk_item(
+        event=CommonResponseEvent.COMPONENT_GENERATOR.value,
+        payload=payload,
+    )
+    resp = factory.from_conversation_item(item)
+    assert resp.event == CommonResponseEvent.COMPONENT_GENERATOR
+    assert resp.data.payload.component_type == "chart"  # type: ignore[attr-defined]
+
+
+def test_tool_call_completed(factory: ResponseFactory):
+    payload = ToolCallPayload(
+        tool_call_id="tc-1", tool_name="search", tool_result="{result}"
+    ).model_dump_json()
+    item = _mk_item(
+        event=StreamResponseEvent.TOOL_CALL_COMPLETED.value,
+        payload=payload,
+    )
+    resp = factory.from_conversation_item(item)
+    assert resp.event == StreamResponseEvent.TOOL_CALL_COMPLETED
+    assert resp.data.payload.tool_name == "search"  # type: ignore[attr-defined]
diff --git a/python/valuecell/core/session/manager.py b/python/valuecell/core/session/manager.py
index daa1fb4cf..e3294bd12 100644
--- a/python/valuecell/core/session/manager.py
+++ b/python/valuecell/core/session/manager.py
@@ -128,9 +128,6 @@ async def add_message(
     async def get_session_messages(
         self,
         session_id: str,
-        limit: Optional[int] = None,
-        offset: int = 0,
-        role: Optional[Role] = None,
     ) -> List[ConversationItem]:
         """Get messages for a session with optional filtering and pagination
 
@@ -140,7 +137,7 @@ async def get_session_messages(
             offset: Number of messages to skip
             role: Filter by specific role (optional)
         """
-        return await self.message_store.get_messages(session_id, limit, offset, role)
+        return await self.message_store.get_messages(session_id)
 
     async def get_latest_message(self, session_id: str) -> Optional[ConversationItem]:
         """Get latest message in a session"""

From d0f1d69c4733f0fa5e17700ab14a75e29e28204b Mon Sep 17 00:00:00 2001
From: Zhaofeng Zhang <24791380+vcfgv@users.noreply.github.com>
Date: Thu, 25 Sep 2025 09:29:17 +0800
Subject: [PATCH 21/21] fix: update default database path from
 valuecell_core.db to valuecell.db

---
 python/valuecell/core/session/manager.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/python/valuecell/core/session/manager.py b/python/valuecell/core/session/manager.py
index e3294bd12..4aa66d664 100644
--- a/python/valuecell/core/session/manager.py
+++ b/python/valuecell/core/session/manager.py
@@ -207,21 +207,21 @@ async def get_sessions_by_status(
 
 # Default session manager instance
 def _default_db_path() -> str:
-    """Resolve repository root and return default DB path valuecell_core.db.
+    """Resolve repository root and return default DB path valuecell.db.
 
     Layout assumption: this file is at repo_root/python/valuecell/core/session/manager.py
     We walk up 4 levels to reach repo_root.
     """
     here = os.path.dirname(__file__)
     repo_root = os.path.abspath(os.path.join(here, "..", "..", "..", ".."))
-    return os.path.join(repo_root, "valuecell_core.db")
+    return os.path.join(repo_root, "valuecell.db")
 
 
 def _resolve_db_path() -> str:
     return os.environ.get("VALUECELL_SQLITE_DB") or _default_db_path()
 
 
-# Default: use SQLite at repo root valuecell_core.db (env VALUECELL_SQLITE_DB overrides)
+# Default: use SQLite at repo root valuecell.db (env VALUECELL_SQLITE_DB overrides)
 _session_manager = SessionManager(message_store=SQLiteMessageStore(_resolve_db_path()))