agent-teams-eval

Here are 4 public repositories matching this topic...

kar-ganap / ate-series

Agent Teams Eval: experimental series comparing Claude Code Agent Teams vs subagents across bug-fixing, feature implementation, and architecture design.

multi-agent-systems claude-code agent-teams subagents research-index agent-teams-eval

Updated Feb 26, 2026

kar-ganap / ate-features

Star

Agent Teams Eval: comparing Claude Code Agent Teams vs single-agent for feature implementation on LangGraph. Ceiling effect, 3.6x speedup, zero peer communication.

multi-agent-systems feature-implementation langgraph experimental-research claude-code agent-teams subagents agent-teams-eval

Updated Feb 26, 2026
Python

kar-ganap / ate-arch

Star

Agent Teams Eval: comparing Claude Code Agent Teams vs subagents for architecture design. First significant result — Agent Teams advantage d=+0.99, p=0.014.

software-architecture multi-agent-systems llm-as-judge experimental-research claude-code agent-teams subagents agent-teams-eval stakeholder-simulation