From c84821639663f19984c116226c753733338e112e Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E5=B0=8F=E6=A9=98?= <xiaoju@shazhou.work>
Date: Wed, 13 May 2026 01:55:06 +0000
Subject: [PATCH] docs: RFC for workflow-agent-react package
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

小橘 🍊
---
 docs/plans/2026-05-12-react-agent.md | 194 +++++++++++++++++++++++++++
 1 file changed, 194 insertions(+)
 create mode 100644 docs/plans/2026-05-12-react-agent.md
diff --git a/docs/plans/2026-05-12-react-agent.md b/docs/plans/2026-05-12-react-agent.md
new file mode 100644
index 0000000..d9d5858
--- /dev/null
+++ b/docs/plans/2026-05-12-react-agent.md
@@ -0,0 +1,194 @@
+# workflow-agent-react — ReAct Agent Package
+
+**Status**: RFC
+**Author**: 小橘 🍊
+
+## Problem
+
+现有的 agent 包都依赖外部 CLI 进程：
+
+| Package | 机制 | 能力 |
+|---------|------|------|
+| `workflow-agent-hermes` | spawn `hermes chat` | 完整工具链（文件、终端、浏览器…） |
+| `workflow-agent-cursor` | spawn `cursor-agent` | IDE 级别代码编辑 |
+| `workflow-agent-llm` | 单轮 chat completion | 纯文本，无工具 |
+
+缺少一个 **内置 ReAct agent**：用 LLM + tool calling 循环执行任务，不依赖外部 CLI，工具集由调用方注入。
+
+用途：
+1. **Smoke test 闭环** — setup → bundle → add → run → show，用 workflow.yaml 里配置的 provider 直接跑，不需要装 hermes/cursor
+2. **轻量 agent** — 只需要读写文件 + 跑命令的场景，不需要启动完整的 CLI agent
+
+## 现有 reactor 的局限
+
+`workflow-reactor` 已有 ReAct 循环，但它是为 **structured extraction** 设计的：
+
+```typescript
+// reactor 的终止条件：拿到符合 schema 的 structured output
+ThreadReactorFn<TThread> = <T>(args: {
+  thread: TThread;
+  input: string;
+  schema: z.ZodType<T>;     // ← 强制要求
+}) => Promise<Result<T, string>>
+```
+
+agent 需要的是：**循环调用工具直到任务完成，返回自由文本**。终止条件不同，不适合硬套。
+
+## Design
+
+### 新包 `@uncaged/workflow-agent-react`
+
+依赖：
+- `@uncaged/workflow-protocol` — `AgentFn`, `AgentContext`, `LlmProvider` 类型
+- `@uncaged/workflow-reactor` — `LlmFn`, `createLlmFn`, `ChatMessage`, `ToolDefinition`, `ToolCall` 类型
+
+```
+packages/workflow-agent-react/
+  src/
+    types.ts
+    react-loop.ts         # ReAct 循环核心
+    create-react-agent.ts # AgentFn 工厂
+    index.ts
+  package.json
+```
+
+### 类型定义 (`types.ts`)
+
+```typescript
+import type { LlmProvider } from "@uncaged/workflow-protocol";
+import type { ToolDefinition } from "@uncaged/workflow-reactor";
+
+/**
+ * Tool handler: receives tool name + JSON arguments string,
+ * returns tool output as string.
+ */
+type ReactToolHandler = (name: string, args: string) => Promise<string>;
+
+type ReactAgentConfig = {
+  provider: LlmProvider;
+  tools: readonly ToolDefinition[];
+  toolHandler: ReactToolHandler;
+  maxRounds: number;
+  command: string | null;       // 保持与其他 agent 包一致，此包忽略
+};
+```
+
+### 工厂函数 (`create-react-agent.ts`)
+
+```typescript
+import type { AgentFn } from "@uncaged/workflow-protocol";
+import type { ReactAgentConfig } from "./types.js";
+
+function createReactAgent(config: ReactAgentConfig): AgentFn;
+```
+
+`AgentFn` 签名是 `(ctx: AgentContext) => Promise<AgentFnResult>`。
+
+执行流程：
+1. 从 `ctx.currentRole.systemPrompt` 取 system prompt
+2. 用 `buildAgentPrompt(ctx)` 构造完整 user message（含 thread history）
+3. 进入 ReAct 循环
+
+### ReAct 循环 (`react-loop.ts`)
+
+```typescript
+import type { LlmFn, ChatMessage, ToolDefinition, ToolCall } from "@uncaged/workflow-reactor";
+import type { ReactToolHandler } from "./types.js";
+
+type ReactLoopConfig = {
+  llm: LlmFn;
+  tools: readonly ToolDefinition[];
+  toolHandler: ReactToolHandler;
+  maxRounds: number;
+};
+
+type ReactLoopInput = {
+  systemPrompt: string;
+  userMessage: string;
+};
+
+/**
+ * Returns the assistant's final text reply (the first reply without tool calls).
+ */
+function runReactLoop(config: ReactLoopConfig, input: ReactLoopInput): Promise<string>;
+```
+
+**循环逻辑：**
+
+```
+messages = [system, user]
+for round in 0..maxRounds:
+    response = llm({ messages, tools })
+    assistant = parseAssistantMessage(response)
+    if assistant has tool_calls:
+        messages.push(assistant)
+        for each tool_call:
+            result = toolHandler(name, arguments)
+            messages.push({ role: "tool", tool_call_id, content: result })
+    else:
+        return assistant.content   // ← 终止：纯文本回复 = 任务完成
+throw Error("max rounds exceeded")
+```
+
+### 需要从 reactor 导出的公共函数
+
+reactor 内部的 assistant message 解析逻辑是私有的。react-agent 需要相同的解析能力。两个方案：
+
+**方案 A：从 reactor 导出解析函数**
+
+```typescript
+// workflow-reactor/src/index.ts 新增导出
+export { firstAssistantMessage } from "./thread-reactor.js";
+export { normalizeToolCalls } from "./thread-reactor.js";
+```
+
+**方案 B：react-agent 自己实现解析（~30 行）**
+
+考虑到解析逻辑简单且 reactor 的实现和 react-agent 的需求略有不同（reactor 需要处理 plain JSON fallback，react-agent 不需要），**倾向方案 B**，避免 reactor 为了外部消费调整内部结构。
+
+### bundle-entry 用法
+
+```typescript
+// workflows/develop/entry.ts（smoke test 用）
+import { createReactAgent } from "@uncaged/workflow-agent-react";
+import { createWorkflow } from "@uncaged/workflow-runtime";
+import { developWorkflowDefinition, buildDevelopDescriptor } from "@uncaged/workflow-template-develop";
+
+const agent = createReactAgent({
+  provider: { baseUrl: "...", apiKey: "...", model: "..." },
+  tools: [readFileTool, writeFileTool, shellExecTool],
+  toolHandler: handleTool,
+  maxRounds: 30,
+  command: null,
+});
+
+export const descriptor = buildDevelopDescriptor();
+export const run = createWorkflow(developWorkflowDefinition, { agent, overrides: null });
+```
+
+## 工具集（后续讨论）
+
+最小闭环需要的工具待定，候选参考 hermes builtin：
+
+| 工具 | 说明 | 优先级 |
+|------|------|--------|
+| `read_file` | 读文件 | P0 |
+| `write_file` | 写文件 | P0 |
+| `patch_file` | find-and-replace 编辑 | P0 |
+| `shell_exec` | 执行 shell 命令 | P0 |
+| `search_files` | grep / find | P1 |
+| `list_files` | ls | P1 |
+
+工具实现放在 react-agent 包内还是独立包，取决于复用需求。
+
+## 不做的事
+
+- **不泛化 reactor** — reactor 的 structured extraction 循环和 agent 的自由文本循环是两个不同的关注点，不强行统一
+- **不处理 childThread** — react-agent 返回纯文本 `string`，不支持嵌套 workflow（那是 `workflowAsAgent` 的事）
+- **不内置 system prompt** — 直接用 role definition 里的 `systemPrompt`，不额外包装
+
+## Phases
+
+1. **Phase 1**: 包骨架 + ReAct 循环 + `createReactAgent` + 测试（mock LLM）
+2. **Phase 2**: 工具集实现（read/write/patch/shell）
+3. **Phase 3**: bundle-entry 集成 + smoke test 闭环