feat(cli-workflow): implement multi-strategy workflow resolution for issue #428

- Add 4-strategy resolution priority: CAS hash → file path → local discovery → global registry - Add helper functions: isFilePath, workflowFileExists, findWorkflowInDir, findWorkflowInParents - Refactor resolveWorkflowCasRef to support direct hash, explicit paths, and parent traversal - Add comprehensive test suite with 24 tests covering all strategies and edge cases - Support .workflow/ and .workflows/ directories with .yaml/.yml extensions - All 60 tests pass across 5 test files Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-05-23 11:05:22 +00:00
47 changed files with 537 additions and 2845 deletions
@@ -1,67 +0,0 @@
-# Sync README
-
-When updating README.md files in this monorepo, follow these conventions.
-
-## Scope
-
- Root `README.md` — project overview and navigation hub
- Per-package `packages/*/README.md` — each package self-contained
-
-## Root README Structure
-
-The root README should have these sections in order:
-
-1. **Title and one-liner** — stateless workflow engine driven by single-step CLI
-2. **Overview** — 2-3 paragraphs explaining what it does and key concepts
-3. **Architecture** — dependency layer diagram (text-based)
-4. **Packages** — table with ALL packages from packages/ directory, columns: Package, Description, Type (cli/lib/agent/app)
-5. **Quick Start** — install, build, register workflow, start thread, run step
-6. **CLI Reference** — brief command list, detailed usage in cli-workflow README
-7. **Development** — bun install / build / check / test
-
-## Per-Package README Structure
-
-Each package README should have:
-
-1. **Title** — package name
-2. **One-line description** — matching package.json
-3. **Overview** — what it does, where it sits in the architecture, dependencies
-4. **Installation** — bun add (for libs) or "included as binary" (for cli/agents)
-5. **API** (lib packages) — all exports from src/index.ts with type signatures, grouped by category, minimal usage examples
-6. **CLI Usage** (cli/agent packages) — command reference with examples
-7. **Internal Structure** — brief src/ file organization
-8. **Configuration** (if applicable)
-
-## Execution Steps
-
-### Step 1: Gather current state
-For each package read:
- package.json (name, version, description, dependencies, bin)
- src/index.ts (public API exports)
- Existing README.md (preserve hand-written content worth keeping)
-
-### Step 2: Update root README
- Ensure ALL packages in packages/ directory are listed in the table
- Update CLI command reference from uwf --help output
- Keep Quick Start examples valid
-
-### Step 3: Write/update each package README
- Follow the per-package structure
- API section MUST match actual src/index.ts exports — never invent
- For agent packages: document CLI binary name, how it is invoked
- For lib packages: document exported types and functions
- Internal structure: list actual files in src/
-
-### Step 4: Verify
- All relative links work
- Package names match package.json
- No references to removed/renamed packages
- bun run build still passes
-
-## Guidelines
-
- Only document what src/index.ts actually exports
- Root README summarizes, package READMEs go into detail
- Verify CLI examples against actual commands
- Preserve existing good prose when updating
- English for all README content
@@ -41,8 +41,7 @@ roles:
      Before starting any work, ensure a clean worktree:
      1. `git checkout main && git pull` to get the latest code
      2. `git checkout -b fix/<issue-number>-<short-description>` to create a fresh branch
-         - If bounced back from reviewer or tester, reuse the existing branch and rebase onto latest main:
-           `git checkout main && git pull && git checkout <branch> && git rebase main`
+         - If bounced back from reviewer or tester, reuse the existing branch instead

      Then implement TDD:
      3. Read the test spec from CAS: `uwf cas get <plan hash>` (find the hash from the latest planner step's frontmatter.plan)
@@ -2,102 +2,92 @@

 A stateless workflow engine driven by a single-step CLI. Workflows are YAML definitions with roles, JSONata routing conditions, and a directed graph. Threads are immutable CAS-linked chains — each `uwf thread step` runs one moderator→agent→extract cycle and exits.

-## Overview
+## Package Map

-This monorepo implements **uwf**, a workflow engine with no long-running daemon. You register YAML workflow definitions in a content-addressed store (CAS), start a thread with an initial prompt, then invoke `uwf thread step` repeatedly until the moderator routes to `$END`. Each step is a complete process: the moderator evaluates JSONata conditions to pick the next role, an external agent CLI produces frontmatter markdown output, and an extract pipeline validates or structures that output against the role's JSON Schema.
+| Package | npm | Role |
+|---------|-----|------|
+| `cli-workflow` | `@uncaged/cli-workflow` | `uwf` CLI binary — thread lifecycle, workflow registry, CAS inspection, setup |
+| `workflow-protocol` | `@uncaged/workflow-protocol` | Shared TypeScript types (`WorkflowPayload`, `StepNodePayload`, `WorkflowConfig`, etc.) |
+| `workflow-moderator` | `@uncaged/workflow-moderator` | JSONata graph evaluator — determines next role or `$END` |
+| `workflow-agent-kit` | `@uncaged/workflow-agent-kit` | `createAgent` factory, context builder, two-layer extract pipeline |
+| `workflow-agent-hermes` | `@uncaged/workflow-agent-hermes` | `uwf-hermes` agent — spawns Hermes chat, captures session |
+| `workflow-util` | `@uncaged/workflow-util` | Crockford Base32, ULID, logger, frontmatter parsing |

-Workflow state lives entirely on disk under `~/.uncaged/workflow/`: CAS nodes for definitions and step payloads, `registry.yaml` for workflow name→hash mappings, and `threads.yaml` for active thread head pointers. Completed threads are archived to `history.jsonl`. Because there is no server process, workflows are easy to debug, fork, and inspect with ordinary CLI tools.
-
-Agents are pluggable CLI binaries (`uwf-hermes`, `uwf-builtin`, `uwf-claude-code`, or custom commands). The engine spawns the configured agent with `<thread-id>` and `<role>`, sets `UWF_EDGE_PROMPT` from the graph transition, and captures both the agent's markdown output and a detail CAS node for session replay.
-
-## Architecture
-
-Dependency layers (lower layers have no dependency on higher layers):
-
-```
-Layer 0 — Contract
-  workflow-protocol          Shared types and JSON Schema definitions
-
-Layer 1 — Shared infra
-  workflow-util              Encoding, IDs, logging, frontmatter, paths
-  workflow-moderator         JSONata graph evaluator
-
-Layer 2 — Agent framework
-  workflow-agent-kit         createAgent factory, context builder, extract pipeline
-
-Layer 3 — Agent implementations
-  workflow-agent-hermes      Hermes ACP agent (uwf-hermes)
-  workflow-agent-builtin     Built-in LLM + tools agent (uwf-builtin)
-  workflow-agent-claude-code Claude Code agent (uwf-claude-code)
-
-Layer 4 — CLI
-  cli-workflow               uwf binary — thread lifecycle, registry, CAS, setup
-
-App (uses protocol; not in the runtime engine stack)
-  workflow-dashboard         Web UI for visual workflow editing
-```
-
-External CAS: [`@uncaged/json-cas`](https://www.npmjs.com/package/@uncaged/json-cas) (store API, hashing, schema validation) + `@uncaged/json-cas-fs` (filesystem backend).
-
-See [docs/architecture.md](docs/architecture.md) for the full design — three-phase engine loop, CAS node types, storage layout, agent CLI protocol, and design decisions.
-
-## Packages
-
-| Package | npm | Description | Type | README |
-|---------|-----|-------------|------|--------|
-| `cli-workflow` | `@uncaged/cli-workflow` | `uwf` CLI — thread lifecycle, workflow registry, CAS inspection, setup | cli | [README](packages/cli-workflow/README.md) |
-| `workflow-protocol` | `@uncaged/workflow-protocol` | Shared TypeScript types and JSON Schema constants | lib | [README](packages/workflow-protocol/README.md) |
-| `workflow-moderator` | `@uncaged/workflow-moderator` | JSONata graph evaluator — next role or `$END` | lib | [README](packages/workflow-moderator/README.md) |
-| `workflow-agent-kit` | `@uncaged/workflow-agent-kit` | `createAgent` factory, context builder, extract pipeline | lib | [README](packages/workflow-agent-kit/README.md) |
-| `workflow-util` | `@uncaged/workflow-util` | Crockford Base32, ULID, logger, frontmatter parsing, storage paths | lib | [README](packages/workflow-util/README.md) |
-| `workflow-agent-hermes` | `@uncaged/workflow-agent-hermes` | `uwf-hermes` — spawns Hermes chat via ACP | agent | [README](packages/workflow-agent-hermes/README.md) |
-| `workflow-agent-builtin` | `@uncaged/workflow-agent-builtin` | `uwf-builtin` — built-in LLM agent with file/shell tools | agent | [README](packages/workflow-agent-builtin/README.md) |
-| `workflow-agent-claude-code` | `@uncaged/workflow-agent-claude-code` | `uwf-claude-code` — spawns Claude Code CLI | agent | [README](packages/workflow-agent-claude-code/README.md) |
-| `workflow-dashboard` | `@uncaged/workflow-dashboard` | Web graph editor for workflow YAML (private, alpha) | app | [README](packages/workflow-dashboard/README.md) |
+External: [`@uncaged/json-cas`](https://www.npmjs.com/package/@uncaged/json-cas) (CAS store + JSON Schema validation) + `@uncaged/json-cas-fs` (filesystem backend).

 ## Quick Start

 ```bash
-# 1. Configure provider, model, and default agent
+# 1. Configure provider and model
 uwf setup

 # 2. Register a workflow from YAML
 uwf workflow put examples/solve-issue.yaml

-# 3. Start a thread (creates head pointer; does not execute)
+# 3. Start a thread
 uwf thread start solve-issue -p "Fix the login redirect bug"

 # 4. Execute steps (one at a time, until done)
 uwf thread step <thread-id>
 ```

-Use `-c, --count <number>` on `thread step` to run multiple steps in one invocation. Override the agent with `--agent <cmd>`.
+## CLI Commands

-## CLI Reference
+### Thread

-Global options: `-V, --version`, `--format <json|yaml>`, `-h, --help`.
+| Command | Description |
+|---------|-------------|
+| `uwf thread start <workflow> -p <prompt>` | Create a thread (no execution) |
+| `uwf thread step <thread-id> [--agent <cmd>]` | Execute one moderator→agent→extract cycle |
+| `uwf thread show <thread-id>` | Show head pointer and done status |
+| `uwf thread list [--all]` | List threads (`--all` includes archived) |
+| `uwf thread steps <thread-id>` | List all steps chronologically |
+| `uwf thread read <thread-id> [--quota N]` | Render thread as readable markdown |
+| `uwf thread fork <step-hash>` | Fork from a specific step |
+| `uwf thread step-details <step-hash>` | Dump full detail node |
+| `uwf thread kill <thread-id>` | Terminate and archive |

-| Group | Commands |
-|-------|----------|
-| **thread** | `start`, `step`, `show`, `list`, `kill`, `steps`, `read`, `fork`, `step-details` |
-| **workflow** | `put`, `show`, `list` |
-| **cas** | `get`, `put`, `put-text`, `has`, `refs`, `walk`, `reindex`, `schema list`, `schema get` |
-| **setup** | Interactive or `--provider`, `--base-url`, `--api-key`, `--model`, `--agent` |
-| **skill** | `cli` — print markdown reference of all uwf commands |
-| **log** | `list`, `show`, `clean` — process-level debug logs |
+### Workflow

-Config is stored in `~/.uncaged/workflow/config.yaml`. API keys go in `~/.uncaged/workflow/.env`.
+| Command | Description |
+|---------|-------------|
+| `uwf workflow put <file.yaml>` | Register a workflow from YAML |
+| `uwf workflow show <name-or-hash>` | Show workflow definition |
+| `uwf workflow list` | List registered workflows |

-Detailed command usage, options, and examples: [packages/cli-workflow/README.md](packages/cli-workflow/README.md).
+### CAS
+
+| Command | Description |
+|---------|-------------|
+| `uwf cas get <hash>` | Read a CAS node |
+| `uwf cas put <type-hash> <data>` | Store a node |
+| `uwf cas has <hash>` | Check existence |
+| `uwf cas refs <hash>` | List direct references |
+| `uwf cas walk <hash>` | Recursive traversal |
+| `uwf cas reindex` | Rebuild type index |
+| `uwf cas schema list` | List schemas |
+| `uwf cas schema get <hash>` | Show a schema |
+
+### Setup
+
+| Command | Description |
+|---------|-------------|
+| `uwf setup` | Interactive provider/model/agent configuration |
+| `uwf setup --provider ... --base-url ... --api-key ... --model ...` | Non-interactive setup |
+
+Config stored in `~/.uncaged/workflow/config.yaml`. API keys in `~/.uncaged/workflow/.env`.

 ## Development

 ```bash
 bun install --no-cache     # Install dependencies
-bun run build              # tsc --build (all packages)
 bun run check              # tsc + biome + lint-log-tags
 bun run format             # Auto-format with Biome
 bun test                   # Run all tests
 ```

 Managed with **bun workspace**. See [CLAUDE.md](CLAUDE.md) for coding conventions.
+
+## Architecture
+
+See [docs/architecture.md](docs/architecture.md) for the full design — three-phase engine loop, CAS node types, storage layout, agent CLI protocol, and design decisions.
@@ -17,15 +17,6 @@
    "indentWidth": 2,
    "lineWidth": 100
  },
-  "css": {
-    "parser": {
-      "cssModules": true,
-      "tailwindDirectives": true
-    },
-    "linter": {
-      "enabled": false
-    }
-  },
  "javascript": {
    "formatter": {
      "quoteStyle": "double",
@@ -9,7 +9,7 @@
    "check": "bunx tsc --build && biome check . && bash scripts/lint-log-tags.sh",
    "typecheck": "bunx tsc --build",
    "format": "biome format --write .",
-    "test": "bun run --filter './packages/*' test",
+    "test": "bun run --filter '*' test",
    "changeset": "bunx changeset",
    "version": "bunx changeset version",
    "release": "bun run build && bun test && node scripts/publish-all.mjs"
@@ -1,128 +0,0 @@
-# @uncaged/cli-workflow
-
-`uwf` CLI — thread lifecycle, workflow registry, CAS inspection, and setup.
-
-## Overview
-
-Layer 4 entry point for the workflow engine. The `uwf` binary orchestrates one step per invocation: load thread head from `threads.yaml`, run the moderator, spawn the configured agent CLI, run extract, append a CAS step node, and update the head pointer (or archive when `$END`).
-
-This package has no library `src/index.ts` — it is consumed as a CLI binary only.
-
-**Dependencies:** `@uncaged/json-cas`, `@uncaged/json-cas-fs`, `@uncaged/workflow-agent-kit`, `@uncaged/workflow-moderator`, `@uncaged/workflow-protocol`, `@uncaged/workflow-util`, `commander`, `dotenv`, `yaml`
-
-## Installation
-
-Included as the `uwf` binary when you install `@uncaged/cli-workflow`:
-
-```bash
-bun add -g @uncaged/cli-workflow
-# or from the monorepo:
-bun link packages/cli-workflow
-```
-
-## CLI Usage
-
-### Global options
-
-```
-V, --version          Show version
--format <json|yaml>   Output format (default: json)
-h, --help             Show help
-```
-
-### Thread
-
-| Command | Description |
-|---------|-------------|
-| `uwf thread start <workflow> -p <prompt>` | Create a thread without executing |
-| `uwf thread step <thread-id> [--agent <cmd>] [-c <count>]` | Execute one or more moderator→agent→extract cycles |
-| `uwf thread show <thread-id>` | Show thread head pointer |
-| `uwf thread list [--all]` | List active threads (`--all` includes archived) |
-| `uwf thread steps <thread-id>` | List all steps chronologically |
-| `uwf thread read <thread-id> [--quota N] [--before <hash>] [--start]` | Render thread as readable markdown |
-| `uwf thread fork <step-hash>` | Fork from a specific step |
-| `uwf thread step-details <step-hash>` | Dump full detail node as YAML |
-| `uwf thread kill <thread-id>` | Terminate and archive |
-
-Examples:
-
-```bash
-uwf thread start solve-issue -p "Fix the login redirect bug"
-uwf thread step 01ARZ3NDEKTSV4RRFFQ69G5FAV
-uwf thread step 01ARZ3NDEKTSV4RRFFQ69G5FAV -c 3 --agent uwf-builtin
-uwf thread read 01ARZ3NDEKTSV4RRFFQ69G5FAV --quota 8000
-```
-
-### Workflow
-
-| Command | Description |
-|---------|-------------|
-| `uwf workflow put <file.yaml>` | Register a workflow from YAML |
-| `uwf workflow show <name-or-hash>` | Show workflow definition |
-| `uwf workflow list` | List registered workflows |
-
-### CAS
-
-| Command | Description |
-|---------|-------------|
-| `uwf cas get <hash> [--timestamp]` | Read a CAS node |
-| `uwf cas put <type-hash> <data>` | Store a node, print hash |
-| `uwf cas put-text <text>` | Store plain text, print hash |
-| `uwf cas has <hash>` | Check existence |
-| `uwf cas refs <hash>` | List direct references |
-| `uwf cas walk <hash>` | Recursive traversal |
-| `uwf cas reindex` | Rebuild type index |
-| `uwf cas schema list` | List registered schemas |
-| `uwf cas schema get <hash>` | Show a schema |
-
-### Setup
-
-```bash
-uwf setup
-uwf setup --provider openai --base-url https://api.openai.com/v1 \
-  --api-key sk-... --model gpt-4o --agent hermes
-```
-
-Config: `~/.uncaged/workflow/config.yaml`. API keys: `~/.uncaged/workflow/.env`.
-
-### Skill
-
-| Command | Description |
-|---------|-------------|
-| `uwf skill cli` | Print markdown reference of all uwf commands (for agent skills) |
-
-### Log
-
-| Command | Description |
-|---------|-------------|
-| `uwf log list` | List log files with sizes |
-| `uwf log show [--thread <id>] [--process <pid>] [--date YYYY-MM-DD]` | Show filtered log entries |
-| `uwf log clean [--before YYYY-MM-DD]` | Delete old log files |
-
-## Internal Structure
-
-```
-src/
-├── cli.ts              Commander entrypoint, command registration
-├── format.ts           JSON/YAML output formatting
-├── store.ts            CAS store + registry initialization
-├── validate.ts         Workflow YAML validation
-├── schemas.ts          CLI-local schema registration
-└── commands/
-    ├── thread.ts       Thread lifecycle and step execution
-    ├── workflow.ts     Workflow registry (put/show/list)
-    ├── cas.ts          CAS inspection and schema ops
-    ├── setup.ts        Interactive/non-interactive setup
-    ├── skill.ts        Built-in skill references
-    └── log.ts          Process debug log management
-```
-
-## Configuration
-
-| File | Purpose |
-|------|---------|
-| `~/.uncaged/workflow/config.yaml` | Providers, models, default agent |
-| `~/.uncaged/workflow/.env` | API keys (referenced by `apiKeyEnv` in config) |
-| `~/.uncaged/workflow/registry.yaml` | Workflow name → CAS hash |
-| `~/.uncaged/workflow/threads.yaml` | Active thread head pointers |
-| `~/.uncaged/workflow/cas/` | Content-addressed node storage |
@@ -1,381 +0,0 @@
-import { mkdirSync, writeFileSync } from "node:fs";
-import { tmpdir } from "node:os";
-import { join } from "node:path";
-import { afterEach, describe, expect, test, vi } from "vitest";
-import {
-  _discoverAgents,
-  _isBackspace,
-  _isTerminator,
-  _parseWhichOutput,
-  _printModelMenu,
-  _printProviderMenu,
-  _printValidationResult,
-  _resolveModelChoice,
-  _resolveProviderChoice,
-  _searchPathDirs,
-} from "../commands/setup.js";
-
-// ──────────────────────────────────────────────────────────────────────────────
-// 1a. _searchPathDirs
-// ──────────────────────────────────────────────────────────────────────────────
-
-describe("_searchPathDirs", () => {
-  test("returns empty array for empty PATH", async () => {
-    const result = await _searchPathDirs("");
-    expect(result).toEqual([]);
-  });
-
-  test("finds uwf-hermes in a single dir", async () => {
-    const dir = mkdirSync(join(tmpdir(), `uwf-test-${Date.now()}`), { recursive: true }) as
-      | string
-      | undefined;
-    const actualDir = dir ?? join(tmpdir(), `uwf-test-${Date.now()}`);
-    mkdirSync(actualDir, { recursive: true });
-    const filePath = join(actualDir, "uwf-hermes");
-    writeFileSync(filePath, "#!/bin/sh\n", { mode: 0o755 });
-    const result = await _searchPathDirs(actualDir);
-    expect(result).toContain("uwf-hermes");
-  });
-
-  test("skips non-uwf- prefixed binaries", async () => {
-    const dir = join(tmpdir(), `uwf-test-${Date.now()}-2`);
-    mkdirSync(dir, { recursive: true });
-    writeFileSync(join(dir, "hermes"), "#!/bin/sh\n", { mode: 0o755 });
-    writeFileSync(join(dir, "uwf-hermes"), "#!/bin/sh\n", { mode: 0o755 });
-    const result = await _searchPathDirs(dir);
-    expect(result).toEqual(["uwf-hermes"]);
-  });
-
-  test("skips entry named exactly 'uwf'", async () => {
-    const dir = join(tmpdir(), `uwf-test-${Date.now()}-3`);
-    mkdirSync(dir, { recursive: true });
-    writeFileSync(join(dir, "uwf"), "#!/bin/sh\n", { mode: 0o755 });
-    writeFileSync(join(dir, "uwf-hermes"), "#!/bin/sh\n", { mode: 0o755 });
-    const result = await _searchPathDirs(dir);
-    expect(result).toEqual(["uwf-hermes"]);
-  });
-
-  test("skips non-executable files", async () => {
-    const dir = join(tmpdir(), `uwf-test-${Date.now()}-4`);
-    mkdirSync(dir, { recursive: true });
-    writeFileSync(join(dir, "uwf-foo"), "#!/bin/sh\n", { mode: 0o644 });
-    const result = await _searchPathDirs(dir);
-    expect(result).toEqual([]);
-  });
-
-  test("deduplicates across PATH dirs", async () => {
-    const dir1 = join(tmpdir(), `uwf-test-${Date.now()}-5a`);
-    const dir2 = join(tmpdir(), `uwf-test-${Date.now()}-5b`);
-    mkdirSync(dir1, { recursive: true });
-    mkdirSync(dir2, { recursive: true });
-    writeFileSync(join(dir1, "uwf-hermes"), "#!/bin/sh\n", { mode: 0o755 });
-    writeFileSync(join(dir2, "uwf-hermes"), "#!/bin/sh\n", { mode: 0o755 });
-    const result = await _searchPathDirs(`${dir1}:${dir2}`);
-    expect(result).toEqual(["uwf-hermes"]);
-  });
-
-  test("returns sorted array", async () => {
-    const dir = join(tmpdir(), `uwf-test-${Date.now()}-6`);
-    mkdirSync(dir, { recursive: true });
-    writeFileSync(join(dir, "uwf-zoo"), "#!/bin/sh\n", { mode: 0o755 });
-    writeFileSync(join(dir, "uwf-alpha"), "#!/bin/sh\n", { mode: 0o755 });
-    writeFileSync(join(dir, "uwf-mid"), "#!/bin/sh\n", { mode: 0o755 });
-    const result = await _searchPathDirs(dir);
-    expect(result).toEqual(["uwf-alpha", "uwf-mid", "uwf-zoo"]);
-  });
-
-  test("skips inaccessible/nonexistent directories silently", async () => {
-    const result = await _searchPathDirs("/nonexistent-dir-xyz-abc-12345");
-    expect(result).toEqual([]);
-  });
-});
-
-// ──────────────────────────────────────────────────────────────────────────────
-// 1b. _parseWhichOutput
-// ──────────────────────────────────────────────────────────────────────────────
-
-describe("_parseWhichOutput", () => {
-  test("returns empty array for empty string", () => {
-    expect(_parseWhichOutput("")).toEqual([]);
-  });
-
-  test("parses single path", () => {
-    expect(_parseWhichOutput("/usr/local/bin/uwf-hermes")).toEqual(["uwf-hermes"]);
-  });
-
-  test("parses multiple paths", () => {
-    expect(_parseWhichOutput("/usr/local/bin/uwf-hermes\n/usr/bin/uwf-claude-code")).toEqual([
-      "uwf-claude-code",
-      "uwf-hermes",
-    ]);
-  });
-
-  test("deduplicates identical basenames from different dirs", () => {
-    expect(_parseWhichOutput("/a/uwf-hermes\n/b/uwf-hermes")).toEqual(["uwf-hermes"]);
-  });
-
-  test("skips blank lines", () => {
-    expect(_parseWhichOutput("/a/uwf-hermes\n\n/b/uwf-cursor")).toEqual([
-      "uwf-cursor",
-      "uwf-hermes",
-    ]);
-  });
-
-  test("skips entry named exactly 'uwf'", () => {
-    expect(_parseWhichOutput("/usr/bin/uwf")).toEqual([]);
-  });
-
-  test("skips basenames not starting with uwf-", () => {
-    expect(_parseWhichOutput("/usr/bin/node")).toEqual([]);
-  });
-
-  test("returns sorted array", () => {
-    expect(_parseWhichOutput("/a/uwf-zoo\n/a/uwf-alpha")).toEqual(["uwf-alpha", "uwf-zoo"]);
-  });
-});
-
-// ──────────────────────────────────────────────────────────────────────────────
-// 2a. _isTerminator
-// ──────────────────────────────────────────────────────────────────────────────
-
-describe("_isTerminator", () => {
-  test("\\n is a terminator", () => {
-    expect(_isTerminator("\n")).toBe(true);
-  });
-  test("\\r is a terminator", () => {
-    expect(_isTerminator("\r")).toBe(true);
-  });
-  test("\\u0004 (EOT) is a terminator", () => {
-    expect(_isTerminator("")).toBe(true);
-  });
-  test("regular char is not a terminator", () => {
-    expect(_isTerminator("a")).toBe(false);
-  });
-  test("empty string is not a terminator", () => {
-    expect(_isTerminator("")).toBe(false);
-  });
-});
-
-// ──────────────────────────────────────────────────────────────────────────────
-// 2b. _isBackspace
-// ──────────────────────────────────────────────────────────────────────────────
-
-describe("_isBackspace", () => {
-  test("\\u007F is a backspace", () => {
-    expect(_isBackspace("")).toBe(true);
-  });
-  test("\\b is a backspace", () => {
-    expect(_isBackspace("\b")).toBe(true);
-  });
-  test("regular char is not a backspace", () => {
-    expect(_isBackspace("x")).toBe(false);
-  });
-});
-
-// ──────────────────────────────────────────────────────────────────────────────
-// 3a. _printProviderMenu
-// ──────────────────────────────────────────────────────────────────────────────
-
-describe("_printProviderMenu", () => {
-  afterEach(() => {
-    vi.restoreAllMocks();
-  });
-
-  const providers = [
-    { name: "openai", label: "OpenAI", baseUrl: "https://api.openai.com/v1" },
-    { name: "xai", label: "xAI", baseUrl: "https://api.x.ai/v1" },
-  ] as const;
-
-  test("prints correct number of lines (one per provider + custom)", () => {
-    const lines: string[] = [];
-    vi.spyOn(console, "log").mockImplementation((msg: string) => {
-      lines.push(msg);
-    });
-    _printProviderMenu(providers);
-    // 2 providers + 1 custom = 3 lines
-    expect(lines.length).toBe(3);
-  });
-
-  test("custom option number = providers.length + 1", () => {
-    const lines: string[] = [];
-    vi.spyOn(console, "log").mockImplementation((msg: string) => {
-      lines.push(msg);
-    });
-    _printProviderMenu(providers);
-    const lastLine = lines[lines.length - 1] ?? "";
-    expect(lastLine).toMatch(/3\)/);
-  });
-
-  test("each provider line contains its label and baseUrl", () => {
-    const lines: string[] = [];
-    vi.spyOn(console, "log").mockImplementation((msg: string) => {
-      lines.push(msg);
-    });
-    _printProviderMenu(providers);
-    expect(lines[0]).toContain("OpenAI");
-    expect(lines[0]).toContain("https://api.openai.com/v1");
-    expect(lines[1]).toContain("xAI");
-    expect(lines[1]).toContain("https://api.x.ai/v1");
-  });
-});
-
-// ──────────────────────────────────────────────────────────────────────────────
-// 3b. _resolveProviderChoice
-// ──────────────────────────────────────────────────────────────────────────────
-
-describe("_resolveProviderChoice", () => {
-  const providers = [
-    { name: "openai", label: "OpenAI", baseUrl: "https://api.openai.com/v1" },
-    { name: "xai", label: "xAI", baseUrl: "https://api.x.ai/v1" },
-    { name: "deepseek", label: "DeepSeek", baseUrl: "https://api.deepseek.com/v1" },
-  ] as const;
-
-  test("valid index 1 returns first provider", () => {
-    const result = _resolveProviderChoice("1", providers);
-    expect(result).toEqual({ providerName: "openai", baseUrl: "https://api.openai.com/v1" });
-  });
-
-  test("valid index N (last preset) returns last provider", () => {
-    const result = _resolveProviderChoice("3", providers);
-    expect(result).toEqual({ providerName: "deepseek", baseUrl: "https://api.deepseek.com/v1" });
-  });
-
-  test("index providers.length+1 (custom) returns null", () => {
-    const result = _resolveProviderChoice("4", providers);
-    expect(result).toBeNull();
-  });
-
-  test("non-numeric string returns null", () => {
-    expect(_resolveProviderChoice("abc", providers)).toBeNull();
-  });
-
-  test("0 returns null (out of range)", () => {
-    expect(_resolveProviderChoice("0", providers)).toBeNull();
-  });
-
-  test("N+2 returns null (out of range)", () => {
-    expect(_resolveProviderChoice("5", providers)).toBeNull();
-  });
-
-  test("negative number returns null", () => {
-    expect(_resolveProviderChoice("-1", providers)).toBeNull();
-  });
-});
-
-// ──────────────────────────────────────────────────────────────────────────────
-// 3c. _resolveModelChoice
-// ──────────────────────────────────────────────────────────────────────────────
-
-describe("_resolveModelChoice", () => {
-  test("numeric input within range returns model at that index", () => {
-    expect(_resolveModelChoice("2", ["a", "b", "c"])).toBe("b");
-  });
-
-  test("numeric input out of range returns input as-is", () => {
-    expect(_resolveModelChoice("5", ["a"])).toBe("5");
-  });
-
-  test("non-numeric input returns input as-is", () => {
-    expect(_resolveModelChoice("gpt-4o", ["a", "b"])).toBe("gpt-4o");
-  });
-
-  test("numeric input 1 returns first model", () => {
-    expect(_resolveModelChoice("1", ["alpha", "beta"])).toBe("alpha");
-  });
-
-  test("empty models list with numeric input returns input as-is", () => {
-    expect(_resolveModelChoice("1", [])).toBe("1");
-  });
-});
-
-// ──────────────────────────────────────────────────────────────────────────────
-// 3d. _printModelMenu
-// ──────────────────────────────────────────────────────────────────────────────
-
-describe("_printModelMenu", () => {
-  afterEach(() => {
-    vi.restoreAllMocks();
-  });
-
-  test("prints all models — each model name appears in output", () => {
-    const output: string[] = [];
-    vi.spyOn(console, "log").mockImplementation((msg: string) => {
-      output.push(msg);
-    });
-    const models = ["model-a", "model-b", "model-c"];
-    _printModelMenu(models, 100);
-    const combined = output.join("\n");
-    for (const m of models) {
-      expect(combined).toContain(m);
-    }
-  });
-
-  test("single column when termCols is very small", () => {
-    const output: string[] = [];
-    vi.spyOn(console, "log").mockImplementation((msg: string) => {
-      output.push(msg);
-    });
-    _printModelMenu(["a", "b", "c"], 1);
-    // Each model on its own row → 3 lines
-    expect(output.length).toBe(3);
-  });
-
-  test("wide terminal fits multiple columns", () => {
-    const output: string[] = [];
-    vi.spyOn(console, "log").mockImplementation((msg: string) => {
-      output.push(msg);
-    });
-    const models = Array.from({ length: 6 }, (_, i) => `m${i}`);
-    _printModelMenu(models, 200);
-    // With wide terminal and short names, should fit in fewer than 6 rows
-    expect(output.length).toBeLessThan(6);
-  });
-});
-
-// ──────────────────────────────────────────────────────────────────────────────
-// 3e. _printValidationResult
-// ──────────────────────────────────────────────────────────────────────────────
-
-describe("_printValidationResult", () => {
-  afterEach(() => {
-    vi.restoreAllMocks();
-  });
-
-  test("ok=true prints success message containing '✓'", () => {
-    const lines: string[] = [];
-    vi.spyOn(console, "log").mockImplementation((msg: string) => {
-      lines.push(msg);
-    });
-    _printValidationResult({ ok: true, error: null });
-    expect(lines.join("\n")).toContain("✓");
-  });
-
-  test("ok=false prints warning message containing '⚠'", () => {
-    const lines: string[] = [];
-    vi.spyOn(console, "log").mockImplementation((msg: string) => {
-      lines.push(msg);
-    });
-    _printValidationResult({ ok: false, error: "HTTP 401" });
-    expect(lines.join("\n")).toContain("⚠");
-  });
-
-  test("ok=false includes the error string in output", () => {
-    const lines: string[] = [];
-    vi.spyOn(console, "log").mockImplementation((msg: string) => {
-      lines.push(msg);
-    });
-    _printValidationResult({ ok: false, error: "HTTP 401" });
-    expect(lines.join("\n")).toContain("HTTP 401");
-  });
-});
-
-// ──────────────────────────────────────────────────────────────────────────────
-// 4. Regression
-// ──────────────────────────────────────────────────────────────────────────────
-
-describe("_discoverAgents regression", () => {
-  test("returns an array (may be empty) — never throws", async () => {
-    const result = await _discoverAgents();
-    expect(Array.isArray(result)).toBe(true);
-  });
-});
@@ -266,7 +266,12 @@ describe("cmdThreadRead ### Content section", () => {

    expect(markdown).toContain("### Content");
    expect(markdown).toContain("The assistant response text");
-    expect(markdown).not.toContain("### Output");
+
+    const contentIdx = markdown.indexOf("### Content");
+    const outputIdx = markdown.indexOf("### Output");
+    expect(contentIdx).toBeGreaterThanOrEqual(0);
+    expect(outputIdx).toBeGreaterThanOrEqual(0);
+    expect(contentIdx).toBeLessThan(outputIdx);
  });

  test("omits ### Content when detail has no matching assistant turns", async () => {
@@ -309,7 +314,7 @@ describe("cmdThreadRead ### Content section", () => {
    const markdown = await cmdThreadRead(tmpDir, threadId, THREAD_READ_DEFAULT_QUOTA, null, false);

    expect(markdown).not.toContain("### Content");
-    expect(markdown).not.toContain("### Output");
+    expect(markdown).toContain("### Output");
  });
 });

@@ -382,266 +387,8 @@ describe("cmdThreadStepDetails", () => {
      content: "done",
    });
  });
-});

-// ── cmdThreadRead: ### Prompt deduplication ───────────────────────────────────
-
-describe("cmdThreadRead ### Prompt deduplication", () => {
-  async function makeThreadWithRoles(uwf: UwfStore, roles: string[]): Promise<string> {
-    const roleMap: Record<string, unknown> = {};
-    for (const r of [...new Set(roles)]) {
-      roleMap[r] = {
-        description: r,
-        goal: `Goal for ${r}`,
-        capabilities: [],
-        procedure: "Do stuff.",
-        output: "Output.",
-        meta: "placeholder00" as CasRef,
-      };
-    }
-    const workflowHash = await uwf.store.put(uwf.schemas.workflow, {
-      name: "dedup-wf",
-      description: "desc",
-      roles: roleMap,
-      conditions: {},
-      graph: {},
-    });
-    const startHash = await uwf.store.put(uwf.schemas.startNode, {
-      workflow: workflowHash,
-      prompt: "Start",
-    });
-    const outputHash = await uwf.store.put(uwf.schemas.workflow, {
-      name: "out",
-      description: "",
-      roles: {},
-      conditions: {},
-      graph: {},
-    });
-
-    let prev: string | null = null;
-    let stepHash = "";
-    for (const role of roles) {
-      stepHash = await uwf.store.put(uwf.schemas.stepNode, {
-        start: startHash,
-        prev: prev as CasRef | null,
-        role,
-        output: outputHash,
-        detail: null,
-        agent: "uwf-test",
-      });
-      prev = stepHash;
-    }
-    return stepHash;
-  }
-
-  test("same consecutive role shows ### Prompt once", async () => {
-    const uwf = await makeUwfStore(tmpDir);
-    const headHash = await makeThreadWithRoles(uwf, ["writer", "writer"]);
-    const threadId = "01JTEST0000000000000003" as ThreadId;
-    await saveThreadsIndex(tmpDir, { [threadId]: headHash });
-
-    const markdown = await cmdThreadRead(tmpDir, threadId, THREAD_READ_DEFAULT_QUOTA, null, false);
-    const count = (markdown.match(/### Prompt/g) ?? []).length;
-    expect(count).toBe(1);
-  });
-
-  test("different consecutive roles each show ### Prompt", async () => {
-    const uwf = await makeUwfStore(tmpDir);
-    const headHash = await makeThreadWithRoles(uwf, ["planner", "coder"]);
-    const threadId = "01JTEST0000000000000004" as ThreadId;
-    await saveThreadsIndex(tmpDir, { [threadId]: headHash });
-
-    const markdown = await cmdThreadRead(tmpDir, threadId, THREAD_READ_DEFAULT_QUOTA, null, false);
-    const count = (markdown.match(/### Prompt/g) ?? []).length;
-    expect(count).toBe(2);
-  });
-
-  test("non-consecutive same role shows ### Prompt twice", async () => {
-    const uwf = await makeUwfStore(tmpDir);
-    const headHash = await makeThreadWithRoles(uwf, ["roleA", "roleB", "roleA"]);
-    const threadId = "01JTEST0000000000000005" as ThreadId;
-    await saveThreadsIndex(tmpDir, { [threadId]: headHash });
-
-    const markdown = await cmdThreadRead(tmpDir, threadId, THREAD_READ_DEFAULT_QUOTA, null, false);
-    const count = (markdown.match(/### Prompt/g) ?? []).length;
-    expect(count).toBe(2);
-  });
-});
-
-// ── cmdThreadRead: showStart / before / quota ─────────────────────────────────
-
-describe("cmdThreadRead start section / before / quota", () => {
-  async function makeSimpleThread(
-    uwf: UwfStore,
-    roles: string[],
-  ): Promise<{ startHash: CasRef; stepHashes: CasRef[] }> {
-    const uniqueRoles = [...new Set(roles)];
-    const workflowHash = await uwf.store.put(uwf.schemas.workflow, {
-      name: "simple-wf",
-      description: "desc",
-      roles: Object.fromEntries(
-        uniqueRoles.map((r) => [
-          r,
-          {
-            description: r,
-            goal: `Goal for ${r}`,
-            capabilities: [],
-            procedure: "Do stuff.",
-            output: "Output.",
-            meta: "placeholder00" as CasRef,
-          },
-        ]),
-      ),
-      conditions: {},
-      graph: {},
-    });
-    const startHash = (await uwf.store.put(uwf.schemas.startNode, {
-      workflow: workflowHash,
-      prompt: "Initial prompt",
-    })) as CasRef;
-    const outputHash = await uwf.store.put(uwf.schemas.workflow, {
-      name: "out",
-      description: "",
-      roles: {},
-      conditions: {},
-      graph: {},
-    });
-
-    const stepHashes: CasRef[] = [];
-    let prev: CasRef | null = null;
-    for (const role of roles) {
-      const stepHash = (await uwf.store.put(uwf.schemas.stepNode, {
-        start: startHash,
-        prev,
-        role,
-        output: outputHash,
-        detail: null,
-        agent: "uwf-test",
-      })) as CasRef;
-      stepHashes.push(stepHash);
-      prev = stepHash;
-    }
-    return { startHash, stepHashes };
-  }
-
-  test("showStart=true includes # Thread header and ## Task section", async () => {
-    const uwf = await makeUwfStore(tmpDir);
-    const { stepHashes } = await makeSimpleThread(uwf, ["roleA"]);
-    const threadId = "01JTEST0000000000000006" as ThreadId;
-    await saveThreadsIndex(tmpDir, { [threadId]: stepHashes[stepHashes.length - 1]! });
-
-    const markdown = await cmdThreadRead(tmpDir, threadId, THREAD_READ_DEFAULT_QUOTA, null, true);
-    expect(markdown).toContain("# Thread");
-    expect(markdown).toContain("## Task");
-    expect(markdown).toContain("Initial prompt");
-  });
-
-  test("showStart=false with before=null still shows # Thread header (default behavior)", async () => {
-    const uwf = await makeUwfStore(tmpDir);
-    const { stepHashes } = await makeSimpleThread(uwf, ["roleA"]);
-    const threadId = "01JTEST0000000000000007" as ThreadId;
-    await saveThreadsIndex(tmpDir, { [threadId]: stepHashes[stepHashes.length - 1]! });
-
-    // When before=null, the start section is always shown regardless of showStart
-    const markdown = await cmdThreadRead(tmpDir, threadId, THREAD_READ_DEFAULT_QUOTA, null, false);
-    expect(markdown).toContain("# Thread");
-    expect(markdown).toContain("## Task");
-  });
-
-  test("before filter: only steps before the given hash appear", async () => {
-    const uwf = await makeUwfStore(tmpDir);
-    const { stepHashes } = await makeSimpleThread(uwf, ["roleA", "roleB", "roleC"]);
-    const [_hashA, hashB, hashC] = stepHashes as [CasRef, CasRef, CasRef];
-    const threadId = "01JTEST0000000000000008" as ThreadId;
-    await saveThreadsIndex(tmpDir, { [threadId]: hashC });
-
-    const markdown = await cmdThreadRead(tmpDir, threadId, THREAD_READ_DEFAULT_QUOTA, hashB, false);
-    expect(markdown).toContain("roleA");
-    expect(markdown).not.toContain("roleB");
-    expect(markdown).not.toContain("roleC");
-  });
-
-  test("quota=1 limits output and includes skip hint", async () => {
-    const uwf = await makeUwfStore(tmpDir);
-    const { stepHashes } = await makeSimpleThread(uwf, ["roleA", "roleB", "roleC"]);
-    const threadId = "01JTEST000000000000000A" as ThreadId;
-    await saveThreadsIndex(tmpDir, { [threadId]: stepHashes[stepHashes.length - 1]! });
-
-    const markdown = await cmdThreadRead(tmpDir, threadId, 1, null, false);
-    expect(markdown).toContain("earlier step");
-  });
-
-  test("all steps fit in quota: no skip hint", async () => {
-    const uwf = await makeUwfStore(tmpDir);
-    const { stepHashes } = await makeSimpleThread(uwf, ["roleA"]);
-    const threadId = "01JTEST000000000000000B" as ThreadId;
-    await saveThreadsIndex(tmpDir, { [threadId]: stepHashes[0]! });
-
-    const markdown = await cmdThreadRead(tmpDir, threadId, THREAD_READ_DEFAULT_QUOTA, null, false);
-    expect(markdown).not.toContain("earlier step");
-  });
-});
-
-// ── Tests that call process.exit must be last ─────────────────────────────────
-
-describe("cmdThreadStepDetails (process.exit tests - must be last)", () => {
  test("throws when step hash does not exist", async () => {
    await expect(cmdThreadStepDetails(tmpDir, "nonexistenth0" as CasRef)).rejects.toThrow();
  });
-
-  test("before with unknown hash rejects", async () => {
-    const _uwf = await makeUwfStore(tmpDir);
-    const casDir = join(tmpDir, "cas");
-    await mkdir(casDir, { recursive: true });
-    const store = createFsStore(casDir);
-    const schemas = await registerUwfSchemas(store);
-    const uwfStore: UwfStore = { storageRoot: tmpDir, store, schemas };
-
-    const workflowHash = await uwfStore.store.put(uwfStore.schemas.workflow, {
-      name: "wf2",
-      description: "",
-      roles: {
-        roleA: {
-          description: "r",
-          goal: "g",
-          capabilities: [],
-          procedure: "p",
-          output: "o",
-          meta: "placeholder00" as CasRef,
-        },
-      },
-      conditions: {},
-      graph: {},
-    });
-    const startHash = await uwfStore.store.put(uwfStore.schemas.startNode, {
-      workflow: workflowHash,
-      prompt: "p",
-    });
-    const outputHash = await uwfStore.store.put(uwfStore.schemas.workflow, {
-      name: "out",
-      description: "",
-      roles: {},
-      conditions: {},
-      graph: {},
-    });
-    const stepHash = await uwfStore.store.put(uwfStore.schemas.stepNode, {
-      start: startHash,
-      prev: null,
-      role: "roleA",
-      output: outputHash,
-      detail: null,
-      agent: "uwf-test",
-    });
-    await saveThreadsIndex(tmpDir, { ["01JTEST000000000000000C" as ThreadId]: stepHash as CasRef });
-
-    await expect(
-      cmdThreadRead(
-        tmpDir,
-        "01JTEST000000000000000C" as ThreadId,
-        THREAD_READ_DEFAULT_QUOTA,
-        "unknownhash0" as CasRef,
-        false,
-      ),
-    ).rejects.toThrow();
-  });
 });
@@ -1,4 +1,4 @@
-import { existsSync, mkdirSync, readdirSync, readFileSync, statSync, writeFileSync } from "node:fs";
+import { existsSync, mkdirSync, readFileSync, writeFileSync } from "node:fs";
 import { join } from "node:path";
 import { stdin as input, stdout as output } from "node:process";
 import { createInterface } from "node:readline/promises";
@@ -137,182 +137,75 @@ function apiKeyEnvName(providerName: string): string {
  return `${providerName.toUpperCase().replace(/[^A-Z0-9]/g, "_")}_API_KEY`;
 }

-// ──────────────────────────────────────────────────────────────────────────────
-// Extracted helpers — _discoverAgents
-// ──────────────────────────────────────────────────────────────────────────────
-
-/**
- * Scans directories from a PATH string for uwf-* executables.
- */
-export async function _searchPathDirs(pathEnv: string): Promise<string[]> {
-  if (!pathEnv) return [];
-  const dirs = pathEnv.split(":").filter((d) => d.length > 0);
-  const agents = new Set<string>();
-  for (const dir of dirs) {
-    _scanDirForAgents(dir, agents);
-  }
-  return Array.from(agents).sort();
-}
-
-function _scanDirForAgents(dir: string, agents: Set<string>): void {
-  try {
-    if (!existsSync(dir)) return;
-    const entries = readdirSync(dir);
-    for (const entry of entries) {
-      if (!entry.startsWith("uwf-") || entry === "uwf") continue;
-      if (_isExecutableFile(join(dir, entry))) {
-        agents.add(entry);
-      }
-    }
-  } catch {
-    // Skip inaccessible directories
-  }
-}
-
-function _isExecutableFile(fullPath: string): boolean {
-  try {
-    const s = statSync(fullPath);
-    return s.isFile() && (s.mode & 0o111) !== 0;
-  } catch {
-    return false;
-  }
-}
-
-/**
- * Parses the stdout of `which -a` into sorted unique basenames.
- */
-export function _parseWhichOutput(text: string): string[] {
-  if (!text) return [];
-  const agents = new Set<string>();
-  for (const line of text.trim().split("\n")) {
-    if (!line) continue;
-    const basename = line.split("/").pop() ?? "";
-    if (basename.startsWith("uwf-") && basename !== "uwf") {
-      agents.add(basename);
-    }
-  }
-  return Array.from(agents).sort();
-}
-
 /**
 * Discover uwf-* agent binaries in PATH.
 * Returns sorted list of binary names (e.g., ["uwf-hermes", "uwf-claude-code"]).
 */
-export async function _discoverAgents(): Promise<string[]> {
-  try {
-    const agents = await _tryWhichDiscovery();
-    if (agents !== null) return agents;
-    return await _searchPathDirs(process.env.PATH ?? "");
-  } catch {
-    return [];
-  }
-}
-
-async function _tryWhichDiscovery(): Promise<string[] | null> {
+async function _discoverAgents(): Promise<string[]> {
  try {
+    // Use which -a to find all uwf-* binaries in PATH
    const proc = Bun.spawn(["which", "-a", "uwf-hermes", "uwf-claude-code", "uwf-cursor"], {
      stdout: "pipe",
      stderr: "pipe",
    });
+
    const text = await new Response(proc.stdout).text();
    await proc.exited;
-    if (proc.exitCode !== 0) return null;
-    return _parseWhichOutput(text);
-  } catch {
-    return null;
-  }
-}

-// ──────────────────────────────────────────────────────────────────────────────
-// Extracted helpers — onData closure (promptSecret)
-// ──────────────────────────────────────────────────────────────────────────────
+    if (proc.exitCode !== 0) {
+      // Try alternative approach: search PATH directories manually
+      const pathEnv = process.env.PATH || "";
+      const pathDirs = pathEnv.split(":").filter((d) => d.length > 0);
+      const agents = new Set<string>();

-/** Returns true for newline, carriage return, or EOF (EOT). */
-export function _isTerminator(c: string): boolean {
-  return c === "\n" || c === "\r" || c === "";
-}
+      for (const dir of pathDirs) {
+        try {
+          if (!existsSync(dir)) continue;
+          const { readdirSync, statSync } = await import("node:fs");
+          const entries = readdirSync(dir);

-/** Returns true for DEL or backspace. */
-export function _isBackspace(c: string): boolean {
-  return c === "" || c === "\b";
-}
+          for (const entry of entries) {
+            if (!entry.startsWith("uwf-") || entry === "uwf") continue;
+            const fullPath = join(dir, entry);
+            try {
+              const stat = statSync(fullPath);
+              // Check if executable (owner, group, or other has execute bit)
+              if (stat.isFile() && (stat.mode & 0o111) !== 0) {
+                agents.add(entry);
+              }
+            } catch {
+              // Skip if can't stat
+            }
+          }
+        } catch {
+          // Skip inaccessible directories
+        }
+      }

-// ──────────────────────────────────────────────────────────────────────────────
-// Extracted helpers — cmdSetupInteractive
-// ──────────────────────────────────────────────────────────────────────────────
-
-type ProviderEntry = { name: string; label: string; baseUrl: string };
-
-/** Prints the numbered provider list and custom option to stdout. */
-export function _printProviderMenu(providers: readonly ProviderEntry[]): void {
-  const numWidth = String(providers.length + 1).length;
-  for (let i = 0; i < providers.length; i++) {
-    const p = providers[i];
-    if (!p) continue;
-    const num = String(i + 1).padStart(numWidth);
-    console.log(`  ${num}) ${p.label.padEnd(28)} ${p.baseUrl}`);
-  }
-  const customNum = String(providers.length + 1).padStart(numWidth);
-  console.log(`  ${customNum}) Custom (enter name and URL manually)\n`);
-}
-
-/** Resolves a numeric choice string to a preset provider, or null for custom/invalid. */
-export function _resolveProviderChoice(
-  choice: string,
-  providers: readonly ProviderEntry[],
-): { providerName: string; baseUrl: string } | null {
-  const n = Number.parseInt(choice, 10);
-  if (Number.isNaN(n) || n < 1 || n > providers.length) return null;
-  const p = providers[n - 1];
-  if (!p) return null;
-  return { providerName: p.name, baseUrl: p.baseUrl };
-}
-
-/** Resolves numeric index or literal model name to a model string. */
-export function _resolveModelChoice(input: string, models: string[]): string {
-  const n = Number.parseInt(input, 10);
-  if (!Number.isNaN(n) && n >= 1 && n <= models.length) {
-    return models[n - 1] ?? input;
-  }
-  return input;
-}
-
-/** Prints the multi-column model list to stdout. */
-export function _printModelMenu(models: string[], termCols: number): void {
-  const nw = String(models.length).length;
-  const maxLen = models.reduce((m, s) => Math.max(m, s.length), 0);
-  const colWidth = nw + 2 + maxLen + 4;
-  const cols = Math.max(1, Math.floor(termCols / colWidth));
-  const rows = Math.ceil(models.length / cols);
-  for (let r = 0; r < rows; r++) {
-    let line = "";
-    for (let c = 0; c < cols; c++) {
-      const idx = c * rows + r;
-      if (idx >= models.length) break;
-      const num = String(idx + 1).padStart(nw);
-      const name = (models[idx] ?? "").padEnd(maxLen);
-      line += `  ${num}) ${name}  `;
+      return Array.from(agents).sort();
    }
-    console.log(line.trimEnd());
+
+    // Parse which output - each line is a path to a binary
+    const paths = text
+      .trim()
+      .split("\n")
+      .filter((line) => line.length > 0);
+    const agents = new Set<string>();
+
+    for (const path of paths) {
+      const basename = path.split("/").pop();
+      if (basename?.startsWith("uwf-") && basename !== "uwf") {
+        agents.add(basename);
+      }
+    }
+
+    return Array.from(agents).sort();
+  } catch {
+    // If all fails, return empty array
+    return [];
  }
 }

-type ValidationResult = { ok: boolean; error: string | null };
-
-/** Prints the model validation result to stdout. */
-export function _printValidationResult(validation: ValidationResult): void {
-  if (validation.ok) {
-    console.log("✓ Model verified — connection successful.\n");
-  } else {
-    console.log(`\n⚠ Warning: Could not reach model — ${validation.error}`);
-    console.log(
-      "  Config saved, but you may want to try a different model or check your API key.\n",
-    );
-  }
-}
-
-// ──────────────────────────────────────────────────────────────────────────────
-
 /**
 * Merge setup args into config.yaml structure. Non-destructive — preserves existing entries.
 */
@@ -388,46 +281,6 @@ export async function cmdSetup(args: SetupArgs): Promise<Record<string, unknown>
  };
 }

-type SecretState = {
-  buf: string;
-  rawWasSet: boolean;
-  resolve: (value: string) => void;
-  onData: (chunk: string) => void;
-};
-
-function _handleSecretTerminator(state: SecretState): void {
-  if (process.stdin.isTTY) process.stdin.setRawMode(state.rawWasSet);
-  process.stdin.pause();
-  process.stdin.removeListener("data", state.onData);
-  process.stdout.write("\n");
-  state.resolve(state.buf.trim());
-}
-
-function _handleSecretBackspace(state: SecretState): void {
-  if (state.buf.length > 0) {
-    state.buf = state.buf.slice(0, -1);
-    process.stdout.write("\b \b");
-  }
-}
-
-function _handleSecretChar(c: string, state: SecretState): boolean {
-  if (_isTerminator(c)) {
-    _handleSecretTerminator(state);
-    return true;
-  }
-  if (_isBackspace(c)) {
-    _handleSecretBackspace(state);
-    return false;
-  }
-  if (c === "") {
-    if (process.stdin.isTTY) process.stdin.setRawMode(state.rawWasSet);
-    process.exit(130);
-  }
-  state.buf += c;
-  process.stdout.write("*");
-  return false;
-}
-
 /** Read a line with terminal echo disabled (for secrets). */
 async function promptSecret(label: string): Promise<string> {
  process.stdout.write(label);
@@ -439,13 +292,33 @@ async function promptSecret(label: string): Promise<string> {
    process.stdin.resume();
    process.stdin.setEncoding("utf8");

-    const state: SecretState = { buf: "", rawWasSet, resolve, onData: () => {} };
-    state.onData = (chunk: string) => {
+    let buf = "";
+    const onData = (chunk: string) => {
      for (const c of chunk.toString()) {
-        if (_handleSecretChar(c, state)) return;
+        if (c === "\n" || c === "\r" || c === "\u0004") {
+          if (process.stdin.isTTY) process.stdin.setRawMode(rawWasSet);
+          process.stdin.pause();
+          process.stdin.removeListener("data", onData);
+          process.stdout.write("\n");
+          resolve(buf.trim());
+          return;
+        }
+        if (c === "\u007F" || c === "\b") {
+          if (buf.length > 0) {
+            buf = buf.slice(0, -1);
+            process.stdout.write("\b \b");
+          }
+          continue;
+        }
+        if (c === "\u0003") {
+          if (process.stdin.isTTY) process.stdin.setRawMode(rawWasSet);
+          process.exit(130);
+        }
+        buf += c;
+        process.stdout.write("*");
      }
    };
-    process.stdin.on("data", state.onData);
+    process.stdin.on("data", onData);
  });
 }

@@ -471,56 +344,6 @@ async function fetchModels(baseUrl: string, apiKey: string): Promise<string[]> {
  }
 }

-async function _promptProviderSelection(
-  rl: ReturnType<typeof createInterface>,
-): Promise<{ providerName: string; baseUrl: string }> {
-  console.log("Select a provider:\n");
-  _printProviderMenu(PRESET_PROVIDERS);
-
-  const choice = (await rl.question(`Choose [1-${PRESET_PROVIDERS.length + 1}]: `)).trim();
-  const choiceNum = Number.parseInt(choice, 10);
-  if (Number.isNaN(choiceNum) || choiceNum < 1 || choiceNum > PRESET_PROVIDERS.length + 1) {
-    throw new Error(`Invalid choice: ${choice}`);
-  }
-
-  const preset = _resolveProviderChoice(choice, PRESET_PROVIDERS);
-  if (preset) {
-    const selected = PRESET_PROVIDERS[choiceNum - 1];
-    if (selected) {
-      console.log(`\n  → ${selected.label} (${selected.baseUrl})\n`);
-    }
-    return preset;
-  }
-
-  const providerName = (await rl.question("Provider name (e.g. my-proxy): ")).trim();
-  if (!providerName) throw new Error("Provider name required");
-  const baseUrl = (await rl.question("OpenAI-compatible API base URL: ")).trim();
-  if (!baseUrl) throw new Error("Base URL required");
-  return { providerName, baseUrl };
-}
-
-async function _promptModelSelection(
-  rl: ReturnType<typeof createInterface>,
-  baseUrl: string,
-  apiKey: string,
-): Promise<string> {
-  console.log("\nFetching available models...");
-  const models = await fetchModels(baseUrl, apiKey);
-
-  if (models.length === 0) {
-    console.log("Could not fetch models. Enter model name manually.");
-    const model = (await rl.question("Default model (e.g. qwen-plus, gpt-4o): ")).trim();
-    if (!model) throw new Error("Model required");
-    return model;
-  }
-  console.log(`\nAvailable models (${models.length}):\n`);
-  _printModelMenu(models, process.stdout.columns || 100);
-  console.log(`\nChoose a number, or type a model name directly.`);
-  const modelInput = (await rl.question(`Default model [1-${models.length}]: `)).trim();
-  if (!modelInput) throw new Error("Model required");
-  return _resolveModelChoice(modelInput, models);
-}
-
 /**
 * Interactive setup — prompts user for provider, API key, model.
 */
@@ -530,7 +353,39 @@ export async function cmdSetupInteractive(storageRoot: string): Promise<Record<s
  try {
    console.log("Configure LLM provider for uwf workflow agents.\n");

-    const { providerName, baseUrl } = await _promptProviderSelection(rl);
+    // 1. Provider selection
+    const numWidth = String(PRESET_PROVIDERS.length + 1).length;
+    console.log("Select a provider:\n");
+    for (let i = 0; i < PRESET_PROVIDERS.length; i++) {
+      const p = PRESET_PROVIDERS[i];
+      if (!p) continue;
+      const num = String(i + 1).padStart(numWidth);
+      console.log(`  ${num}) ${p.label.padEnd(28)} ${p.baseUrl}`);
+    }
+    const customNum = String(PRESET_PROVIDERS.length + 1).padStart(numWidth);
+    console.log(`  ${customNum}) Custom (enter name and URL manually)\n`);
+
+    const choice = (await rl.question(`Choose [1-${PRESET_PROVIDERS.length + 1}]: `)).trim();
+    const choiceNum = Number.parseInt(choice, 10);
+    if (Number.isNaN(choiceNum) || choiceNum < 1 || choiceNum > PRESET_PROVIDERS.length + 1) {
+      throw new Error(`Invalid choice: ${choice}`);
+    }
+
+    let providerName: string;
+    let baseUrl: string;
+
+    if (choiceNum <= PRESET_PROVIDERS.length) {
+      const selected = PRESET_PROVIDERS[choiceNum - 1];
+      if (!selected) throw new Error("Invalid selection");
+      providerName = selected.name;
+      baseUrl = selected.baseUrl;
+      console.log(`\n  → ${selected.label} (${selected.baseUrl})\n`);
+    } else {
+      providerName = (await rl.question("Provider name (e.g. my-proxy): ")).trim();
+      if (!providerName) throw new Error("Provider name required");
+      baseUrl = (await rl.question("OpenAI-compatible API base URL: ")).trim();
+      if (!baseUrl) throw new Error("Base URL required");
+    }

    // 2. API key
    rl.close();
@@ -539,8 +394,47 @@ export async function cmdSetupInteractive(storageRoot: string): Promise<Record<s

    // 3. Model selection
    const rl2 = createInterface({ input, output });
-    const model = await _promptModelSelection(rl2, baseUrl, apiKey);
+    console.log("\nFetching available models...");
+    const models = await fetchModels(baseUrl, apiKey);
+
+    let model: string;
+    if (models.length > 0) {
+      console.log(`\nAvailable models (${models.length}):\n`);
+      const nw = String(models.length).length;
+      // Multi-column layout
+      const maxLen = models.reduce((m, s) => Math.max(m, s.length), 0);
+      const colWidth = nw + 2 + maxLen + 4; // "  N) name    "
+      const termCols = process.stdout.columns || 100;
+      const cols = Math.max(1, Math.floor(termCols / colWidth));
+      const rows = Math.ceil(models.length / cols);
+      for (let r = 0; r < rows; r++) {
+        let line = "";
+        for (let c = 0; c < cols; c++) {
+          const idx = c * rows + r;
+          if (idx >= models.length) break;
+          const num = String(idx + 1).padStart(nw);
+          const name = (models[idx] ?? "").padEnd(maxLen);
+          line += `  ${num}) ${name}  `;
+        }
+        console.log(line.trimEnd());
+      }
+      console.log(`\nChoose a number, or type a model name directly.`);
+      const modelInput = (await rl2.question(`Default model [1-${models.length}]: `)).trim();
+      if (!modelInput) throw new Error("Model required");
+      const modelNum = Number.parseInt(modelInput, 10);
+      if (!Number.isNaN(modelNum) && modelNum >= 1 && modelNum <= models.length) {
+        model = models[modelNum - 1] ?? modelInput;
+      } else {
+        model = modelInput;
+      }
+    } else {
+      console.log("Could not fetch models. Enter model name manually.");
+      model = (await rl2.question("Default model (e.g. qwen-plus, gpt-4o): ")).trim();
+      if (!model) throw new Error("Model required");
+    }
+
    rl2.close();
+
    console.log(`  → ${providerName}/${model}\n`);

    const setupResult = await cmdSetup({
@@ -553,8 +447,17 @@ export async function cmdSetupInteractive(storageRoot: string): Promise<Record<s

    // Show validation result
    if (setupResult.validation && typeof setupResult.validation === "object") {
-      _printValidationResult(setupResult.validation as ValidationResult);
+      const v = setupResult.validation as { ok: boolean; error?: string };
+      if (v.ok) {
+        console.log("✓ Model verified — connection successful.\n");
+      } else {
+        console.log(`\n⚠ Warning: Could not reach model — ${v.error}`);
+        console.log(
+          "  Config saved, but you may want to try a different model or check your API key.\n",
+        );
+      }
    }
+
    console.log("Setup complete! Get started:\n");
    console.log("  uwf workflow put <workflow.yaml>   Register a workflow");
    console.log('  uwf thread start <name> -p "..."   Start a thread');
@@ -462,68 +462,49 @@ function expandDeep(store: CasStore, hash: CasRef, visited?: Set<string>): unkno
  return expandValue(store, schema, node.payload, seen);
 }

-function expandCasRefField(store: CasStore, value: unknown, visited: Set<string>): unknown {
-  if (typeof value === "string") {
-    return expandDeep(store, value as CasRef, visited);
-  }
-  return value;
-}
-
-function expandAnyOfField(
-  store: CasStore,
-  schema: JSONSchema,
-  value: unknown,
-  visited: Set<string>,
-): unknown {
-  if (!Array.isArray(schema.anyOf)) return value;
-  for (const sub of schema.anyOf as JSONSchema[]) {
-    if (sub.format === "cas_ref" && typeof value === "string") {
-      return expandDeep(store, value as CasRef, visited);
-    }
-  }
-  return value;
-}
-
-function expandArrayField(
-  store: CasStore,
-  schema: JSONSchema,
-  value: unknown,
-  visited: Set<string>,
-): unknown {
-  if (!schema.items || !Array.isArray(value)) return value;
-  const itemSchema = schema.items as JSONSchema;
-  return (value as unknown[]).map((item) => expandValue(store, itemSchema, item, visited));
-}
-
-function expandObjectField(
-  store: CasStore,
-  schema: JSONSchema,
-  value: unknown,
-  visited: Set<string>,
-): unknown {
-  if (value === null || typeof value !== "object" || Array.isArray(value) || !schema.properties) {
-    return value;
-  }
-  const props = schema.properties as Record<string, JSONSchema>;
-  const obj = value as Record<string, unknown>;
-  const result: Record<string, unknown> = {};
-  for (const [key, val] of Object.entries(obj)) {
-    const propSchema = props[key];
-    result[key] = propSchema ? expandValue(store, propSchema, val, visited) : val;
-  }
-  return result;
-}
-
 function expandValue(
  store: CasStore,
  schema: JSONSchema,
  value: unknown,
  visited: Set<string>,
 ): unknown {
-  if (schema.format === "cas_ref") return expandCasRefField(store, value, visited);
-  if (Array.isArray(schema.anyOf)) return expandAnyOfField(store, schema, value, visited);
-  if (schema.type === "array") return expandArrayField(store, schema, value, visited);
-  return expandObjectField(store, schema, value, visited);
+  // If this field is a cas_ref, expand it
+  if (schema.format === "cas_ref") {
+    if (typeof value === "string") {
+      return expandDeep(store, value as CasRef, visited);
+    }
+    return value;
+  }
+
+  // anyOf (nullable refs)
+  if (Array.isArray(schema.anyOf)) {
+    for (const sub of schema.anyOf as JSONSchema[]) {
+      if (sub.format === "cas_ref" && typeof value === "string") {
+        return expandDeep(store, value as CasRef, visited);
+      }
+    }
+    return value;
+  }
+
+  // Array of cas_ref items
+  if (schema.type === "array" && schema.items && Array.isArray(value)) {
+    const itemSchema = schema.items as JSONSchema;
+    return (value as unknown[]).map((item) => expandValue(store, itemSchema, item, visited));
+  }
+
+  // Object with properties
+  if (value !== null && typeof value === "object" && !Array.isArray(value) && schema.properties) {
+    const props = schema.properties as Record<string, JSONSchema>;
+    const obj = value as Record<string, unknown>;
+    const result: Record<string, unknown> = {};
+    for (const [key, val] of Object.entries(obj)) {
+      const propSchema = props[key];
+      result[key] = propSchema ? expandValue(store, propSchema, val, visited) : val;
+    }
+    return result;
+  }
+
+  return value;
 }

 function collectOrderedSteps(
@@ -558,7 +539,7 @@ function collectOrderedSteps(
 }

 function formatYaml(value: unknown): string {
-  return stringify(value, { aliasDuplicateObjects: false }).trimEnd();
+  return stringify(value).trimEnd();
 }

 function formatCompactStep(index: number, item: OrderedStepItem, outputYaml: string): string {
@@ -607,85 +588,6 @@ export function extractLastAssistantContent(uwf: UwfStore, detailRef: CasRef): s
  return null;
 }

-function sliceBeforeHash(
-  candidates: OrderedStepItem[],
-  before: CasRef,
-  threadId: ThreadId,
-): OrderedStepItem[] {
-  const idx = candidates.findIndex((s) => s.hash === before);
-  if (idx === -1) {
-    fail(`step ${before} not found in thread ${threadId}`);
-  }
-  return candidates.slice(0, idx);
-}
-
-function selectByQuota(
-  candidates: OrderedStepItem[],
-  uwf: UwfStore,
-  quota: number,
-): { selected: OrderedStepItem[]; skippedCount: number } {
-  const selected: OrderedStepItem[] = [];
-  let totalChars = 0;
-  for (let i = candidates.length - 1; i >= 0; i--) {
-    const item = candidates[i];
-    if (item === undefined) continue;
-    const outputYaml = formatYaml(expandOutput(uwf, item.payload.output));
-    const blockLen = formatCompactStep(i + 1, item, outputYaml).length;
-    selected.unshift(item);
-    totalChars += blockLen;
-    if (totalChars > quota) break;
-  }
-  return { selected, skippedCount: candidates.length - selected.length };
-}
-
-function formatStepHeader(stepNum: number, item: OrderedStepItem): string {
-  const ts = new Date(item.timestamp)
-    .toISOString()
-    .replace("T", " ")
-    .replace(/\.\d+Z$/, "");
-  return [
-    `## Step ${stepNum}: ${item.payload.role} \`${item.hash}\``,
-    `**Agent:** ${item.payload.agent} | **Time:** ${ts}`,
-  ].join("\n");
-}
-
-function formatStepPrompt(
-  roleDef: WorkflowPayload["roles"][string] | undefined,
-  role: string,
-  shownPromptRoles: Set<string>,
-): string {
-  if (!roleDef || shownPromptRoles.has(role)) return "";
-  shownPromptRoles.add(role);
-  return ["", "", "### Prompt", "", roleDef.goal].join("\n");
-}
-
-function formatStepContent(uwf: UwfStore, item: OrderedStepItem): string {
-  if (!item.payload.detail) return "";
-  const content = extractLastAssistantContent(uwf, item.payload.detail);
-  if (content === null) return "";
-  return ["", "", "### Content", "", content].join("\n");
-}
-
-function formatStartSection(options: {
-  threadId: ThreadId;
-  workflowName: string;
-  workflowHash: CasRef;
-  prompt: string;
-  before: CasRef | null;
-  showStart: boolean;
-}): string {
-  if (options.before !== null && !options.showStart) return "";
-  return [
-    `# Thread \`${options.threadId}\``,
-    "",
-    `**Workflow:** ${options.workflowName} (\`${options.workflowHash}\`)`,
-    "",
-    "## Task",
-    "",
-    options.prompt,
-  ].join("\n");
-}
-
 function formatThreadReadMarkdown(options: {
  threadId: ThreadId;
  workflowName: string;
@@ -698,16 +600,50 @@ function formatThreadReadMarkdown(options: {
  before: CasRef | null;
  showStart: boolean;
 }): string {
-  const { ordered, uwf, workflow, quota, before } = options;
+  const { ordered, uwf, workflow, quota, before, showStart } = options;

-  const candidates = before !== null ? sliceBeforeHash(ordered, before, options.threadId) : ordered;
-  const { selected, skippedCount } = selectByQuota(candidates, uwf, quota);
+  // Determine which steps to consider
+  let candidates = ordered;
+  if (before !== null) {
+    const idx = candidates.findIndex((s) => s.hash === before);
+    if (idx === -1) {
+      fail(`step ${before} not found in thread ${options.threadId}`);
+    }
+    candidates = candidates.slice(0, idx);
+  }

+  // Walk backward from newest, accumulating chars until quota exceeded
+  const selected: OrderedStepItem[] = [];
+  let totalChars = 0;
+  for (let i = candidates.length - 1; i >= 0; i--) {
+    const item = candidates[i];
+    if (item === undefined) continue;
+    const outputYaml = formatYaml(expandOutput(uwf, item.payload.output));
+    const blockLen = formatCompactStep(i + 1, item, outputYaml).length;
+    selected.unshift(item);
+    totalChars += blockLen;
+    if (totalChars > quota) break;
+  }
+
+  const skippedCount = candidates.length - selected.length;
  const parts: string[] = [];

-  const startSection = formatStartSection(options);
-  if (startSection !== "") parts.push(startSection);
+  // Start section
+  if (before === null || showStart) {
+    parts.push(
+      [
+        `# Thread \`${options.threadId}\``,
+        "",
+        `**Workflow:** ${options.workflowName} (\`${options.workflowHash}\`)`,
+        "",
+        "## Task",
+        "",
+        options.prompt,
+      ].join("\n"),
+    );
+  }

+  // Skip hint
  if (skippedCount > 0 && selected.length > 0) {
    const firstSelected = selected[0];
    if (firstSelected !== undefined) {
@@ -717,21 +653,34 @@ function formatThreadReadMarkdown(options: {
    }
  }

+  // Step blocks
  const startIndex = candidates.length - selected.length;
-  const shownPromptRoles = new Set<string>();
  for (let i = 0; i < selected.length; i++) {
    const item = selected[i];
    if (item === undefined) continue;
    const stepNum = startIndex + i + 1;
+    const outputYaml = formatYaml(expandOutput(uwf, item.payload.output));
+    const ts = new Date(item.timestamp)
+      .toISOString()
+      .replace("T", " ")
+      .replace(/\.\d+Z$/, "");
+    const stepLines = [
+      `## Step ${stepNum}: ${item.payload.role} \`${item.hash}\``,
+      `**Agent:** ${item.payload.agent} | **Time:** ${ts}`,
+    ];
    const roleDef = workflow.roles[item.payload.role];
-    const stepBlock = [
-      formatStepHeader(stepNum, item),
-      formatStepPrompt(roleDef, item.payload.role, shownPromptRoles),
-      formatStepContent(uwf, item),
-    ]
-      .filter((s) => s !== "")
-      .join("");
-    parts.push(stepBlock);
+    if (roleDef) {
+      const prompt = roleDef.goal;
+      stepLines.push("", "### Prompt", "", prompt);
+    }
+    if (item.payload.detail) {
+      const content = extractLastAssistantContent(uwf, item.payload.detail);
+      if (content !== null) {
+        stepLines.push("", "### Content", "", content);
+      }
+    }
+    stepLines.push("", "### Output", "", "```yaml", outputYaml, "```");
+    parts.push(stepLines.join("\n"));
  }

  return parts.join("\n\n---\n\n");
@@ -7,6 +7,6 @@ export function formatOutput(data: unknown, format: OutputFormat): string {
    case "json":
      return JSON.stringify(data);
    case "yaml":
-      return stringify(data, { aliasDuplicateObjects: false }).trimEnd();
+      return stringify(data).trimEnd();
  }
 }
@@ -1,141 +0,0 @@
-# @uncaged/workflow-agent-builtin
-
-`uwf-builtin` agent — built-in LLM agent with file read/write and shell tools.
-
-## Overview
-
-Layer 3 agent implementation. Runs an OpenAI-compatible chat completion loop with built-in tools (`read_file`, `write_file`, `run_command`). Uses the configured provider/model from `config.yaml`. Produces frontmatter markdown output and stores turn-by-turn session detail in CAS.
-
-Useful when you want a self-contained agent without an external CLI like Hermes or Claude Code.
-
-**Dependencies:** `@uncaged/json-cas`, `@uncaged/workflow-agent-kit`, `@uncaged/workflow-util`
-
-## Installation
-
-Included as the `uwf-builtin` binary when you install `@uncaged/workflow-agent-builtin`:
-
-```bash
-bun add -g @uncaged/workflow-agent-builtin
-```
-
-## CLI Usage
-
-Invoked by `uwf thread step`:
-
-```bash
-uwf-builtin <thread-id> <role>
-```
-
-Configure as default agent:
-
-```bash
-uwf setup --agent builtin
-```
-
-Override per step:
-
-```bash
-uwf thread step <thread-id> --agent uwf-builtin
-```
-
-Environment variables set by the engine:
-
-| Variable | Purpose |
-|----------|---------|
-| `UWF_EDGE_PROMPT` | Moderator edge instruction for this step |
-
-## API
-
-All exports come from `src/index.ts`.
-
-### Agent factory
-
-```typescript
-function createBuiltinAgent(): () => Promise<void>
-function buildBuiltinMessages(ctx: AgentContext): ChatMessage[]
-```
-
-### LLM loop
-
-```typescript
-const BUILTIN_MAX_TURNS = 30;
-const BUILTIN_CONTINUE_MAX_TURNS = 5;
-
-function runBuiltinLoop(/* options: RunBuiltinLoopOptions */): Promise<RunBuiltinLoopResult>
-function chatCompletionWithTools(
-  provider: ResolvedLlmProvider,
-  messages: ChatMessage[],
-  tools: OpenAiToolDefinition[],
-): Promise<LlmAssistantResponse>
-```
-
-`RunBuiltinLoopOptions` and `RunBuiltinLoopResult` are internal to `loop.ts` and not re-exported from `index.ts`.
-
-### Tools
-
-```typescript
-function getBuiltinTools(): readonly BuiltinTool[]
-function executeBuiltinTool(
-  name: string,
-  args: Record<string, unknown>,
-  ctx: ToolContext,
-): Promise<string>
-```
-
-### Session and detail
-
-```typescript
-function initSessionDir(storageRoot: string): Promise<void>
-function appendSessionTurn(storageRoot: string, sessionId: string, turn: BuiltinTurnPayload): Promise<void>
-function readSessionTurns(storageRoot: string, sessionId: string): Promise<BuiltinTurnPayload[]>
-function removeSession(storageRoot: string, sessionId: string): Promise<void>
-function registerBuiltinSchemas(store: Store): Promise<BuiltinSchemaHashes>
-function storeBuiltinDetail(store: Store, payload: BuiltinDetailPayload): Promise<string>
-```
-
-### Types
-
-```typescript
-type ChatMessage = /* system | user | assistant | tool */;
-type LlmAssistantResponse = { content: string | null; toolCalls: LlmToolCall[] | null };
-type LlmToolCall = { id: string; name: string; arguments: string };
-type BuiltinTool = { name: string; description: string; parameters: Record<string, unknown> };
-type ToolContext = { cwd: string; storageRoot: string };
-type BuiltinDetailPayload = { /* session turns, model, timestamps */ };
-type BuiltinLoopTurn = { /* single loop iteration record */ };
-type BuiltinToolCallRecord = { /* tool call audit */ };
-type BuiltinToolResultRecord = { /* tool result audit */ };
-type BuiltinTurnPayload = { /* persisted turn */ };
-```
-
-## Internal Structure
-
-```
-src/
-├── index.ts
-├── cli.ts              Binary entrypoint
-├── agent.ts            createBuiltinAgent
-├── loop.ts             Multi-turn LLM + tool loop
-├── prompt.ts           buildBuiltinMessages
-├── session.ts          Session directory persistence
-├── detail.ts           CAS detail node storage
-├── schemas.ts          Builtin CAS schemas
-├── types.ts            Detail and turn payload types
-├── llm/
-│   ├── index.ts
-│   ├── llm.ts          chatCompletionWithTools
-│   └── types.ts        ChatMessage, LlmToolCall, etc.
-└── tools/
-    ├── index.ts        getBuiltinTools, executeBuiltinTool
-    ├── read-file.ts
-    ├── write-file.ts
-    ├── run-command.ts
-    ├── path.ts
-    └── types.ts
-```
-
-## Configuration
-
-Requires a configured OpenAI-compatible provider and model in `~/.uncaged/workflow/config.yaml` (via `uwf setup`). API keys are loaded from `~/.uncaged/workflow/.env`.
-
-Tools run with the current working directory as `ToolContext.cwd` (typically the directory where `uwf thread step` was invoked).
@@ -1,156 +0,0 @@
-import { beforeEach, describe, expect, mock, test } from "bun:test";
-
-const mockChatCompletionWithTools = mock(async () => ({
-  content: "---\nstatus: done\n---",
-  toolCalls: [],
-}));
-const mockAppendSessionTurn = mock(async () => {});
-const mockExecuteBuiltinTool = mock(async () => "tool-result");
-
-mock.module("../src/llm/index.js", () => ({
-  chatCompletionWithTools: mockChatCompletionWithTools,
-}));
-mock.module("../src/session.js", () => ({
-  appendSessionTurn: mockAppendSessionTurn,
-}));
-mock.module("../src/tools/index.js", () => ({
-  builtinToolsToOpenAi: () => [],
-  executeBuiltinTool: mockExecuteBuiltinTool,
-  getBuiltinTools: () => [],
-}));
-
-import { executeTurnTools, runBuiltinLoop, shouldNudge } from "../src/loop.js";
-
-const fakeProvider = {} as any;
-const fakeToolCtx = {} as any;
-
-function makeOptions(overrides: Partial<Parameters<typeof runBuiltinLoop>[0]> = {}) {
-  return {
-    provider: fakeProvider,
-    messages: [{ role: "system" as const, content: "sys" }],
-    toolCtx: fakeToolCtx,
-    maxTurns: 5,
-    storageRoot: "/tmp",
-    sessionId: "sess",
-    noTools: false,
-    ...overrides,
-  };
-}
-
-beforeEach(() => {
-  mockChatCompletionWithTools.mockReset();
-  mockAppendSessionTurn.mockReset();
-  mockExecuteBuiltinTool.mockReset();
-});
-
-describe("shouldNudge", () => {
-  test("2.1 returns true when all conditions met", () => {
-    expect(shouldNudge({ noTools: false, text: "some text", turn: 0, maxTurns: 5 })).toBe(true);
-  });
-  test("2.2 returns false when noTools=true", () => {
-    expect(shouldNudge({ noTools: true, text: "some text", turn: 0, maxTurns: 5 })).toBe(false);
-  });
-  test("2.3 returns false when text starts with ---", () => {
-    expect(shouldNudge({ noTools: false, text: "---\nstatus: done", turn: 0, maxTurns: 5 })).toBe(
-      false,
-    );
-  });
-  test("2.4 returns false on last turn", () => {
-    expect(shouldNudge({ noTools: false, text: "some text", turn: 4, maxTurns: 5 })).toBe(false);
-  });
-  test("2.5 returns true on second-to-last turn", () => {
-    expect(shouldNudge({ noTools: false, text: "some text", turn: 3, maxTurns: 5 })).toBe(true);
-  });
-  test("2.6 leading whitespace before --- suppresses nudge", () => {
-    expect(shouldNudge({ noTools: false, text: "  ---\nstatus: done", turn: 0, maxTurns: 5 })).toBe(
-      false,
-    );
-  });
-});
-
-describe("executeTurnTools", () => {
-  test("4.1 executes each tool call and pushes tool result messages", async () => {
-    mockExecuteBuiltinTool.mockResolvedValue("result");
-    const messages: any[] = [];
-    const calls = [
-      { id: "c1", name: "tool_a", arguments: "{}" },
-      { id: "c2", name: "tool_b", arguments: "{}" },
-    ];
-    const count = await executeTurnTools(calls, fakeToolCtx, messages, "/tmp", "sess");
-    expect(messages.length).toBe(2);
-    expect(messages[0].role).toBe("tool");
-    expect(messages[1].role).toBe("tool");
-    expect(count).toBe(2);
-  });
-  test("4.2 tool result content matches executeBuiltinTool return value", async () => {
-    mockExecuteBuiltinTool.mockResolvedValue("result-A");
-    const messages: any[] = [];
-    await executeTurnTools(
-      [{ id: "c1", name: "read_file", arguments: "{}" }],
-      fakeToolCtx,
-      messages,
-      "/tmp",
-      "sess",
-    );
-    expect(messages[0].content).toBe("result-A");
-  });
-});
-
-describe("runBuiltinLoop integration", () => {
-  test("3.1 single text-only response returns finalText immediately", async () => {
-    mockChatCompletionWithTools.mockResolvedValue({
-      content: "---\nstatus: done\n---",
-      toolCalls: [],
-    });
-    const result = await runBuiltinLoop(makeOptions());
-    expect(result.finalText).toBe("---\nstatus: done\n---");
-    expect(result.turnCount).toBe(1);
-  });
-  test("3.2 noTools=true suppresses tool calls", async () => {
-    mockChatCompletionWithTools.mockResolvedValue({
-      content: "ok",
-      toolCalls: [{ id: "c1", name: "read_file", arguments: "{}" }],
-    });
-    const result = await runBuiltinLoop(makeOptions({ noTools: true }));
-    expect(result.finalText).toBe("ok");
-    expect(result.turnCount).toBe(1);
-  });
-  test("3.3 tool call followed by text response", async () => {
-    mockChatCompletionWithTools
-      .mockResolvedValueOnce({
-        content: null,
-        toolCalls: [{ id: "c1", name: "read_file", arguments: "{}" }],
-      })
-      .mockResolvedValueOnce({ content: "---\nstatus: done\n---", toolCalls: [] });
-    mockExecuteBuiltinTool.mockResolvedValue("file contents");
-    const result = await runBuiltinLoop(makeOptions());
-    expect(result.finalText).toBe("---\nstatus: done\n---");
-    expect(result.turnCount).toBe(3);
-  });
-  test("3.4 nudge cycle inserts nudge message", async () => {
-    mockChatCompletionWithTools
-      .mockResolvedValueOnce({ content: "I am thinking", toolCalls: [] })
-      .mockResolvedValueOnce({ content: "---\nstatus: done\n---", toolCalls: [] });
-    const result = await runBuiltinLoop(makeOptions());
-    expect(result.finalText).toBe("---\nstatus: done\n---");
-    const nudgeMsg = result.messages.find(
-      (m) =>
-        m.role === "user" && typeof m.content === "string" && m.content.includes("frontmatter"),
-    );
-    expect(nudgeMsg).toBeDefined();
-  });
-  test("3.5 maxTurns exhaustion falls back to last assistant content", async () => {
-    mockChatCompletionWithTools.mockResolvedValue({ content: "still thinking", toolCalls: [] });
-    const result = await runBuiltinLoop(makeOptions({ maxTurns: 3 }));
-    expect(result.finalText).toBe("still thinking");
-  });
-  test("3.6 original messages array is not mutated", async () => {
-    mockChatCompletionWithTools.mockResolvedValue({
-      content: "---\nstatus: done\n---",
-      toolCalls: [],
-    });
-    const original = [{ role: "system" as const, content: "sys" }];
-    await runBuiltinLoop(makeOptions({ messages: original }));
-    expect(original.length).toBe(1);
-  });
-});
@@ -7,44 +7,17 @@ import {
  resolveModel,
  resolveStorageRoot,
 } from "@uncaged/workflow-agent-kit";
-import { createLogger, generateUlid } from "@uncaged/workflow-util";
+import { generateUlid } from "@uncaged/workflow-util";

 import { storeBuiltinDetail } from "./detail.js";
 import type { ChatMessage } from "./llm/index.js";
 import { BUILTIN_CONTINUE_MAX_TURNS, BUILTIN_MAX_TURNS, runBuiltinLoop } from "./loop.js";
 import { buildBuiltinMessages } from "./prompt.js";
-import { initSessionDir } from "./session.js";
+import type { BuiltinSessionState } from "./types.js";

-const log = createLogger({ sink: { kind: "stderr" } });
+const sessions = new Map<string, BuiltinSessionState>();

-const FRONTMATTER_FENCE = "---";
-
-/**
- * Strip any text before the first `---` fence.
- * LLMs sometimes emit preamble text before the frontmatter block.
- */
-function stripPreamble(text: string): string {
-  if (text.startsWith(FRONTMATTER_FENCE)) {
-    return text;
-  }
-  const idx = text.indexOf(`\n${FRONTMATTER_FENCE}\n`);
-  if (idx !== -1) {
-    log("6GWRP3QX", `stripped ${idx + 1} chars of preamble before frontmatter`);
-    return text.slice(idx + 1);
-  }
-  return text;
-}
-
-type SessionRecord = {
-  sessionId: string;
-  model: string;
-  startedAtMs: number;
-  messages: ChatMessage[];
-};
-
-const sessions = new Map<string, SessionRecord>();
-
-function getSession(sessionId: string): SessionRecord {
+function getSession(sessionId: string): BuiltinSessionState {
  const session = sessions.get(sessionId);
  if (session === undefined) {
    throw new Error(`builtin session not found: ${sessionId}`);
@@ -63,38 +36,31 @@ async function runBuiltinWithMessages(
  storageRoot: string,
  provider: ReturnType<typeof resolveModel>,
  messages: ChatMessage[],
-  session: SessionRecord,
+  session: BuiltinSessionState,
  store: Store,
  maxTurns: number,
-  noTools: boolean,
 ): Promise<AgentRunResult> {
  const loopResult = await runBuiltinLoop({
    provider,
    messages,
    toolCtx: buildToolContext(storageRoot),
    maxTurns,
-    storageRoot,
-    sessionId: session.sessionId,
-    noTools,
+    existingTurns: session.turns,
  });

  session.messages = loopResult.messages;
+  session.turns = loopResult.turns;

-  if (loopResult.turnCount === 0) {
-    log("5RWTK9NB", "no turns produced, returning empty output");
-    return { output: "", detailHash: "", sessionId: session.sessionId };
-  }
-
-  // Read jsonl → persist turns to CAS → store detail
-  const { detailHash } = await storeBuiltinDetail(
+  const { detailHash, output } = await storeBuiltinDetail(
    store,
-    storageRoot,
    session.sessionId,
    session.model,
    session.startedAtMs,
+    session.turns,
  );

-  return { output: stripPreamble(loopResult.finalText), detailHash, sessionId: session.sessionId };
+  const finalOutput = output !== "" ? output : loopResult.finalText;
+  return { output: finalOutput, detailHash, sessionId: session.sessionId };
 }

 async function runBuiltin(ctx: AgentContext): Promise<AgentRunResult> {
@@ -103,14 +69,14 @@ async function runBuiltin(ctx: AgentContext): Promise<AgentRunResult> {
  const provider = resolveModel(config, config.defaultModel);

  const sessionId = generateUlid(Date.now());
-  await initSessionDir(storageRoot);
  const messages = buildBuiltinMessages(ctx);

-  const session: SessionRecord = {
+  const session: BuiltinSessionState = {
    sessionId,
    model: provider.model,
    startedAtMs: Date.now(),
    messages,
+    turns: [],
  };
  sessions.set(sessionId, session);

@@ -121,7 +87,6 @@ async function runBuiltin(ctx: AgentContext): Promise<AgentRunResult> {
    session,
    ctx.store,
    BUILTIN_MAX_TURNS,
-    false,
  );
 }

@@ -144,7 +109,6 @@ async function continueBuiltin(
    session,
    store,
    BUILTIN_CONTINUE_MAX_TURNS,
-    true,
  );
 }

@@ -1,15 +1,72 @@
 import { bootstrap, putSchema, type Store } from "@uncaged/json-cas";

 import { BUILTIN_DETAIL_SCHEMA, BUILTIN_TURN_SCHEMA } from "./schemas.js";
-import { readSessionTurns } from "./session.js";
-import type { BuiltinDetailPayload } from "./types.js";
+import type {
+  BuiltinDetailPayload,
+  BuiltinLoopTurn,
+  BuiltinToolCall,
+  BuiltinTurnPayload,
+  BuiltinTurnRole,
+} from "./types.js";
+
+function mapToolCalls(calls: NonNullable<BuiltinLoopTurn["toolCalls"]>): BuiltinToolCall[] {
+  return calls.map((call) => ({
+    name: call.name,
+    args: call.args,
+  }));
+}
+
+function loopTurnToAssistantPayload(turn: BuiltinLoopTurn, index: number): BuiltinTurnPayload {
+  return {
+    index,
+    role: "assistant",
+    content: turn.assistantContent ?? "",
+    toolCalls:
+      turn.toolCalls !== null && turn.toolCalls.length > 0 ? mapToolCalls(turn.toolCalls) : null,
+    reasoning: null,
+  };
+}
+
+function loopTurnToToolPayloads(turn: BuiltinLoopTurn, startIndex: number): BuiltinTurnPayload[] {
+  if (turn.toolResults === null || turn.toolResults.length === 0) {
+    return [];
+  }
+  const payloads: BuiltinTurnPayload[] = [];
+  let index = startIndex;
+  for (const result of turn.toolResults) {
+    payloads.push({
+      index,
+      role: "tool" as BuiltinTurnRole,
+      content: result.content,
+      toolCalls: null,
+      reasoning: null,
+    });
+    index += 1;
+  }
+  return payloads;
+}
+
+/** Last assistant message with non-empty text. */
+export function extractFinalAssistantText(turns: BuiltinLoopTurn[]): string {
+  for (let i = turns.length - 1; i >= 0; i--) {
+    const turn = turns[i];
+    if (turn === undefined) {
+      continue;
+    }
+    const text = turn.assistantContent;
+    if (text !== null && text.trim() !== "") {
+      return text;
+    }
+  }
+  return "";
+}

 type BuiltinSchemaHashes = {
  turn: string;
  detail: string;
 };

-export async function registerBuiltinSchemas(store: Store): Promise<BuiltinSchemaHashes> {
+async function registerBuiltinSchemas(store: Store): Promise<BuiltinSchemaHashes> {
  await bootstrap(store);
  const [turn, detail] = await Promise.all([
    putSchema(store, BUILTIN_TURN_SCHEMA),
@@ -18,22 +75,30 @@ export async function registerBuiltinSchemas(store: Store): Promise<BuiltinSchem
  return { turn, detail };
 }

-/** Read session jsonl, persist each turn to CAS, return detail hash. */
 export async function storeBuiltinDetail(
  store: Store,
-  storageRoot: string,
  sessionId: string,
  model: string,
  startedAtMs: number,
+  turns: BuiltinLoopTurn[],
  nowMs: number = Date.now(),
-): Promise<{ detailHash: string; turnCount: number }> {
+): Promise<{ detailHash: string; output: string }> {
  const schemas = await registerBuiltinSchemas(store);
-  const turns = await readSessionTurns(storageRoot, sessionId);
-
  const turnHashes: string[] = [];
-  for (const turn of turns) {
-    const hash = await store.put(schemas.turn, turn);
-    turnHashes.push(hash);
+  let turnIndex = 0;
+
+  for (const loopTurn of turns) {
+    const assistant = loopTurnToAssistantPayload(loopTurn, turnIndex);
+    const assistantHash = await store.put(schemas.turn, assistant);
+    turnHashes.push(assistantHash);
+    turnIndex += 1;
+
+    const toolPayloads = loopTurnToToolPayloads(loopTurn, turnIndex);
+    for (const toolPayload of toolPayloads) {
+      const toolHash = await store.put(schemas.turn, toolPayload);
+      turnHashes.push(toolHash);
+      turnIndex += 1;
+    }
  }

  const duration = Math.max(0, nowMs - startedAtMs);
@@ -45,5 +110,6 @@ export async function storeBuiltinDetail(
    turns: turnHashes,
  };
  const detailHash = await store.put(schemas.detail, detail);
-  return { detailHash, turnCount: turnHashes.length };
+  const output = extractFinalAssistantText(turns);
+  return { detailHash, output };
 }
@@ -1,16 +1,14 @@
 export { createBuiltinAgent } from "./agent.js";
-export { registerBuiltinSchemas, storeBuiltinDetail } from "./detail.js";
+export { extractFinalAssistantText, storeBuiltinDetail } from "./detail.js";
 export type { ChatMessage, LlmAssistantResponse, LlmToolCall } from "./llm/index.js";
 export { chatCompletionWithTools } from "./llm/index.js";
 export { BUILTIN_CONTINUE_MAX_TURNS, BUILTIN_MAX_TURNS, runBuiltinLoop } from "./loop.js";
 export { buildBuiltinMessages } from "./prompt.js";
-export { appendSessionTurn, initSessionDir, readSessionTurns, removeSession } from "./session.js";
 export type { BuiltinTool, ToolContext } from "./tools/index.js";
 export { executeBuiltinTool, getBuiltinTools } from "./tools/index.js";
 export type {
  BuiltinDetailPayload,
  BuiltinLoopTurn,
-  BuiltinToolCallRecord,
-  BuiltinToolResultRecord,
+  BuiltinSessionState,
  BuiltinTurnPayload,
 } from "./types.js";
@@ -96,17 +96,8 @@ function serializeMessage(message: ChatMessage): Record<string, unknown> {
 export async function chatCompletionWithTools(
  provider: ResolvedLlmProvider,
  messages: ChatMessage[],
-  tools: OpenAiToolDefinition[] | null,
+  tools: OpenAiToolDefinition[],
 ): Promise<LlmAssistantResponse> {
-  const body: Record<string, unknown> = {
-    model: provider.model,
-    messages: messages.map(serializeMessage),
-  };
-  if (tools !== null && tools.length > 0) {
-    body.tools = tools;
-    body.tool_choice = "auto";
-  }
-
  let response: Response;
  try {
    response = await fetch(chatUrl(provider.baseUrl), {
@@ -115,7 +106,12 @@ export async function chatCompletionWithTools(
        Authorization: `Bearer ${provider.apiKey}`,
        "Content-Type": "application/json",
      },
-      body: JSON.stringify(body),
+      body: JSON.stringify({
+        model: provider.model,
+        messages: messages.map(serializeMessage),
+        tools,
+        tool_choice: "auto",
+      }),
    });
  } catch (cause) {
    const message = cause instanceof Error ? cause.message : String(cause);
@@ -2,14 +2,13 @@ import type { ResolvedLlmProvider } from "@uncaged/workflow-agent-kit";
 import { createLogger } from "@uncaged/workflow-util";

 import { type ChatMessage, chatCompletionWithTools, type LlmToolCall } from "./llm/index.js";
-import { appendSessionTurn } from "./session.js";
 import {
  builtinToolsToOpenAi,
  executeBuiltinTool,
  getBuiltinTools,
  type ToolContext,
 } from "./tools/index.js";
-import type { BuiltinToolCall, BuiltinTurnPayload } from "./types.js";
+import type { BuiltinLoopTurn, BuiltinToolCallRecord, BuiltinToolResultRecord } from "./types.js";

 const log = createLogger({ sink: { kind: "stderr" } });

@@ -21,158 +20,75 @@ export type RunBuiltinLoopOptions = {
  messages: ChatMessage[];
  toolCtx: ToolContext;
  maxTurns: number;
-  storageRoot: string;
-  sessionId: string;
-  /** When true, do not provide tools — force LLM to emit text only. */
-  noTools: boolean;
+  existingTurns: BuiltinLoopTurn[];
 };

 export type RunBuiltinLoopResult = {
  finalText: string;
  messages: ChatMessage[];
-  turnCount: number;
+  turns: BuiltinLoopTurn[];
 };

-function mapToolCallsForPayload(calls: LlmToolCall[]): BuiltinToolCall[] {
+function mapToolCalls(calls: LlmToolCall[]): BuiltinToolCallRecord[] {
  return calls.map((call) => ({
+    id: call.id,
    name: call.name,
    args: call.arguments,
  }));
 }

-async function appendTurn(
-  storageRoot: string,
-  sessionId: string,
-  payload: BuiltinTurnPayload,
-): Promise<void> {
-  await appendSessionTurn(storageRoot, sessionId, payload);
-}
-
-export async function executeTurnTools(
-  calls: Array<{ id: string; name: string; arguments: string }>,
-  toolCtx: ToolContext,
-  messages: ChatMessage[],
-  storageRoot: string,
-  sessionId: string,
-): Promise<number> {
-  let turnCount = 0;
-  for (const call of calls) {
-    const result = await executeBuiltinTool(call.name, call.arguments, toolCtx);
-    messages.push({ role: "tool", tool_call_id: call.id, content: result });
-    await appendTurn(storageRoot, sessionId, {
-      role: "tool",
-      content: result,
-      toolCalls: null,
-      reasoning: null,
-    });
-    turnCount += 1;
-  }
-  return turnCount;
-}
-
-export type ShouldNudgeOptions = {
-  noTools: boolean;
-  text: string;
-  turn: number;
-  maxTurns: number;
-};
-
-const MAX_NUDGES = 3;
-const DEADLINE_WARNING_TURNS = 3;
-
-export function shouldNudge({ noTools, text, turn, maxTurns }: ShouldNudgeOptions): boolean {
-  return !noTools && !text.trimStart().startsWith("---") && turn < maxTurns - 1;
-}
-
 /** Agent run loop: LLM ↔ tools until no tool_calls or maxTurns. */
 export async function runBuiltinLoop(
  options: RunBuiltinLoopOptions,
 ): Promise<RunBuiltinLoopResult> {
  const messages = [...options.messages];
-  const openAiTools = options.noTools ? [] : builtinToolsToOpenAi(getBuiltinTools());
+  const turns = [...options.existingTurns];
+  const openAiTools = builtinToolsToOpenAi(getBuiltinTools());
  let finalText = "";
-  let turnCount = 0;
-  let nudgeCount = 0;
-  let deadlineWarned = false;

  for (let turn = 0; turn < options.maxTurns; turn++) {
    log("8K2M4N7P", `builtin loop turn ${turn + 1}/${options.maxTurns}`);
-
-    // Warn agent when approaching turn limit
-    const turnsRemaining = options.maxTurns - turn;
-    if (!options.noTools && !deadlineWarned && turnsRemaining <= DEADLINE_WARNING_TURNS) {
-      deadlineWarned = true;
-      log("4NRXW6KT", `${turnsRemaining} turns remaining, injecting deadline warning`);
-      messages.push({
-        role: "user",
-        content:
-          `⚠️ You have ${turnsRemaining} turns remaining. ` +
-          "Wrap up your work and output the YAML frontmatter starting with `---`. " +
-          "If you cannot finish in time, output frontmatter with `status: failed` and describe what remains.",
-      });
-    }
-
-    const response = await chatCompletionWithTools(
-      options.provider,
-      messages,
-      openAiTools.length > 0 ? openAiTools : null,
-    );
-
-    // When noTools is set, ignore any tool_calls the LLM might still return
-    const effectiveToolCalls = options.noTools ? null : (response.toolCalls ?? null);
+    const response = await chatCompletionWithTools(options.provider, messages, openAiTools);

    const assistantMessage: ChatMessage = {
      role: "assistant",
      content: response.content,
-      tool_calls: effectiveToolCalls,
+      tool_calls: response.toolCalls,
    };
    messages.push(assistantMessage);

-    if (effectiveToolCalls === null || effectiveToolCalls.length === 0) {
-      const text = response.content ?? "";
-      await appendTurn(options.storageRoot, options.sessionId, {
-        role: "assistant",
-        content: text,
+    if (response.toolCalls === null || response.toolCalls.length === 0) {
+      finalText = response.content ?? "";
+      turns.push({
+        assistantContent: response.content,
        toolCalls: null,
-        reasoning: null,
+        toolResults: null,
      });
-      turnCount += 1;
-
-      if (shouldNudge({ noTools: options.noTools, text, turn, maxTurns: options.maxTurns })) {
-        nudgeCount += 1;
-        log("7FXQM2KN", `text-only turn without frontmatter, nudge ${nudgeCount}/${MAX_NUDGES}`);
-        const nudge =
-          "You stopped calling tools but your response does not start with the required `---` YAML frontmatter. " +
-          "Either continue using tools to complete your work, or output your final response starting with `---`.";
-        messages.push({ role: "user", content: nudge });
-        // Nudge doesn't consume turn budget (up to MAX_NUDGES)
-        if (nudgeCount <= MAX_NUDGES) {
-          turn -= 1;
-        }
-        continue;
-      }
-
-      finalText = text;
      break;
    }

-    // Assistant turn with tool calls
-    await appendTurn(options.storageRoot, options.sessionId, {
-      role: "assistant",
-      content: response.content ?? "",
-      toolCalls: mapToolCallsForPayload(effectiveToolCalls),
-      reasoning: null,
-    });
-    turnCount += 1;
+    const toolCallRecords = mapToolCalls(response.toolCalls);
+    const toolResults: BuiltinToolResultRecord[] = [];

-    // Execute tools
-    turnCount += await executeTurnTools(
-      effectiveToolCalls,
-      options.toolCtx,
-      messages,
-      options.storageRoot,
-      options.sessionId,
-    );
+    for (const call of response.toolCalls) {
+      const result = await executeBuiltinTool(call.name, call.arguments, options.toolCtx);
+      toolResults.push({
+        toolCallId: call.id,
+        name: call.name,
+        content: result,
+      });
+      messages.push({
+        role: "tool",
+        tool_call_id: call.id,
+        content: result,
+      });
+    }
+
+    turns.push({
+      assistantContent: response.content,
+      toolCalls: toolCallRecords,
+      toolResults,
+    });
  }

  if (finalText === "" && messages.length > 0) {
@@ -190,5 +106,5 @@ export async function runBuiltinLoop(
    }
  }

-  return { finalText, messages, turnCount };
+  return { finalText, messages, turns };
 }
@@ -59,22 +59,6 @@ export function buildBuiltinMessages(ctx: AgentContext): ChatMessage[] {
  }
  systemParts.push(rolePrompt);

-  systemParts.push(
-    "",
-    "## Workflow",
-    "",
-    `Your working directory is: ${process.cwd()}`,
-    "",
-    "You have tools available (read_file, write_file, run_command). " +
-      "Use them to complete your task — read files, run commands, make changes as needed. " +
-      "Your task is described in the user message below — do NOT use uwf or workflow CLI commands to discover your task. " +
-      "When you are done, output your final response with the YAML frontmatter block as specified above. " +
-      "Do NOT output the frontmatter until you have completed all necessary work. " +
-      "If you are running low on turns and cannot finish, output the frontmatter with `status: failed` and explain what remains in the body. " +
-      "CRITICAL: Your final output MUST start with the `---` fence on the very first line — " +
-      "no preamble text, no explanation before it. The parser requires `---` at position 0.",
-  );
-
  const messages: ChatMessage[] = [{ role: "system", content: systemParts.join("\n") }];

  const roleVisitIndices: number[] = [];
@@ -13,8 +13,9 @@ const BUILTIN_TOOL_CALL_SCHEMA: JSONSchema = {
 export const BUILTIN_TURN_SCHEMA: JSONSchema = {
  title: "builtin-turn",
  type: "object",
-  required: ["role", "content"],
+  required: ["index", "role", "content"],
  properties: {
+    index: { type: "integer" },
    role: { type: "string", enum: ["assistant", "tool"] },
    content: { type: "string" },
    toolCalls: {
@@ -1,59 +0,0 @@
-import { appendFile, mkdir, readFile, rm } from "node:fs/promises";
-import { join } from "node:path";
-
-import { createLogger } from "@uncaged/workflow-util";
-
-import type { BuiltinTurnPayload } from "./types.js";
-
-const log = createLogger({ sink: { kind: "stderr" } });
-
-function sessionsDir(storageRoot: string): string {
-  return join(storageRoot, "sessions");
-}
-
-function sessionFile(storageRoot: string, sessionId: string): string {
-  return join(sessionsDir(storageRoot), `${sessionId}.jsonl`);
-}
-
-/** Ensure sessions directory exists. */
-export async function initSessionDir(storageRoot: string): Promise<void> {
-  await mkdir(sessionsDir(storageRoot), { recursive: true });
-}
-
-/** Append a turn to the session jsonl file. */
-export async function appendSessionTurn(
-  storageRoot: string,
-  sessionId: string,
-  turn: BuiltinTurnPayload,
-): Promise<void> {
-  const line = `${JSON.stringify(turn)}\n`;
-  await appendFile(sessionFile(storageRoot, sessionId), line, "utf-8");
-  log("3XQVN8KR", `session ${sessionId} appended ${turn.role} turn`);
-}
-
-/** Read all turns from session jsonl. Returns empty array if file does not exist. */
-export async function readSessionTurns(
-  storageRoot: string,
-  sessionId: string,
-): Promise<BuiltinTurnPayload[]> {
-  try {
-    const content = await readFile(sessionFile(storageRoot, sessionId), "utf-8");
-    const lines = content
-      .trim()
-      .split("\n")
-      .filter((l) => l.length > 0);
-    return lines.map((l) => JSON.parse(l) as BuiltinTurnPayload);
-  } catch {
-    return [];
-  }
-}
-
-/** Remove session jsonl file (called after detail is persisted to step CAS). */
-export async function removeSession(storageRoot: string, sessionId: string): Promise<void> {
-  try {
-    await rm(sessionFile(storageRoot, sessionId));
-    log("7FWDP2MJ", `session ${sessionId} removed`);
-  } catch {
-    // already gone — fine
-  }
-}
@@ -34,6 +34,7 @@ export type BuiltinToolCall = {
 };

 export type BuiltinTurnPayload = {
+  index: number;
  role: BuiltinTurnRole;
  content: string;
  toolCalls: BuiltinToolCall[] | null;
@@ -1,91 +0,0 @@
-# @uncaged/workflow-agent-claude-code
-
-`uwf-claude-code` agent — spawns the Claude Code CLI and captures session detail.
-
-## Overview
-
-Layer 3 agent implementation. Spawns the `claude` CLI with a composed system prompt (role definition, task, prior steps, edge prompt). Parses stream or JSON stdout, caches session IDs for multi-turn continuation, and stores raw output plus structured detail in CAS.
-
-**Dependencies:** `@uncaged/json-cas`, `@uncaged/workflow-agent-kit`
-
-## Installation
-
-Included as the `uwf-claude-code` binary when you install `@uncaged/workflow-agent-claude-code`:
-
-```bash
-bun add -g @uncaged/workflow-agent-claude-code
-```
-
-Requires the `claude` CLI on `PATH`.
-
-## CLI Usage
-
-Invoked by `uwf thread step`:
-
-```bash
-uwf-claude-code <thread-id> <role>
-```
-
-Configure or override the agent:
-
-```bash
-uwf setup --agent claude-code
-uwf thread step <thread-id> --agent uwf-claude-code
-```
-
-Environment variables set by the engine:
-
-| Variable | Purpose |
-|----------|---------|
-| `UWF_EDGE_PROMPT` | Moderator edge instruction for this step |
-
-## API
-
-All exports come from `src/index.ts`.
-
-### Agent factory
-
-```typescript
-function createClaudeCodeAgent(): () => Promise<void>
-function buildClaudeCodePrompt(ctx: AgentContext): string
-```
-
-### Session detail
-
-```typescript
-function parseClaudeCodeStreamOutput(stdout: string): ClaudeCodeParsedResult | null
-function parseClaudeCodeJsonOutput(stdout: string): ClaudeCodeParsedResult | null
-function storeClaudeCodeDetail(
-  store: Store,
-  parsed: ClaudeCodeParsedResult,
-  sessionId: string,
-): Promise<string>
-function storeClaudeCodeRawOutput(store: Store, rawOutput: string): Promise<string>
-```
-
-## Usage (library)
-
-```typescript
-import { createClaudeCodeAgent, buildClaudeCodePrompt } from "@uncaged/workflow-agent-claude-code";
-
-const main = createClaudeCodeAgent();
-void main();
-```
-
-## Internal Structure
-
-```
-src/
-├── index.ts
-├── cli.ts              Binary entrypoint
-├── claude-code.ts      createClaudeCodeAgent, buildClaudeCodePrompt, spawn logic
-├── session-detail.ts   Parse stdout, store CAS detail nodes
-├── schemas.ts          Claude Code detail CAS schemas
-└── types.ts            ClaudeCodeParsedResult, message shapes
-```
-
-## Configuration
-
-Uses session caching from `@uncaged/workflow-agent-kit` (`getCachedSessionId` / `setCachedSessionId`). No separate config file — relies on the Claude Code CLI's own authentication.
-
-Maximum turns per invocation: 90 (constant in `claude-code.ts`).
@@ -16,7 +16,6 @@ const log = createLogger({ sink: { kind: "stderr" } });

 const CLAUDE_COMMAND = "claude";
 const CLAUDE_MAX_TURNS = 90;
-const CLAUDE_MODEL = process.env["CLAUDE_MODEL"] ?? null;

 function buildHistorySummary(steps: AgentContext["steps"]): string {
  if (steps.length === 0) {
@@ -88,7 +87,7 @@ function spawnClaude(args: string[]): Promise<{ stdout: string; stderr: string }
 }

 function spawnClaudeRun(prompt: string): Promise<{ stdout: string; stderr: string }> {
-  const args = [
+  return spawnClaude([
    "-p",
    prompt,
    "--output-format",
@@ -97,18 +96,14 @@ function spawnClaudeRun(prompt: string): Promise<{ stdout: string; stderr: strin
    "--dangerously-skip-permissions",
    "--max-turns",
    String(CLAUDE_MAX_TURNS),
-  ];
-  if (CLAUDE_MODEL !== null) {
-    args.push("--model", CLAUDE_MODEL);
-  }
-  return spawnClaude(args);
+  ]);
 }

 function spawnClaudeResume(
  sessionId: string,
  message: string,
 ): Promise<{ stdout: string; stderr: string }> {
-  const args = [
+  return spawnClaude([
    "-p",
    message,
    "--resume",
@@ -119,11 +114,7 @@ function spawnClaudeResume(
    "--dangerously-skip-permissions",
    "--max-turns",
    String(CLAUDE_MAX_TURNS),
-  ];
-  if (CLAUDE_MODEL !== null) {
-    args.push("--model", CLAUDE_MODEL);
-  }
-  return spawnClaude(args);
+  ]);
 }

 async function processClaudeOutput(stdout: string, store: Store): Promise<AgentRunResult> {
@@ -1,90 +0,0 @@
-# @uncaged/workflow-agent-hermes
-
-`uwf-hermes` agent — spawns Hermes chat via ACP and captures session detail.
-
-## Overview
-
-Layer 3 agent implementation. Wraps the Hermes CLI using the Agent Client Protocol (ACP). On first visit to a role it sends a composed prompt (role definition, task, history, edge prompt); on continuation it resumes the cached session. Session transcripts and raw output are stored as CAS detail nodes.
-
-**Dependencies:** `@uncaged/json-cas`, `@uncaged/workflow-agent-kit`, `@uncaged/workflow-protocol`, `@uncaged/workflow-util`
-
-## Installation
-
-Included as the `uwf-hermes` binary when you install `@uncaged/workflow-agent-hermes`:
-
-```bash
-bun add -g @uncaged/workflow-agent-hermes
-```
-
-Requires the `hermes` CLI on `PATH`.
-
-## CLI Usage
-
-Invoked by `uwf thread step` (not typically run directly):
-
-```bash
-uwf-hermes <thread-id> <role>
-```
-
-Environment variables set by the engine:
-
-| Variable | Purpose |
-|----------|---------|
-| `UWF_EDGE_PROMPT` | Moderator edge instruction for this step |
-
-Configure as the default agent via `uwf setup --agent hermes`.
-
-Override per step:
-
-```bash
-uwf thread step <thread-id> --agent uwf-hermes
-```
-
-## API
-
-All exports come from `src/index.ts`.
-
-### Agent factory
-
-```typescript
-function createHermesAgent(): () => Promise<void>
-function buildHermesPrompt(ctx: AgentContext): string
-```
-
-### ACP client
-
-```typescript
-class HermesAcpClient {
-  // Spawns hermes, handles JSON-RPC over stdio
-}
-```
-
-## Usage (library)
-
-```typescript
-import { createHermesAgent, buildHermesPrompt } from "@uncaged/workflow-agent-hermes";
-
-// CLI entry (src/cli.ts):
-const main = createHermesAgent();
-void main();
-```
-
-## Internal Structure
-
-```
-src/
-├── index.ts
-├── cli.ts              Binary entrypoint
-├── hermes.ts           createHermesAgent, buildHermesPrompt
-├── acp-client.ts       HermesAcpClient — ACP JSON-RPC over stdio
-├── session-cache.ts    Session ID cache (re-exports kit helpers + isResumeDisabled)
-├── session-detail.ts   Parse Hermes session JSON, store CAS detail nodes
-├── schemas.ts          Hermes detail CAS schemas
-└── types.ts            HermesSessionJson, HermesSessionMessage
-```
-
-## Configuration
-
-Uses workflow config from `~/.uncaged/workflow/config.yaml` (via agent-kit). Hermes session files are stored under the workflow storage root (see `session-detail.ts`).
-
-Set `UWF_HERMES_NO_RESUME=1` to disable session resume (see `isResumeDisabled` in `session-cache.ts`).
@@ -54,8 +54,7 @@ describe("HermesAcpClient", () => {
    { timeout: 2 * 60 * 1000 },
  );

-  // TODO(#435): flaky — depends on live LLM; mock or move to integration suite
-  it.skip(
+  it(
    "prompt() collects structured messages including tool calls",
    async () => {
      await client.connect(process.cwd());
@@ -21,8 +21,7 @@ describe("HermesAcpClient cross-process resume", () => {
    clients.length = 0;
  });

-  // TODO(#435): flaky — depends on live LLM; mock or move to integration suite
-  it.skip(
+  it(
    "resume() after close — second prompt returns non-empty text",
    async () => {
      // --- Client A: first run ---
@@ -1,182 +0,0 @@
-# @uncaged/workflow-agent-kit
-
-Agent framework — `createAgent` factory, context builder, frontmatter fast-path, and LLM extract pipeline.
-
-## Overview
-
-Layer 2 agent framework. Provides the standard entrypoint for all agent CLIs: parse `<thread-id> <role>` from argv, load thread/workflow context from CAS, invoke the agent's `run`/`continue` functions, validate output via frontmatter fast-path or LLM extract, and write a `StepNodePayload` to CAS.
-
-Also exports prompt builders, config/storage helpers, and session ID caching for multi-turn agents.
-
-**Dependencies:** `@uncaged/json-cas`, `@uncaged/json-cas-fs`, `@uncaged/workflow-protocol`, `@uncaged/workflow-util`, `dotenv`, `yaml`
-
-## Installation
-
-```bash
-bun add @uncaged/workflow-agent-kit
-```
-
-## API
-
-All exports come from `src/index.ts`.
-
-### Agent factory
-
-```typescript
-function createAgent(options: AgentOptions): () => Promise<void>
-
-type AgentOptions = {
-  name: string;
-  run: AgentRunFn;
-  continue: AgentContinueFn;
-};
-
-type AgentRunFn = (ctx: AgentContext) => Promise<AgentRunResult>;
-type AgentContinueFn = (
-  sessionId: string,
-  message: string,
-  store: AgentContext["store"],
-) => Promise<AgentRunResult>;
-
-type AgentRunResult = {
-  output: string;
-  detailHash: string;
-  sessionId: string;
-};
-```
-
-Agent CLIs call `createAgent(...)` and invoke the returned function as `main()`.
-
-### Context
-
-```typescript
-function buildContext(threadId: ThreadId, role: string): Promise<AgentContext>
-function buildContextWithMeta(
-  threadId: ThreadId,
-  role: string,
-): Promise<AgentContext & { meta: BuildContextMeta }>
-
-type AgentContext = ModeratorContext & {
-  threadId: ThreadId;
-  role: string;
-  store: Store;
-  workflow: WorkflowPayload;
-  outputFormatInstruction: string;
-  edgePrompt: string;
-  isFirstVisit: boolean;
-};
-
-type BuildContextMeta = {
-  storageRoot: string;
-  store: Store;
-  schemas: AgentStore["schemas"];
-  headHash: CasRef;
-  chain: ChainState;
-};
-```
-
-Requires `UWF_EDGE_PROMPT` in the environment (set by `uwf thread step`).
-
-### Prompt builders
-
-```typescript
-function buildRolePrompt(role: RoleDefinition): string
-function buildOutputFormatInstruction(schema: JSONSchema): string
-function buildContinuationPrompt(
-  ctx: AgentContext,
-  priorOutput: string,
-  instruction: string,
-): string
-```
-
-### Extract pipeline
-
-```typescript
-function resolveExtractModelAlias(config: WorkflowConfig): ModelAlias
-function resolveModel(config: WorkflowConfig, alias: ModelAlias): ResolvedLlmProvider
-function extract(
-  rawOutput: string,
-  outputSchema: CasRef,
-  config: WorkflowConfig,
-): Promise<ExtractResult>
-
-type ResolvedLlmProvider = { baseUrl: string; apiKey: string; model: string };
-type ExtractResult = { value: unknown; hash: CasRef };
-```
-
-### Frontmatter fast-path
-
-```typescript
-function tryFrontmatterFastPath(
-  rawOutput: string,
-  outputSchema: CasRef,
-  store: Store,
-): Promise<FrontmatterFastPathResult | null>
-
-type FrontmatterFastPathResult = { body: string; outputHash: CasRef };
-```
-
-### Session cache
-
-```typescript
-function getCachedSessionId(threadId: ThreadId, role: string): Promise<string | null>
-function setCachedSessionId(
-  threadId: ThreadId,
-  role: string,
-  sessionId: string,
-): Promise<void>
-```
-
-### Config and storage
-
-```typescript
-function getConfigPath(storageRoot: string): string
-function getEnvPath(storageRoot: string): string
-function resolveStorageRoot(): string
-function loadWorkflowConfig(storageRoot: string): Promise<WorkflowConfig>
-```
-
-## Usage
-
-```typescript
-import { createAgent, buildRolePrompt } from "@uncaged/workflow-agent-kit";
-import type { AgentContext, AgentRunResult } from "@uncaged/workflow-agent-kit";
-
-async function run(ctx: AgentContext): Promise<AgentRunResult> {
-  const prompt = buildRolePrompt(ctx.workflow.roles[ctx.role]!);
-  // ... spawn external process, capture output ...
-  return { output: markdown, detailHash: "...", sessionId: "..." };
-}
-
-async function continueSession(
-  sessionId: string,
-  message: string,
-): Promise<AgentRunResult> {
-  // ... continue multi-turn session ...
-  return { output: markdown, detailHash: "...", sessionId };
-}
-
-export const main = createAgent({ name: "my-agent", run, continue: continueSession });
-```
-
-## Internal Structure
-
-```
-src/
-├── index.ts
-├── run.ts                         createAgent entrypoint
-├── context.ts                     Thread chain walk, AgentContext builder
-├── extract.ts                     LLM structured extract fallback
-├── frontmatter.ts                 Frontmatter fast-path validation
-├── build-role-prompt.ts           Role definition → prompt text
-├── build-output-format-instruction.ts
-├── build-continuation-prompt.ts
-├── session-cache.ts               Per-thread/session ID persistence
-├── storage.ts                     CAS store, config, threads index
-├── schemas.ts                     Agent CAS schema registration
-└── types.ts                       AgentContext, AgentOptions, etc.
-```
-
-## Configuration
-
-Reads `config.yaml` and `.env` from the workflow storage root (`~/.uncaged/workflow` by default). See `@uncaged/workflow-protocol` for `WorkflowConfig` shape. Set via `uwf setup`.
@@ -121,11 +121,6 @@ export function createAgent(options: AgentOptions): () => Promise<void> {

    let agentResult = await runWithMessage("agent run failed", () => options.run(ctx));

-    // Preserve the primary detail from the first run — it contains the full
-    // tool-call turn history.  Continuation retries only fix frontmatter
-    // formatting and their 1-turn detail is not meaningful.
-    const primaryDetailHash = agentResult.detailHash;
-
    // Try to extract frontmatter; retry via continue if it fails
    let outputHash = await tryExtractOutput(agentResult.output, roleDef.frontmatter, ctx);

@@ -152,7 +147,7 @@ export function createAgent(options: AgentOptions): () => Promise<void> {
    const stepHash = await persistStep({
      ctx,
      outputHash,
-      detailHash: primaryDetailHash,
+      detailHash: agentResult.detailHash,
      agentName: agentLabel(options.name),
    });

@@ -1,84 +0,0 @@
-# @uncaged/workflow-dashboard
-
-Web graph editor for visualizing and editing workflow YAML definitions.
-
-## Overview
-
-A private alpha web app (not part of the runtime engine stack). Provides a React + `@xyflow/react` canvas for editing workflow roles, conditions, and graph transitions. Uses `@uncaged/workflow-protocol` types for validation and YAML round-tripping.
-
-Planned integration: local `uwf connect` over WebSocket to sync YAML between CLI and the browser editor. The REST API and Elysia backend are currently stubs for development.
-
-**Dependencies:** `@uncaged/workflow-protocol`, `@xyflow/react`, React 19, react-router v7, Vite 8, Tailwind CSS v4, Elysia
-
-## Installation
-
-Monorepo-only ( `"private": true` ). Not published to npm.
-
-```bash
-cd packages/workflow-dashboard
-bun install --no-cache
-```
-
-## CLI Usage
-
-Start the Vite dev server (port 3000):
-
-```bash
-cd packages/workflow-dashboard
-bun run dev
-```
-
-Build for production:
-
-```bash
-bun run build
-```
-
-Open `http://localhost:3000` in a browser.
-
-## Internal Structure
-
-```
-workflow-dashboard/
-├── server.ts                 Vite dev server entry (port 3000)
-├── vite.config.ts            Vite + React + Tailwind + Elysia plugin
-├── vite-dev.ts               Custom Vite plugin
-├── index.html
-├── components.json           shadcn configuration
-├── server/
-│   ├── api.ts                Elysia REST API (health + workflow CRUD stub)
-│   └── workflow.ts           Workflow file read/write + format conversion
-└── src/
-    ├── main.tsx              React DOM entry
-    ├── app.tsx               Root layout
-    ├── router.tsx            Hash-mode routes
-    ├── index.css
-    ├── lib/utils.ts          Tailwind cn() helper
-    ├── components/ui/        shadcn components (button, card, dialog, input, …)
-    ├── pages/
-    │   ├── home.tsx          Workflow list
-    │   ├── detail.tsx        Workflow detail view
-    │   └── editor.tsx        Full editor page
-    └── editor/               Core graph editor
-        ├── flow.tsx          FlowEditor component
-        ├── context.tsx       State (useSyncExternalStore + Immer)
-        ├── injection.ts      DI container
-        ├── type.ts             Internal editor types
-        ├── model/              Node/edge state model
-        ├── nodes/              Start, role, end node components
-        ├── edges/              Conditional edge rendering
-        ├── panel/              Toolbar, add/edit panels
-        ├── trans/              YAML ↔ graph conversion (trans-in, trans-out, validate)
-        ├── layout/             Auto-layout
-        └── utils/              Event helpers, click-outside hook
-```
-
-## Configuration
-
-| Setting | Default | Notes |
-|---------|---------|-------|
-| Dev server port | `3000` | Set in `server.ts` |
-| Workflow storage (dev) | `tmp/workflow/` | YAML files during development |
-| Path alias | `@/` → `src/` | Configured in `vite.config.ts` |
-
-No library API — this package is an application, not importable as a module.
@@ -63,7 +63,7 @@ function stepsToPayload(name: string, description: string, steps: WorkFlowSteps)
      let condName: string | null = null;
      if (t.condition) {
        if (expressionToName.has(t.condition)) {
-          condName = expressionToName.get(t.condition) ?? null;
+          condName = expressionToName.get(t.condition)!;
        } else {
          condName = `cond${condIdx++}`;
          expressionToName.set(t.condition, condName);
@@ -4,7 +4,6 @@ import { cn } from "@/lib/utils";

 function Label({ className, ...props }: React.ComponentProps<"label">) {
  return (
-    // biome-ignore lint/a11y/noLabelWithoutControl: generic Label component; control association handled by consumer
    <label
      data-slot="label"
      className={cn(
@@ -15,7 +15,6 @@ interface State<T, A> {
  readonly onlyView: boolean;
 }
 type Use = <T, A>(sub: SubModel<T, A>) => [T, A];
-// biome-ignore lint/suspicious/noExplicitAny: UseV intentionally erases the action type
 type UseV = <T>(sub: SubModel<T, any>) => T;
 type Create<T, A> = (set: Setter<T>, get: () => T, model: Model) => A;

@@ -28,9 +27,7 @@ export function generate<T>(val: T) {
    const next = typeof ch === "function" ? (ch as (prev: T) => T)(val) : ch;
    if (Object.is(val, next)) return;
    val = next;
-    for (const call of listener) {
-      call();
-    }
+    listener.forEach((call) => call());
  }
  const listen = (call: VoidFunction) => {
    listener.add(call);
@@ -41,26 +38,21 @@ export function generate<T>(val: T) {
 }

 class SubModel<T, A> {
-  public readonly name: string;
-  private readonly make: () => T;
-  private readonly create: Create<T, A>;
-  private readonly onlyView: boolean;
-
-  constructor(name: string, _make: () => T, _create: Create<T, A>, _onlyView = false) {
-    this.name = name;
-    this.make = _make;
-    this.create = _create;
-    this.onlyView = _onlyView;
-  }
+  constructor(
+    public readonly name: string,
+    _make: () => T,
+    _create: Create<T, A>,
+    _onlyView = false,
+  ) {}

  public gen(model: Model): State<T, A> {
-    const { get, set, use, listen } = generate(this.make());
-    const actions = this.create(set, get, model);
-    return { get, set, use, listen, actions, onlyView: this.onlyView };
+    const { make, create, onlyView } = this;
+    const { get, set, use, listen } = generate(make());
+    const actions = create(set, get, model);
+    return { get, set, use, listen, actions, onlyView };
  }

  use(): [T, A] {
-    // biome-ignore lint/correctness/useHookAtTopLevel: use() is called as a hook by consumers
    const { query } = useContext(Context);
    const { use, actions } = query(this);
    return [use(), actions];
@@ -75,27 +67,20 @@ class SubModel<T, A> {
  }
 }

-// biome-ignore lint/suspicious/noExplicitAny: snapshot data is heterogeneous
 type Snapshot = [name: string, data: any];
 class Model {
  private ustack: Snapshot[][] = [];
  private rstack: Snapshot[][] = [];
  private transaction = 0;
-  // biome-ignore lint/suspicious/noExplicitAny: backup stores heterogeneous state values
  private backup = new Map<string, any>();
  public flow = {} as ReactFlowInstance<AnyWorkNode>;
  private stackListeners = new Set<() => void>();
  public readonly stackState: readonly [boolean, boolean] = [false, false];

-  // biome-ignore lint/suspicious/noExplicitAny: store holds heterogeneous state types
-  private readonly store: Map<string, State<any, any>>;
-  public readonly use: Use;
-
-  // biome-ignore lint/suspicious/noExplicitAny: store holds heterogeneous state types
-  constructor(store: Map<string, State<any, any>>, use: Use) {
-    this.store = store;
-    this.use = use;
-  }
+  constructor(
+    private readonly store: Map<string, State<any, any>>,
+    public readonly use: Use,
+  ) {}

  public reset() {
    this.ustack = [];
@@ -113,9 +98,7 @@ class Model {
  private triggerStackState() {
    // @ts-expect-error
    this.stackState = [this.canUndo(), this.canRedo()];
-    for (const call of this.stackListeners) {
-      call();
-    }
+    this.stackListeners.forEach((call) => call());
  }

  private getStackState = () => this.stackState;
@@ -125,11 +108,10 @@ class Model {
  }

  public log() {
-    // biome-ignore lint/suspicious/noExplicitAny: debug log accumulates heterogeneous values
    const snapshots: Record<string, any> = {};
-    for (const [name, state] of this.store) {
+    this.store.forEach((state, name) => {
      snapshots[name] = state.get();
-    }
+    });
  }

  public undo() {
@@ -137,13 +119,11 @@ class Model {
    const item = ustack.pop();
    if (!item) return;
    const step: Snapshot[] = [];
-    for (const [name, data] of item) {
-      const entry = store.get(name);
-      if (!entry) continue;
-      const { get, set } = entry;
+    item.forEach(([name, data]) => {
+      const { get, set } = store.get(name)!;
      step.push([name, get()]);
      set(data);
-    }
+    });
    rstack.push(step);
    this.triggerStackState();
  }
@@ -153,13 +133,11 @@ class Model {
    const item = rstack.pop();
    if (!item) return;
    const step: Snapshot[] = [];
-    for (const [name, data] of item) {
-      const entry = store.get(name);
-      if (!entry) continue;
-      const { get, set } = entry;
+    item.forEach(([name, data]) => {
+      const { get, set } = store.get(name)!;
      step.push([name, get()]);
      set(data);
-    }
+    });
    ustack.push(step);
    this.triggerStackState();
  }
@@ -175,10 +153,10 @@ class Model {
  public startTransaction() {
    if (this.transaction === 0) {
      this.backup.clear();
-      for (const [name, state] of this.store) {
-        if (state.onlyView) continue;
+      this.store.forEach((state, name) => {
+        if (state.onlyView) return;
        this.backup.set(name, state.get());
-      }
+      });
    }
    this.transaction += 1;
    return this.endTransaction;
@@ -189,12 +167,12 @@ class Model {
    this.transaction -= 1;
    if (this.transaction === 0) {
      const changes: Snapshot[] = [];
-      for (const [name, state] of this.store) {
-        if (state.onlyView) continue;
+      this.store.forEach((state, name) => {
+        if (state.onlyView) return;
        const before = this.backup.get(name);
-        if (Object.is(before, state.get())) continue;
+        if (Object.is(before, state.get())) return;
        changes.push([name, before]);
-      }
+      });
      this.backup.clear();
      if (changes.length === 0) return;
      this.ustack.push(changes);
@@ -205,10 +183,8 @@ class Model {
 }

 function build() {
-  // biome-ignore lint/suspicious/noExplicitAny: store holds heterogeneous state types
  const store = new Map<string, State<any, any>>();

-  // biome-ignore lint/suspicious/noExplicitAny: memo cache stores heterogeneous values
  const mem: Record<string, any> = {};
  function use<T, A>(m: SubModel<T, A>): [T, A] {
    const state = query(m);
@@ -255,16 +231,10 @@ function defineModel<T, A>(name: string, make: () => T, create: Create<T, A>) {
  return new SubModel<T, A>(name, make, create);
 }

-// biome-ignore lint/suspicious/noExplicitAny: default create returns setter directly
 const defaultCreate: Create<any, Setter<any>> = (set) => set;
 function defineView<T, A>(name: string, make: () => T, create: Create<T, A>): SubModel<T, A>;
 function defineView<T>(name: string, make: () => T): SubModel<T, Setter<T>>;
-function defineView<T>(
-  name: string,
-  make: () => T,
-  create?: Create<T, unknown>,
-): SubModel<T, unknown> {
-  // biome-ignore lint/suspicious/noExplicitAny: wraps into SubModel with erased action type
+function defineView<T>(name: string, make: () => T, create?: any): any {
  return new SubModel<T, any>(name, make, create ?? defaultCreate, true);
 }

@@ -272,12 +242,9 @@ function memoize<T>(init: (use: Use, model: Model) => T) {
  const id = uuid();
  return {
    use(): T {
-      // biome-ignore lint/correctness/useHookAtTopLevel: use() is called as a hook by consumers
      const { mem, model, use } = useContext(Context);
-      if (!mem[id]) {
-        mem[id] = init(use, model);
-      }
-      return mem[id] as T;
+      const fn = mem[id] || (mem[id] = init(use, model));
+      return fn as T;
    },
  };
 }
@@ -286,25 +253,17 @@ function compute<T>(calc: (use: UseV) => T) {
  const id = uuid();
  return {
    use(): T {
-      // biome-ignore lint/correctness/useHookAtTopLevel: use() is called as a hook by consumers
      const { mem, query } = useContext(Context);
      let state: ReturnType<typeof generate<T>> = mem[id];
      if (state) return state.use();

-      // biome-ignore lint/suspicious/noExplicitAny: deps collect heterogeneous SubModels
      const deps = new Set<SubModel<any, any>>();
-      // biome-ignore lint/suspicious/noExplicitAny: useV erases action type
-      let usev = (m: SubModel<any, any>) => {
-        deps.add(m);
-        return query(m).get();
-      };
+      let usev = (m: SubModel<any, any>) => (deps.add(m), query(m).get());
      mem[id] = state = generate<T>(calc(usev));
      if (deps.size) {
        usev = (m) => query(m).get();
        const update = () => state.set(calc(usev));
-        for (const m of deps) {
-          query(m).listen(update);
-        }
+        deps.forEach((m) => query(m).listen(update));
      }
      return state.use();
    },
@@ -137,7 +137,6 @@ function ConditionLabel({ condition, labelX, labelY, onSave }: ConditionLabelPro
      }}
      onPointerDown={(e) => e.stopPropagation()}
    >
-      {/* biome-ignore lint/a11y/noStaticElementInteractions: click handler on badge label */}
      <div onClick={handleBadgeClick} onKeyDown={undefined} className="cursor-pointer">
        <span
          className={cn(
@@ -25,7 +25,6 @@ function Flow() {
  const readonly = useReadonly();

  return (
-    // biome-ignore lint/a11y/noStaticElementInteractions: keyboard handler for flow shortcuts
    <div style={{ height: "100%" }} onKeyDown={readonly ? undefined : handleKeyDown}>
      <ReactFlowProvider>
        <ReactFlow<AnyWorkNode, Edge>
@@ -12,13 +12,11 @@ interface PrivateEvents {
 export const InternalField = Symbol("InternalField");

 export class Injection extends Eventer<PrivateEvents> {
-  public readonly emitPublic: Eventer<PublicEvents>["emit"];
-  private inital_steps: WorkFlowSteps | undefined;
-
-  constructor(emitPublic: Eventer<PublicEvents>["emit"], inital_steps?: WorkFlowSteps) {
+  constructor(
+    public readonly emitPublic: Eventer<PublicEvents>["emit"],
+    private inital_steps?: WorkFlowSteps,
+  ) {
    super();
-    this.emitPublic = emitPublic;
-    this.inital_steps = inital_steps;
  }

  public on: Eventer<PrivateEvents>["on"] = (type, lisenter) => {
@@ -60,8 +60,8 @@ function assignLayers(nodes: Node[], edges: Edge[]): Map<string, number> {

  // 2. BFS 分层（排除 end 节点，稍后单独处理）
  while (queue.length > 0) {
-    const current = queue.shift() ?? "";
-    const currentLayer = layers.get(current) ?? 0;
+    const current = queue.shift()!;
+    const currentLayer = layers.get(current)!;

    for (const target of outgoing.get(current) ?? []) {
      // 跳过 end 节点，稍后处理
@@ -31,7 +31,6 @@ export const editNodeViewModel = define.view("editNodeView", editNodeView, (set,

    model.startTransaction();
    editNode(state.node.id, (node) => {
-      // biome-ignore lint/suspicious/noExplicitAny: node data type varies by node kind
      node.data = data as any;
    });
    requestAnimationFrame(model.endTransaction);
@@ -23,7 +23,6 @@ export const handlers = define.memoize((use, model) => {
    if (!to || !fromHandle || !fromNode) return;
    const { clientX, clientY } = event as MouseEvent;
    use(addNodeViewModel)[1].start({
-      // biome-ignore lint/suspicious/noExplicitAny: ReactFlow node type mismatch
      fromNode: fromNode as any as AnyWorkNode,
      fromHandle: fromHandle,
      position: model.flow.screenToFlowPosition({ x: clientX, y: clientY }),
@@ -67,7 +67,7 @@ export function transIn(steps: WorkFlowStep[]): Result {
    });
  }

-  const firstStepId = nameToId.get(steps[0].role.name) ?? "";
+  const firstStepId = nameToId.get(steps[0].role.name)!;
  edges.push({
    id: `e-start-${firstStepId}`,
    source: "start",
@@ -78,8 +78,8 @@ export function transIn(steps: WorkFlowStep[]): Result {
  });

  for (const step of steps) {
-    const sourceId = nameToId.get(step.role.name) ?? "";
-    const _sourceOrder = idToOrder.get(sourceId) ?? 0;
+    const sourceId = nameToId.get(step.role.name)!;
+    const _sourceOrder = idToOrder.get(sourceId)!;
    const hasMultipleTransitions = step.transitions.length > 1;

    const sorted = hasMultipleTransitions
@@ -169,7 +169,7 @@ function bfs(startId: string, adj: Map<string, string[]>): Set<string> {
  const queue = [startId];
  visited.add(startId);
  while (queue.length > 0) {
-    const current = queue.shift() ?? "";
+    const current = queue.shift()!;
    for (const next of adj.get(current) ?? []) {
      if (!visited.has(next)) {
        visited.add(next);
@@ -1,11 +1,9 @@
-type Maper<T> = {
+interface Maper<T> {
  [key: string]: T;
-};
+}
 type Listen<T> = (data: T) => void;

-// biome-ignore lint/suspicious/noExplicitAny: generic event map requires any
 export class Eventer<M extends Maper<any>> {
-  // biome-ignore lint/complexity/noBannedTypes: Set<Function> needed for heterogeneous listener types
  private lisenters = {} as { [K in keyof M]: Set<Function> };

  public on<K extends keyof M>(key: K, lisenter: Listen<M[K]>) {
@@ -30,8 +28,6 @@ export class Eventer<M extends Maper<any>> {
    const set = this.lisenters[key];
    if (set === undefined) return;
    // Todo: maybe implement stoping bubble
-    for (const call of set) {
-      call(data);
-    }
+    set.forEach((call) => call(data));
  }
 }
@@ -33,7 +33,7 @@
  --color-sidebar: var(--sidebar);
  --color-sidebar-foreground: var(--sidebar-foreground);
  --font-heading: var(--font-sans);
-  --font-sans: "Geist Variable", sans-serif;
+  --font-sans: 'Geist Variable', sans-serif;
  --color-sidebar-ring: var(--sidebar-ring);
  --color-sidebar-border: var(--sidebar-border);
  --color-sidebar-accent-foreground: var(--sidebar-accent-foreground);
@@ -55,7 +55,7 @@ export function DetailPage(): ReactNode {
    );
  }

-  const basePath = `/workflow/${encodeURIComponent(name ?? "")}`;
+  const basePath = `/workflow/${encodeURIComponent(name!)}`;

  return (
    <div className="flex h-full flex-col">
@@ -1,60 +0,0 @@
-# @uncaged/workflow-moderator
-
-JSONata-based graph evaluator — determines the next role or `$END` with zero LLM cost.
-
-## Overview
-
-The moderator (Layer 1) walks the workflow graph from the current role. For each outgoing transition it evaluates an optional JSONata condition against `ModeratorContext` (start prompt + prior step outputs). The first truthy transition wins; its target role and edge prompt are returned. When no transition matches, the workflow ends (`$END`).
-
-**Dependencies:** `@uncaged/workflow-protocol`, `jsonata`
-
-## Installation
-
-```bash
-bun add @uncaged/workflow-moderator
-```
-
-## API
-
-### Functions
-
-```typescript
-function evaluate(
-  workflow: WorkflowPayload,
-  context: ModeratorContext,
-): Promise<Result<EvaluateResult, Error>>
-```
-
-Returns `{ ok: true, value: { role, prompt } }` where `role` is the next role name or `"$END"`, and `prompt` is the edge instruction for the agent.
-
-### Types
-
-```typescript
-type EvaluateResult = {
-  role: string;
-  prompt: string;
-};
-```
-
-The `Result<T, E>` type is local to this package (`{ ok: true; value: T } | { ok: false; error: E }`), not re-exported from `index.ts`.
-
-## Usage
-
-```typescript
-import { evaluate } from "@uncaged/workflow-moderator";
-import type { ModeratorContext, WorkflowPayload } from "@uncaged/workflow-protocol";
-
-const result = await evaluate(workflow, context);
-if (result.ok && result.value.role !== "$END") {
-  console.log(`Next role: ${result.value.role}, prompt: ${result.value.prompt}`);
-}
-```
-
-## Internal Structure
-
-```
-src/
-├── index.ts      Public exports
-├── evaluate.ts   Graph walk + JSONata condition evaluation
-└── types.ts      EvaluateResult, Result
-```
@@ -1,193 +0,0 @@
-# @uncaged/workflow-protocol
-
-Shared TypeScript types and JSON Schema constants for the workflow engine.
-
-## Overview
-
-This is the contract layer (Layer 0). It defines `WorkflowPayload`, thread node payloads, moderator context, CLI output shapes, and configuration types used across every other package. It has no runtime logic beyond exporting schema objects from `@uncaged/json-cas`.
-
-**Dependencies:** `@uncaged/json-cas`, `@uncaged/json-cas-fs`
-
-## Installation
-
-```bash
-bun add @uncaged/workflow-protocol
-```
-
-## API
-
-All exports come from `src/index.ts`.
-
-### JSON Schema constants
-
-```typescript
-START_NODE_SCHEMA: JSONSchema
-STEP_NODE_SCHEMA: JSONSchema
-WORKFLOW_SCHEMA: JSONSchema
-```
-
-### Core identifiers
-
-```typescript
-type CasRef = string      // XXH64 hash, 13-char Crockford Base32
-type ThreadId = string    // ULID, 26-char Crockford Base32
-type WorkflowName = string
-type RoleName = string
-```
-
-### Workflow definition
-
-```typescript
-type RoleDefinition = {
-  description: string;
-  goal: string;
-  capabilities: string[];
-  procedure: string;
-  output: string;
-  frontmatter: CasRef;
-};
-
-type Transition = {
-  role: string;
-  condition: string | null;
-  prompt: string;
-};
-
-type ConditionDefinition = {
-  description: string;
-  expression: string;
-};
-
-type WorkflowPayload = {
-  name: string;
-  description: string;
-  roles: Record<string, RoleDefinition>;
-  conditions: Record<string, ConditionDefinition>;
-  graph: Record<string, Transition[]>;
-};
-```
-
-### Thread nodes
-
-```typescript
-type StepRecord = {
-  role: string;
-  output: CasRef;
-  detail: CasRef;
-  agent: string;
-  edgePrompt: string;
-};
-
-type StartNodePayload = {
-  workflow: CasRef;
-  prompt: string;
-};
-
-type StepNodePayload = StepRecord & {
-  start: CasRef;
-  prev: CasRef | null;
-};
-```
-
-### Moderator context
-
-```typescript
-type StepContext = Omit<StepRecord, "output"> & { output: unknown };
-
-type ModeratorContext = {
-  start: StartNodePayload;
-  steps: StepContext[];
-};
-```
-
-### Configuration
-
-```typescript
-type ProviderAlias = string;
-type ModelAlias = string;
-type AgentAlias = string;
-
-type ProviderConfig = { baseUrl: string; apiKeyEnv: string };
-type ModelConfig = {
-  provider: ProviderAlias;
-  name: string;
-};
-
-type AgentConfig = {
-  command: string;
-  args: string[];
-};
-
-type WorkflowConfig = {
-  providers: Record<ProviderAlias, ProviderConfig>;
-  models: Record<ModelAlias, ModelConfig>;
-  agents: Record<AgentAlias, AgentConfig>;
-  defaultAgent: AgentAlias;
-  agentOverrides: Record<WorkflowName, Record<RoleName, AgentAlias>> | null;
-  defaultModel: ModelAlias;
-  modelOverrides: Record<Scenario, ModelAlias> | null;
-};
-```
-
-### CLI output types
-
-```typescript
-type StartOutput = { workflow: CasRef; thread: ThreadId };
-
-type StepOutput = {
-  workflow: CasRef;
-  thread: ThreadId;
-  head: CasRef;
-  done: boolean;
-};
-
-type StepEntry = {
-  hash: CasRef;
-  role: string;
-  output: unknown;
-  detail: CasRef;
-  agent: string;
-  timestamp: number;
-};
-
-type StartEntry = {
-  hash: CasRef;
-  workflow: CasRef;
-  prompt: string;
-  timestamp: number;
-};
-
-type ThreadStepsOutput = {
-  thread: ThreadId;
-  workflow: CasRef;
-  steps: [StartEntry, ...StepEntry[]];
-};
-
-type ThreadForkOutput = {
-  thread: ThreadId;
-  forkedFrom: { step: CasRef };
-};
-
-type ThreadListItem = {
-  thread: ThreadId;
-  workflow: CasRef;
-  head: CasRef;
-};
-
-type ThreadsIndex = Record<ThreadId, CasRef>;
-
-type Scenario = string;
-```
-
-## Internal Structure
-
-```
-src/
-├── index.ts      Public re-exports
-├── types.ts      All type definitions
-└── schemas.ts    START_NODE_SCHEMA, STEP_NODE_SCHEMA, WORKFLOW_SCHEMA
-```
-
-## Configuration
-
-This package defines `WorkflowConfig` types only. Runtime config loading lives in `@uncaged/workflow-agent-kit` (`loadWorkflowConfig`).
@@ -1,145 +1,32 @@
 # @uncaged/workflow-util

-Shared utilities: encoding, IDs, logging, frontmatter parsing, storage paths, and CLI reference generation.
+Shared utilities: encoding, IDs, logging, storage paths, and ref-field normalization.

-## Overview
+## What This Package Does

-Layer 1 shared infrastructure used across CLI, agent-kit, and agent packages. Provides Crockford Base32 encoding, ULID generation, structured logging with fixed 8-char tags, frontmatter markdown parsing/validation, process-level debug logging, and helpers for the default workflow data directory.
+It provides filesystem-safe Base32 and ULID generation, the structured logger used across packages, helpers for the default workflow data directory and global CAS path, and utilities to merge/normalize `refs` on steps. It re-exports `ok`/`err` from protocol for convenience.

-**Dependencies:** none (standalone)
+## Key Exports

-## Installation
+From `src/index.ts`:

-```bash
-bun add @uncaged/workflow-util
-```
+- **Base32:** `CROCKFORD_BASE32_ALPHABET`, `decodeCrockfordBase32Bits`, `decodeCrockfordToUint64`, `encodeCrockfordBase32Bits`, `encodeUint64AsCrockford`
+- **Logger:** `createLogger`
+- **Refs:** `mergeRefsWithContentHash`, `normalizeRefsField`
+- **Result:** `ok`, `err` (from `@uncaged/workflow-protocol`)
+- **Paths:** `getDefaultWorkflowStorageRoot`, `getGlobalCasDir`
+- **ULID:** `generateUlid`
+- **Types:** `CreateLoggerOptions`, `LogFn`, `LoggerSink`, `Result`

-## API
+## Dependencies

-All exports come from `src/index.ts`.
-
-### Encoding and IDs
-
-```typescript
-function encodeUint64AsCrockford(value: bigint): string
-function generateUlid(nowMs: number): string
-```
-
-### Logging
-
-```typescript
-function createLogger(options?: { sink: { kind: "stderr" } }): LogFn
-
-type LogFn = (tag: string, message: string) => void
-// CreateLoggerOptions and LoggerSink are internal types
-```
-
-### Process logger
-
-```typescript
-function createProcessLogger(options: CreateProcessLoggerOptions): ProcessLogger
-
-type ProcessLogger = {
-  pid: string;
-  log: ProcessLogFn;
-};
-
-type ProcessLoggerContext = {
-  thread: string | null;
-  workflow: string | null;
-};
-
-type CreateProcessLoggerOptions = {
-  storageRoot: string | null;
-  context: ProcessLoggerContext;
-};
-
-type ProcessLogFn = (
-  tag: string,
-  msg: string,
-  context: Record<string, string> | null,
-) => void;
-```
-
-### Frontmatter markdown
-
-```typescript
-function parseFrontmatterMarkdown(raw: string): ParsedFrontmatterMarkdown
-function validateFrontmatter(
-  parsed: ParsedFrontmatterMarkdown,
-  schema: Record<string, unknown>,
-): FrontmatterValidationError[]
-
-type ParsedFrontmatterMarkdown = {
-  frontmatter: Record<string, unknown>;
-  body: string;
-};
-
-type AgentFrontmatter = { /* standard agent frontmatter fields */ };
-type FrontmatterScope = string;
-type FrontmatterStatus = string;
-type FrontmatterValidationError = { path: string; message: string };
-```
-
-### Result helpers
-
-```typescript
-function ok<T>(value: T): Result<T, never>
-function err<E>(error: E): Result<never, E>
-
-type Result<T, E> = { ok: true; value: T } | { ok: false; error: E }
-```
-
-### Storage paths
-
-```typescript
-function getDefaultWorkflowStorageRoot(): string
-function getGlobalCasDir(storageRoot: string | undefined): string
-```
-
-### Refs and misc
-
-```typescript
-function normalizeRefsField(value: unknown): string[]
-function generateCliReference(): string
-function env(name: string, fallback: string): string
-```
+- **Workspace:** `@uncaged/workflow-protocol` — `Result` and shared types used by helpers

 ## Usage

 ```typescript
-import {
-  createLogger,
-  generateUlid,
-  getDefaultWorkflowStorageRoot,
-  parseFrontmatterMarkdown,
-} from "@uncaged/workflow-util";
+import { createLogger, getDefaultWorkflowStorageRoot, generateUlid } from "@uncaged/workflow-util";

 const log = createLogger();
-log("4KNMR2PX", "Loading workflow...");
-
-const root = getDefaultWorkflowStorageRoot();
-const threadId = generateUlid(Date.now());
+log("4KNMR2PX", "example");
 ```
-
-## Internal Structure
-
-```
-src/
-├── index.ts
-├── base32.ts              Crockford Base32 encode/decode
-├── ulid.ts                  ULID generation
-├── logger.ts                Structured logger
-├── process-logger/          Process-level debug log files
-├── frontmatter-markdown/    Parse and validate agent frontmatter
-├── refs-field.ts            Normalize refs arrays on CAS nodes
-├── result.ts                ok / err helpers
-├── storage-root.ts          Default ~/.uncaged/workflow paths
-├── env.ts                   Environment variable helper
-├── cli-reference.ts         Markdown CLI reference generator
-└── types.ts                 LogFn, Result, logger options
-```
-
-## Configuration
-
-`getDefaultWorkflowStorageRoot()` resolves to `~/.uncaged/workflow` unless overridden by environment (see `storage-root.ts`).