feat: knowledge-extraction workflow — BFS 三角色知识卡片生成 #266

New Issue

2026-04-30T02:14:14Z

xiaoju commented

2026-04-30 02:14:14 +00:00

What

实现一个 nerve workflow，用 BFS 遍历 .knowledge/ 目录下的卡片，自动发现知识盲区并补全。

Why

.knowledge/ 卡片是 AI agent 的 context 注入源，但手动维护容易遗漏。需要一个自动化的知识探测闭环，确保卡片覆盖系统所有关键概念。

Design

三个 Role

Role	职责	约束
questioner	读一张卡片，提 3 个卡片未覆盖的技术问题	不看代码，只看卡片本身
answerer	用 `nerve knowledge query` 搜索答案	禁止看代码，只用知识库搜索
explorer	对未回答的问题读代码找答案，写新卡片或补丁已有卡片	写完后 `nerve knowledge sync`

BFS 流程

消息历史本身就是 BFS 队列的物化：

Queue: [seed_card.md]

while queue not empty:
    card = dequeue()
    
    → questioner(card) → 3 questions
    → answerer(questions) → found / not found
    → explorer(not_found) → patch existing cards / create new cards → enqueue new cards

Moderator 逻辑（伪码）

if steps.length === 0:
    return "questioner"       # 首轮提问

last = steps[-1]

if last.role === "questioner":
    return "answerer"         # 提问后回答

if last.role === "answerer":
    if last.meta.has_unanswered:
        return "explorer"     # 有未回答问题，探索
    else:
        if queue_empty(steps):
            return END        # 所有卡片处理完
        return "questioner"   # 下一张卡片

if last.role === "explorer":
    if queue_empty(steps):
        return END            # 所有卡片处理完
    return "questioner"       # 继续下一张卡片

BFS 状态

不需要外部状态文件。消息历史就是状态：

questioner 的 meta 记录当前处理的 card 路径
explorer 的 meta 记录新增的卡片路径（enqueue）
Moderator 遍历 steps 即可算出 visited set 和 queue

Meta Schemas

// questioner
type QuestionerMeta = {
  card: string;  // 当前处理的卡片路径
  questions: Array<{
    id: string;
    question: string;
    domain: string;  // 期望答案所在的概念域
  }>;
};

// answerer
type AnswererMeta = {
  results: Array<{
    id: string;
    found: boolean;
    source: string | null;
    note: string;
  }>;
  has_unanswered: boolean;
};

// explorer
type ExplorerMeta = {
  patches: Array<{ card: string; section: string }>;
  new_cards: string[];  // 新增卡片路径，构成 BFS 入队
};

Adapter 选择

三个角色都用 LLM adapter（createLlmRole 或 createRole + LLM AgentFn）：

questioner: 纯推理，给卡片内容让 LLM 提问
answerer: 需要调用 nerve knowledge query CLI — 可能需要一个能执行命令的 adapter，或者在 role 内部用 spawn 调用 CLI 后把结果喂给 LLM 判断
explorer: 需要读代码 + 写文件 — 用 hermes adapter 或 cursor adapter

终止条件

BFS queue 为空（所有卡片都 visited）
连续 2 轮 explorer 没产出新卡片（知识已收敛）
maxRounds 兜底（默认 30）

nerve.yaml 配置

workflows:
  knowledge-extraction:
    concurrency: 1
    overflow: drop

CLI 触发

nerve workflow trigger knowledge-extraction \
  --prompt ".knowledge/architecture.md" \
  --max-rounds 30

prompt 参数传种子卡片路径。

Open Questions

answerer 需要执行 nerve knowledge query 命令 — 是让 adapter 内部 spawn，还是做一个专门的 "CLI adapter"？
explorer 写文件后需要 nerve knowledge sync — 这个 side effect 放在 role 里还是 moderator 触发？
要不要支持 --dry-run 模式（只提问 + 搜索，不写卡片）？

Ref

Knowledge layer design: .knowledge/knowledge-layer.md
Workflow engine: .knowledge/workflow.md

## What 实现一个 nerve workflow，用 BFS 遍历 `.knowledge/` 目录下的卡片，自动发现知识盲区并补全。 ## Why `.knowledge/` 卡片是 AI agent 的 context 注入源，但手动维护容易遗漏。需要一个自动化的知识探测闭环，确保卡片覆盖系统所有关键概念。 ## Design ### 三个 Role | Role | 职责 | 约束 | |------|------|------| | **questioner** | 读一张卡片，提 3 个卡片未覆盖的技术问题 | 不看代码，只看卡片本身 | | **answerer** | 用 `nerve knowledge query` 搜索答案 | **禁止看代码**，只用知识库搜索 | | **explorer** | 对未回答的问题读代码找答案，写新卡片或补丁已有卡片 | 写完后 `nerve knowledge sync` | ### BFS 流程消息历史本身就是 BFS 队列的物化： ``` Queue: [seed_card.md] while queue not empty: card = dequeue() → questioner(card) → 3 questions → answerer(questions) → found / not found → explorer(not_found) → patch existing cards / create new cards → enqueue new cards ``` ### Moderator 逻辑（伪码） ``` if steps.length === 0: return "questioner" # 首轮提问 last = steps[-1] if last.role === "questioner": return "answerer" # 提问后回答 if last.role === "answerer": if last.meta.has_unanswered: return "explorer" # 有未回答问题，探索 else: if queue_empty(steps): return END # 所有卡片处理完 return "questioner" # 下一张卡片 if last.role === "explorer": if queue_empty(steps): return END # 所有卡片处理完 return "questioner" # 继续下一张卡片 ``` ### BFS 状态不需要外部状态文件。**消息历史就是状态**： - `questioner` 的 meta 记录当前处理的 card 路径 - `explorer` 的 meta 记录新增的卡片路径（enqueue） - Moderator 遍历 steps 即可算出 visited set 和 queue ### Meta Schemas ```ts // questioner type QuestionerMeta = { card: string; // 当前处理的卡片路径 questions: Array<{ id: string; question: string; domain: string; // 期望答案所在的概念域 }>; }; // answerer type AnswererMeta = { results: Array<{ id: string; found: boolean; source: string | null; note: string; }>; has_unanswered: boolean; }; // explorer type ExplorerMeta = { patches: Array<{ card: string; section: string }>; new_cards: string[]; // 新增卡片路径，构成 BFS 入队 }; ``` ### Adapter 选择三个角色都用 **LLM adapter**（`createLlmRole` 或 `createRole` + LLM AgentFn）： - questioner: 纯推理，给卡片内容让 LLM 提问 - answerer: 需要调用 `nerve knowledge query` CLI — 可能需要一个能执行命令的 adapter，或者在 role 内部用 spawn 调用 CLI 后把结果喂给 LLM 判断 - explorer: 需要读代码 + 写文件 — 用 hermes adapter 或 cursor adapter ### 终止条件 1. BFS queue 为空（所有卡片都 visited） 2. 连续 2 轮 explorer 没产出新卡片（知识已收敛） 3. maxRounds 兜底（默认 30） ### nerve.yaml 配置 ```yaml workflows: knowledge-extraction: concurrency: 1 overflow: drop ``` ### CLI 触发 ```bash nerve workflow trigger knowledge-extraction \ --prompt ".knowledge/architecture.md" \ --max-rounds 30 ``` prompt 参数传种子卡片路径。 ## Open Questions 1. answerer 需要执行 `nerve knowledge query` 命令 — 是让 adapter 内部 spawn，还是做一个专门的 "CLI adapter"？ 2. explorer 写文件后需要 `nerve knowledge sync` — 这个 side effect 放在 role 里还是 moderator 触发？ 3. 要不要支持 `--dry-run` 模式（只提问 + 搜索，不写卡片）？ ## Ref Knowledge layer design: `.knowledge/knowledge-layer.md` Workflow engine: `.knowledge/workflow.md`

xiaoju commented

2026-05-02 03:15:26 +00:00

Workflow 已实现在 workspace（~/.uncaged-nerve/workflows/extract-knowledge/），并已实际运行生成/更新了 11 张 .knowledge 卡片（commit 9c832b0）。

— 小橘 🍊（NEKO Team）

Workflow 已实现在 workspace（`~/.uncaged-nerve/workflows/extract-knowledge/`），并已实际运行生成/更新了 11 张 .knowledge 卡片（commit 9c832b0）。 — 小橘 🍊（NEKO Team）

xiaoju closed this issue

2026-05-02 03:15:27 +00:00

This repo is archived. You cannot comment on issues.

Branches Tags

main

chore/325-workflow-cleanup

refactor/320-extract-workflow-package

refactor/318-sense-shell-only

refactor/316-followup

feat/315-shell-trigger

feat/agent-inject-claude

fix/313-state-persistence-hardening

refactor/308-stateful-sense

docs/285-workflow-naming-convention

feat/agent-inject-cursor

chore/dead-code-cleanup

chore/rfc-006-cleanup

fix/298-update-hermes-skill

refactor/rfc-006-workflow-runtime

feat/agent-inject-phase3

feat/agent-inject-phase2

refactor/rfc-006-worker-runtime

refactor/287-align-prompts-knowledge

feat/agent-inject-phase1

refactor/277-llm-adapter-four-tuple

refactor/274-single-package-workspace

refactor/core-file-consolidation

refactor/rfc-005-phase-1

chore/knowledge-cards

refactor/pure-sense-compute

feat/sense-contract

feat/workflow-meta-package

feat/role-reviewer-package

feat/rfc004-role-committer

docs/rfc-004-package-architecture

feat/254-with-dry-run

fix/136-reflex-null-on

fix/134-hot-reload-in-flight

feat/130-dryrun-defaults

fix/123-llmextract-dryrun-defaults

feat/121-workflow-exit-codes

refactor/111-split-types-generify-sense-result

refactor/110-moderator-context-restructure

refactor/109-role-step

refactor/113-logentry-timestamp

refactor/108-remove-null-unify-ts

feat/106-workspace-biome

feat/104-dryrun-utils

feat/101-dry-run

refactor/100-extract-start-signal

feat/97-workflow-utils

docs/95-update-readme-to-match-code

refactor/93-shared-ipc-types

chore/add-pre-push-hook

fix/test-failures-after-type-safety-refactor

refactor/type-safety

refactor/split-kernel

refactor/extract-nerve-store

fix/pr81-review-followups

refactor/workflow-type-safety

feat/workflow-thread-77

chore/cursor-rules-from-conventions

fix/trigger-payload-string-support

docs/readme-update

feat/init-from-git

build/tsup-to-rslib

refactor/drizzle-v1-node-sqlite

fix/walkthrough-cleanup

refactor/node-sqlite

refactor/sql-js-migration

refactor/static-imports

feat/sense-query

fix/dev-worker-crash

refactor/daemon-subcommand

fix/review-issues-46-49

feat/blob-store

fix/init-sqlite-retry

refactor/decouple-daemon-from-cli

feat/log-archive

feat/nerve-logs

fix/phase4-followup

feat/workflow-engine-phase4

feat/workflow-engine-phase3

fix/init-runtime-bugs

feat/workflow-engine-phase2

feat/workflow-engine-phase1

rfc-002-workflow

feat/phase-7-logging

feat/phase-6-hot-reload

feat/phase-5-cli-workspace

feat/phase-4-process-manager

feat/signal-bus-reflex

feat/sense-runtime

feat/phase-1-core-types

1 Participants

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: uncaged/nerve#266