From 05b6c7eac1cb2386378713784fcc440a841f25c1 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E5=B0=8F=E5=A2=A8?= <xiaomooo@shazhou.work>
Date: Fri, 3 Apr 2026 00:09:41 +0000
Subject: [PATCH] =?UTF-8?q?docs:=20=E6=9B=B4=E6=96=B0=20Uncaged=20?=
 =?UTF-8?q?=E8=83=BD=E5=8A=9B=E8=99=9A=E6=8B=9F=E5=8C=96=20=E2=80=94=20?=
 =?UTF-8?q?=E4=BF=AE=E6=AD=A3=E9=85=8D=E9=A2=9D=E6=95=B0=E6=8D=AE=E3=80=81?=
 =?UTF-8?q?=E5=A2=9E=E5=8A=A0=E5=86=85=E6=A0=B8=E6=80=81/=E7=94=A8?=
 =?UTF-8?q?=E6=88=B7=E6=80=81=E5=88=86=E5=B1=82=E3=80=81=E8=A1=A5=E5=85=85?=
 =?UTF-8?q?=E9=93=BE=E6=8E=A5?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

---
 .../uncaged-capability-virtualization.md      | 90 +++++++++++++------
 1 file changed, 65 insertions(+), 25 deletions(-)
diff --git a/docs/shared/uncaged-capability-virtualization.md b/docs/shared/uncaged-capability-virtualization.md
index 74d9ff5..e6e4d11 100644
--- a/docs/shared/uncaged-capability-virtualization.md
+++ b/docs/shared/uncaged-capability-virtualization.md
@@ -7,7 +7,24 @@
 
 2026-04-02，主人在讨论 Uncaged（基于 Cloudflare Workers 的 Serverless 平台）架构时，从操作系统的 **LRU 内存换页**机制出发，发现了一个跨领域的统一模式：
 
-> CF Workers 免费版只允许 500 个 Worker；AI Agent 的 Context Window 也只能装有限数量的工具描述。两者的瓶颈结构完全一致。
+> CF Workers 免费版只允许 100 个 Worker，付费版也只有 500 个；AI Agent 的 Context Window 也只能装有限数量的工具描述。两者的瓶颈结构完全一致。
+
+## Cloudflare Workers 平台配额
+
+> 数据来源：[Cloudflare Workers Limits](https://developers.cloudflare.com/workers/platform/limits/)（2026-04 查证）
+
+| 特性 | Workers Free | Workers Paid ($5/月) |
+|------|-------------|---------------------|
+| **Worker 数量** | 100 | 500 |
+| **CPU Time / 请求** | 10 ms | 5 min（默认 30s，可调） |
+| **请求量** | 100,000/天 | 无限制 |
+| **Subrequests / 请求** | 50 | 10,000 |
+| **内存** | 128 MB | 128 MB |
+| **Worker 包大小** | 3 MB | 10 MB |
+| **Cron Triggers** | 5 | 250 |
+
+!!! note "Workers for Platforms"
+    如果需要突破 500 Worker 上限，CF 提供了 [Workers for Platforms](https://developers.cloudflare.com/cloudflare-for-platforms/workers-for-platforms/) 产品，专为多租户场景设计，支持**无限数量**的用户 Worker、自定义限额、可观测性和标签管理。这是 Uncaged 长期演进的候选方案。
 
 ## 统一模型
 
@@ -19,7 +36,7 @@
        │ 按需加载 (page in)
        ▼
 ┌─────────────┐
-│  活跃槽位    │  有限：500 Worker / Context Window
+│  活跃槽位    │  有限：100~500 Worker / Context Window
 │  (内存/热区) │
 └──────┬──────┘
        │ LRU 淘汰 (page out)
@@ -33,7 +50,7 @@
 
 | 维度 | AI Agent 工具上下文 | Uncaged Workers |
 |------|-------------------|-----------------|
-| **槽位限制** | Context Window (token 数) | 500 Worker 配额 |
+| **槽位限制** | Context Window (token 数) | 100~500 Worker 配额 |
 | **能力池** | 所有可用工具 / 技能 | KV 里所有 Worker 源码 |
 | **瓶颈表现** | Token 太多 → 模型注意力下降 | 配额用完 → 无法部署新服务 |
 | **调度策略** | 按语义相关性加载工具 | 按访问频率 LRU 换页 |
@@ -41,7 +58,7 @@
 
 ## OpenClaw Skills：已有的两级页表
 
-OpenClaw 的 Skills 机制天然实现了这个模式：
+[OpenClaw](https://github.com/openclaw/openclaw) 的 Skills 机制天然实现了这个模式：
 
 - **L1 页表（常驻）**：每个 Skill 的 `<description>` 标签，轻量，始终在 Context 里
 - **L2 页面（按需加载）**：`SKILL.md` 完整内容，只在匹配到时才 `read` 进来
@@ -56,47 +73,62 @@ Agent 收到请求
 
 这就是**两级页表**——用极小的索引成本覆盖大量能力，只在需要时付出完整加载的代价。
 
-## Uncaged 三级缓存架构
+## Uncaged 分层架构
 
-将同样的思路应用到 Uncaged：
+将同样的思路应用到 Uncaged，Worker 分为两层：**内核态**和**用户态**。
 
-### L1 — 热 Worker（独立部署）
+### 内核态 — 系统 Worker（常驻部署）
 
-- 核心高频服务，始终在线
-- 独立 CF Worker，性能最优
-- 数量：~50 个关键服务
+类比操作系统的内核进程，这些 Worker 是平台本身运行的基础设施，始终在线：
 
-### L2 — 冷代码（KV 存储 + 按需部署）
+| 系统 Worker | 职责 | 类比 |
+|------------|------|------|
+| **forge-router** | 路由分发、LRU 调度器 | 内核调度器 |
+| **worker-crud** | Worker 的创建/部署/删除 API | 进程管理 (fork/exec/kill) |
+| **auth-gateway** | 鉴权、密钥验证、访问控制 | 安全子系统 |
+| **health-check** | 状态页、心跳检测 | watchdog |
+| **kv-manager** | KV 代码仓库管理 | 文件系统 |
 
-- 全部 Worker 源码存在 KV（相当于磁盘）
+这些对应 Agent 架构中的 **Skill 注册表**——不是具体能力，而是让能力能被发现和调度的基础设施。
+
+### 用户态 — 业务 Worker（LRU 换页）
+
+实际的业务功能 Worker，通过 LRU 策略动态管理：
+
+- 全部源码存在 KV（相当于磁盘）
 - 收到请求时，如果目标 Worker 未部署：
     1. 从 KV 读取源码
     2. 通过 CF API 部署 Worker
-    3. 淘汰最久未访问的 Worker（LRU）
+    3. 配额满时，淘汰最久未访问的 Worker（LRU page out）
 - 冷启动延迟 1-3 秒（CF API 部署时间）
 
-### 路由表 — Forge Router（常驻）
-
-- 轻量映射：`路径 → Worker 名 → 部署状态`
-- 记录每个 Worker 的最后访问时间
-- LRU 淘汰决策的依据
-
 ```
-请求 → Forge Router
+请求 → forge-router（内核态）
   → 查路由表
-  → 已部署？→ 直接转发（L1 命中）
-  → 未部署？→ KV 读源码 → CF API 部署 → 转发（L2 换入）
-  → 配额满？→ LRU 淘汰最冷 Worker → 再部署（换页）
+  → 已部署？→ 直接转发（命中）
+  → 未部署？→ worker-crud 从 KV 拉代码 → 部署 → 转发（换入）
+  → 配额满？→ LRU 淘汰最冷用户 Worker → 再部署（换页）
 ```
 
+### 配额分配策略
+
+以付费版 500 Worker 为例：
+
+| 层级 | 分配 | 用途 |
+|------|------|------|
+| 内核态 | ~10 个 | 系统基础设施，永不换出 |
+| 用户态热区 | ~490 个 | 业务 Worker，LRU 管理 |
+| KV 冷存 | 无限 | 全部 Worker 源码备份 |
+
 ## 关键约束
 
 | 约束 | 影响 | 应对 |
 |------|------|------|
 | CF 禁止 `unsafe-eval` | 不能在 forge 内部 `eval()` KV 代码 | 必须通过 CF API 部署为独立 Worker |
+| Worker 数量上限 | Free 100 / Paid 500 | LRU 换页；长期考虑 Workers for Platforms |
 | CF API Rate Limit | 1000 req/min | 批量操作需节流；预热策略减少突发换页 |
-| 冷启动延迟 | 1-3 秒 | L1 热 Worker 覆盖高频请求；低频可接受 |
-| 免费版 CPU Time | 10ms/请求 | 简单路由足够；复杂逻辑考虑付费版（50ms） |
+| 冷启动延迟 | CF API 部署 1-3 秒 | 内核态 Worker 覆盖关键路径；业务 Worker 预热 |
+| 免费版 CPU Time | 10ms / 请求 | 路由转发 < 1ms 足够；复杂逻辑用付费版（默认 30s，可调至 5min） |
 
 ## 设计哲学
 
@@ -109,6 +141,14 @@ Agent 收到请求
 !!! tip "核心原则"
     **不要试图把所有能力同时装进有限的槽位。用轻量索引覆盖全局，按需加载具体能力，LRU 回收不活跃的资源。**
 
+## 相关链接
+
+- [Cloudflare Workers 文档](https://developers.cloudflare.com/workers/)
+- [Workers 配额限制](https://developers.cloudflare.com/workers/platform/limits/)
+- [Workers for Platforms](https://developers.cloudflare.com/cloudflare-for-platforms/workers-for-platforms/)（多租户/无限 Worker）
+- [OpenClaw](https://github.com/openclaw/openclaw)（Agent 框架，Skills 机制参考）
+- [ClawHub](https://clawhub.ai)（Skill 市场）
+
 ---
 
 *来源：2026-04-02 主人与小墨的架构讨论*