docs: refresh zeroclaw L0-L4

2026-03-26 19:28:25 +08:00
parent d256643208
commit b90955d1b5
6 changed files with 743 additions and 6056 deletions
--- a/docs/L0-产品白皮书与能力全景层.md
+++ b/docs/L0-产品白皮书与能力全景层.md
@@ -1,474 +1,129 @@
 # L0 — 产品白皮书与能力全景层

-**文档版本**: 1.0
-**适用项目**: sgClaw (业数融合一平台 AI Agent 底座)
-**编制日期**: 2026-03-03
+**文档版本**: 2.0  
+**适用项目**: sgClaw（ZeroClaw 重构版）  
+**编制日期**: 2026-03-26

 ---

-## 1. 产品定位
+## 1. 产品定义

-sgClaw 是面向国家电网"业数融合一平台"的 **AI 驱动智能代理平台**。它并非一个独立应用程序，而是作为核心能力嵌入 SuperRPA 定制 Chromium 浏览器内核之中，通过浏览器 Side Panel 中的控制按钮一键激活。
+sgClaw 是一个嵌入企业浏览器运行环境中的浏览器智能体执行内核。它的职责不是替代整个平台，也不是承诺“全自动数字员工”，而是把自然语言任务转换成受控的浏览器操作，并通过既有浏览器宿主完成页面执行。

-用户只需用自然语言描述业务意图，sgClaw 即可自主理解指令语义，规划执行步骤，在 ERP、OA、财务、人力资源、经济法务等复杂业务系统中完成跨系统操作——**无需编写任何代码**。
+ZeroClaw 重构之后，sgClaw 的产品形态可以概括为三件事：

-> **核心比喻：一位会思考、能学习、永不犯错的数字员工。**
+1. 把用户任务接入统一的 Agent 执行入口。
+2. 通过固定的 `browser_action` 工具把意图翻译为浏览器命令。
+3. 在协议、域名和动作白名单的约束下完成可审计的页面操作。

-sgClaw 从浏览器内核层面发起操作，与真实用户行为完全一致，不可被反自动化机制识别，从根本上解决了传统外部 RPA 工具被检测、被拦截的行业痛点。
-
-```
-┌─────────────────────────────────────────────────────────────────┐
-│                    SuperRPA 定制 Chromium 浏览器                  │
-│                                                                 │
-│  ┌──────────────────────┐    ┌────────────────────────────────┐ │
-│  │     浏览器主窗口       │    │        Side Panel 控制区        │ │
-│  │                      │    │                                │ │
-│  │  ┌────────────────┐  │    │  ┌──────────────────────────┐  │ │
-│  │  │  ERP / OA /    │  │    │  │  [启动 Agent]  [停止]     │  │ │
-│  │  │  财务 / HR 等   │  │    │  │                          │  │ │
-│  │  │  业务系统页面    │  │    │  │  指令输入：              │  │ │
-│  │  │                │  │    │  │  "导出本月合规报表"        │  │ │
-│  │  │                │  │    │  │                          │  │ │
-│  │  └────────────────┘  │    │  │  ▼ 任务进度              │  │ │
-│  │         ▲             │    │  │  ████████░░ 80%          │  │ │
-│  │         │ 内核级操作   │    │  │                          │  │ │
-│  │         │             │    │  │  ✓ 已登录 ERP            │  │ │
-│  │  ┌──────┴─────────┐  │    │  │  ✓ 已导出财务报表         │  │ │
-│  │  │   sgClaw 引擎   │◄─┼────┼──│  ► 正在导出合规报表...    │  │ │
-│  │  │  (Rust Binary)  │  │    │  │                          │  │ │
-│  │  └────────────────┘  │    │  └──────────────────────────┘  │ │
-│  └──────────────────────┘    └────────────────────────────────┘ │
-└─────────────────────────────────────────────────────────────────┘
-```
+当前仓库中的 sgClaw 不是一个完整前端产品，也不是浏览器发行版本身，而是“浏览器 Agent Runtime + Pipe 协议 + ZeroClaw 兼容层”的产品核心。

 ---

-## 2. 行业痛点
+## 2. 重构后的产品边界

-国家电网及大型央企的业务运营高度依赖多套信息系统协同。一线业务人员每天需要在 5 至 10 余套系统之间反复切换，手工搬运数据，面临以下核心痛点：
+### 2.1 当前已经落地的能力

-### 2.1 效率低下
+- 浏览器侧通过 STDIO JSON Line 协议与 Rust 进程通信。
+- 启动时执行 `init -> init_ack` 握手，并建立会话级 HMAC 密钥。
+- 任务输入统一走 `submit_task` 消息。
+- Rust 侧支持两条执行路径：
+  - 未配置大模型时，使用仓库内置 planner/fallback 逻辑。
+  - 配置 `DEEPSEEK_*` 环境变量时，切换到 ZeroClaw compatibility runtime。
+- 当前有效工具面收敛为一个工具：`browser_action`。
+- 当前真正开放给模型的动作仅 4 个：`click`、`type`、`navigate`、`getText`。
+- 所有浏览器动作都受 `resources/rules.json` 中的域名和动作白名单约束。
+- 执行过程中会向宿主发送结构化日志和最终任务结果。

-一线员工日常需在 ERP、OA、财务管控、人力资源、经济法务、营销等多套系统间反复登录、切换、手工录入。一项跨系统操作（如合规线索提报）平均需要 **15-30 分钟**，涉及 **3-5 个系统** 的数据交叉核对。全年此类重复操作累计耗费数万人时。
+### 2.2 当前明确不宣称的能力

-### 2.2 人工差错
+以下内容在旧文档中存在较多规划性描述，但并非当前仓库中的已实现事实：

-手工跨系统数据搬运极易出错。财务合规场景下，一个数字的录入错误可能导致审计异常，引发合规风险。据行业统计，人工跨系统操作的 **错误率约为 2%-5%**，在高强度、高压力的月末结算期间错误率更高。
+- 独立的 Skill 仓库与 Skill 脚本执行引擎。
+- 完整 MCP 工具接入和多工具编排。
+- 独立 Critic/Circuit Breaker 子系统。
+- 完整的浏览器 Side Panel 产品界面。
+- 40+ 页面动作在 Agent 侧全部开放。
+- 真实生产级多租户、审计后台、任务编排中心。

-### 2.3 培训成本高
-
-新员工需要 **3-6 个月** 才能熟练掌握多套业务系统的操作流程和业务规则。人员调动频繁时，培训成本成倍增长，且经验难以沉淀、传承。
-
-### 2.4 合规风险
-
-手工操作缺乏完整的审计轨迹，难以事后追溯"谁在什么时间对哪个系统做了什么操作"。在日趋严格的内控与合规要求下，这构成了显著的制度性风险。
-
-### 2.5 重复劳动
-
-经调研分析，一线业务人员 **约 80%** 的跨系统操作属于规则明确、流程固定的重复性工作。这些工作本应由自动化工具承担，但因系统间壁垒和技术限制，长期依赖人力完成。
-
-### 2.6 传统 RPA 局限
-
-外部 RPA 工具（UiPath、BluePrism 等）通过屏幕抓取、模拟点击等方式操控浏览器，存在根本性缺陷：
-
- **易被检测**：反自动化机制可识别 WebDriver、Selenium 等注入痕迹
- **被系统拦截**：越来越多的业务系统部署了 Bot Detection，直接阻断 RPA 操作
- **需专业脚本**：每个流程需要专门开发自动化脚本，维护成本高
- **环境依赖**：对操作系统版本、屏幕分辨率、系统界面变更高度敏感
+这些能力可以保留为后续扩展方向，但不应继续写入 L0-L4 作为现状描述。

 ---

-## 3. 核心能力矩阵
+## 3. 产品价值主张

-| 能力维度 | 能力描述 | 关键指标 |
-|---------|---------|---------|
-| **自然语言驱动** | 用户以自然语言（中文）描述业务意图，Agent 自主理解语义、分解任务、规划步骤并执行 | 支持复杂多步指令，意图识别准确率 > 95% |
-| **内核级隐蔽操作** | 从浏览器内核层面发起 DOM 操作与事件派发，与真实用户行为在技术栈上完全一致 | 反自动化检测通过率 100%，零注入痕迹 |
-| **自进化学习** | 每次成功执行的操作序列自动沉淀为 Skill，后续同类任务直接复用，无需重复推理 | Skill 复用率随使用时长持续提升 |
-| **三层安全防御** | Pipeline 协议层安全 + Rust 命令验证层 + C++ 内核 MAC 强制访问控制 | 纵深防御，任一层均可独立拦截非法操作 |
-| **Skill 技能仓库** | 预置覆盖财务合规、风险管控、营销、人力资源、经济法务等业务领域的操作技能包 | 开箱即用，支持自定义扩展 |
-| **多模型适配** | 支持 Claude、GPT 系列、本地化模型（Qwen、ChatGLM 等），可按安全等级灵活切换 | 模型切换零代码，响应延迟 < 2s |
-| **跨平台支持** | 原生支持 Linux（银河麒麟 V10）与 Windows，满足国产化适配要求 | 信创环境全面兼容 |
-| **极致轻量** | Rust 编写的 Agent 引擎，资源占用极低 | 内存 ~5MB，冷启动 < 10ms |
+ZeroClaw 重构后的 sgClaw，核心价值不在“功能堆叠”，而在于把原本分散的浏览器自动化能力收敛成一个可控、可替换、可验证的智能体执行底座。

-```
-┌─────────────────────────────────────────────────────────────┐
-│                   sgClaw 核心能力全景图                       │
-├─────────────────────────────────────────────────────────────┤
-│                                                             │
-│  ┌─────────────┐  ┌─────────────┐  ┌─────────────────────┐ │
-│  │  自然语言    │  │  自进化学习  │  │  多模型适配          │ │
-│  │  理解与规划  │  │  Skill 沉淀  │  │  Claude/GPT/Qwen   │ │
-│  └──────┬──────┘  └──────┬──────┘  └──────────┬──────────┘ │
-│         │                │                     │            │
-│         ▼                ▼                     ▼            │
-│  ┌──────────────────────────────────────────────────────┐   │
-│  │              sgClaw Agent 引擎 (Rust)                │   │
-│  │         内存 ~5MB  |  冷启动 < 10ms                   │   │
-│  └───────────────────────┬──────────────────────────────┘   │
-│                          │                                  │
-│         ┌────────────────┼────────────────┐                 │
-│         ▼                ▼                ▼                 │
-│  ┌────────────┐  ┌─────────────┐  ┌────────────────┐       │
-│  │ Pipeline   │  │ Rust 命令   │  │ C++ 内核 MAC   │       │
-│  │ 协议层安全  │  │ 验证层      │  │ 强制访问控制    │       │
-│  └────────────┘  └─────────────┘  └────────────────┘       │
-│         │                │                │                 │
-│         └────────────────┼────────────────┘                 │
-│                          ▼                                  │
-│  ┌──────────────────────────────────────────────────────┐   │
-│  │           内核级隐蔽操作 (Chromium C++ 层)             │   │
-│  │     DOM 操作 · 事件派发 · 与真实用户行为完全一致        │   │
-│  └──────────────────────────────────────────────────────┘   │
-│                          │                                  │
-│         ┌────────────────┼────────────────┐                 │
-│         ▼                ▼                ▼                 │
-│  ┌────────────┐  ┌─────────────┐  ┌────────────────┐       │
-│  │ Skill 仓库  │  │ 跨平台支持   │  │ 全链路审计     │       │
-│  │ 业务技能包  │  │ 麒麟/Windows │  │ trace_id 追溯  │       │
-│  └────────────┘  └─────────────┘  └────────────────┘       │
-│                                                             │
-└─────────────────────────────────────────────────────────────┘
-```
+### 3.1 对业务侧
+
+- 用自然语言触发浏览器任务，不再直接暴露底层页面命令。
+- 统一任务入口，降低页面自动化能力的使用门槛。
+- 执行链路具备日志、结果回传和协议约束，便于纳入业务流程。
+
+### 3.2 对集成侧
+
+- 浏览器宿主只需实现固定协议，不必理解模型内部细节。
+- Agent Runtime 可以在保留宿主协议的前提下切换实现策略。
+- ZeroClaw 兼容层把未来模型、记忆、工具调度的升级入口预留在 Rust 侧。
+
+### 3.3 对安全侧
+
+- 不是“模型可任意操作浏览器”，而是“模型只能调用被允许的动作”。
+- 安全边界前置到协议和 MAC Policy，而不是把约束留给提示词。
+- 域名、动作、HMAC 三类控制共同组成最小可信执行面。

 ---

-## 4. 典型业务场景
+## 4. 能力全景

-### 4.1 财务合规
-
-**场景示例**：合规线索提报与交叉核查
-
-用户指令：*"将本月 ERP 中的异常交易记录与财务管控系统的合规规则交叉比对，生成合规线索提报清单。"*
-
-sgClaw 执行流程：
-1. 自动登录 ERP 系统，导航至异常交易模块
-2. 按时间范围筛选并导出本月异常交易数据
-3. 切换至财务管控系统，调取对应合规规则库
-4. 逐条交叉比对，标记命中合规规则的记录
-5. 自动生成合规线索提报清单，填入指定模板
-6. 提交至审批流程，附加完整操作审计记录
-
-**业务价值**：原需 2-3 小时的人工操作压缩至 **5-8 分钟**，错误率从 3% 降至 **0%**。
-
-### 4.2 风险管控
-
-**场景示例**：跨系统风险指标监测与异常预警
-
-用户指令：*"每日自动检查 ERP 和风控系统中的关键风险指标，发现异常立即生成预警报告。"*
-
-sgClaw 执行流程：
-1. 定时自动巡检 ERP 系统中的关键财务指标
-2. 同步核查风控系统中的风险阈值配置
-3. 对比分析指标偏离情况，识别异常模式
-4. 异常触发时自动截屏取证、生成预警报告
-5. 推送至相关负责人，并在 OA 系统创建跟踪工单
-
-**业务价值**：实现 **7x24 小时** 不间断风险监控，预警响应时间从 "次日发现" 缩短至 **实时告警**。
-
-### 4.3 营销
-
-**场景示例**：电费异常批量处理与账单核对
-
-用户指令：*"批量处理本月电费账单异常记录，对比营销系统与财务系统的数据差异。"*
-
-sgClaw 执行流程：
-1. 进入营销系统，筛选本月标记为异常的电费账单
-2. 逐条提取异常记录的用户编号、金额、异常类型
-3. 在财务系统中查询对应的收费记录
-4. 自动比对金额差异，生成差异明细报表
-5. 对可自动修正的记录执行批量修正操作
-6. 对需人工确认的记录生成待办清单
-
-**业务价值**：月均处理量从 **200 条/人日** 提升至 **5000+ 条/小时**，释放大量人力投入高价值工作。
-
-### 4.4 人力资源
-
-**场景示例**：社保表单自动填报与薪酬数据核验
-
-用户指令：*"从 HR 系统导出本月社保基数变更人员名单，自动填入社保申报表并交叉验证薪酬数据。"*
-
-sgClaw 执行流程：
-1. 登录 HR 系统，导出社保基数变更人员明细
-2. 自动填入社保局在线申报表单的对应字段
-3. 同步查询薪酬系统中的工资明细数据
-4. 交叉验证社保基数与实际薪酬的一致性
-5. 标记不一致记录，生成差异报告
-6. 合规记录自动提交，异常记录流转至人工复核
-
-**业务价值**：每月社保申报工作从 **3-5 个工作日** 压缩至 **2-4 小时**。
-
-### 4.5 经济法务
-
-**场景示例**：合同履约监测与法律风险预警
-
-用户指令：*"监控即将到期的合同，检查履约状态，对存在违约风险的合同生成法律风险预警。"*
-
-sgClaw 执行流程：
-1. 在合同管理系统中筛选 30 天内到期的合同
-2. 逐一核查合同关键条款的履约状态
-3. 交叉查询 ERP 系统中的付款/交货记录
-4. 识别履约偏差，评估违约风险等级
-5. 生成法律风险预警报告，按风险等级排序
-6. 自动推送至法务部门，创建跟踪任务
-
-**业务价值**：合同风险识别从 "事后补救" 转变为 **"事前预警"**，法律纠纷发生率显著降低。
-
-### 4.6 协同办公
-
-**场景示例**：跨系统数据同步与报表整合
-
-用户指令：*"从 ERP、财务、HR 三个系统导出本月关键运营数据，汇总生成月度经营分析报表。"*
-
-sgClaw 执行流程：
-1. 依次登录 ERP、财务、HR 系统
-2. 按预设模板提取各系统的关键运营数据
-3. 自动对齐数据口径，统一格式
-4. 汇总计算关键指标，生成月度经营分析报表
-5. 导出为标准格式，上传至 OA 系统
-
-**业务价值**：月度报表整合从 **2-3 天人工汇总** 缩短至 **30 分钟自动生成**。
-
-### 4.7 通用场景
-
-用户只需一句自然语言指令，sgClaw 即可自主完成端到端的跨系统操作：
-
-| 自然语言指令 | Agent 自主完成的操作 |
-|------------|-------------------|
-| "导出本月所有合规报表" | 依次登录各业务系统 → 定位报表模块 → 设定时间范围 → 导出 → 汇总 |
-| "检查上周新入职员工的系统权限配置" | HR 系统查询入职名单 → 各业务系统逐一核查权限 → 生成核查报告 |
-| "把 ERP 里的采购订单数据同步到财务系统" | ERP 导出订单 → 格式转换 → 财务系统录入 → 数据校验 |
-| "统计各部门本季度差旅报销总额" | OA 系统提取差旅审批 → 财务系统核查报销 → 按部门汇总 → 生成报表 |
+| 能力域 | 当前状态 | 产品含义 |
+|---|---|---|
+| 任务接入 | 已实现 | 接收浏览器宿主发来的 `submit_task` 指令 |
+| 协议握手 | 已实现 | 统一版本、会话标识、HMAC 种子交换 |
+| Agent 执行 | 已实现 | planner fallback 与 ZeroClaw compat 共存 |
+| 浏览器工具 | 已实现 | 单一 `browser_action` 工具 |
+| 核心动作 | 已实现 | `click/type/navigate/getText` |
+| 域名白名单 | 已实现 | 仅允许规则文件中的域名 |
+| 动作白名单 | 已实现 | 仅允许规则文件中的动作 |
+| 结构化日志 | 已实现 | `log_entry` 与 `task_complete` 回传 |
+| 扩展动作枚举 | 已预留 | 协议枚举已定义，但默认未开放 |
+| Skill 引擎 | 未独立实现 | 当前仅保留“可被工具和提示词扩展”的语义入口 |
+| MCP 生态 | 未在主链路启用 | ZeroClaw 兼容层为后续保留位置 |

 ---

-## 5. 技术优势对比
+## 5. 典型产品场景

-### 5.1 综合对比矩阵
+### 5.1 页面导航与信息读取

-| 对比维度 | 人工操作 | 传统 RPA (UiPath/BluePrism) | 外部 Agent (OpenClaw) | **sgClaw** |
-|---------|---------|---------------------------|---------------------|-----------|
-| **架构方式** | N/A | 外部进程控制浏览器 | 外部进程 + WebSocket | **嵌入浏览器内核** |
-| **反检测能力** | 天然通过 | 易被检测拦截 | 可被端口扫描发现 | **原生行为，不可检测** |
-| **安全层级** | 依赖人员素质 | 应用层安全 | 应用层安全 | **三层纵深防御** |
-| **通信方式** | N/A | HTTP / COM | HTTP / WebSocket (端口暴露) | **STDIO Pipe (进程私有)** |
-| **内存占用** | N/A | 200-500MB | 394MB+ | **~5MB** |
-| **冷启动时间** | N/A | 10-30s | 5-15s | **< 10ms** |
-| **技能复用** | 经验口传 | 需重新开发脚本 | 需重新训练 | **复用已有 JS 业务代码** |
-| **部署方式** | N/A | 独立安装 + 配置 | 独立安装 + 配置 | **内嵌浏览器，零独立安装** |
-| **自然语言** | N/A | 不支持 | 部分支持 | **完整支持中文自然语言** |
-| **国产化适配** | N/A | 有限支持 | 不支持 | **银河麒麟 V10 原生支持** |
-| **学习门槛** | 3-6 个月 | 需专业 RPA 开发 | 需技术配置 | **自然语言，零学习成本** |
+用户输入“进入 ERP 首页并读取当前待办数量”，系统可以拆解为：

-### 5.2 关键差异化优势
+1. `navigate` 到目标地址。
+2. `getText` 读取页面目标区域。
+3. 返回结构化结果摘要。

-```
-┌──────────────────────────────────────────────────────────────────┐
-│                    架构差异：外部控制 vs 内核嵌入                    │
-├──────────────────────────────────────────────────────────────────┤
-│                                                                  │
-│  传统 RPA / 外部 Agent 方案：                                     │
-│                                                                  │
-│  ┌────────────┐    HTTP/WS     ┌──────────────┐                  │
-│  │ RPA Engine │ ──────────────→│   浏览器      │                  │
-│  │ (外部进程)  │  端口暴露       │  (被外部控制)  │                  │
-│  └────────────┘  可被检测       └──────────────┘                  │
-│       394MB+                     反自动化机制                     │
-│                                   可识别拦截                      │
-│                                                                  │
-│  ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─   │
-│                                                                  │
-│  sgClaw 方案：                                                    │
-│                                                                  │
-│  ┌──────────────────────────────────────────────┐                │
-│  │            SuperRPA Chromium 浏览器            │                │
-│  │                                              │                │
-│  │  ┌──────────┐  STDIO Pipe  ┌──────────────┐  │                │
-│  │  │ sgClaw   │ ◄──────────► │ Chromium C++ │  │                │
-│  │  │ (Rust)   │  进程私有     │ 内核层       │  │                │
-│  │  │ ~5MB     │  零端口暴露   │              │  │                │
-│  │  └──────────┘              └──────────────┘  │                │
-│  │                                              │                │
-│  │      操作 = 原生用户行为，不可被检测            │                │
-│  └──────────────────────────────────────────────┘                │
-│                                                                  │
-└──────────────────────────────────────────────────────────────────┘
-```
+这是当前仓库最稳定、最符合实现面的任务类型。
+
+### 5.2 表单录入与提交流程中的局部自动化
+
+当页面元素定位规则明确时，系统可用 `click` 和 `type` 组合完成表单录入、按钮点击、简单提交等动作。  
+是否能覆盖完整业务流程，取决于浏览器宿主是否提供对应页面、选择器和回包信息，而不是文档层面预设“所有流程都能端到端执行”。
+
+### 5.3 作为更大产品中的 Agent 执行核
+
+sgClaw 更适合被理解为产品底座中的一个执行核：
+
+- 上层可以接入任务输入框、审批入口或业务编排器。
+- 下层通过既有浏览器控制面执行。
+- 中间由 sgClaw 把自然语言与浏览器动作连接起来。

 ---

-## 6. 安全与合规保障
+## 6. 成功标准

-sgClaw 将安全视为产品基因而非附加功能，构建了从通信层到内核层的 **三层纵深防御体系**。
+重构后的产品文档，以“真实能力清晰可交付”为标准，而不是以“愿景尽可能大”为标准。当前版本应满足：

-### 6.1 进程隔离通信
-
- 采用 **STDIO Pipe** 作为 Agent 与浏览器内核的唯一通信通道
- 不开放任何网络端口，外部进程无法探测或连接
- 通信数据仅存在于父子进程的文件描述符中，操作系统级别的隐私保护
-
-### 6.2 MAC 强制访问控制
-
- 浏览器 C++ 内核层实施 **Mandatory Access Control**
- 严格的域名白名单机制：Agent 仅可操作授权的业务系统域名
- 敏感操作（如支付、审批）需额外的内核级权限校验
- 白名单策略由管理员统一配置，Agent 无法自行绕过
-
-### 6.3 凭证安全保护
-
- 用户凭证由浏览器 Zombie Session Pool 统一管理
- 凭证信息 **永远不会通过 Pipe 协议传输** 至 Agent 进程
- Agent 通过 BrowserAction API 间接使用已建立的会话，无需接触明文密码
-
-### 6.4 人工激活机制
-
- Agent 功能 **默认关闭**，需用户在 Side Panel 中显式点击启动按钮
- 每次启动均需用户确认，杜绝后台无感自动运行
- 用户可随时一键停止 Agent 的所有操作
-
-### 6.5 全链路审计追溯
-
- 每次 Agent 会话分配唯一 **trace_id**
- 所有操作步骤（页面导航、元素点击、数据读取、表单提交）均有完整日志记录
- 日志包含操作时间戳、目标系统、操作类型、执行结果
- 支持事后审计回溯与合规举证
-
-### 6.6 防失控熔断机制
-
- 内置 **Circuit Breaker** 机制，防止 Agent 进入死循环或失控状态
- 单次任务设置最大步骤数上限
- 连续失败自动熔断，暂停执行并通知用户
- 关键操作设置人工确认断点（human-in-the-loop）
-
---
-
-## 7. 产品形态与交付方式
-
-### 7.1 产品形态
-
-| 组件 | 形态 | 规格 |
-|------|------|------|
-| Agent 引擎 | Rust 编译二进制 | 约 8.8MB |
-| 宿主环境 | SuperRPA 定制 Chromium 浏览器 | 集成交付 |
-| 用户界面 | 浏览器 Side Panel 控制区 | 启停按钮 + 指令输入 + 任务进度 |
-| Skill 仓库 | JSON 格式技能定义文件 | 随浏览器内置，支持在线更新 |
-| 运行时依赖 | 无 | Rust 静态编译，零外部依赖 |
-
-### 7.2 交付方式
-
- **Linux (银河麒麟 V10)**：集成于 `superrpa-chromium` .deb 安装包
- **Windows**：集成于 `superrpa-chromium` .exe 安装包
- **无需独立安装**：随浏览器一并部署，无额外配置步骤
- **无需独立升级**：随浏览器版本统一升级管理
-
-### 7.3 用户交互流程
-
-```
-用户操作流程：
-
-  打开 SuperRPA 浏览器
-         │
-         ▼
-  访问业务系统（自动登录）
-         │
-         ▼
-  打开 Side Panel ──→ 看到 sgClaw 控制区
-         │
-         ▼
-  点击 [启动 Agent] 按钮
-         │
-         ▼
-  输入自然语言指令 ──→ "导出本月所有合规报表"
-         │
-         ▼
-  Agent 自主执行 ──→ Side Panel 实时显示进度
-         │
-         ▼
-  执行完成 ──→ 结果展示 / 文件下载
-         │
-         ▼
-  （可选）点击 [停止] 终止任务
-```
-
---
-
-## 8. 与 SuperRPA 浏览器的协同关系
-
-sgClaw 并非独立产品，而是与 SuperRPA 浏览器深度耦合的 **智能增强层**。两者各司其职，协同构成完整的"智能数字员工"平台。
-
-### 8.1 能力分工
-
-```
-┌────────────────────────────────────────────────────────────────────┐
-│                  "智能数字员工" 完整能力栈                           │
-├────────────────────────────────────────────────────────────────────┤
-│                                                                    │
-│  ┌──────────────────────────────────────────────────────────────┐  │
-│  │                    sgClaw 智能增强层                          │  │
-│  │                                                              │  │
-│  │  ┌────────────┐ ┌──────────┐ ┌──────────┐ ┌──────────────┐  │  │
-│  │  │ LLM 智能    │ │ 自然语言  │ │ 多步自主  │ │ 自进化学习    │  │  │
-│  │  │ 推理引擎    │ │ 理解     │ │ 任务执行  │ │ Skill 沉淀   │  │  │
-│  │  └────────────┘ └──────────┘ └──────────┘ └──────────────┘  │  │
-│  │                                                              │  │
-│  └──────────────────────────┬───────────────────────────────────┘  │
-│                             │ STDIO Pipe                           │
-│  ┌──────────────────────────┴───────────────────────────────────┐  │
-│  │                 SuperRPA 浏览器基础设施层                      │  │
-│  │                                                              │  │
-│  │  ┌────────────┐ ┌──────────┐ ┌──────────┐ ┌──────────────┐  │  │
-│  │  │ Zombie     │ │ SDK      │ │ Browser  │ │ 凭证与会话    │  │  │
-│  │  │ Session    │ │ 注入引擎  │ │ Action   │ │ 安全管理     │  │  │
-│  │  │ Pool       │ │          │ │ API      │ │              │  │  │
-│  │  └────────────┘ └──────────┘ └──────────┘ └──────────────┘  │  │
-│  │                                                              │  │
-│  │  ┌────────────┐ ┌──────────┐ ┌──────────┐ ┌──────────────┐  │  │
-│  │  │ 反检测     │ │ 多标签页  │ │ 域名     │ │ C++ 内核     │  │  │
-│  │  │ 指纹伪装   │ │ 并发管理  │ │ 白名单   │ │ MAC 控制     │  │  │
-│  │  └────────────┘ └──────────┘ └──────────┘ └──────────────┘  │  │
-│  │                                                              │  │
-│  └──────────────────────────────────────────────────────────────┘  │
-│                                                                    │
-├────────────────────────────────────────────────────────────────────┤
-│                         协同价值                                    │
-│                                                                    │
-│   SuperRPA 提供：                    sgClaw 增加：                  │
-│   ├─ Zombie Session Pool 会话池     ├─ LLM 智能推理能力            │
-│   ├─ SDK 注入与 JS 执行环境          ├─ 自然语言理解与意图解析       │
-│   ├─ BrowserAction API 操作接口     ├─ 自主多步任务规划与执行       │
-│   ├─ 凭证管理与自动登录              ├─ 自进化学习与 Skill 积累     │
-│   ├─ 反自动化检测基础设施            ├─ 跨系统业务流程编排          │
-│   └─ 内核级安全强制控制              └─ 业务语义理解与异常处理       │
-│                                                                    │
-│   单独的 SuperRPA = 强大的自动化浏览器                               │
-│   SuperRPA + sgClaw = 会思考的智能数字员工                           │
-│                                                                    │
-└────────────────────────────────────────────────────────────────────┘
-```
-
-### 8.2 典型协同流程
-
-以"自动完成月度合规报表导出"为例：
-
-| 步骤 | 执行者 | 操作 |
-|------|-------|------|
-| 1 | SuperRPA | Zombie Session Pool 提供已登录的各系统会话 |
-| 2 | sgClaw | LLM 理解用户指令，规划任务步骤 |
-| 3 | sgClaw | 通过 BrowserAction API 向浏览器发送操作指令 |
-| 4 | SuperRPA | SDK 注入层执行 DOM 操作（内核级，不可检测） |
-| 5 | SuperRPA | C++ 内核 MAC 校验操作合法性（域名白名单） |
-| 6 | sgClaw | 解析操作结果，决定下一步行动 |
-| 7 | sgClaw | 任务完成后将操作序列沉淀为 Skill |
-| 8 | SuperRPA | 记录完整操作审计日志（含 trace_id） |
-
-### 8.3 价值总结
-
-sgClaw 与 SuperRPA 浏览器的结合，实现了 **"能力 + 智能"** 的完整闭环：
-
- **SuperRPA 浏览器** 解决了 "如何安全、隐蔽地操作业务系统" 的基础设施问题
- **sgClaw** 解决了 "如何智能地理解业务意图并自主执行" 的上层智能问题
- 两者结合，使"业数融合一平台"真正具备 **"理解自然语言 → 自主规划 → 安全执行 → 持续进化"** 的完整智能数字员工能力
-
---
-
-> **sgClaw — 让每一位员工都拥有一位永不疲倦、永不犯错的智能数字助手。**
+- 任何架构描述都能在 `src/`、`resources/`、`tests/` 中找到对应实现。
+- 任何对外宣称的动作能力都与 `rules.json` 和工具 schema 一致。
+- 任何“未来可扩展”内容都与“当前已实现”明确区分。
+- L0 到 L4 能从产品、架构、接口、数据流、工程五层连续闭环。
--- a/docs/L1-系统架构与安全模型层.md
+++ b/docs/L1-系统架构与安全模型层.md
--- a/docs/L2-核心模块与接口契约层.md
+++ b/docs/L2-核心模块与接口契约层.md
--- a/docs/L3-数据流与Skill体系层.md
+++ b/docs/L3-数据流与Skill体系层.md
--- a/docs/L4-工程实现与部署拓扑层.md
+++ b/docs/L4-工程实现与部署拓扑层.md
--- a/docs/plans/2026-03-26-l0-l4-doc-refresh.md
+++ b/docs/plans/2026-03-26-l0-l4-doc-refresh.md
@@ -0,0 +1,93 @@
+# L0-L4 Documentation Refresh Implementation Plan
+
+> **For Claude:** REQUIRED SUB-SKILL: Use superpowers:executing-plans to implement this plan task-by-task.
+
+**Goal:** Refresh the L0-L4 product documentation so it matches the current ZeroClaw-based refactor and removes outdated team or roadmap narratives.
+
+**Architecture:** Replace speculative architecture with the repository's current runtime model: a Rust browser-agent process that speaks the existing STDIO JSON Line protocol, enforces MAC policy from `resources/rules.json`, and uses a ZeroClaw compatibility runtime when provider configuration is present. Keep protocol and deployment descriptions aligned with actual files under `src/`, `resources/`, `tests/`, and `docs/浏览器对接标准.md`.
+
+**Tech Stack:** Markdown, Rust source inspection, existing sgClaw protocol docs
+
+### Task 1: Reconfirm source-of-truth files
+
+**Files:**
+- Modify: `docs/L0-产品白皮书与能力全景层.md`
+- Modify: `docs/L1-系统架构与安全模型层.md`
+- Modify: `docs/L2-核心模块与接口契约层.md`
+- Modify: `docs/L3-数据流与Skill体系层.md`
+- Modify: `docs/L4-工程实现与部署拓扑层.md`
+- Reference: `src/lib.rs`
+- Reference: `src/agent/mod.rs`
+- Reference: `src/agent/runtime.rs`
+- Reference: `src/compat/runtime.rs`
+- Reference: `src/compat/browser_tool_adapter.rs`
+- Reference: `src/pipe/protocol.rs`
+- Reference: `resources/rules.json`
+- Reference: `docs/浏览器对接标准.md`
+
+**Step 1: Inspect current docs and implementation**
+
+Run: `sed -n '1,220p' docs/L0-产品白皮书与能力全景层.md`
+Expected: outdated capability claims and pre-refactor architecture language are visible.
+
+**Step 2: Inspect runtime and protocol source**
+
+Run: `sed -n '1,260p' src/pipe/protocol.rs`
+Expected: `BrowserMessage`, `AgentMessage`, and `Action` definitions show the real contract surface.
+
+**Step 3: Inspect compatibility runtime path**
+
+Run: `sed -n '1,260p' src/compat/runtime.rs`
+Expected: current ZeroClaw integration is clearly a compatibility adapter around `browser_action`.
+
+### Task 2: Rewrite the layered product narrative
+
+**Files:**
+- Modify: `docs/L0-产品白皮书与能力全景层.md`
+- Modify: `docs/L1-系统架构与安全模型层.md`
+
+**Step 1: Replace L0 narrative**
+
+Write: describe sgClaw as the productized browser-agent runtime after the ZeroClaw refactor, define current value, supported workflows, and explicit non-goals.
+
+**Step 2: Replace L1 architecture**
+
+Write: describe the actual three-part runtime topology, dual execution path, and layered security model without claiming unimplemented subsystems.
+
+### Task 3: Rewrite contract and flow documents
+
+**Files:**
+- Modify: `docs/L2-核心模块与接口契约层.md`
+- Modify: `docs/L3-数据流与Skill体系层.md`
+
+**Step 1: Replace L2**
+
+Write: define module ownership, protocol messages, active tool contract, and the relationship to `docs/浏览器对接标准.md`.
+
+**Step 2: Replace L3**
+
+Write: describe task lifecycle, planner fallback versus ZeroClaw compat path, memory/config loading, and why “Skill 体系” is currently a prompt/tool abstraction rather than a standalone skill engine.
+
+### Task 4: Rewrite engineering and deployment view
+
+**Files:**
+- Modify: `docs/L4-工程实现与部署拓扑层.md`
+
+**Step 1: Replace L4**
+
+Write: document the real repository layout, build/test commands, environment variables, deployment assumptions, and integration boundaries with the browser host.
+
+### Task 5: Verify consistency
+
+**Files:**
+- Modify: `docs/plans/2026-03-26-l0-l4-doc-refresh.md`
+
+**Step 1: Review git status**
+
+Run: `git status --short`
+Expected: only intended doc updates and existing archive-related changes remain.
+
+**Step 2: Spot-check final docs**
+
+Run: `sed -n '1,120p' docs/L2-核心模块与接口契约层.md`
+Expected: tool contract, protocol messages, and allowed actions match the codebase.