docs: refresh zeroclaw L0-L4

This commit is contained in:
zyl
2026-03-26 19:28:25 +08:00
parent d256643208
commit b90955d1b5
6 changed files with 743 additions and 6056 deletions

View File

@@ -1,474 +1,129 @@
# L0 — 产品白皮书与能力全景层
**文档版本**: 1.0
**适用项目**: sgClaw (业数融合一平台 AI Agent 底座)
**编制日期**: 2026-03-03
**文档版本**: 2.0
**适用项目**: sgClawZeroClaw 重构版)
**编制日期**: 2026-03-26
---
## 1. 产品定
## 1. 产品定
sgClaw 是面向国家电网"业数融合一平台"的 **AI 驱动智能代理平台**。它并非一个独立应用程序,而是作为核心能力嵌入 SuperRPA 定制 Chromium 浏览器内核之中,通过浏览器 Side Panel 中的控制按钮一键激活
sgClaw 是一个嵌入企业浏览器运行环境中的浏览器智能体执行内核。它的职责不是替代整个平台,也不是承诺“全自动数字员工”,而是把自然语言任务转换成受控的浏览器操作,并通过既有浏览器宿主完成页面执行
用户只需用自然语言描述业务意图sgClaw 即可自主理解指令语义,规划执行步骤,在 ERP、OA、财务、人力资源、经济法务等复杂业务系统中完成跨系统操作——**无需编写任何代码**。
ZeroClaw 重构之后sgClaw 的产品形态可以概括为三件事:
> **核心比喻:一位会思考、能学习、永不犯错的数字员工。**
1. 把用户任务接入统一的 Agent 执行入口。
2. 通过固定的 `browser_action` 工具把意图翻译为浏览器命令。
3. 在协议、域名和动作白名单的约束下完成可审计的页面操作。
sgClaw 从浏览器内核层面发起操作,与真实用户行为完全一致,不可被反自动化机制识别,从根本上解决了传统外部 RPA 工具被检测、被拦截的行业痛点
```
┌─────────────────────────────────────────────────────────────────┐
│ SuperRPA 定制 Chromium 浏览器 │
│ │
│ ┌──────────────────────┐ ┌────────────────────────────────┐ │
│ │ 浏览器主窗口 │ │ Side Panel 控制区 │ │
│ │ │ │ │ │
│ │ ┌────────────────┐ │ │ ┌──────────────────────────┐ │ │
│ │ │ ERP / OA / │ │ │ │ [启动 Agent] [停止] │ │ │
│ │ │ 财务 / HR 等 │ │ │ │ │ │ │
│ │ │ 业务系统页面 │ │ │ │ 指令输入: │ │ │
│ │ │ │ │ │ │ "导出本月合规报表" │ │ │
│ │ │ │ │ │ │ │ │ │
│ │ └────────────────┘ │ │ │ ▼ 任务进度 │ │ │
│ │ ▲ │ │ │ ████████░░ 80% │ │ │
│ │ │ 内核级操作 │ │ │ │ │ │
│ │ │ │ │ │ ✓ 已登录 ERP │ │ │
│ │ ┌──────┴─────────┐ │ │ │ ✓ 已导出财务报表 │ │ │
│ │ │ sgClaw 引擎 │◄─┼────┼──│ ► 正在导出合规报表... │ │ │
│ │ │ (Rust Binary) │ │ │ │ │ │ │
│ │ └────────────────┘ │ │ └──────────────────────────┘ │ │
│ └──────────────────────┘ └────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
```
当前仓库中的 sgClaw 不是一个完整前端产品,也不是浏览器发行版本身,而是“浏览器 Agent Runtime + Pipe 协议 + ZeroClaw 兼容层”的产品核心
---
## 2. 行业痛点
## 2. 重构后的产品边界
国家电网及大型央企的业务运营高度依赖多套信息系统协同。一线业务人员每天需要在 5 至 10 余套系统之间反复切换,手工搬运数据,面临以下核心痛点:
### 2.1 当前已经落地的能力
### 2.1 效率低下
- 浏览器侧通过 STDIO JSON Line 协议与 Rust 进程通信。
- 启动时执行 `init -> init_ack` 握手,并建立会话级 HMAC 密钥。
- 任务输入统一走 `submit_task` 消息。
- Rust 侧支持两条执行路径:
- 未配置大模型时,使用仓库内置 planner/fallback 逻辑。
- 配置 `DEEPSEEK_*` 环境变量时,切换到 ZeroClaw compatibility runtime。
- 当前有效工具面收敛为一个工具:`browser_action`
- 当前真正开放给模型的动作仅 4 个:`click``type``navigate``getText`
- 所有浏览器动作都受 `resources/rules.json` 中的域名和动作白名单约束。
- 执行过程中会向宿主发送结构化日志和最终任务结果。
一线员工日常需在 ERP、OA、财务管控、人力资源、经济法务、营销等多套系统间反复登录、切换、手工录入。一项跨系统操作如合规线索提报平均需要 **15-30 分钟**,涉及 **3-5 个系统** 的数据交叉核对。全年此类重复操作累计耗费数万人时。
### 2.2 当前明确不宣称的能力
### 2.2 人工差错
以下内容在旧文档中存在较多规划性描述,但并非当前仓库中的已实现事实:
手工跨系统数据搬运极易出错。财务合规场景下,一个数字的录入错误可能导致审计异常,引发合规风险。据行业统计,人工跨系统操作的 **错误率约为 2%-5%**,在高强度、高压力的月末结算期间错误率更高
- 独立的 Skill 仓库与 Skill 脚本执行引擎
- 完整 MCP 工具接入和多工具编排。
- 独立 Critic/Circuit Breaker 子系统。
- 完整的浏览器 Side Panel 产品界面。
- 40+ 页面动作在 Agent 侧全部开放。
- 真实生产级多租户、审计后台、任务编排中心。
### 2.3 培训成本高
新员工需要 **3-6 个月** 才能熟练掌握多套业务系统的操作流程和业务规则。人员调动频繁时,培训成本成倍增长,且经验难以沉淀、传承。
### 2.4 合规风险
手工操作缺乏完整的审计轨迹,难以事后追溯"谁在什么时间对哪个系统做了什么操作"。在日趋严格的内控与合规要求下,这构成了显著的制度性风险。
### 2.5 重复劳动
经调研分析,一线业务人员 **约 80%** 的跨系统操作属于规则明确、流程固定的重复性工作。这些工作本应由自动化工具承担,但因系统间壁垒和技术限制,长期依赖人力完成。
### 2.6 传统 RPA 局限
外部 RPA 工具UiPath、BluePrism 等)通过屏幕抓取、模拟点击等方式操控浏览器,存在根本性缺陷:
- **易被检测**:反自动化机制可识别 WebDriver、Selenium 等注入痕迹
- **被系统拦截**:越来越多的业务系统部署了 Bot Detection直接阻断 RPA 操作
- **需专业脚本**:每个流程需要专门开发自动化脚本,维护成本高
- **环境依赖**:对操作系统版本、屏幕分辨率、系统界面变更高度敏感
这些能力可以保留为后续扩展方向,但不应继续写入 L0-L4 作为现状描述。
---
## 3. 核心能力矩阵
## 3. 产品价值主张
| 能力维度 | 能力描述 | 关键指标 |
|---------|---------|---------|
| **自然语言驱动** | 用户以自然语言中文描述业务意图Agent 自主理解语义、分解任务、规划步骤并执行 | 支持复杂多步指令,意图识别准确率 > 95% |
| **内核级隐蔽操作** | 从浏览器内核层面发起 DOM 操作与事件派发,与真实用户行为在技术栈上完全一致 | 反自动化检测通过率 100%,零注入痕迹 |
| **自进化学习** | 每次成功执行的操作序列自动沉淀为 Skill后续同类任务直接复用无需重复推理 | Skill 复用率随使用时长持续提升 |
| **三层安全防御** | Pipeline 协议层安全 + Rust 命令验证层 + C++ 内核 MAC 强制访问控制 | 纵深防御,任一层均可独立拦截非法操作 |
| **Skill 技能仓库** | 预置覆盖财务合规、风险管控、营销、人力资源、经济法务等业务领域的操作技能包 | 开箱即用,支持自定义扩展 |
| **多模型适配** | 支持 Claude、GPT 系列、本地化模型Qwen、ChatGLM 等),可按安全等级灵活切换 | 模型切换零代码,响应延迟 < 2s |
| **跨平台支持** | 原生支持 Linux银河麒麟 V10与 Windows满足国产化适配要求 | 信创环境全面兼容 |
| **极致轻量** | Rust 编写的 Agent 引擎,资源占用极低 | 内存 ~5MB冷启动 < 10ms |
ZeroClaw 重构后的 sgClaw核心价值不在“功能堆叠”而在于把原本分散的浏览器自动化能力收敛成一个可控、可替换、可验证的智能体执行底座。
```
┌─────────────────────────────────────────────────────────────┐
│ sgClaw 核心能力全景图 │
├─────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────────────┐ │
│ │ 自然语言 │ │ 自进化学习 │ │ 多模型适配 │ │
│ │ 理解与规划 │ │ Skill 沉淀 │ │ Claude/GPT/Qwen │ │
│ └──────┬──────┘ └──────┬──────┘ └──────────┬──────────┘ │
│ │ │ │ │
│ ▼ ▼ ▼ │
│ ┌──────────────────────────────────────────────────────┐ │
│ │ sgClaw Agent 引擎 (Rust) │ │
│ │ 内存 ~5MB | 冷启动 < 10ms │ │
│ └───────────────────────┬──────────────────────────────┘ │
│ │ │
│ ┌────────────────┼────────────────┐ │
│ ▼ ▼ ▼ │
│ ┌────────────┐ ┌─────────────┐ ┌────────────────┐ │
│ │ Pipeline │ │ Rust 命令 │ │ C++ 内核 MAC │ │
│ │ 协议层安全 │ │ 验证层 │ │ 强制访问控制 │ │
│ └────────────┘ └─────────────┘ └────────────────┘ │
│ │ │ │ │
│ └────────────────┼────────────────┘ │
│ ▼ │
│ ┌──────────────────────────────────────────────────────┐ │
│ │ 内核级隐蔽操作 (Chromium C++ 层) │ │
│ │ DOM 操作 · 事件派发 · 与真实用户行为完全一致 │ │
│ └──────────────────────────────────────────────────────┘ │
│ │ │
│ ┌────────────────┼────────────────┐ │
│ ▼ ▼ ▼ │
│ ┌────────────┐ ┌─────────────┐ ┌────────────────┐ │
│ │ Skill 仓库 │ │ 跨平台支持 │ │ 全链路审计 │ │
│ │ 业务技能包 │ │ 麒麟/Windows │ │ trace_id 追溯 │ │
│ └────────────┘ └─────────────┘ └────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────┘
```
### 3.1 对业务侧
- 用自然语言触发浏览器任务,不再直接暴露底层页面命令。
- 统一任务入口,降低页面自动化能力的使用门槛。
- 执行链路具备日志、结果回传和协议约束,便于纳入业务流程。
### 3.2 对集成侧
- 浏览器宿主只需实现固定协议,不必理解模型内部细节。
- Agent Runtime 可以在保留宿主协议的前提下切换实现策略。
- ZeroClaw 兼容层把未来模型、记忆、工具调度的升级入口预留在 Rust 侧。
### 3.3 对安全侧
- 不是“模型可任意操作浏览器”,而是“模型只能调用被允许的动作”。
- 安全边界前置到协议和 MAC Policy而不是把约束留给提示词。
- 域名、动作、HMAC 三类控制共同组成最小可信执行面。
---
## 4. 典型业务场
## 4. 能力全
### 4.1 财务合规
**场景示例**:合规线索提报与交叉核查
用户指令:*"将本月 ERP 中的异常交易记录与财务管控系统的合规规则交叉比对,生成合规线索提报清单。"*
sgClaw 执行流程:
1. 自动登录 ERP 系统,导航至异常交易模块
2. 按时间范围筛选并导出本月异常交易数据
3. 切换至财务管控系统,调取对应合规规则库
4. 逐条交叉比对,标记命中合规规则的记录
5. 自动生成合规线索提报清单,填入指定模板
6. 提交至审批流程,附加完整操作审计记录
**业务价值**:原需 2-3 小时的人工操作压缩至 **5-8 分钟**,错误率从 3% 降至 **0%**
### 4.2 风险管控
**场景示例**:跨系统风险指标监测与异常预警
用户指令:*"每日自动检查 ERP 和风控系统中的关键风险指标,发现异常立即生成预警报告。"*
sgClaw 执行流程:
1. 定时自动巡检 ERP 系统中的关键财务指标
2. 同步核查风控系统中的风险阈值配置
3. 对比分析指标偏离情况,识别异常模式
4. 异常触发时自动截屏取证、生成预警报告
5. 推送至相关负责人,并在 OA 系统创建跟踪工单
**业务价值**:实现 **7x24 小时** 不间断风险监控,预警响应时间从 "次日发现" 缩短至 **实时告警**
### 4.3 营销
**场景示例**:电费异常批量处理与账单核对
用户指令:*"批量处理本月电费账单异常记录,对比营销系统与财务系统的数据差异。"*
sgClaw 执行流程:
1. 进入营销系统,筛选本月标记为异常的电费账单
2. 逐条提取异常记录的用户编号、金额、异常类型
3. 在财务系统中查询对应的收费记录
4. 自动比对金额差异,生成差异明细报表
5. 对可自动修正的记录执行批量修正操作
6. 对需人工确认的记录生成待办清单
**业务价值**:月均处理量从 **200 条/人日** 提升至 **5000+ 条/小时**,释放大量人力投入高价值工作。
### 4.4 人力资源
**场景示例**:社保表单自动填报与薪酬数据核验
用户指令:*"从 HR 系统导出本月社保基数变更人员名单,自动填入社保申报表并交叉验证薪酬数据。"*
sgClaw 执行流程:
1. 登录 HR 系统,导出社保基数变更人员明细
2. 自动填入社保局在线申报表单的对应字段
3. 同步查询薪酬系统中的工资明细数据
4. 交叉验证社保基数与实际薪酬的一致性
5. 标记不一致记录,生成差异报告
6. 合规记录自动提交,异常记录流转至人工复核
**业务价值**:每月社保申报工作从 **3-5 个工作日** 压缩至 **2-4 小时**
### 4.5 经济法务
**场景示例**:合同履约监测与法律风险预警
用户指令:*"监控即将到期的合同,检查履约状态,对存在违约风险的合同生成法律风险预警。"*
sgClaw 执行流程:
1. 在合同管理系统中筛选 30 天内到期的合同
2. 逐一核查合同关键条款的履约状态
3. 交叉查询 ERP 系统中的付款/交货记录
4. 识别履约偏差,评估违约风险等级
5. 生成法律风险预警报告,按风险等级排序
6. 自动推送至法务部门,创建跟踪任务
**业务价值**:合同风险识别从 "事后补救" 转变为 **"事前预警"**,法律纠纷发生率显著降低。
### 4.6 协同办公
**场景示例**:跨系统数据同步与报表整合
用户指令:*"从 ERP、财务、HR 三个系统导出本月关键运营数据,汇总生成月度经营分析报表。"*
sgClaw 执行流程:
1. 依次登录 ERP、财务、HR 系统
2. 按预设模板提取各系统的关键运营数据
3. 自动对齐数据口径,统一格式
4. 汇总计算关键指标,生成月度经营分析报表
5. 导出为标准格式,上传至 OA 系统
**业务价值**:月度报表整合从 **2-3 天人工汇总** 缩短至 **30 分钟自动生成**
### 4.7 通用场景
用户只需一句自然语言指令sgClaw 即可自主完成端到端的跨系统操作:
| 自然语言指令 | Agent 自主完成的操作 |
|------------|-------------------|
| "导出本月所有合规报表" | 依次登录各业务系统 → 定位报表模块 → 设定时间范围 → 导出 → 汇总 |
| "检查上周新入职员工的系统权限配置" | HR 系统查询入职名单 → 各业务系统逐一核查权限 → 生成核查报告 |
| "把 ERP 里的采购订单数据同步到财务系统" | ERP 导出订单 → 格式转换 → 财务系统录入 → 数据校验 |
| "统计各部门本季度差旅报销总额" | OA 系统提取差旅审批 → 财务系统核查报销 → 按部门汇总 → 生成报表 |
| 能力域 | 当前状态 | 产品含义 |
|---|---|---|
| 任务接入 | 已实现 | 接收浏览器宿主发来的 `submit_task` 指令 |
| 协议握手 | 已实现 | 统一版本、会话标识、HMAC 种子交换 |
| Agent 执行 | 已实现 | planner fallback 与 ZeroClaw compat 共存 |
| 浏览器工具 | 已实现 | 单一 `browser_action` 工具 |
| 核心动作 | 已实现 | `click/type/navigate/getText` |
| 域名白名单 | 已实现 | 仅允许规则文件中的域名 |
| 动作白名单 | 已实现 | 仅允许规则文件中的动作 |
| 结构化日志 | 已实现 | `log_entry``task_complete` 回传 |
| 扩展动作枚举 | 已预留 | 协议枚举已定义,但默认未开放 |
| Skill 引擎 | 未独立实现 | 当前仅保留“可被工具和提示词扩展”的语义入口 |
| MCP 生态 | 未在主链路启用 | ZeroClaw 兼容层为后续保留位置 |
---
## 5. 技术优势对比
## 5. 典型产品场景
### 5.1 综合对比矩阵
### 5.1 页面导航与信息读取
| 对比维度 | 人工操作 | 传统 RPA (UiPath/BluePrism) | 外部 Agent (OpenClaw) | **sgClaw** |
|---------|---------|---------------------------|---------------------|-----------|
| **架构方式** | N/A | 外部进程控制浏览器 | 外部进程 + WebSocket | **嵌入浏览器内核** |
| **反检测能力** | 天然通过 | 易被检测拦截 | 可被端口扫描发现 | **原生行为,不可检测** |
| **安全层级** | 依赖人员素质 | 应用层安全 | 应用层安全 | **三层纵深防御** |
| **通信方式** | N/A | HTTP / COM | HTTP / WebSocket (端口暴露) | **STDIO Pipe (进程私有)** |
| **内存占用** | N/A | 200-500MB | 394MB+ | **~5MB** |
| **冷启动时间** | N/A | 10-30s | 5-15s | **< 10ms** |
| **技能复用** | 经验口传 | 需重新开发脚本 | 需重新训练 | **复用已有 JS 业务代码** |
| **部署方式** | N/A | 独立安装 + 配置 | 独立安装 + 配置 | **内嵌浏览器,零独立安装** |
| **自然语言** | N/A | 不支持 | 部分支持 | **完整支持中文自然语言** |
| **国产化适配** | N/A | 有限支持 | 不支持 | **银河麒麟 V10 原生支持** |
| **学习门槛** | 3-6 个月 | 需专业 RPA 开发 | 需技术配置 | **自然语言,零学习成本** |
用户输入“进入 ERP 首页并读取当前待办数量”,系统可以拆解为:
### 5.2 关键差异化优势
1. `navigate` 到目标地址。
2. `getText` 读取页面目标区域。
3. 返回结构化结果摘要。
```
┌──────────────────────────────────────────────────────────────────┐
│ 架构差异:外部控制 vs 内核嵌入 │
├──────────────────────────────────────────────────────────────────┤
│ │
│ 传统 RPA / 外部 Agent 方案: │
│ │
│ ┌────────────┐ HTTP/WS ┌──────────────┐ │
│ │ RPA Engine │ ──────────────→│ 浏览器 │ │
│ │ (外部进程) │ 端口暴露 │ (被外部控制) │ │
│ └────────────┘ 可被检测 └──────────────┘ │
│ 394MB+ 反自动化机制 │
│ 可识别拦截 │
│ │
│ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ │
│ │
│ sgClaw 方案: │
│ │
│ ┌──────────────────────────────────────────────┐ │
│ │ SuperRPA Chromium 浏览器 │ │
│ │ │ │
│ │ ┌──────────┐ STDIO Pipe ┌──────────────┐ │ │
│ │ │ sgClaw │ ◄──────────► │ Chromium C++ │ │ │
│ │ │ (Rust) │ 进程私有 │ 内核层 │ │ │
│ │ │ ~5MB │ 零端口暴露 │ │ │ │
│ │ └──────────┘ └──────────────┘ │ │
│ │ │ │
│ │ 操作 = 原生用户行为,不可被检测 │ │
│ └──────────────────────────────────────────────┘ │
│ │
└──────────────────────────────────────────────────────────────────┘
```
这是当前仓库最稳定、最符合实现面的任务类型。
### 5.2 表单录入与提交流程中的局部自动化
当页面元素定位规则明确时,系统可用 `click``type` 组合完成表单录入、按钮点击、简单提交等动作。
是否能覆盖完整业务流程,取决于浏览器宿主是否提供对应页面、选择器和回包信息,而不是文档层面预设“所有流程都能端到端执行”。
### 5.3 作为更大产品中的 Agent 执行核
sgClaw 更适合被理解为产品底座中的一个执行核:
- 上层可以接入任务输入框、审批入口或业务编排器。
- 下层通过既有浏览器控制面执行。
- 中间由 sgClaw 把自然语言与浏览器动作连接起来。
---
## 6. 安全与合规保障
## 6. 成功标准
sgClaw 将安全视为产品基因而非附加功能,构建了从通信层到内核层的 **三层纵深防御体系**
重构后的产品文档,以“真实能力清晰可交付”为标准,而不是以“愿景尽可能大”为标准。当前版本应满足:
### 6.1 进程隔离通信
- 采用 **STDIO Pipe** 作为 Agent 与浏览器内核的唯一通信通道
- 不开放任何网络端口,外部进程无法探测或连接
- 通信数据仅存在于父子进程的文件描述符中,操作系统级别的隐私保护
### 6.2 MAC 强制访问控制
- 浏览器 C++ 内核层实施 **Mandatory Access Control**
- 严格的域名白名单机制Agent 仅可操作授权的业务系统域名
- 敏感操作(如支付、审批)需额外的内核级权限校验
- 白名单策略由管理员统一配置Agent 无法自行绕过
### 6.3 凭证安全保护
- 用户凭证由浏览器 Zombie Session Pool 统一管理
- 凭证信息 **永远不会通过 Pipe 协议传输** 至 Agent 进程
- Agent 通过 BrowserAction API 间接使用已建立的会话,无需接触明文密码
### 6.4 人工激活机制
- Agent 功能 **默认关闭**,需用户在 Side Panel 中显式点击启动按钮
- 每次启动均需用户确认,杜绝后台无感自动运行
- 用户可随时一键停止 Agent 的所有操作
### 6.5 全链路审计追溯
- 每次 Agent 会话分配唯一 **trace_id**
- 所有操作步骤(页面导航、元素点击、数据读取、表单提交)均有完整日志记录
- 日志包含操作时间戳、目标系统、操作类型、执行结果
- 支持事后审计回溯与合规举证
### 6.6 防失控熔断机制
- 内置 **Circuit Breaker** 机制,防止 Agent 进入死循环或失控状态
- 单次任务设置最大步骤数上限
- 连续失败自动熔断,暂停执行并通知用户
- 关键操作设置人工确认断点human-in-the-loop
---
## 7. 产品形态与交付方式
### 7.1 产品形态
| 组件 | 形态 | 规格 |
|------|------|------|
| Agent 引擎 | Rust 编译二进制 | 约 8.8MB |
| 宿主环境 | SuperRPA 定制 Chromium 浏览器 | 集成交付 |
| 用户界面 | 浏览器 Side Panel 控制区 | 启停按钮 + 指令输入 + 任务进度 |
| Skill 仓库 | JSON 格式技能定义文件 | 随浏览器内置,支持在线更新 |
| 运行时依赖 | 无 | Rust 静态编译,零外部依赖 |
### 7.2 交付方式
- **Linux (银河麒麟 V10)**:集成于 `superrpa-chromium` .deb 安装包
- **Windows**:集成于 `superrpa-chromium` .exe 安装包
- **无需独立安装**:随浏览器一并部署,无额外配置步骤
- **无需独立升级**:随浏览器版本统一升级管理
### 7.3 用户交互流程
```
用户操作流程:
打开 SuperRPA 浏览器
访问业务系统(自动登录)
打开 Side Panel ──→ 看到 sgClaw 控制区
点击 [启动 Agent] 按钮
输入自然语言指令 ──→ "导出本月所有合规报表"
Agent 自主执行 ──→ Side Panel 实时显示进度
执行完成 ──→ 结果展示 / 文件下载
(可选)点击 [停止] 终止任务
```
---
## 8. 与 SuperRPA 浏览器的协同关系
sgClaw 并非独立产品,而是与 SuperRPA 浏览器深度耦合的 **智能增强层**。两者各司其职,协同构成完整的"智能数字员工"平台。
### 8.1 能力分工
```
┌────────────────────────────────────────────────────────────────────┐
│ "智能数字员工" 完整能力栈 │
├────────────────────────────────────────────────────────────────────┤
│ │
│ ┌──────────────────────────────────────────────────────────────┐ │
│ │ sgClaw 智能增强层 │ │
│ │ │ │
│ │ ┌────────────┐ ┌──────────┐ ┌──────────┐ ┌──────────────┐ │ │
│ │ │ LLM 智能 │ │ 自然语言 │ │ 多步自主 │ │ 自进化学习 │ │ │
│ │ │ 推理引擎 │ │ 理解 │ │ 任务执行 │ │ Skill 沉淀 │ │ │
│ │ └────────────┘ └──────────┘ └──────────┘ └──────────────┘ │ │
│ │ │ │
│ └──────────────────────────┬───────────────────────────────────┘ │
│ │ STDIO Pipe │
│ ┌──────────────────────────┴───────────────────────────────────┐ │
│ │ SuperRPA 浏览器基础设施层 │ │
│ │ │ │
│ │ ┌────────────┐ ┌──────────┐ ┌──────────┐ ┌──────────────┐ │ │
│ │ │ Zombie │ │ SDK │ │ Browser │ │ 凭证与会话 │ │ │
│ │ │ Session │ │ 注入引擎 │ │ Action │ │ 安全管理 │ │ │
│ │ │ Pool │ │ │ │ API │ │ │ │ │
│ │ └────────────┘ └──────────┘ └──────────┘ └──────────────┘ │ │
│ │ │ │
│ │ ┌────────────┐ ┌──────────┐ ┌──────────┐ ┌──────────────┐ │ │
│ │ │ 反检测 │ │ 多标签页 │ │ 域名 │ │ C++ 内核 │ │ │
│ │ │ 指纹伪装 │ │ 并发管理 │ │ 白名单 │ │ MAC 控制 │ │ │
│ │ └────────────┘ └──────────┘ └──────────┘ └──────────────┘ │ │
│ │ │ │
│ └──────────────────────────────────────────────────────────────┘ │
│ │
├────────────────────────────────────────────────────────────────────┤
│ 协同价值 │
│ │
│ SuperRPA 提供: sgClaw 增加: │
│ ├─ Zombie Session Pool 会话池 ├─ LLM 智能推理能力 │
│ ├─ SDK 注入与 JS 执行环境 ├─ 自然语言理解与意图解析 │
│ ├─ BrowserAction API 操作接口 ├─ 自主多步任务规划与执行 │
│ ├─ 凭证管理与自动登录 ├─ 自进化学习与 Skill 积累 │
│ ├─ 反自动化检测基础设施 ├─ 跨系统业务流程编排 │
│ └─ 内核级安全强制控制 └─ 业务语义理解与异常处理 │
│ │
│ 单独的 SuperRPA = 强大的自动化浏览器 │
│ SuperRPA + sgClaw = 会思考的智能数字员工 │
│ │
└────────────────────────────────────────────────────────────────────┘
```
### 8.2 典型协同流程
以"自动完成月度合规报表导出"为例:
| 步骤 | 执行者 | 操作 |
|------|-------|------|
| 1 | SuperRPA | Zombie Session Pool 提供已登录的各系统会话 |
| 2 | sgClaw | LLM 理解用户指令,规划任务步骤 |
| 3 | sgClaw | 通过 BrowserAction API 向浏览器发送操作指令 |
| 4 | SuperRPA | SDK 注入层执行 DOM 操作(内核级,不可检测) |
| 5 | SuperRPA | C++ 内核 MAC 校验操作合法性(域名白名单) |
| 6 | sgClaw | 解析操作结果,决定下一步行动 |
| 7 | sgClaw | 任务完成后将操作序列沉淀为 Skill |
| 8 | SuperRPA | 记录完整操作审计日志(含 trace_id |
### 8.3 价值总结
sgClaw 与 SuperRPA 浏览器的结合,实现了 **"能力 + 智能"** 的完整闭环:
- **SuperRPA 浏览器** 解决了 "如何安全、隐蔽地操作业务系统" 的基础设施问题
- **sgClaw** 解决了 "如何智能地理解业务意图并自主执行" 的上层智能问题
- 两者结合,使"业数融合一平台"真正具备 **"理解自然语言 → 自主规划 → 安全执行 → 持续进化"** 的完整智能数字员工能力
---
> **sgClaw — 让每一位员工都拥有一位永不疲倦、永不犯错的智能数字助手。**
- 任何架构描述都能在 `src/``resources/``tests/` 中找到对应实现。
- 任何对外宣称的动作能力都与 `rules.json` 和工具 schema 一致。
- 任何“未来可扩展”内容都与“当前已实现”明确区分。
- L0 到 L4 能从产品、架构、接口、数据流、工程五层连续闭环。

File diff suppressed because it is too large Load Diff

File diff suppressed because it is too large Load Diff

File diff suppressed because it is too large Load Diff

File diff suppressed because it is too large Load Diff

View File

@@ -0,0 +1,93 @@
# L0-L4 Documentation Refresh Implementation Plan
> **For Claude:** REQUIRED SUB-SKILL: Use superpowers:executing-plans to implement this plan task-by-task.
**Goal:** Refresh the L0-L4 product documentation so it matches the current ZeroClaw-based refactor and removes outdated team or roadmap narratives.
**Architecture:** Replace speculative architecture with the repository's current runtime model: a Rust browser-agent process that speaks the existing STDIO JSON Line protocol, enforces MAC policy from `resources/rules.json`, and uses a ZeroClaw compatibility runtime when provider configuration is present. Keep protocol and deployment descriptions aligned with actual files under `src/`, `resources/`, `tests/`, and `docs/浏览器对接标准.md`.
**Tech Stack:** Markdown, Rust source inspection, existing sgClaw protocol docs
### Task 1: Reconfirm source-of-truth files
**Files:**
- Modify: `docs/L0-产品白皮书与能力全景层.md`
- Modify: `docs/L1-系统架构与安全模型层.md`
- Modify: `docs/L2-核心模块与接口契约层.md`
- Modify: `docs/L3-数据流与Skill体系层.md`
- Modify: `docs/L4-工程实现与部署拓扑层.md`
- Reference: `src/lib.rs`
- Reference: `src/agent/mod.rs`
- Reference: `src/agent/runtime.rs`
- Reference: `src/compat/runtime.rs`
- Reference: `src/compat/browser_tool_adapter.rs`
- Reference: `src/pipe/protocol.rs`
- Reference: `resources/rules.json`
- Reference: `docs/浏览器对接标准.md`
**Step 1: Inspect current docs and implementation**
Run: `sed -n '1,220p' docs/L0-产品白皮书与能力全景层.md`
Expected: outdated capability claims and pre-refactor architecture language are visible.
**Step 2: Inspect runtime and protocol source**
Run: `sed -n '1,260p' src/pipe/protocol.rs`
Expected: `BrowserMessage`, `AgentMessage`, and `Action` definitions show the real contract surface.
**Step 3: Inspect compatibility runtime path**
Run: `sed -n '1,260p' src/compat/runtime.rs`
Expected: current ZeroClaw integration is clearly a compatibility adapter around `browser_action`.
### Task 2: Rewrite the layered product narrative
**Files:**
- Modify: `docs/L0-产品白皮书与能力全景层.md`
- Modify: `docs/L1-系统架构与安全模型层.md`
**Step 1: Replace L0 narrative**
Write: describe sgClaw as the productized browser-agent runtime after the ZeroClaw refactor, define current value, supported workflows, and explicit non-goals.
**Step 2: Replace L1 architecture**
Write: describe the actual three-part runtime topology, dual execution path, and layered security model without claiming unimplemented subsystems.
### Task 3: Rewrite contract and flow documents
**Files:**
- Modify: `docs/L2-核心模块与接口契约层.md`
- Modify: `docs/L3-数据流与Skill体系层.md`
**Step 1: Replace L2**
Write: define module ownership, protocol messages, active tool contract, and the relationship to `docs/浏览器对接标准.md`.
**Step 2: Replace L3**
Write: describe task lifecycle, planner fallback versus ZeroClaw compat path, memory/config loading, and why “Skill 体系” is currently a prompt/tool abstraction rather than a standalone skill engine.
### Task 4: Rewrite engineering and deployment view
**Files:**
- Modify: `docs/L4-工程实现与部署拓扑层.md`
**Step 1: Replace L4**
Write: document the real repository layout, build/test commands, environment variables, deployment assumptions, and integration boundaries with the browser host.
### Task 5: Verify consistency
**Files:**
- Modify: `docs/plans/2026-03-26-l0-l4-doc-refresh.md`
**Step 1: Review git status**
Run: `git status --short`
Expected: only intended doc updates and existing archive-related changes remain.
**Step 2: Spot-check final docs**
Run: `sed -n '1,120p' docs/L2-核心模块与接口契约层.md`
Expected: tool contract, protocol messages, and allowed actions match the codebase.