Files
skill-lib/docs/L0-产品白皮书与能力全景层.md
2026-03-06 03:36:12 +08:00

475 lines
31 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# L0 — 产品白皮书与能力全景层
**文档版本**: 1.0
**适用项目**: sgClaw (业数融合一平台 AI Agent 底座)
**编制日期**: 2026-03-03
---
## 1. 产品定位
sgClaw 是面向国家电网"业数融合一平台"的 **AI 驱动智能代理平台**。它并非一个独立应用程序,而是作为核心能力嵌入 SuperRPA 定制 Chromium 浏览器内核之中,通过浏览器 Side Panel 中的控制按钮一键激活。
用户只需用自然语言描述业务意图sgClaw 即可自主理解指令语义,规划执行步骤,在 ERP、OA、财务、人力资源、经济法务等复杂业务系统中完成跨系统操作——**无需编写任何代码**。
> **核心比喻:一位会思考、能学习、永不犯错的数字员工。**
sgClaw 从浏览器内核层面发起操作,与真实用户行为完全一致,不可被反自动化机制识别,从根本上解决了传统外部 RPA 工具被检测、被拦截的行业痛点。
```
┌─────────────────────────────────────────────────────────────────┐
│ SuperRPA 定制 Chromium 浏览器 │
│ │
│ ┌──────────────────────┐ ┌────────────────────────────────┐ │
│ │ 浏览器主窗口 │ │ Side Panel 控制区 │ │
│ │ │ │ │ │
│ │ ┌────────────────┐ │ │ ┌──────────────────────────┐ │ │
│ │ │ ERP / OA / │ │ │ │ [启动 Agent] [停止] │ │ │
│ │ │ 财务 / HR 等 │ │ │ │ │ │ │
│ │ │ 业务系统页面 │ │ │ │ 指令输入: │ │ │
│ │ │ │ │ │ │ "导出本月合规报表" │ │ │
│ │ │ │ │ │ │ │ │ │
│ │ └────────────────┘ │ │ │ ▼ 任务进度 │ │ │
│ │ ▲ │ │ │ ████████░░ 80% │ │ │
│ │ │ 内核级操作 │ │ │ │ │ │
│ │ │ │ │ │ ✓ 已登录 ERP │ │ │
│ │ ┌──────┴─────────┐ │ │ │ ✓ 已导出财务报表 │ │ │
│ │ │ sgClaw 引擎 │◄─┼────┼──│ ► 正在导出合规报表... │ │ │
│ │ │ (Rust Binary) │ │ │ │ │ │ │
│ │ └────────────────┘ │ │ └──────────────────────────┘ │ │
│ └──────────────────────┘ └────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘
```
---
## 2. 行业痛点
国家电网及大型央企的业务运营高度依赖多套信息系统协同。一线业务人员每天需要在 5 至 10 余套系统之间反复切换,手工搬运数据,面临以下核心痛点:
### 2.1 效率低下
一线员工日常需在 ERP、OA、财务管控、人力资源、经济法务、营销等多套系统间反复登录、切换、手工录入。一项跨系统操作如合规线索提报平均需要 **15-30 分钟**,涉及 **3-5 个系统** 的数据交叉核对。全年此类重复操作累计耗费数万人时。
### 2.2 人工差错
手工跨系统数据搬运极易出错。财务合规场景下,一个数字的录入错误可能导致审计异常,引发合规风险。据行业统计,人工跨系统操作的 **错误率约为 2%-5%**,在高强度、高压力的月末结算期间错误率更高。
### 2.3 培训成本高
新员工需要 **3-6 个月** 才能熟练掌握多套业务系统的操作流程和业务规则。人员调动频繁时,培训成本成倍增长,且经验难以沉淀、传承。
### 2.4 合规风险
手工操作缺乏完整的审计轨迹,难以事后追溯"谁在什么时间对哪个系统做了什么操作"。在日趋严格的内控与合规要求下,这构成了显著的制度性风险。
### 2.5 重复劳动
经调研分析,一线业务人员 **约 80%** 的跨系统操作属于规则明确、流程固定的重复性工作。这些工作本应由自动化工具承担,但因系统间壁垒和技术限制,长期依赖人力完成。
### 2.6 传统 RPA 局限
外部 RPA 工具UiPath、BluePrism 等)通过屏幕抓取、模拟点击等方式操控浏览器,存在根本性缺陷:
- **易被检测**:反自动化机制可识别 WebDriver、Selenium 等注入痕迹
- **被系统拦截**:越来越多的业务系统部署了 Bot Detection直接阻断 RPA 操作
- **需专业脚本**:每个流程需要专门开发自动化脚本,维护成本高
- **环境依赖**:对操作系统版本、屏幕分辨率、系统界面变更高度敏感
---
## 3. 核心能力矩阵
| 能力维度 | 能力描述 | 关键指标 |
|---------|---------|---------|
| **自然语言驱动** | 用户以自然语言中文描述业务意图Agent 自主理解语义、分解任务、规划步骤并执行 | 支持复杂多步指令,意图识别准确率 > 95% |
| **内核级隐蔽操作** | 从浏览器内核层面发起 DOM 操作与事件派发,与真实用户行为在技术栈上完全一致 | 反自动化检测通过率 100%,零注入痕迹 |
| **自进化学习** | 每次成功执行的操作序列自动沉淀为 Skill后续同类任务直接复用无需重复推理 | Skill 复用率随使用时长持续提升 |
| **三层安全防御** | Pipeline 协议层安全 + Rust 命令验证层 + C++ 内核 MAC 强制访问控制 | 纵深防御,任一层均可独立拦截非法操作 |
| **Skill 技能仓库** | 预置覆盖财务合规、风险管控、营销、人力资源、经济法务等业务领域的操作技能包 | 开箱即用,支持自定义扩展 |
| **多模型适配** | 支持 Claude、GPT 系列、本地化模型Qwen、ChatGLM 等),可按安全等级灵活切换 | 模型切换零代码,响应延迟 < 2s |
| **跨平台支持** | 原生支持 Linux银河麒麟 V10与 Windows满足国产化适配要求 | 信创环境全面兼容 |
| **极致轻量** | Rust 编写的 Agent 引擎,资源占用极低 | 内存 ~5MB冷启动 < 10ms |
```
┌─────────────────────────────────────────────────────────────┐
│ sgClaw 核心能力全景图 │
├─────────────────────────────────────────────────────────────┤
│ │
│ ┌─────────────┐ ┌─────────────┐ ┌─────────────────────┐ │
│ │ 自然语言 │ │ 自进化学习 │ │ 多模型适配 │ │
│ │ 理解与规划 │ │ Skill 沉淀 │ │ Claude/GPT/Qwen │ │
│ └──────┬──────┘ └──────┬──────┘ └──────────┬──────────┘ │
│ │ │ │ │
│ ▼ ▼ ▼ │
│ ┌──────────────────────────────────────────────────────┐ │
│ │ sgClaw Agent 引擎 (Rust) │ │
│ │ 内存 ~5MB | 冷启动 < 10ms │ │
│ └───────────────────────┬──────────────────────────────┘ │
│ │ │
│ ┌────────────────┼────────────────┐ │
│ ▼ ▼ ▼ │
│ ┌────────────┐ ┌─────────────┐ ┌────────────────┐ │
│ │ Pipeline │ │ Rust 命令 │ │ C++ 内核 MAC │ │
│ │ 协议层安全 │ │ 验证层 │ │ 强制访问控制 │ │
│ └────────────┘ └─────────────┘ └────────────────┘ │
│ │ │ │ │
│ └────────────────┼────────────────┘ │
│ ▼ │
│ ┌──────────────────────────────────────────────────────┐ │
│ │ 内核级隐蔽操作 (Chromium C++ 层) │ │
│ │ DOM 操作 · 事件派发 · 与真实用户行为完全一致 │ │
│ └──────────────────────────────────────────────────────┘ │
│ │ │
│ ┌────────────────┼────────────────┐ │
│ ▼ ▼ ▼ │
│ ┌────────────┐ ┌─────────────┐ ┌────────────────┐ │
│ │ Skill 仓库 │ │ 跨平台支持 │ │ 全链路审计 │ │
│ │ 业务技能包 │ │ 麒麟/Windows │ │ trace_id 追溯 │ │
│ └────────────┘ └─────────────┘ └────────────────┘ │
│ │
└─────────────────────────────────────────────────────────────┘
```
---
## 4. 典型业务场景
### 4.1 财务合规
**场景示例**:合规线索提报与交叉核查
用户指令:*"将本月 ERP 中的异常交易记录与财务管控系统的合规规则交叉比对,生成合规线索提报清单。"*
sgClaw 执行流程:
1. 自动登录 ERP 系统,导航至异常交易模块
2. 按时间范围筛选并导出本月异常交易数据
3. 切换至财务管控系统,调取对应合规规则库
4. 逐条交叉比对,标记命中合规规则的记录
5. 自动生成合规线索提报清单,填入指定模板
6. 提交至审批流程,附加完整操作审计记录
**业务价值**:原需 2-3 小时的人工操作压缩至 **5-8 分钟**,错误率从 3% 降至 **0%**
### 4.2 风险管控
**场景示例**:跨系统风险指标监测与异常预警
用户指令:*"每日自动检查 ERP 和风控系统中的关键风险指标,发现异常立即生成预警报告。"*
sgClaw 执行流程:
1. 定时自动巡检 ERP 系统中的关键财务指标
2. 同步核查风控系统中的风险阈值配置
3. 对比分析指标偏离情况,识别异常模式
4. 异常触发时自动截屏取证、生成预警报告
5. 推送至相关负责人,并在 OA 系统创建跟踪工单
**业务价值**:实现 **7x24 小时** 不间断风险监控,预警响应时间从 "次日发现" 缩短至 **实时告警**
### 4.3 营销
**场景示例**:电费异常批量处理与账单核对
用户指令:*"批量处理本月电费账单异常记录,对比营销系统与财务系统的数据差异。"*
sgClaw 执行流程:
1. 进入营销系统,筛选本月标记为异常的电费账单
2. 逐条提取异常记录的用户编号、金额、异常类型
3. 在财务系统中查询对应的收费记录
4. 自动比对金额差异,生成差异明细报表
5. 对可自动修正的记录执行批量修正操作
6. 对需人工确认的记录生成待办清单
**业务价值**:月均处理量从 **200 条/人日** 提升至 **5000+ 条/小时**,释放大量人力投入高价值工作。
### 4.4 人力资源
**场景示例**:社保表单自动填报与薪酬数据核验
用户指令:*"从 HR 系统导出本月社保基数变更人员名单,自动填入社保申报表并交叉验证薪酬数据。"*
sgClaw 执行流程:
1. 登录 HR 系统,导出社保基数变更人员明细
2. 自动填入社保局在线申报表单的对应字段
3. 同步查询薪酬系统中的工资明细数据
4. 交叉验证社保基数与实际薪酬的一致性
5. 标记不一致记录,生成差异报告
6. 合规记录自动提交,异常记录流转至人工复核
**业务价值**:每月社保申报工作从 **3-5 个工作日** 压缩至 **2-4 小时**
### 4.5 经济法务
**场景示例**:合同履约监测与法律风险预警
用户指令:*"监控即将到期的合同,检查履约状态,对存在违约风险的合同生成法律风险预警。"*
sgClaw 执行流程:
1. 在合同管理系统中筛选 30 天内到期的合同
2. 逐一核查合同关键条款的履约状态
3. 交叉查询 ERP 系统中的付款/交货记录
4. 识别履约偏差,评估违约风险等级
5. 生成法律风险预警报告,按风险等级排序
6. 自动推送至法务部门,创建跟踪任务
**业务价值**:合同风险识别从 "事后补救" 转变为 **"事前预警"**,法律纠纷发生率显著降低。
### 4.6 协同办公
**场景示例**:跨系统数据同步与报表整合
用户指令:*"从 ERP、财务、HR 三个系统导出本月关键运营数据,汇总生成月度经营分析报表。"*
sgClaw 执行流程:
1. 依次登录 ERP、财务、HR 系统
2. 按预设模板提取各系统的关键运营数据
3. 自动对齐数据口径,统一格式
4. 汇总计算关键指标,生成月度经营分析报表
5. 导出为标准格式,上传至 OA 系统
**业务价值**:月度报表整合从 **2-3 天人工汇总** 缩短至 **30 分钟自动生成**
### 4.7 通用场景
用户只需一句自然语言指令sgClaw 即可自主完成端到端的跨系统操作:
| 自然语言指令 | Agent 自主完成的操作 |
|------------|-------------------|
| "导出本月所有合规报表" | 依次登录各业务系统 → 定位报表模块 → 设定时间范围 → 导出 → 汇总 |
| "检查上周新入职员工的系统权限配置" | HR 系统查询入职名单 → 各业务系统逐一核查权限 → 生成核查报告 |
| "把 ERP 里的采购订单数据同步到财务系统" | ERP 导出订单 → 格式转换 → 财务系统录入 → 数据校验 |
| "统计各部门本季度差旅报销总额" | OA 系统提取差旅审批 → 财务系统核查报销 → 按部门汇总 → 生成报表 |
---
## 5. 技术优势对比
### 5.1 综合对比矩阵
| 对比维度 | 人工操作 | 传统 RPA (UiPath/BluePrism) | 外部 Agent (OpenClaw) | **sgClaw** |
|---------|---------|---------------------------|---------------------|-----------|
| **架构方式** | N/A | 外部进程控制浏览器 | 外部进程 + WebSocket | **嵌入浏览器内核** |
| **反检测能力** | 天然通过 | 易被检测拦截 | 可被端口扫描发现 | **原生行为,不可检测** |
| **安全层级** | 依赖人员素质 | 应用层安全 | 应用层安全 | **三层纵深防御** |
| **通信方式** | N/A | HTTP / COM | HTTP / WebSocket (端口暴露) | **STDIO Pipe (进程私有)** |
| **内存占用** | N/A | 200-500MB | 394MB+ | **~5MB** |
| **冷启动时间** | N/A | 10-30s | 5-15s | **< 10ms** |
| **技能复用** | 经验口传 | 需重新开发脚本 | 需重新训练 | **复用已有 JS 业务代码** |
| **部署方式** | N/A | 独立安装 + 配置 | 独立安装 + 配置 | **内嵌浏览器,零独立安装** |
| **自然语言** | N/A | 不支持 | 部分支持 | **完整支持中文自然语言** |
| **国产化适配** | N/A | 有限支持 | 不支持 | **银河麒麟 V10 原生支持** |
| **学习门槛** | 3-6 个月 | 需专业 RPA 开发 | 需技术配置 | **自然语言,零学习成本** |
### 5.2 关键差异化优势
```
┌──────────────────────────────────────────────────────────────────┐
│ 架构差异:外部控制 vs 内核嵌入 │
├──────────────────────────────────────────────────────────────────┤
│ │
│ 传统 RPA / 外部 Agent 方案: │
│ │
│ ┌────────────┐ HTTP/WS ┌──────────────┐ │
│ │ RPA Engine │ ──────────────→│ 浏览器 │ │
│ │ (外部进程) │ 端口暴露 │ (被外部控制) │ │
│ └────────────┘ 可被检测 └──────────────┘ │
│ 394MB+ 反自动化机制 │
│ 可识别拦截 │
│ │
│ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ │
│ │
│ sgClaw 方案: │
│ │
│ ┌──────────────────────────────────────────────┐ │
│ │ SuperRPA Chromium 浏览器 │ │
│ │ │ │
│ │ ┌──────────┐ STDIO Pipe ┌──────────────┐ │ │
│ │ │ sgClaw │ ◄──────────► │ Chromium C++ │ │ │
│ │ │ (Rust) │ 进程私有 │ 内核层 │ │ │
│ │ │ ~5MB │ 零端口暴露 │ │ │ │
│ │ └──────────┘ └──────────────┘ │ │
│ │ │ │
│ │ 操作 = 原生用户行为,不可被检测 │ │
│ └──────────────────────────────────────────────┘ │
│ │
└──────────────────────────────────────────────────────────────────┘
```
---
## 6. 安全与合规保障
sgClaw 将安全视为产品基因而非附加功能,构建了从通信层到内核层的 **三层纵深防御体系**
### 6.1 进程隔离通信
- 采用 **STDIO Pipe** 作为 Agent 与浏览器内核的唯一通信通道
- 不开放任何网络端口,外部进程无法探测或连接
- 通信数据仅存在于父子进程的文件描述符中,操作系统级别的隐私保护
### 6.2 MAC 强制访问控制
- 浏览器 C++ 内核层实施 **Mandatory Access Control**
- 严格的域名白名单机制Agent 仅可操作授权的业务系统域名
- 敏感操作(如支付、审批)需额外的内核级权限校验
- 白名单策略由管理员统一配置Agent 无法自行绕过
### 6.3 凭证安全保护
- 用户凭证由浏览器 Zombie Session Pool 统一管理
- 凭证信息 **永远不会通过 Pipe 协议传输** 至 Agent 进程
- Agent 通过 BrowserAction API 间接使用已建立的会话,无需接触明文密码
### 6.4 人工激活机制
- Agent 功能 **默认关闭**,需用户在 Side Panel 中显式点击启动按钮
- 每次启动均需用户确认,杜绝后台无感自动运行
- 用户可随时一键停止 Agent 的所有操作
### 6.5 全链路审计追溯
- 每次 Agent 会话分配唯一 **trace_id**
- 所有操作步骤(页面导航、元素点击、数据读取、表单提交)均有完整日志记录
- 日志包含操作时间戳、目标系统、操作类型、执行结果
- 支持事后审计回溯与合规举证
### 6.6 防失控熔断机制
- 内置 **Circuit Breaker** 机制,防止 Agent 进入死循环或失控状态
- 单次任务设置最大步骤数上限
- 连续失败自动熔断,暂停执行并通知用户
- 关键操作设置人工确认断点human-in-the-loop
---
## 7. 产品形态与交付方式
### 7.1 产品形态
| 组件 | 形态 | 规格 |
|------|------|------|
| Agent 引擎 | Rust 编译二进制 | 约 8.8MB |
| 宿主环境 | SuperRPA 定制 Chromium 浏览器 | 集成交付 |
| 用户界面 | 浏览器 Side Panel 控制区 | 启停按钮 + 指令输入 + 任务进度 |
| Skill 仓库 | JSON 格式技能定义文件 | 随浏览器内置,支持在线更新 |
| 运行时依赖 | 无 | Rust 静态编译,零外部依赖 |
### 7.2 交付方式
- **Linux (银河麒麟 V10)**:集成于 `superrpa-chromium` .deb 安装包
- **Windows**:集成于 `superrpa-chromium` .exe 安装包
- **无需独立安装**:随浏览器一并部署,无额外配置步骤
- **无需独立升级**:随浏览器版本统一升级管理
### 7.3 用户交互流程
```
用户操作流程:
打开 SuperRPA 浏览器
访问业务系统(自动登录)
打开 Side Panel ──→ 看到 sgClaw 控制区
点击 [启动 Agent] 按钮
输入自然语言指令 ──→ "导出本月所有合规报表"
Agent 自主执行 ──→ Side Panel 实时显示进度
执行完成 ──→ 结果展示 / 文件下载
(可选)点击 [停止] 终止任务
```
---
## 8. 与 SuperRPA 浏览器的协同关系
sgClaw 并非独立产品,而是与 SuperRPA 浏览器深度耦合的 **智能增强层**。两者各司其职,协同构成完整的"智能数字员工"平台。
### 8.1 能力分工
```
┌────────────────────────────────────────────────────────────────────┐
│ "智能数字员工" 完整能力栈 │
├────────────────────────────────────────────────────────────────────┤
│ │
│ ┌──────────────────────────────────────────────────────────────┐ │
│ │ sgClaw 智能增强层 │ │
│ │ │ │
│ │ ┌────────────┐ ┌──────────┐ ┌──────────┐ ┌──────────────┐ │ │
│ │ │ LLM 智能 │ │ 自然语言 │ │ 多步自主 │ │ 自进化学习 │ │ │
│ │ │ 推理引擎 │ │ 理解 │ │ 任务执行 │ │ Skill 沉淀 │ │ │
│ │ └────────────┘ └──────────┘ └──────────┘ └──────────────┘ │ │
│ │ │ │
│ └──────────────────────────┬───────────────────────────────────┘ │
│ │ STDIO Pipe │
│ ┌──────────────────────────┴───────────────────────────────────┐ │
│ │ SuperRPA 浏览器基础设施层 │ │
│ │ │ │
│ │ ┌────────────┐ ┌──────────┐ ┌──────────┐ ┌──────────────┐ │ │
│ │ │ Zombie │ │ SDK │ │ Browser │ │ 凭证与会话 │ │ │
│ │ │ Session │ │ 注入引擎 │ │ Action │ │ 安全管理 │ │ │
│ │ │ Pool │ │ │ │ API │ │ │ │ │
│ │ └────────────┘ └──────────┘ └──────────┘ └──────────────┘ │ │
│ │ │ │
│ │ ┌────────────┐ ┌──────────┐ ┌──────────┐ ┌──────────────┐ │ │
│ │ │ 反检测 │ │ 多标签页 │ │ 域名 │ │ C++ 内核 │ │ │
│ │ │ 指纹伪装 │ │ 并发管理 │ │ 白名单 │ │ MAC 控制 │ │ │
│ │ └────────────┘ └──────────┘ └──────────┘ └──────────────┘ │ │
│ │ │ │
│ └──────────────────────────────────────────────────────────────┘ │
│ │
├────────────────────────────────────────────────────────────────────┤
│ 协同价值 │
│ │
│ SuperRPA 提供: sgClaw 增加: │
│ ├─ Zombie Session Pool 会话池 ├─ LLM 智能推理能力 │
│ ├─ SDK 注入与 JS 执行环境 ├─ 自然语言理解与意图解析 │
│ ├─ BrowserAction API 操作接口 ├─ 自主多步任务规划与执行 │
│ ├─ 凭证管理与自动登录 ├─ 自进化学习与 Skill 积累 │
│ ├─ 反自动化检测基础设施 ├─ 跨系统业务流程编排 │
│ └─ 内核级安全强制控制 └─ 业务语义理解与异常处理 │
│ │
│ 单独的 SuperRPA = 强大的自动化浏览器 │
│ SuperRPA + sgClaw = 会思考的智能数字员工 │
│ │
└────────────────────────────────────────────────────────────────────┘
```
### 8.2 典型协同流程
以"自动完成月度合规报表导出"为例:
| 步骤 | 执行者 | 操作 |
|------|-------|------|
| 1 | SuperRPA | Zombie Session Pool 提供已登录的各系统会话 |
| 2 | sgClaw | LLM 理解用户指令,规划任务步骤 |
| 3 | sgClaw | 通过 BrowserAction API 向浏览器发送操作指令 |
| 4 | SuperRPA | SDK 注入层执行 DOM 操作(内核级,不可检测) |
| 5 | SuperRPA | C++ 内核 MAC 校验操作合法性(域名白名单) |
| 6 | sgClaw | 解析操作结果,决定下一步行动 |
| 7 | sgClaw | 任务完成后将操作序列沉淀为 Skill |
| 8 | SuperRPA | 记录完整操作审计日志(含 trace_id |
### 8.3 价值总结
sgClaw 与 SuperRPA 浏览器的结合,实现了 **"能力 + 智能"** 的完整闭环:
- **SuperRPA 浏览器** 解决了 "如何安全、隐蔽地操作业务系统" 的基础设施问题
- **sgClaw** 解决了 "如何智能地理解业务意图并自主执行" 的上层智能问题
- 两者结合,使"业数融合一平台"真正具备 **"理解自然语言 → 自主规划 → 安全执行 → 持续进化"** 的完整智能数字员工能力
---
> **sgClaw — 让每一位员工都拥有一位永不疲倦、永不犯错的智能数字助手。**