业数融合一平台 · SuperRPA 智能增强层
项目架构宣讲 · 2026年3月
约 30 分钟
约 30 分钟
国网系统已有 SuperRPA 定制 Chromium 浏览器,广泛覆盖 OA、ERP、财务、人资等核心业务系统。
浏览器内建 40+ 自动化操作能力(CommandRouter),可执行点击、输入、页面跳转等操作。
⚠️ 但目前全靠预编写脚本驱动,遇到新场景必须开发人员介入修改。
现有脚本方案无法应对业务变化——每当出现新的操作场景,都需要开发人员编写新脚本,响应周期长。
期望:业务人员用自然语言就能驱动自动化,无需编写脚本,无需等待开发排期。
✨ sgClaw = 让 SuperRPA 拥有 AI 大脑,从"按剧本执行"升级为"自主理解、自主操作"。
💡 核心概念:Claw = 让 AI 像人一样操作浏览器的技术
⚠️ 这不是传统自动化脚本
Claw 使用 AI 推理,能应对页面变化,而非依赖预设路径
🔥 2024-2025 最热方向
Claw 成为 AI 领域最热门的方向之一,开源社区涌现大量项目
AI 读取当前页面的全部内容,理解页面上有哪些按钮、输入框、菜单选项。就像一个人打开网页后先"看一眼",搞清楚当前在哪个页面、有什么可以操作的。
AI 大模型进行分析和规划:"要导出报表,我需要先登录 ERP,找到报表页面,选择本月日期范围,点击导出按钮。" 这个过程就像一个熟练员工在脑海里规划操作步骤。
AI 自动点击按钮、输入文字、切换页面,就像真人在操作浏览器一样。每一步操作后,AI 会重新"看一眼"页面,确认操作是否生效。
AI 检查操作是否成功完成。如果发现页面报错或操作不符合预期,会自动重试或调整方案。遇到无法解决的问题,会主动请求人工帮助。
🔁 整个过程循环进行,直到任务完成。与传统脚本不同,AI 能应对页面变化和异常情况——即使按钮位置变了、多了一步确认弹窗,AI 也能自适应处理。
⚠️ 这些项目各有特色,但直接用于国网政企环境存在共性问题 →
所有开源方案都是独立进程通过网络端口控制浏览器。端口暴露在本机上,任何进程都能连接,容易被安全检测工具发现和拦截。
AI 大模型的输出直接执行,没有任何防护层。如果 AI 被恶意网页内容诱导(提示词注入攻击),可能执行危险操作、泄露敏感数据。
运行环境加浏览器实例,动辄占用 300-500MB 内存。国网终端标配 8GB 内存,同时运行业务系统后所剩无几,无法承受额外负担。
每次执行相同任务都要从头推理,消耗大量 AI 调用额度和等待时间。没有学习能力,不会越用越快、越用越准。
均面向国外操作系统开发,未适配银河麒麟 V10。运行环境依赖复杂,内网环境下安装部署难度极大。
通信端口暴露,可被检测拦截
通过进程私有管道通信,没有端口暴露,不可被外部检测
AI 输出直接执行,零防护
三层独立拦截,任意一层即可阻断危险操作
300-500MB 内存,终端吃紧
Rust 编写,二进制仅 8.8MB,占总内存预算不到 0.1%
每次从头推理,不会学习
相似任务直接复用历史经验,高频任务提炼为正式技能
内网部署极其困难
静态编译零依赖,内网部署仅需复制一个文件
| 对比维度 | 🏆 sgClaw | browser-use | OpenHands | Stagehand |
|---|---|---|---|---|
| 语言 / 框架 | Rust / ZeroClaw | Python / Playwright | Python / Playwright | TypeScript / Playwright |
| 架构模式 | 浏览器内核嵌入 | 外部进程 + 网络端口 | 外部进程 + 网络端口 | 外部进程 + 网络端口 |
| 通信方式 | 私有管道(零暴露) | 端口暴露 | 端口暴露 | 端口暴露 |
| 安全管控 | 三层纵深防御 | 无 | 基础沙箱 | 无 |
| 运行内存 | ~5MB | ~394MB | ~500MB+ | ~200MB |
| 国产化支持 | 银河麒麟原生 | 需适配 | 需适配 | 需适配 |
| Skill 复用 | 自进化 + Skill 仓库 | 无 | 无 | 无 |
| 反检测能力 | 内核级,不可检测 | 可被检测 | 可被检测 | 可被检测 |
和平时一模一样的浏览器,没有额外安装,没有新软件
浏览器侧边栏新增一个 AI 助手入口,点击即可展开对话界面
在对话框输入:"帮我导出本月 ERP 合规报表",像和同事说话一样
自动登录 ERP → 导航到报表页 → 选择月份 → 点击导出。侧边栏实时显示执行进度
侧边栏显示 "报表已导出到下载目录",用户确认即可
全程不离开浏览器 · 不需要安装任何软件 · 不需要编写脚本
直接复用浏览器已有的 40+ 操作能力,不重复造轮子,开发效率最大化。
外部方案有端口暴露和安全风险,嵌入方案零暴露、零风险,满足政企安全要求。
零侵入设计。sgClaw 不在时,浏览器完全正常工作,不影响任何现有功能。
涉及登录密码、数据删除等敏感操作时,必须弹窗请用户确认,AI 无法绕过。任何时候用户都可以一键停止 AI,立即中断所有操作。人始终拥有最终控制权。
AI 每次要操作浏览器,都要经过严格审查:不能访问未授权的网站,不能执行危险操作(如批量删除),连续失败超过阈值会自动停止运行,防止 AI 陷入错误循环。
AI 引擎和浏览器之间的通信管道是完全私有的,就像两个人通过专线电话交谈,外人无法窃听、无法插话、无法伪造指令。不存在网络端口暴露。
🛡️ 即使 AI 大模型被恶意内容诱导,三层防线中的任意一层都能独立拦截,确保安全可控。
Pipe 协议、浏览器工具、安全策略
Skill 加载、记忆管理、评估器
进程宿主、管道监听、MAC 检查
AI 辅助迁移 400+ 场景,提示词工程
AI 助手面板、Skill 管理后台、测试框架、CI/CD 流水线、双平台打包
📐 基于开源 ZeroClaw 框架,84% 代码复用,仅需自研约 2250 行代码——高效务实,不重复造轮子
P1a/P1b: Rust 环境 · P2: Chromium 编译 · P3: 场景调研 · P4: Vue 开发环境
实现 STDIO 双向通信,为 Day 4-5 联调做准备
极高风险:阻塞所有后续工作!互发 JSON 消息 → 调用 15 个 BrowserAction
🛡️ 预案:Day 4 晚没通 → P1b 全力支援 · Day 5 中午没通 → 启动 HTTP 降级方案
Vue 输入"点击登录" → C++ → Rust → 大模型 → 浏览器真实点击
P1a+P1b Runtime · P1b+P3 Skill 加载 · P2+P4 UI 对接
P1a: MAC 策略 · P2: 人工确认弹窗 · P3: 批量 AI 翻译第 1 批 (100 个)
6 个业务场景全流程测试 · P3 完成 400 个 Skill AI 翻译
P4 打包 .deb + .exe · 完整测试报告 · 演示视频
"嵌入浏览器内核的 AI Agent"
框架选型 → 详细架构 → 安全详解 → 模块设计 → 数据流 → Skill体系 → 工程实现
Rust 实现的 AI Agent 框架 · GitHub ★ 17K Stars
Core: trait-driven architecture
fn execute()fn chat()fn search()Built-in: ReAct Loop MCP Client (rmcp) Streaming Output Multi-Provider
| 维度 | ZeroClaw | Rig | Moltis | OpenFang |
|---|---|---|---|---|
| Stars | 17K | 4.2K | 1.8K | 0.9K |
| Runtime Memory | ~5MB | ~12MB | ~20MB | ~15MB |
| Embeddability | Library | Library | Framework | Framework |
| Browser Replaceable | ✓ Tool trait | ✗ | ✗ | Partial |
| ReAct Loop | ✓ Built-in | ✓ | ✗ | ✓ |
| MCP | ✓ rmcp | ✗ | ✗ | WIP |
| Key Advantage | Trait 可插拔 + 最小体积 | RAG 生态 | 多 Agent | 代码生成 |
代码行数: 5000 行 → 1500 行 (-70%)
Memory Safety 无 GC → 运行时 ~5MB
Cross-compile
银河麒麟 V10: x86_64-unknown-linux-musl
Windows: x86_64-pc-windows-msvc
Binary 8.8MB (Linux) / 9.0MB (Windows)
static linking, zero deps
Cold Start <10ms
| vs | 内存 | 启动 |
|---|---|---|
| Node.js | 1/40 | 1/100 |
| Python | 10x ↑ | 无运行时依赖 |
| Method | Linux | Windows | Security | Latency |
|---|---|---|---|---|
| STDIO Pipe | ✓ fd inherit | ✓ HANDLE | Highest process-private |
~0.1ms |
| Unix Socket | ✓ | ✗ | High | ~0.2ms |
| Named Pipe | ✗ | ✓ | High | ~0.2ms |
| TCP localhost | ✓ | ✓ | LOW any process |
~0.5ms |
base::LaunchProcess 原生支持 + 最高安全 + 最低延迟
| Component | Memory |
|---|---|
| OS + Desktop (Kylin V10) | ~2.0 GB |
| Browser (main) | ~0.2 GB |
| Foreground Tabs | ~0.3-0.9 GB |
| Side Panel | ~0.05 GB |
| Zombie Pool (max 5) | ~0.15-0.25 GB |
| local_service | ~0.1 GB |
| sgClaw | ~0.005 GB (5MB!) |
| Total | ~3.0-3.6 GB |
| Headroom | >50% |
| Threat | Layer | Strategy |
|---|---|---|
| Pipe 劫持 | ||
| HTTP/TCP 劫持 | L1 | STDIO Pipe 无端口,规避网络劫持 | L1 | 进程私有 fd |
| Prompt 注入 | L2 | JSON Schema + Action 白名单 |
| Skill 投毒 | L2+L3 | Ed25519 签名 + 沙箱 |
| 凭证泄露 | L3 | credential_store 不暴露 |
| 重放攻击 | L2 | seq 递增 + HMAC |
| 重试风暴 | L2 | 熔断器 (阈值 10) |
✓ Allowed navigate, click, fill, getText, getAOM, screenshot
✗ Forbidden eval, deleteCookies, clearStorage, modifyHeaders
⚠ NeedConfirm download, upload, formSubmit, printPage
依赖原则:
· Config 是叶节点 → 所有模块依赖它
· AgentRuntime 是根 → 协调所有模块
· No circular deps
Start() / Stop() / OnCrash()Idle → Starting → Running → Stopping → Stopped → Crashed
CommandRouter
rules.jsonAllow | NeedConfirm | Deny
✓ browserAction console JSON Promise setTimeout
✗ fetch require process fs eval
BrowserAction API 直接调用max_tokens 4096VecDeque<Message>Rust unit tests (mock LLM + mock pipe)
C++ unit tests (ProcessHost/Listener/MAC)
Pipe integration (real sgclaw process)
E2E acceptance (mock LLM, full scenario)
银河麒麟 V10 SP1 .deb
Windows 10/11
Package: 447 → 456MB +2%
Known Risks & Pending Decisions
各组接口人: 浏览器组 · AI 平台组 · 安全组 · 测试组
项目文档: confluence/sgclaw ·
代码仓库: gitlab/superrpa/sgclaw ·
看板: jira/SGCLAW