同一个 Agent 框架,面对"简单直调"与"复杂规划"两类指令走完全不同的路径。本文拆解两条路径的内部时序,帮助研发与业务团队建立准确认知。
sgClaw 在执行任何操作前,先由引擎分析指令语义,判断是否能从技能库中直接命中一个 Skill。
命中率高 → 跳过大模型,走简单路径; 需要拆解 → 交由大模型规划,走复杂路径。
| 对比维度 | ⚡ A. 简单指令(Single-Skill) | 🧠 B. 复杂指令(ReAct Planning) |
|---|---|---|
| 典型场景 | 提取当前页面表格、截图保存 | 对比A/B公司财报、跨系统数据同步 |
| 大模型调用次数 | 0 次(无需LLM) | 2 ~ 8+ 次(规划 + 每步评估) |
| 预计完成时间 | < 1 秒 | 5 ~ 30 秒 |
| Skill 调用数量 | 1 个 Skill(直接命中) | N 个 Skill(动态加载) |
| 记忆系统使用 | 不写入记忆(一次性操作) | 每步写入 L1 短期记忆,汇总写入 L2 |
| 失败恢复 | 无 Critic,直接报错返回 | Critic 评估后可自动纠错重试 |
| 适用前提 | 技能库中已有对应 Skill | 技能库有原子 Skill,需 LLM 组合编排 |
当用户输入目的极其明确的指令(如"提取当前表格"),引擎直接命中对应的预设 Skill, 全程零 LLM 调用,执行延迟 < 1 秒。Skill 在 Deno Core 沙箱中运行,直接向浏览器内核下发 CDP 动作。
面对模糊或组合型任务(如"对比A、B公司最新财报"),引擎依赖大模型进行动态拆解,并多次调用不同 Skill。 每一步执行后经 Critic 评估器判断是否继续或纠错,同时将中间结果写入记忆系统。