admin/claw

Files

木炎 956f0c2b68 feat: add generated scene skill platform hardening

2026-04-21 23:19:06 +08:00

7.9 KiB

Raw Blame History

G1-E Light Enrichment Report Design

Goal: 定义 G1-E 轻量补查汇总型 的正式实现口径，使生成器能够在“单主请求 + 少量补查请求 + 单次汇总输出”的边界内，稳定恢复出可编译的业务语义，并与普通 G1 single_request_table 明确区分。

Status: Draft

Decision Summary

G1-E 是 G1 的上边界子型，不是 G6/G7/G8 的过渡桶。
G1-E 只承接“主查询清晰、补查轻量、最终仍归并为单次汇总结果”的报表场景。
G1-E 的编译目标不是继续伪装成纯 single_request_table，而是显式生成“主请求 + 轻量补查 + 汇总整形”三段式契约。
G1-E 必须在证据层恢复三类对象：主请求证据、补查请求证据、汇总映射证据。
当补查链路升级为宿主桥接 workflow、多 endpoint 盘点或本地落库分析时，必须 fail-closed 并重分类，不得继续生成 G1-E skill。
高低压新增报装容量月度统计表 作为当前 G1-E 的 P0 样板，用于冻结最小可编译答案。

Why This Family Exists

当前 G1 的问题不只是“识别率不够”，而是把两类结构混在了一起：

真正的单主请求单表报表。
主请求之外还带少量补查、补齐、映射拼装的轻量汇总报表。

这两类场景都长得像“普通报表”，但第二类如果硬塞进 single_request_table，会导致以下问题：

只能抽到主页面状态，抽不出真实业务请求。
即使生成成功，也没有补查契约，运行结果不完整。
生成器会误把补查型样本当成通用模板，继续污染 G1 家族。

因此需要把这类场景单独收束为 G1-E，既保留它们仍属于通用报表上边界的事实，又防止继续伪装成纯单请求报表。

Canonical P0 Sample

当前 G1-E 的标准样板固定为：

高低压新增报装容量月度统计表

该场景的结构特征是：

存在清晰主查询入口：getWkorderAll
存在少量补查请求：
- queryElectCustInfo
- queryBusAcpt
- getBatchPerCust97
最终输出仍是单次统计汇总，而不是宿主驱动的多步任务，也不是本地落库分析后再出文档

G1-E 的第一阶段实现和验收都以这个样板为准，不在本阶段横向扩更多家族。

Non-Negotiable Boundaries

1. `G1-E` 仍属于报表直生家族

G1-E 仍应保持“场景页面直接可恢复业务查询”的基本属性，不能引入以下结构：

宿主桥接主导执行
callback 串联的显式多步 workflow
多 endpoint 分类盘点后再统一聚合
localhost 落库、SQL 分析、文档导出等二段式后链路

2. `G1-E` 不是兜底分类

只有在主请求明确、补查数量受控、补查职责单一的情况下，才能进入 G1-E。如果只是“看起来比 G1 复杂一些”，但证据无法收敛为轻量补查模型，就必须阻断并重新分流。

3. 编译输出必须显式表达补查链路

对于 G1-E，生成器不能再只输出一个模糊的“请求 + 表格”骨架。输出结构里必须能看见：

主请求是谁
每个补查请求补的是什么
补查结果如何并回主结果

Family Definition

G1-E 轻量补查汇总型 的最小定义如下：

存在一个可识别的主查询请求，负责拉取主列表或主统计结果。
存在少量补查请求，数量通常为 1-3 个，且职责明确，不形成开放式 workflow。
补查请求的触发方式可通过主结果行字段、固定上下文参数或有限枚举维度推导。
最终输出仍为单次汇总表或单份统计结果，不依赖本地持久化再分析。
页面整体仍可被视为“同一报表任务”，而不是多个独立业务流程拼接。

Evidence Requirements

G1-E 至少需要恢复以下三层证据。

1. Main Request Evidence

必须恢复：

主请求 endpoint
主请求参数模板
主请求响应路径
主表字段或主结果字段映射

2. Enrichment Request Evidence

对每个补查请求，必须恢复：

补查 endpoint
触发条件
关键入参来源
返回字段中被消费的部分

3. Merge / Normalize Evidence

必须恢复：

主结果与补查结果的关联键
汇总列、补充列或映射列的生成规则
最终输出字段与来源字段之间的映射关系

如果三层证据中任一层缺失到无法闭环，G1-E 应阻断，不得伪生成 runnable skill。

Scene IR Contract

G1-E 的最小 Scene IR 不应再复用纯 single_request_table 的扁平结构，而应扩展为三段式：

main_request
- 主查询定义
enrichment_requests[]
- 补查请求列表
merge_plan
- 主结果与补查结果的并回、字段补齐与最终汇总规则

建议最小字段如下：

main_request.endpoint
main_request.params
main_request.response_path
main_request.columns
enrichment_requests[].endpoint
enrichment_requests[].param_bindings
enrichment_requests[].response_path
enrichment_requests[].consumed_fields
merge_plan.join_keys
merge_plan.field_mappings
merge_plan.aggregate_rules
merge_plan.output_columns

Compiler Contract

G1-E 编译阶段至少应新增以下 gate：

main_request_resolved
- 主请求是否恢复完整
enrichment_requests_resolved
- 是否识别出所有必要补查请求
merge_plan_resolved
- 是否恢复出主补查并回规则
g1e_scope_compatible
- 是否仍处于轻量补查边界内，而没有越界为 G6/G7/G8

编译器行为要求如下：

若 main_request_resolved = false，直接阻断。
若补查请求疑似存在但 enrichment_requests_resolved = false，不得退化为 G1 成功。
若 merge_plan_resolved = false，不得输出缺少并回逻辑的伪 skill。
若检测到宿主桥接、多 endpoint 扫数、落库分析等越界特征，直接阻断并给出家族重排建议。

Runtime Shape

G1-E 的运行时目标形态应固定为：

先执行主请求
基于主结果触发有限补查
将补查结果并回主结果
输出单次汇总结果

这里的“有限补查”必须可控：

不能无限递归
不能升级为宿主驱动式多步任务编排
不能变成接口盘点扫描

Failure Taxonomy

G1-E 第一版至少要显式区分以下失败类型：

missing_main_request
- 主请求未恢复
missing_enrichment_request
- 补查请求存在，但未恢复完整
missing_merge_plan
- 能看见主链和补查链，但并回关系不完整
scope_upgraded_to_g6
- 实际是宿主桥接多步查询
scope_upgraded_to_g7
- 实际是多接口盘点汇总
scope_upgraded_to_g8
- 实际是抓取落库分析出文档

Acceptance Criteria

G1-E 第一阶段完成的标志不是“能产出某个 skill 目录”，而是以下条件成立：

高低压新增报装容量月度统计表 能稳定恢复主请求、补查请求和并回规则三段式语义。
生成结果不再退化为只有 page_state_eval、params=[]、requestEntries=[] 的空壳。
编译器不会再把缺失补查契约的结果误判为普通 G1 成功。
当样本越界时，系统能够明确阻断并说明应转入 G6/G7/G8，而不是继续产出低质量 skill。

Out of Scope

本 spec 当前不覆盖：

G6 宿主桥接多步查询型 的 workflow 建模
G7 多接口盘点汇总型 的多 endpoint 盘点框架
G8 抓取落库分析出文档型 的本地存储与文档生成后链路
G1-E 之外的大规模家族扩展

Next Step

这份 spec 冻结后，下一步应直接派生对应实施计划，内容只围绕以下三个实现对象展开：

G1-E 证据层补齐
G1-E 三段式 Scene IR / compiler gate 落地
高低压新增报装容量月度统计表 的 P0 样板验证

7.9 KiB Raw Blame History Unescape Escape