# 第一轮真实样本迁移与验证执行表 日期:2026-04-18 上游设计:`docs/superpowers/specs/2026-04-17-scene-skill-60-to-90-roadmap-design.md` 上游计划:`docs/superpowers/plans/2026-04-17-scene-skill-60-to-90-roadmap-plan.md` ## 1. 文档目的 本表用于承接 `60 -> 90` 路线图进入真实样本阶段后的首轮落地动作。 这一轮不直接要求业务人员先去内网验证,而是先完成以下顺序: 1. 从真实场景中收敛首轮样本 2. 按当前 scene -> skill 转化链生成首轮 skill 3. 将生成结果与 `tq` 级基线或当前 canonical/family 基线对比 4. 只把通过结构、语义、readiness 初筛的候选物,送入后续内网验证 ## 2. 选样原则 首轮样本选择遵循以下边界: 1. 严格服从 plan 的主线范围,只覆盖 `G1 + G2 + G3` 2. 优先选择业务结构清晰、家族代表性强、后续容易形成复用模板的场景 3. `G2` 优先级最高,因为它直接决定是否能逼近 `tq-lineloss-report` 级别的业务语义恢复 4. `G1` 首轮优先选择通用报表类,不优先选择强上传型、强附件型、强人工补录型 5. `G3` 首轮优先选择分页明细补数链清晰的工单类 6. 对发现“标题与真实脚本结构不一致”或“页面壳与业务链条错位”的场景,先降级为观察样本,不进入首轮主样本 ## 3. 当前收敛结果 ### 3.1 主样本家族 - `G2` 多模式报表家族:先打透 - `G1` 通用单页报表家族:先选干净样本验证可复制性 - `G3` 分页明细补数家族:验证复杂 workflow 拆解与 fail-closed ### 3.2 暂不纳入首轮主样本的发现 - `高低压新增报装容量月度统计表` 当前页面标题、工作信息描述、脚本主体出现明显不一致,疑似存在页面壳复用或内容错配,不适合作为首轮基准样本。 ## 4. 第一轮执行样本表 | 序号 | 场景名称 | 家族 | 首轮角色 | 初判 archetype | 选入原因 | 主要风险 | 对标基线 | 当前状态 | | --- | --- | --- | --- | --- | --- | --- | --- | --- | | 1 | 台区线损大数据-月_周累计线损率统计分析 | G2 | P0 主锚点 | `multi_mode_request.month_week_table` | 已知原始场景,可直接对标 `tq-lineloss-report`,也是当前 60->90 提升的核心样板 | mode matrix、动态日期字段、localhost 与宿主桥接区分 | `tq-lineloss-report` + P0 canonical | 待生成 | | 2 | 白银线损周报 | G2 | 家族扩展样本 | `multi_mode_request` 或同家族线损周报变体 | 与线损家族强相关,能验证 `tq` 样板是否可迁移到同家族其他周报 | 双系统登录态、周报聚合逻辑、内网 token 依赖 | `tq` 家族语义基线 + P1 family | 待生成 | | 3 | 线损同期差异报表 | G2 | 复杂扩展样本 | `multi_mode_request` / `secondary_request` 复合链 | 能暴露“多系统对比、主请求 + 二次补链”的真实缺口,是 G2 向 90 分跨越的关键压力样本 | secondary request、跨系统上下文、workflow 拆解 | `tq` 家族语义基线 + P1 family | 待生成 | | 4 | 售电收入日统计 | G1 | 主样本 | `single_request_table` 倾向,但可能带明细遍历 | 属于典型报表生成场景,页面参数较集中,适合作为 `G1` 首轮切入 | 可能存在按用户逐条查询与汇总,不一定是纯单请求 | P0/P1 canonical/family | 待生成 | | 5 | 供电所线路电量统计 | G1 | 补充样本 | `single_request_table` 到轻量 workflow 之间 | 具备日期范围、关键词、结果表格,能验证单页查询统计类的可抽象程度 | 可能依赖跨页执行与页面内表格汇总,而非纯 API 报表导出 | P0/P1 canonical/family | 待生成 | | 6 | 用户日电量监测 | G1 | 观察补样 | `single_request_table` 外围变体 | 可覆盖上传/处理/导出型报表边界,用于验证 G1 主模板的外延边界 | 上传驱动、处理链较重,不适合作为 G1 唯一主样本 | P0/P1 canonical/family | 待生成 | | 7 | 95598工单明细表 | G3 | 主样本 | `paginated_enrichment` | 典型分页工单明细场景,存在主查询、分页、补数、导出链路,适合作为 G3 首个标准样本 | 分页补数、日区间滚动、SQL/去重/导出链 | P0-3 canonical + family 基线 | 待生成 | | 8 | 95598、12398、流程超期风险工单明细 | G3 | 扩展样本 | `paginated_enrichment` 复合变体 | 同时覆盖多来源工单与超期风险链,能验证 G3 是否只会处理单一分页表 | 多入口 workflow、复合条件、主链与补链拆分 | P0-3 canonical + family 基线 | 待生成 | ## 5. 首轮执行顺序 首轮执行顺序固定如下,不跨序扩散: 1. 先生成 `台区线损大数据-月_周累计线损率统计分析` 2. 再生成 `白银线损周报` 3. 再生成 `线损同期差异报表` 4. 再进入 `G1` 的 `售电收入日统计`、`供电所线路电量统计` 5. `用户日电量监测` 仅作为 `G1` 边界补样,不先于前两个 `G1` 样本 6. 最后进入 `G3` 的两个工单类样本 这样安排的原因是: 1. `G2` 是否打透,决定当前链路是否真正具备 `tq` 级语义恢复能力 2. `G1` 更适合在 `G2` 形成稳定抽取口径后做规模化复制验证 3. `G3` workflow 更复杂,应该建立在前两组的证据层和契约层已经稳定之后 ## 6. 每个样本生成后的必做检查 每个样本生成完后,必须按同一口径检查,不允许直接跳内网: 1. `sceneId / skillId` 是否稳定,不出现退化命名 2. `bootstrap domain` 是否落到真实业务系统,而不是误抽到 `localhost` 3. `workflow archetype` 是否正确,不把复杂链条误压成简单单请求 4. `request contract` 是否闭合,关键字段是否齐全 5. `response path / column defs / normalize rules` 是否闭合 6. `localhost:*` 是否被识别为宿主桥接依赖,而不是业务主链 7. readiness 是否可解释,失败时是否明确 fail-closed ## 7. 每类样本的通过标准 ### 7.1 G2 通过标准 - 至少能恢复正确的 mode matrix - 能区分主业务接口与宿主桥接依赖 - 生成结果在关键语义上达到 `tq-lineloss-report` 同等级参考水平 ### 7.2 G1 通过标准 - 能稳定抽出查询参数、目标接口、响应路径、列定义、导出产物 - 同家族两个以上样本可以共用同一 archetype 与 gate 口径 ### 7.3 G3 通过标准 - 能识别分页主链、补数链、导出链 - 证据不足时稳定阻断,不伪装为可运行 skill ## 8. 本轮产出物要求 本轮真实样本阶段至少产出以下文档或结果: 1. 本执行表 2. 首轮样本生成结果 3. 样本对标比对记录 4. 候选内网验证名单 5. 不通过样本的 blocker 归因 ## 9. 下一步 按本表顺序进入下一步: 1. 使用当前转化链生成上述首轮样本 skill 2. 将生成结果与 `tq/canonical/family` 基线逐项对比 3. 输出首轮迁移与候选验证报告