Files
claw/docs/superpowers/reports/2026-04-18-g2-family-expansion-third-round-report.md

3.8 KiB

G2 家族扩展第三轮回归报告

Date: 2026-04-18 Scope: docs/superpowers/plans/2026-04-18-g2-family-expansion-plan.md Family: G2

1. 本轮执行范围

本轮严格承接上一轮 G2 主样本整改,不回退 tq 主样本链路,只补以下两类剩余变体:

  1. G2-B 周报单侧 mode 变体 代表样本:白银线损周报
  2. G2-C 线损主链路 + 外部系统联动的混合变体 代表样本:线损同期差异报表

本轮实际落地内容:

  1. 在 analyzer 中引入 G2FamilyVariant
  2. 建立 G2-A/G2-B/G2-C 三类子型边界
  3. G2-B 补单周模式最小合同
  4. G2-C 补主链路模式最小合同
  5. 保持 G2-A 主样本不回退

2. 回归测试结果

本地回归:

  • cargo test --test scene_generator_test -- --nocapture
  • 结果:19 passed

新增回归覆盖了:

  1. G2-A 主样本仍被识别为双模式主报表
  2. G2-B 被识别为周报单侧 mode 变体
  3. G2-C 被识别为混合联动变体
  4. G2-B 可以生成最小合同
  5. G2-C 可以生成最小合同

3. 真实样本第三轮结果

3.1 G2-A 基线

样本:

  • 台区线损大数据-月_周累计线损率统计分析
  • 产物:examples/real_scene_batch_round1/skills/real-tq-lineloss-report-r1

结果:

  1. workflowArchetype = multi_mode_request
  2. bootstrap.expectedDomain = 20.76.57.61:18080
  3. bootstrap.targetUrl = http://20.76.57.61:18080/gsllys
  4. modes = [month, week]
  5. g2_family_variant_candidate 已写入
  6. g2_request_contract_complete = true
  7. g2_response_contract_complete = true
  8. readiness.level = A

结论:

  • G2-A 基线稳定,没有回退

3.2 G2-B 周报单侧 mode 变体

样本:

  • 白银线损周报
  • 产物:examples/real_scene_batch_round1/skills/real-baiyin-lineloss-weekly-r1

结果:

  1. 已成功生成,不再 fail-close
  2. workflowArchetype = multi_mode_request
  3. bootstrap.expectedDomain = 20.76.57.61:18080
  4. bootstrap.targetUrl = http://20.76.57.61:18080/gsllys
  5. modes = [week]
  6. 产物中已恢复 LINE_LOSS_RATE
  7. g2_family_variant_candidate 已写入
  8. g2_request_contract_complete = true
  9. g2_response_contract_complete = true
  10. readiness.level = A

结论:

  • G2-B 已从“只能 fail-close”推进到“可解释最小合同”
  • 已可进入候选验证名单

3.3 G2-C 混合联动变体

样本:

  • 线损同期差异报表
  • 产物:examples/real_scene_batch_round1/skills/real-lineloss-period-diff-r1

结果:

  1. 已成功生成,不再 fail-close
  2. workflowArchetype = multi_mode_request
  3. bootstrap.expectedDomain = 20.76.57.61:18080
  4. bootstrap.targetUrl = http://20.76.57.61:18080/gsllys
  5. modes = [primary]
  6. 产物中已恢复 TG_NO
  7. g2_family_variant_candidate 已写入
  8. g2_request_contract_complete = true
  9. g2_response_contract_complete = true
  10. readiness.level = A

结论:

  • G2-C 已从“混合噪声导致整体阻断”推进到“主链路最小合同可生成”
  • 当前可进入候选验证名单

4. 与上一轮相比的变化

上一轮状态:

  1. G2-A 已通
  2. G2-B fail-close
  3. G2-C fail-close

本轮状态:

  1. G2-A 保持稳定
  2. G2-B 已恢复单周模式合同
  3. G2-C 已恢复主链路模式合同
  4. 三份样本都不再被同一种 G2-A 模型粗暴处理

5. 当前结论

按本计划的目标口径,本轮已经完成:

  1. G2 从“单主样本修通”推进到“至少三类子型可区分”
  2. 白银线损周报 不再只是被动 fail-close
  3. 线损同期差异报表 不再只是被动 fail-close
  4. G2-A/G2-B/G2-C 都已进入候选验证名单

当前最准确的状态判断是:

  • G2 家族扩展第一轮已达标
  • 下一步如果继续推进,应切到更大范围的线损变体扩展或真实内网验证