Files
claw/docs/superpowers/reports/2026-04-18-g2-family-expansion-third-round-report.md

143 lines
3.8 KiB
Markdown

# G2 家族扩展第三轮回归报告
> Date: 2026-04-18
> Scope: `docs/superpowers/plans/2026-04-18-g2-family-expansion-plan.md`
> Family: `G2`
## 1. 本轮执行范围
本轮严格承接上一轮 `G2` 主样本整改,不回退 `tq` 主样本链路,只补以下两类剩余变体:
1. `G2-B`
周报单侧 mode 变体
代表样本:`白银线损周报`
2. `G2-C`
线损主链路 + 外部系统联动的混合变体
代表样本:`线损同期差异报表`
本轮实际落地内容:
1. 在 analyzer 中引入 `G2FamilyVariant`
2. 建立 `G2-A/G2-B/G2-C` 三类子型边界
3.`G2-B` 补单周模式最小合同
4.`G2-C` 补主链路模式最小合同
5. 保持 `G2-A` 主样本不回退
## 2. 回归测试结果
本地回归:
- `cargo test --test scene_generator_test -- --nocapture`
- 结果:`19 passed`
新增回归覆盖了:
1. `G2-A` 主样本仍被识别为双模式主报表
2. `G2-B` 被识别为周报单侧 mode 变体
3. `G2-C` 被识别为混合联动变体
4. `G2-B` 可以生成最小合同
5. `G2-C` 可以生成最小合同
## 3. 真实样本第三轮结果
### 3.1 G2-A 基线
样本:
- `台区线损大数据-月_周累计线损率统计分析`
- 产物:`examples/real_scene_batch_round1/skills/real-tq-lineloss-report-r1`
结果:
1. `workflowArchetype = multi_mode_request`
2. `bootstrap.expectedDomain = 20.76.57.61:18080`
3. `bootstrap.targetUrl = http://20.76.57.61:18080/gsllys`
4. `modes = [month, week]`
5. `g2_family_variant_candidate` 已写入
6. `g2_request_contract_complete = true`
7. `g2_response_contract_complete = true`
8. `readiness.level = A`
结论:
- `G2-A` 基线稳定,没有回退
### 3.2 G2-B 周报单侧 mode 变体
样本:
- `白银线损周报`
- 产物:`examples/real_scene_batch_round1/skills/real-baiyin-lineloss-weekly-r1`
结果:
1. 已成功生成,不再 fail-close
2. `workflowArchetype = multi_mode_request`
3. `bootstrap.expectedDomain = 20.76.57.61:18080`
4. `bootstrap.targetUrl = http://20.76.57.61:18080/gsllys`
5. `modes = [week]`
6. 产物中已恢复 `LINE_LOSS_RATE`
7. `g2_family_variant_candidate` 已写入
8. `g2_request_contract_complete = true`
9. `g2_response_contract_complete = true`
10. `readiness.level = A`
结论:
- `G2-B` 已从“只能 fail-close”推进到“可解释最小合同”
- 已可进入候选验证名单
### 3.3 G2-C 混合联动变体
样本:
- `线损同期差异报表`
- 产物:`examples/real_scene_batch_round1/skills/real-lineloss-period-diff-r1`
结果:
1. 已成功生成,不再 fail-close
2. `workflowArchetype = multi_mode_request`
3. `bootstrap.expectedDomain = 20.76.57.61:18080`
4. `bootstrap.targetUrl = http://20.76.57.61:18080/gsllys`
5. `modes = [primary]`
6. 产物中已恢复 `TG_NO`
7. `g2_family_variant_candidate` 已写入
8. `g2_request_contract_complete = true`
9. `g2_response_contract_complete = true`
10. `readiness.level = A`
结论:
- `G2-C` 已从“混合噪声导致整体阻断”推进到“主链路最小合同可生成”
- 当前可进入候选验证名单
## 4. 与上一轮相比的变化
上一轮状态:
1. `G2-A` 已通
2. `G2-B` fail-close
3. `G2-C` fail-close
本轮状态:
1. `G2-A` 保持稳定
2. `G2-B` 已恢复单周模式合同
3. `G2-C` 已恢复主链路模式合同
4. 三份样本都不再被同一种 `G2-A` 模型粗暴处理
## 5. 当前结论
按本计划的目标口径,本轮已经完成:
1. `G2` 从“单主样本修通”推进到“至少三类子型可区分”
2. `白银线损周报` 不再只是被动 fail-close
3. `线损同期差异报表` 不再只是被动 fail-close
4. `G2-A/G2-B/G2-C` 都已进入候选验证名单
当前最准确的状态判断是:
- `G2` 家族扩展第一轮已达标
- 下一步如果继续推进,应切到更大范围的线损变体扩展或真实内网验证