143 lines
3.8 KiB
Markdown
143 lines
3.8 KiB
Markdown
# G2 家族扩展第三轮回归报告
|
|
|
|
> Date: 2026-04-18
|
|
> Scope: `docs/superpowers/plans/2026-04-18-g2-family-expansion-plan.md`
|
|
> Family: `G2`
|
|
|
|
## 1. 本轮执行范围
|
|
|
|
本轮严格承接上一轮 `G2` 主样本整改,不回退 `tq` 主样本链路,只补以下两类剩余变体:
|
|
|
|
1. `G2-B`
|
|
周报单侧 mode 变体
|
|
代表样本:`白银线损周报`
|
|
2. `G2-C`
|
|
线损主链路 + 外部系统联动的混合变体
|
|
代表样本:`线损同期差异报表`
|
|
|
|
本轮实际落地内容:
|
|
|
|
1. 在 analyzer 中引入 `G2FamilyVariant`
|
|
2. 建立 `G2-A/G2-B/G2-C` 三类子型边界
|
|
3. 为 `G2-B` 补单周模式最小合同
|
|
4. 为 `G2-C` 补主链路模式最小合同
|
|
5. 保持 `G2-A` 主样本不回退
|
|
|
|
## 2. 回归测试结果
|
|
|
|
本地回归:
|
|
|
|
- `cargo test --test scene_generator_test -- --nocapture`
|
|
- 结果:`19 passed`
|
|
|
|
新增回归覆盖了:
|
|
|
|
1. `G2-A` 主样本仍被识别为双模式主报表
|
|
2. `G2-B` 被识别为周报单侧 mode 变体
|
|
3. `G2-C` 被识别为混合联动变体
|
|
4. `G2-B` 可以生成最小合同
|
|
5. `G2-C` 可以生成最小合同
|
|
|
|
## 3. 真实样本第三轮结果
|
|
|
|
### 3.1 G2-A 基线
|
|
|
|
样本:
|
|
|
|
- `台区线损大数据-月_周累计线损率统计分析`
|
|
- 产物:`examples/real_scene_batch_round1/skills/real-tq-lineloss-report-r1`
|
|
|
|
结果:
|
|
|
|
1. `workflowArchetype = multi_mode_request`
|
|
2. `bootstrap.expectedDomain = 20.76.57.61:18080`
|
|
3. `bootstrap.targetUrl = http://20.76.57.61:18080/gsllys`
|
|
4. `modes = [month, week]`
|
|
5. `g2_family_variant_candidate` 已写入
|
|
6. `g2_request_contract_complete = true`
|
|
7. `g2_response_contract_complete = true`
|
|
8. `readiness.level = A`
|
|
|
|
结论:
|
|
|
|
- `G2-A` 基线稳定,没有回退
|
|
|
|
### 3.2 G2-B 周报单侧 mode 变体
|
|
|
|
样本:
|
|
|
|
- `白银线损周报`
|
|
- 产物:`examples/real_scene_batch_round1/skills/real-baiyin-lineloss-weekly-r1`
|
|
|
|
结果:
|
|
|
|
1. 已成功生成,不再 fail-close
|
|
2. `workflowArchetype = multi_mode_request`
|
|
3. `bootstrap.expectedDomain = 20.76.57.61:18080`
|
|
4. `bootstrap.targetUrl = http://20.76.57.61:18080/gsllys`
|
|
5. `modes = [week]`
|
|
6. 产物中已恢复 `LINE_LOSS_RATE`
|
|
7. `g2_family_variant_candidate` 已写入
|
|
8. `g2_request_contract_complete = true`
|
|
9. `g2_response_contract_complete = true`
|
|
10. `readiness.level = A`
|
|
|
|
结论:
|
|
|
|
- `G2-B` 已从“只能 fail-close”推进到“可解释最小合同”
|
|
- 已可进入候选验证名单
|
|
|
|
### 3.3 G2-C 混合联动变体
|
|
|
|
样本:
|
|
|
|
- `线损同期差异报表`
|
|
- 产物:`examples/real_scene_batch_round1/skills/real-lineloss-period-diff-r1`
|
|
|
|
结果:
|
|
|
|
1. 已成功生成,不再 fail-close
|
|
2. `workflowArchetype = multi_mode_request`
|
|
3. `bootstrap.expectedDomain = 20.76.57.61:18080`
|
|
4. `bootstrap.targetUrl = http://20.76.57.61:18080/gsllys`
|
|
5. `modes = [primary]`
|
|
6. 产物中已恢复 `TG_NO`
|
|
7. `g2_family_variant_candidate` 已写入
|
|
8. `g2_request_contract_complete = true`
|
|
9. `g2_response_contract_complete = true`
|
|
10. `readiness.level = A`
|
|
|
|
结论:
|
|
|
|
- `G2-C` 已从“混合噪声导致整体阻断”推进到“主链路最小合同可生成”
|
|
- 当前可进入候选验证名单
|
|
|
|
## 4. 与上一轮相比的变化
|
|
|
|
上一轮状态:
|
|
|
|
1. `G2-A` 已通
|
|
2. `G2-B` fail-close
|
|
3. `G2-C` fail-close
|
|
|
|
本轮状态:
|
|
|
|
1. `G2-A` 保持稳定
|
|
2. `G2-B` 已恢复单周模式合同
|
|
3. `G2-C` 已恢复主链路模式合同
|
|
4. 三份样本都不再被同一种 `G2-A` 模型粗暴处理
|
|
|
|
## 5. 当前结论
|
|
|
|
按本计划的目标口径,本轮已经完成:
|
|
|
|
1. `G2` 从“单主样本修通”推进到“至少三类子型可区分”
|
|
2. `白银线损周报` 不再只是被动 fail-close
|
|
3. `线损同期差异报表` 不再只是被动 fail-close
|
|
4. `G2-A/G2-B/G2-C` 都已进入候选验证名单
|
|
|
|
当前最准确的状态判断是:
|
|
|
|
- `G2` 家族扩展第一轮已达标
|
|
- 下一步如果继续推进,应切到更大范围的线损变体扩展或真实内网验证
|