3.8 KiB
3.8 KiB
G2 家族扩展第三轮回归报告
Date: 2026-04-18 Scope:
docs/superpowers/plans/2026-04-18-g2-family-expansion-plan.mdFamily:G2
1. 本轮执行范围
本轮严格承接上一轮 G2 主样本整改,不回退 tq 主样本链路,只补以下两类剩余变体:
G2-B周报单侧 mode 变体 代表样本:白银线损周报G2-C线损主链路 + 外部系统联动的混合变体 代表样本:线损同期差异报表
本轮实际落地内容:
- 在 analyzer 中引入
G2FamilyVariant - 建立
G2-A/G2-B/G2-C三类子型边界 - 为
G2-B补单周模式最小合同 - 为
G2-C补主链路模式最小合同 - 保持
G2-A主样本不回退
2. 回归测试结果
本地回归:
cargo test --test scene_generator_test -- --nocapture- 结果:
19 passed
新增回归覆盖了:
G2-A主样本仍被识别为双模式主报表G2-B被识别为周报单侧 mode 变体G2-C被识别为混合联动变体G2-B可以生成最小合同G2-C可以生成最小合同
3. 真实样本第三轮结果
3.1 G2-A 基线
样本:
台区线损大数据-月_周累计线损率统计分析- 产物:
examples/real_scene_batch_round1/skills/real-tq-lineloss-report-r1
结果:
workflowArchetype = multi_mode_requestbootstrap.expectedDomain = 20.76.57.61:18080bootstrap.targetUrl = http://20.76.57.61:18080/gsllysmodes = [month, week]g2_family_variant_candidate已写入g2_request_contract_complete = trueg2_response_contract_complete = truereadiness.level = A
结论:
G2-A基线稳定,没有回退
3.2 G2-B 周报单侧 mode 变体
样本:
白银线损周报- 产物:
examples/real_scene_batch_round1/skills/real-baiyin-lineloss-weekly-r1
结果:
- 已成功生成,不再 fail-close
workflowArchetype = multi_mode_requestbootstrap.expectedDomain = 20.76.57.61:18080bootstrap.targetUrl = http://20.76.57.61:18080/gsllysmodes = [week]- 产物中已恢复
LINE_LOSS_RATE g2_family_variant_candidate已写入g2_request_contract_complete = trueg2_response_contract_complete = truereadiness.level = A
结论:
G2-B已从“只能 fail-close”推进到“可解释最小合同”- 已可进入候选验证名单
3.3 G2-C 混合联动变体
样本:
线损同期差异报表- 产物:
examples/real_scene_batch_round1/skills/real-lineloss-period-diff-r1
结果:
- 已成功生成,不再 fail-close
workflowArchetype = multi_mode_requestbootstrap.expectedDomain = 20.76.57.61:18080bootstrap.targetUrl = http://20.76.57.61:18080/gsllysmodes = [primary]- 产物中已恢复
TG_NO g2_family_variant_candidate已写入g2_request_contract_complete = trueg2_response_contract_complete = truereadiness.level = A
结论:
G2-C已从“混合噪声导致整体阻断”推进到“主链路最小合同可生成”- 当前可进入候选验证名单
4. 与上一轮相比的变化
上一轮状态:
G2-A已通G2-Bfail-closeG2-Cfail-close
本轮状态:
G2-A保持稳定G2-B已恢复单周模式合同G2-C已恢复主链路模式合同- 三份样本都不再被同一种
G2-A模型粗暴处理
5. 当前结论
按本计划的目标口径,本轮已经完成:
G2从“单主样本修通”推进到“至少三类子型可区分”白银线损周报不再只是被动 fail-close线损同期差异报表不再只是被动 fail-closeG2-A/G2-B/G2-C都已进入候选验证名单
当前最准确的状态判断是:
G2家族扩展第一轮已达标- 下一步如果继续推进,应切到更大范围的线损变体扩展或真实内网验证