feat: add generated scene skill platform hardening

This commit is contained in:
木炎
2026-04-21 23:19:06 +08:00
parent 118fc77935
commit 956f0c2b68
439 changed files with 61974 additions and 3645 deletions

View File

@@ -0,0 +1,155 @@
# 线损家族变体扩展回归报告
> Date: 2026-04-18
> Scope: `docs/superpowers/plans/2026-04-18-lineloss-family-variant-expansion-plan.md`
> Result: Completed
## 1. 本轮执行范围
本轮严格承接已完成的 `G2-A/G2-B/G2-C` 基线,不回头修改主样本整顿逻辑,只做以下两类新增线损变体扩展:
1. `G2-E = g2_e_comparison_crosscheck`
代表真实样本:`台区零度户月度用电量与台区线损电量对比核查报表`
2. `G2-F = g2_f_diagnosis_drilldown`
代表真实样本:`线损大数据-窃电分析`
`G2-D` 预测计算型已完成结构盘点,但因真实样本缺少稳定业务接口,暂不进入本轮生成链路实现。
## 2. Phase 0 / 1 / 2 交付结果
已新增文档:
1. `docs/superpowers/reports/2026-04-18-lineloss-family-variant-grouping-report.md`
2. `docs/superpowers/reports/2026-04-18-lineloss-family-minimum-contract-table.md`
完成内容:
1. 冻结 `G2-A/G2-B/G2-C` 为线损家族既有基线
2. 新增 `G2-D/G2-E/G2-F` 三个扩展方向
3. 明确本轮实际实施对象收敛为 `G2-E/G2-F`
4. 为新增变体建立最小合约与候选验证门槛
## 3. Phase 3 实现结果
### 3.1 新增 fixture
1. `tests/fixtures/generated_scene/g2_comparison_crosscheck/index.html`
2. `tests/fixtures/generated_scene/g2_diagnosis_drilldown/index.html`
### 3.2 新增分类与生成支持
已扩展:
1. `src/generated_scene/analyzer.rs`
- 新增 `G2E`
- 新增 `G2F`
- `G2-E` 判定口径:
- 存在 `getTqLinelossInfoListRank`
- 存在 `getUserElectricList`
- 同时出现用户 / 台区拼接信号
- `G2-F` 判定口径:
- 存在主筛选接口 `getTqLinelossInfoListRank`
- 存在诊断或下钻接口 `tqAutoDiagnoseAnalyse/search` / `stealElecAnalyse/*`
2. `src/generated_scene/generator.rs`
- 新增 `G2-E` 最小 mode`comparison`
- 新增 `G2-F` 最小 mode`diagnosis`
- readiness gate 已接纳两类新 mode
3. `tests/scene_generator_test.rs`
- 新增 `G2-E` 分类测试
- 新增 `G2-F` 分类测试
- 新增 `G2-E` 生成测试
- 新增 `G2-F` 生成测试
### 3.3 本地回归结果
执行命令:
```powershell
cargo test --test scene_generator_test -- --nocapture
```
结果:
1. `23 passed`
2. 原有 `G2-A/G2-B/G2-C` 未回退
3. 新增 `G2-E/G2-F` fixture 分类与生成通过
## 4. Phase 4 真实样本回归结果
### 4.1 `G2-E` 核查对比型
真实样本:
1. `台区零度户月度用电量与台区线损电量对比核查报表`
生成产物:
1. `examples/real_scene_batch_round2/skills/real-zero-consumer-crosscheck-r1`
结果:
1. `workflowArchetype = multi_mode_request`
2. `g2_family_variant_candidate = g2_e_comparison_crosscheck`
3. `bootstrap.expectedDomain = 20.76.57.61:18080`
4. `bootstrap.targetUrl = http://20.76.57.61:18080/gsllys`
5. `defaultMode = comparison`
6. `columnDefs` 已恢复 `TG_NO / TG_NAME / consno / userNmae / thisMonth / beforeMonth1`
7. `readiness.level = A`
结论:
1. 已从“未归类场景”推进到“可进入候选 skill 阶段”
2. 当前生成结果保住了台区 + 用户双层语义
### 4.2 `G2-F` 异常诊断 / 下钻型
真实样本:
1. `线损大数据-窃电分析`
生成产物:
1. `examples/real_scene_batch_round2/skills/real-steal-analysis-r1`
结果:
1. `workflowArchetype = multi_mode_request`
2. `g2_family_variant_candidate = g2_f_diagnosis_drilldown`
3. `bootstrap.expectedDomain = 20.76.57.61:18080`
4. `bootstrap.targetUrl = http://20.76.57.61:18080/gsllys`
5. `defaultMode = diagnosis`
6. `columnDefs` 已恢复 `TG_NO / LL_TYPE_NAME / LOSS_PQ / LINELOSS_RATE / remark`
7. generation report 中保留了 `tqAutoDiagnoseAnalyse/search``stealElecAnalyse/getFlqdyhDetailList``stealElecAnalyse/userVoltsAndElecflowMoniter/search` 证据
8. `readiness.level = A`
结论:
1. 已从“高复杂未归类场景”推进到“可候选验证的诊断型变体”
2. 当前版本恢复的是主链路最小诊断合约,不承诺完整 remark 业务语义
## 5. 当前残留问题
本轮 plan 范围内已达标,但仍有以下残留:
1. `G2-D` 预测计算型尚未进入实现
- 根因:真实样本主要是本地计算与文件输入,缺少稳定业务接口
2. 真实样本 HTML 中仍含大量第三方或非目标业务 URL 噪声
- 当前不会阻塞 `G2-E/G2-F` 候选生成
- 但后续应继续补“目标业务域去噪”能力
3. `G2-F` 的完整诊断 remark 仍未重建
- 当前只恢复最小诊断合约,不等于业务语义完全还原
## 6. 计划完成判定
对照 `2026-04-18-lineloss-family-variant-expansion-plan.md`,本轮已完成:
1. Phase 0冻结线损家族现有基线
2. Phase 1完成线损变体分组和代表样本清单
3. Phase 2完成新增变体最小合约表
4. Phase 3按分组扩展 `fixture / test / analyzer / generator / readiness`
5. Phase 4完成两类新增真实样本回归并输出扩展报告
最终判定:
1. 至少两类新增线损变体已进入候选验证阶段
2. 原有 `G2-A/G2-B/G2-C` 未回退
3. `G2-D` 保留为下一阶段候选组