feat: add generated scene skill platform hardening

This commit is contained in:
木炎
2026-04-21 23:19:06 +08:00
parent 118fc77935
commit 956f0c2b68
439 changed files with 61974 additions and 3645 deletions

View File

@@ -0,0 +1,141 @@
# G2 家族首轮 Blocker 汇总
日期2026-04-18
样本范围:
1. `台区线损大数据-月_周累计线损率统计分析`
2. `白银线损周报`
3. `线损同期差异报表`
对应生成产物:
1. `examples/real_scene_batch_round1/skills/real-tq-lineloss-report-r1`
2. `examples/real_scene_batch_round1/skills/real-baiyin-lineloss-weekly-r1`
3. `examples/real_scene_batch_round1/skills/real-lineloss-period-diff-r1`
## 1. 当前结论
这三个 `G2` 真实样本已经足够说明,当前生成链在“线损多模式报表家族”上存在稳定的共性 blocker而不是单个场景的偶发误差。
当前状态可以概括为:
1. 能抓到部分线损业务信号
2. 但不会把这些信号重建成 `multi_mode_request.month_week_table`
3. 反而会稳定坍缩到 `paginated_enrichment`
## 2. 已稳定复现的共性 blocker
### 2.1 archetype 稳定误判
三个样本都被判成:
- `paginated_enrichment`
而不是:
- `multi_mode_request`
这说明当前 workflow 判定时,分页、补数、过滤等噪声信号权重明显高于 `month/week` 模式矩阵信号。
### 2.2 bootstrap 稳定落错
三个样本都落到:
- `expected_domain = 20.77.115.36:31051`
- `target_url = http://20.77.115.36:31051`
这说明当前 bootstrap 选择逻辑没有把“真实业务承载页”与“其他可见入口页面”区分开。
### 2.3 modes 稳定丢失
三个样本都有这些共性:
1. `modes = []`
2. `defaultMode = "month"`
3. `modeSwitchField = "period_mode"`
也就是说,系统能感知到 mode 相关词,但不会把它编译成真正可执行的 mode 结构。
### 2.4 request contract 稳定缺失
三个样本都出现:
1. `params = []`
2. `requestTemplate = null`
3. 最终脚本把 `args` 直接整体塞进请求体
这说明当前链路没有恢复出线损家族真正需要的 mode-specific 请求合同。
### 2.5 column defs 稳定缺失
三个样本都出现:
1. `columnDefs = []`
2. `normalizeRules.requiredFields = []`
3. 脚本运行时用 `rows[0]` 动态反推列
这意味着业务列语义完全没有固化下来。
### 2.6 endpoint 污染稳定存在
三个样本都同时抓到了:
1. 线损业务接口
2. 95598/营销等其他业务接口
3. 大量第三方库、文档、外链 URL
这说明当前 endpoint candidate 过滤还不够,静态资源和依赖库内容仍在污染主业务判定。
### 2.7 readiness 稳定过度乐观
三个样本都给出:
- `Readiness: A`
但实际核心业务合同明显没有闭合。
这说明 readiness 现在还主要在反映“结构上能生成”,而不是“业务上接近可运行”。
## 3. 目前可以确认的正向信号
虽然不通过,但也有三类正向信号已经稳定出现:
1. 能抓到线损家族核心 endpoint 名称
2. 能抓到 `month/week/tjzq/mode` 这类模式信号
3. 能把 `localhost:*` 归入宿主依赖证据,而不是直接把它选成 bootstrap
这说明系统不是“完全盲”,而是“证据有了,但主链重建失败”。
## 4. 当前最小判断
基于前三个 `G2` 样本,当前可以给出一个更稳定的最小判断:
1. 当前链路已具备 `G2` 证据抽取能力
2. 当前链路尚不具备 `G2` 业务主链重建能力
3. 因此现在不能把 `G2` 结果视为可进入内网验证的候选 skill
## 5. 第三个 G2 样本验证结果
`线损同期差异报表` 已完成首轮生成,结果继续复现以下问题:
1. archetype 是否仍会坍缩到 `paginated_enrichment`
2. bootstrap 是否仍会被错误锚到 `20.77.115.36:31051`
3. endpoint 污染是否仍然严重
4. 当场景引入更明显的对比链、secondary chain 后,是否会进一步放大当前偏差
当前结果表明:
1. 以上问题全部继续复现
2. 且第三个样本的 `filter` 证据还出现了更明显的脏串污染
3. 因此 `G2` blocker 画像可以视为已经稳定
## 6. 当前阶段是否进入 G1/G3
建议:`可以结束 G2 首轮收敛,再决定是否切换`
原因:
1. 执行表顺序本来就是先打透 `G2`
2. 当前 `G2` blocker 已经通过第三个样本完成收口
3. 后续如果继续推进,应该进入“整理首轮迁移报告”或“开始 G1/G3 首轮样本生成”,而不是回头继续补更多 `G2` 观察样本