142 lines
4.2 KiB
Markdown
142 lines
4.2 KiB
Markdown
# G2 家族首轮 Blocker 汇总
|
||
|
||
日期:2026-04-18
|
||
|
||
样本范围:
|
||
|
||
1. `台区线损大数据-月_周累计线损率统计分析`
|
||
2. `白银线损周报`
|
||
3. `线损同期差异报表`
|
||
|
||
对应生成产物:
|
||
|
||
1. `examples/real_scene_batch_round1/skills/real-tq-lineloss-report-r1`
|
||
2. `examples/real_scene_batch_round1/skills/real-baiyin-lineloss-weekly-r1`
|
||
3. `examples/real_scene_batch_round1/skills/real-lineloss-period-diff-r1`
|
||
|
||
## 1. 当前结论
|
||
|
||
这三个 `G2` 真实样本已经足够说明,当前生成链在“线损多模式报表家族”上存在稳定的共性 blocker,而不是单个场景的偶发误差。
|
||
|
||
当前状态可以概括为:
|
||
|
||
1. 能抓到部分线损业务信号
|
||
2. 但不会把这些信号重建成 `multi_mode_request.month_week_table`
|
||
3. 反而会稳定坍缩到 `paginated_enrichment`
|
||
|
||
## 2. 已稳定复现的共性 blocker
|
||
|
||
### 2.1 archetype 稳定误判
|
||
|
||
三个样本都被判成:
|
||
|
||
- `paginated_enrichment`
|
||
|
||
而不是:
|
||
|
||
- `multi_mode_request`
|
||
|
||
这说明当前 workflow 判定时,分页、补数、过滤等噪声信号权重明显高于 `month/week` 模式矩阵信号。
|
||
|
||
### 2.2 bootstrap 稳定落错
|
||
|
||
三个样本都落到:
|
||
|
||
- `expected_domain = 20.77.115.36:31051`
|
||
- `target_url = http://20.77.115.36:31051`
|
||
|
||
这说明当前 bootstrap 选择逻辑没有把“真实业务承载页”与“其他可见入口页面”区分开。
|
||
|
||
### 2.3 modes 稳定丢失
|
||
|
||
三个样本都有这些共性:
|
||
|
||
1. `modes = []`
|
||
2. `defaultMode = "month"`
|
||
3. `modeSwitchField = "period_mode"`
|
||
|
||
也就是说,系统能感知到 mode 相关词,但不会把它编译成真正可执行的 mode 结构。
|
||
|
||
### 2.4 request contract 稳定缺失
|
||
|
||
三个样本都出现:
|
||
|
||
1. `params = []`
|
||
2. `requestTemplate = null`
|
||
3. 最终脚本把 `args` 直接整体塞进请求体
|
||
|
||
这说明当前链路没有恢复出线损家族真正需要的 mode-specific 请求合同。
|
||
|
||
### 2.5 column defs 稳定缺失
|
||
|
||
三个样本都出现:
|
||
|
||
1. `columnDefs = []`
|
||
2. `normalizeRules.requiredFields = []`
|
||
3. 脚本运行时用 `rows[0]` 动态反推列
|
||
|
||
这意味着业务列语义完全没有固化下来。
|
||
|
||
### 2.6 endpoint 污染稳定存在
|
||
|
||
三个样本都同时抓到了:
|
||
|
||
1. 线损业务接口
|
||
2. 95598/营销等其他业务接口
|
||
3. 大量第三方库、文档、外链 URL
|
||
|
||
这说明当前 endpoint candidate 过滤还不够,静态资源和依赖库内容仍在污染主业务判定。
|
||
|
||
### 2.7 readiness 稳定过度乐观
|
||
|
||
三个样本都给出:
|
||
|
||
- `Readiness: A`
|
||
|
||
但实际核心业务合同明显没有闭合。
|
||
|
||
这说明 readiness 现在还主要在反映“结构上能生成”,而不是“业务上接近可运行”。
|
||
|
||
## 3. 目前可以确认的正向信号
|
||
|
||
虽然不通过,但也有三类正向信号已经稳定出现:
|
||
|
||
1. 能抓到线损家族核心 endpoint 名称
|
||
2. 能抓到 `month/week/tjzq/mode` 这类模式信号
|
||
3. 能把 `localhost:*` 归入宿主依赖证据,而不是直接把它选成 bootstrap
|
||
|
||
这说明系统不是“完全盲”,而是“证据有了,但主链重建失败”。
|
||
|
||
## 4. 当前最小判断
|
||
|
||
基于前三个 `G2` 样本,当前可以给出一个更稳定的最小判断:
|
||
|
||
1. 当前链路已具备 `G2` 证据抽取能力
|
||
2. 当前链路尚不具备 `G2` 业务主链重建能力
|
||
3. 因此现在不能把 `G2` 结果视为可进入内网验证的候选 skill
|
||
|
||
## 5. 第三个 G2 样本验证结果
|
||
|
||
`线损同期差异报表` 已完成首轮生成,结果继续复现以下问题:
|
||
|
||
1. archetype 是否仍会坍缩到 `paginated_enrichment`
|
||
2. bootstrap 是否仍会被错误锚到 `20.77.115.36:31051`
|
||
3. endpoint 污染是否仍然严重
|
||
4. 当场景引入更明显的对比链、secondary chain 后,是否会进一步放大当前偏差
|
||
|
||
当前结果表明:
|
||
|
||
1. 以上问题全部继续复现
|
||
2. 且第三个样本的 `filter` 证据还出现了更明显的脏串污染
|
||
3. 因此 `G2` blocker 画像可以视为已经稳定
|
||
|
||
## 6. 当前阶段是否进入 G1/G3
|
||
|
||
建议:`可以结束 G2 首轮收敛,再决定是否切换`
|
||
|
||
原因:
|
||
|
||
1. 执行表顺序本来就是先打透 `G2`
|
||
2. 当前 `G2` blocker 已经通过第三个样本完成收口
|
||
3. 后续如果继续推进,应该进入“整理首轮迁移报告”或“开始 G1/G3 首轮样本生成”,而不是回头继续补更多 `G2` 观察样本
|