Files
claw/docs/superpowers/reports/2026-04-18-g2-first-round-blocker-summary.md

142 lines
4.2 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# G2 家族首轮 Blocker 汇总
日期2026-04-18
样本范围:
1. `台区线损大数据-月_周累计线损率统计分析`
2. `白银线损周报`
3. `线损同期差异报表`
对应生成产物:
1. `examples/real_scene_batch_round1/skills/real-tq-lineloss-report-r1`
2. `examples/real_scene_batch_round1/skills/real-baiyin-lineloss-weekly-r1`
3. `examples/real_scene_batch_round1/skills/real-lineloss-period-diff-r1`
## 1. 当前结论
这三个 `G2` 真实样本已经足够说明,当前生成链在“线损多模式报表家族”上存在稳定的共性 blocker而不是单个场景的偶发误差。
当前状态可以概括为:
1. 能抓到部分线损业务信号
2. 但不会把这些信号重建成 `multi_mode_request.month_week_table`
3. 反而会稳定坍缩到 `paginated_enrichment`
## 2. 已稳定复现的共性 blocker
### 2.1 archetype 稳定误判
三个样本都被判成:
- `paginated_enrichment`
而不是:
- `multi_mode_request`
这说明当前 workflow 判定时,分页、补数、过滤等噪声信号权重明显高于 `month/week` 模式矩阵信号。
### 2.2 bootstrap 稳定落错
三个样本都落到:
- `expected_domain = 20.77.115.36:31051`
- `target_url = http://20.77.115.36:31051`
这说明当前 bootstrap 选择逻辑没有把“真实业务承载页”与“其他可见入口页面”区分开。
### 2.3 modes 稳定丢失
三个样本都有这些共性:
1. `modes = []`
2. `defaultMode = "month"`
3. `modeSwitchField = "period_mode"`
也就是说,系统能感知到 mode 相关词,但不会把它编译成真正可执行的 mode 结构。
### 2.4 request contract 稳定缺失
三个样本都出现:
1. `params = []`
2. `requestTemplate = null`
3. 最终脚本把 `args` 直接整体塞进请求体
这说明当前链路没有恢复出线损家族真正需要的 mode-specific 请求合同。
### 2.5 column defs 稳定缺失
三个样本都出现:
1. `columnDefs = []`
2. `normalizeRules.requiredFields = []`
3. 脚本运行时用 `rows[0]` 动态反推列
这意味着业务列语义完全没有固化下来。
### 2.6 endpoint 污染稳定存在
三个样本都同时抓到了:
1. 线损业务接口
2. 95598/营销等其他业务接口
3. 大量第三方库、文档、外链 URL
这说明当前 endpoint candidate 过滤还不够,静态资源和依赖库内容仍在污染主业务判定。
### 2.7 readiness 稳定过度乐观
三个样本都给出:
- `Readiness: A`
但实际核心业务合同明显没有闭合。
这说明 readiness 现在还主要在反映“结构上能生成”,而不是“业务上接近可运行”。
## 3. 目前可以确认的正向信号
虽然不通过,但也有三类正向信号已经稳定出现:
1. 能抓到线损家族核心 endpoint 名称
2. 能抓到 `month/week/tjzq/mode` 这类模式信号
3. 能把 `localhost:*` 归入宿主依赖证据,而不是直接把它选成 bootstrap
这说明系统不是“完全盲”,而是“证据有了,但主链重建失败”。
## 4. 当前最小判断
基于前三个 `G2` 样本,当前可以给出一个更稳定的最小判断:
1. 当前链路已具备 `G2` 证据抽取能力
2. 当前链路尚不具备 `G2` 业务主链重建能力
3. 因此现在不能把 `G2` 结果视为可进入内网验证的候选 skill
## 5. 第三个 G2 样本验证结果
`线损同期差异报表` 已完成首轮生成,结果继续复现以下问题:
1. archetype 是否仍会坍缩到 `paginated_enrichment`
2. bootstrap 是否仍会被错误锚到 `20.77.115.36:31051`
3. endpoint 污染是否仍然严重
4. 当场景引入更明显的对比链、secondary chain 后,是否会进一步放大当前偏差
当前结果表明:
1. 以上问题全部继续复现
2. 且第三个样本的 `filter` 证据还出现了更明显的脏串污染
3. 因此 `G2` blocker 画像可以视为已经稳定
## 6. 当前阶段是否进入 G1/G3
建议:`可以结束 G2 首轮收敛,再决定是否切换`
原因:
1. 执行表顺序本来就是先打透 `G2`
2. 当前 `G2` blocker 已经通过第三个样本完成收口
3. 后续如果继续推进,应该进入“整理首轮迁移报告”或“开始 G1/G3 首轮样本生成”,而不是回头继续补更多 `G2` 观察样本