164 lines
4.9 KiB
Markdown
164 lines
4.9 KiB
Markdown
# 第一轮迁移与候选验证报告
|
||
|
||
日期:2026-04-18
|
||
|
||
上游执行表:[2026-04-18-first-real-scene-migration-execution-sheet.md](D:/data/ideaSpace/rust/sgClaw/claw-new/docs/superpowers/reports/2026-04-18-first-real-scene-migration-execution-sheet.md)
|
||
|
||
相关分析:
|
||
|
||
1. [2026-04-18-r1-real-tq-lineloss-analysis.md](D:/data/ideaSpace/rust/sgClaw/claw-new/docs/superpowers/reports/2026-04-18-r1-real-tq-lineloss-analysis.md)
|
||
2. [2026-04-18-g2-first-round-blocker-summary.md](D:/data/ideaSpace/rust/sgClaw/claw-new/docs/superpowers/reports/2026-04-18-g2-first-round-blocker-summary.md)
|
||
|
||
## 1. 报告目的
|
||
|
||
本报告只回答四个问题:
|
||
|
||
1. 第一轮真实样本实际迁移了哪些场景
|
||
2. 这些场景生成结果是否达到候选验证门槛
|
||
3. 哪些样本可以进入后续内网验证
|
||
4. 哪些 blocker 已经稳定,可以作为后续整改输入
|
||
|
||
## 2. 第一轮实际执行范围
|
||
|
||
按执行表顺序,本轮实际完成了 `G2` 家族首轮三样本:
|
||
|
||
1. `台区线损大数据-月_周累计线损率统计分析`
|
||
2. `白银线损周报`
|
||
3. `线损同期差异报表`
|
||
|
||
对应生成产物位于:
|
||
|
||
1. `examples/real_scene_batch_round1/skills/real-tq-lineloss-report-r1`
|
||
2. `examples/real_scene_batch_round1/skills/real-baiyin-lineloss-weekly-r1`
|
||
3. `examples/real_scene_batch_round1/skills/real-lineloss-period-diff-r1`
|
||
|
||
本轮尚未进入:
|
||
|
||
1. `G1` 单页报表样本
|
||
2. `G3` 分页明细补数样本
|
||
|
||
## 3. 候选验证判定口径
|
||
|
||
样本只有同时满足以下条件,才可以进入后续内网候选验证:
|
||
|
||
1. archetype 正确
|
||
2. bootstrap 落到真实主业务承载面
|
||
3. modes 或 workflow 主链恢复正确
|
||
4. request contract 基本闭合
|
||
5. response path / column defs / normalize rules 基本闭合
|
||
6. readiness 与真实可运行性不明显冲突
|
||
|
||
任一核心项失败,当前轮次即判定为:
|
||
|
||
- `不进入候选验证`
|
||
|
||
## 4. 第一轮样本结论表
|
||
|
||
| 场景 | 家族 | 生成是否成功 | 语义是否通过 | 是否进入候选验证 | 结论 |
|
||
| --- | --- | --- | --- | --- | --- |
|
||
| 台区线损大数据-月_周累计线损率统计分析 | G2 | 是 | 否 | 否 | 生成成功,但业务语义恢复失败 |
|
||
| 白银线损周报 | G2 | 是 | 否 | 否 | 生成成功,但沿同类错误路径坍缩 |
|
||
| 线损同期差异报表 | G2 | 是 | 否 | 否 | 生成成功,但复杂链路没有被正确表达 |
|
||
|
||
## 5. 候选验证名单
|
||
|
||
本轮候选验证名单:
|
||
|
||
- `空`
|
||
|
||
原因不是“生成器完全跑不起来”,而是“生成器已经能产出包,但这些包还不具备进入内网业务验证的价值”。
|
||
|
||
## 6. 本轮稳定确认的 blocker
|
||
|
||
### 6.1 archetype 坍缩
|
||
|
||
三份样本全部被判成:
|
||
|
||
- `paginated_enrichment`
|
||
|
||
而不是线损家族应接近的:
|
||
|
||
- `multi_mode_request`
|
||
|
||
### 6.2 bootstrap 稳定误选
|
||
|
||
三份样本全部落到:
|
||
|
||
- `20.77.115.36:31051`
|
||
|
||
而没有锚到线损主业务页面承载面。
|
||
|
||
### 6.3 modes 未恢复
|
||
|
||
三份样本都出现:
|
||
|
||
1. `modes = []`
|
||
2. `defaultMode = "month"`
|
||
3. `modeSwitchField = "period_mode"`
|
||
|
||
说明系统只保留了 mode 词面痕迹,没有恢复真正的 mode 结构。
|
||
|
||
### 6.4 request contract 缺失
|
||
|
||
三份样本都出现:
|
||
|
||
1. `params = []`
|
||
2. `requestTemplate = null`
|
||
3. 脚本用泛化 `args` 直接拼请求
|
||
|
||
说明当前还没有恢复出线损家族真正需要的请求合同。
|
||
|
||
### 6.5 column defs 缺失
|
||
|
||
三份样本都出现:
|
||
|
||
1. `columnDefs = []`
|
||
2. `requiredFields = []`
|
||
3. 用返回首行 key 动态拼列
|
||
|
||
这与 `tq` 级稳定报表结构还有明显距离。
|
||
|
||
### 6.6 endpoint 污染
|
||
|
||
三份样本都混入了大量无关 endpoint:
|
||
|
||
1. 其他业务系统接口
|
||
2. 文档和第三方库 URL
|
||
3. 静态依赖中的外链
|
||
|
||
说明当前 endpoint 提取还没有有效隔离业务主链与资源噪声。
|
||
|
||
### 6.7 readiness 过度乐观
|
||
|
||
三份样本都给了较高 readiness,但核心合同并未闭合。
|
||
|
||
这说明当前 readiness 还不能作为“可进内网验证”的判断依据。
|
||
|
||
## 7. 本轮确认的正向信号
|
||
|
||
虽然没有候选样本,但本轮也确认了三类有效正向信号:
|
||
|
||
1. 系统已经能从真实样本中抓到线损核心 endpoint 名称
|
||
2. 系统已经能抓到 `month/week/tjzq/mode` 等模式词面信号
|
||
3. 系统已经能把 `localhost:*` 识别为宿主依赖证据,而不是直接当成业务 bootstrap
|
||
|
||
这说明当前链路不是“完全失明”,而是“证据抽到了,但主业务语义编译失败”。
|
||
|
||
## 8. 本轮阶段结论
|
||
|
||
第一轮迁移阶段的正式结论是:
|
||
|
||
1. 当前生成链已经具备真实场景证据抽取能力
|
||
2. 当前生成链还不具备 `G2/tq` 级业务主链重建能力
|
||
3. 因此第一轮没有任何样本达到候选验证门槛
|
||
4. 本轮最有价值的产出不是候选 skill,而是稳定复现出来的 `G2` 家族 blocker 画像
|
||
|
||
## 9. 后续输入
|
||
|
||
本报告形成后的后续输入只有两类:
|
||
|
||
1. 作为后续整改阶段的 blocker 基线
|
||
2. 作为进入 `G1/G3` 首轮样本前的参考口径
|
||
|
||
本报告本身不包含整改方案,也不展开后续开发任务。
|