4.9 KiB
4.9 KiB
第一轮迁移与候选验证报告
日期:2026-04-18
上游执行表:2026-04-18-first-real-scene-migration-execution-sheet.md
相关分析:
1. 报告目的
本报告只回答四个问题:
- 第一轮真实样本实际迁移了哪些场景
- 这些场景生成结果是否达到候选验证门槛
- 哪些样本可以进入后续内网验证
- 哪些 blocker 已经稳定,可以作为后续整改输入
2. 第一轮实际执行范围
按执行表顺序,本轮实际完成了 G2 家族首轮三样本:
台区线损大数据-月_周累计线损率统计分析白银线损周报线损同期差异报表
对应生成产物位于:
examples/real_scene_batch_round1/skills/real-tq-lineloss-report-r1examples/real_scene_batch_round1/skills/real-baiyin-lineloss-weekly-r1examples/real_scene_batch_round1/skills/real-lineloss-period-diff-r1
本轮尚未进入:
G1单页报表样本G3分页明细补数样本
3. 候选验证判定口径
样本只有同时满足以下条件,才可以进入后续内网候选验证:
- archetype 正确
- bootstrap 落到真实主业务承载面
- modes 或 workflow 主链恢复正确
- request contract 基本闭合
- response path / column defs / normalize rules 基本闭合
- readiness 与真实可运行性不明显冲突
任一核心项失败,当前轮次即判定为:
不进入候选验证
4. 第一轮样本结论表
| 场景 | 家族 | 生成是否成功 | 语义是否通过 | 是否进入候选验证 | 结论 |
|---|---|---|---|---|---|
| 台区线损大数据-月_周累计线损率统计分析 | G2 | 是 | 否 | 否 | 生成成功,但业务语义恢复失败 |
| 白银线损周报 | G2 | 是 | 否 | 否 | 生成成功,但沿同类错误路径坍缩 |
| 线损同期差异报表 | G2 | 是 | 否 | 否 | 生成成功,但复杂链路没有被正确表达 |
5. 候选验证名单
本轮候选验证名单:
空
原因不是“生成器完全跑不起来”,而是“生成器已经能产出包,但这些包还不具备进入内网业务验证的价值”。
6. 本轮稳定确认的 blocker
6.1 archetype 坍缩
三份样本全部被判成:
paginated_enrichment
而不是线损家族应接近的:
multi_mode_request
6.2 bootstrap 稳定误选
三份样本全部落到:
20.77.115.36:31051
而没有锚到线损主业务页面承载面。
6.3 modes 未恢复
三份样本都出现:
modes = []defaultMode = "month"modeSwitchField = "period_mode"
说明系统只保留了 mode 词面痕迹,没有恢复真正的 mode 结构。
6.4 request contract 缺失
三份样本都出现:
params = []requestTemplate = null- 脚本用泛化
args直接拼请求
说明当前还没有恢复出线损家族真正需要的请求合同。
6.5 column defs 缺失
三份样本都出现:
columnDefs = []requiredFields = []- 用返回首行 key 动态拼列
这与 tq 级稳定报表结构还有明显距离。
6.6 endpoint 污染
三份样本都混入了大量无关 endpoint:
- 其他业务系统接口
- 文档和第三方库 URL
- 静态依赖中的外链
说明当前 endpoint 提取还没有有效隔离业务主链与资源噪声。
6.7 readiness 过度乐观
三份样本都给了较高 readiness,但核心合同并未闭合。
这说明当前 readiness 还不能作为“可进内网验证”的判断依据。
7. 本轮确认的正向信号
虽然没有候选样本,但本轮也确认了三类有效正向信号:
- 系统已经能从真实样本中抓到线损核心 endpoint 名称
- 系统已经能抓到
month/week/tjzq/mode等模式词面信号 - 系统已经能把
localhost:*识别为宿主依赖证据,而不是直接当成业务 bootstrap
这说明当前链路不是“完全失明”,而是“证据抽到了,但主业务语义编译失败”。
8. 本轮阶段结论
第一轮迁移阶段的正式结论是:
- 当前生成链已经具备真实场景证据抽取能力
- 当前生成链还不具备
G2/tq级业务主链重建能力 - 因此第一轮没有任何样本达到候选验证门槛
- 本轮最有价值的产出不是候选 skill,而是稳定复现出来的
G2家族 blocker 画像
9. 后续输入
本报告形成后的后续输入只有两类:
- 作为后续整改阶段的 blocker 基线
- 作为进入
G1/G3首轮样本前的参考口径
本报告本身不包含整改方案,也不展开后续开发任务。