admin/claw

Files

木炎 956f0c2b68 feat: add generated scene skill platform hardening

2026-04-21 23:19:06 +08:00

3.2 KiB

Raw Blame History

Scene Skill 102 Full Direct Mock Execution Plan

Date: 2026-04-20 Status: Draft Upstream Design: docs/superpowers/specs/2026-04-20-scene-skill-102-full-direct-mock-execution-design.md

Plan Intent

Run all 102 final materialized scene skill scripts through a local direct mock runtime.

This plan expands beyond representative harness execution, but remains fully mock-only and local.

Fixed Inputs

examples/scene_skill_102_final_materialization_2026-04-19/skills
examples/scene_skill_102_final_materialization_2026-04-19/scene_skill_102_index.json
tests/fixtures/generated_scene/scene_skill_102_static_validation_2026-04-20.json
tests/fixtures/generated_scene/scene_skill_102_mock_runtime_harness_results_2026-04-20.json

Planned Outputs

tests/fixtures/generated_scene/scene_skill_102_full_direct_mock_execution_2026-04-20.json
docs/superpowers/reports/2026-04-20-scene-skill-102-full-direct-mock-execution-report.md

Allowed Files

new direct mock runner under tests/
tests/fixtures/generated_scene/scene_skill_102_full_direct_mock_execution_2026-04-20.json
docs/superpowers/reports/2026-04-20-scene-skill-102-full-direct-mock-execution-report.md

Forbidden Files

src/generated_scene/analyzer.rs
src/generated_scene/generator.rs
src/generated_scene/ir.rs
examples/scene_skill_102_final_materialization_2026-04-19/skills/**
tests/fixtures/generated_scene/scene_execution_board_2026-04-18.json

Phase 0: Freeze Direct Mock Boundary

Tasks

Confirm representative mock harness is complete.
Confirm this plan does not mutate generated skill packages.
Confirm this plan does not use real network, browser, or credentials.

Acceptance Criteria

direct mock starts from final materialized skills
generated skills remain unchanged

Phase 1: Build Direct Mock Runner

Tasks

load the 102 scene index
locate each generated script
reuse fake runtime dependencies by archetype
call buildBrowserEntrypointResult
capture artifact status, row count, failure reason, and mock request log

Acceptance Criteria

every scene is attempted
no single scene failure aborts the full run
no real request is sent

Phase 2: Execute Direct Mock For 102

Tasks

run the direct mock runner
write per-scene direct mock result
classify each scene as:
- direct-mock-pass
- direct-mock-partial
- direct-mock-fail

Acceptance Criteria

output record count is 102
each failure has a named reason

Phase 3: Publish Report

Tasks

summarize direct mock pass/fail
summarize results by archetype
identify remaining mock-only blockers
recommend whether pseudo-production batch selection should start

Acceptance Criteria

report does not claim production execution
report separates mock pass from production pass

Completion Criteria

This plan is complete when:

all 102 scenes have direct mock results
JSON asset is published
report is published
generated skill packages remain unchanged

Stop Statement

Stop after publishing direct mock execution results and report.

Do not start pseudo-production batch selection under this plan.

3.2 KiB Raw Blame History

Scene Skill 102 Full Direct Mock Execution Plan

Plan Intent

Fixed Inputs

Planned Outputs

Allowed Files

Forbidden Files

Phase 0: Freeze Direct Mock Boundary

Tasks

Acceptance Criteria

Phase 1: Build Direct Mock Runner

Tasks

Acceptance Criteria

Phase 2: Execute Direct Mock For 102

Tasks

Acceptance Criteria

Phase 3: Publish Report

Tasks

Acceptance Criteria

Completion Criteria

Stop Statement

3.2 KiB

Raw Blame History