图8:五类 Vibe Coding 模式在“人控-约束-上下文”三维空间中的分布 后训练趋势:用可验证奖励替代人类偏好——代码能跑通 ...