量化标准 + 自动验证 + 重试循环 + 校准进化。人类只审批规则,不审结果。
Verify 失败 → Coach 介入(场景化建议) → 四层智能重试:L1 修补 → L2 诊断换策略 → L3 拆解组合 → L4 标准审查
信号驱动的分层重试。每一层不只是策略变化,更是对问题本质理解的深化。Coach Agent 根据失败信号(分数平台期、环境错误、层级震荡等)决定升级时机。