A
Auto Agent
Dashboard
Docs
Monitor ↗
系统综合评分
-
数据更新于
能力
成功率
-
首次通过率
-
自愈率
-
任务类型
-
效率
L1 直达率
-
平均尝试
-
次/任务
平均 LLM 调用
-
平均耗时
-
秒/任务
质量深度
检验维度
-
维度命中率
-
越高越准确
对抗模式
-
红队发现的攻击模式
金丝雀基准
-
回归测试任务
层级分布
L1 修补
L2 诊断
L3 拆解
L4 审查
进化趋势
成功率
首次通过率
检验维度
Checker Performance
每种验证器的实际使用次数与通过率,数据来自所有 verify.json。
加载中...
Layer 成功率对比
任务全景
Coach & Evolution
Active Patterns
-
Coach 检测规则
总干预
-
Evolution Rules
-
Experience Bank
-