Auto Agent - Dashboard

能力

成功率

-

首次通过率

-

自愈率

-

任务类型

-

效率

L1 直达率

-

平均尝试

-

次/任务

平均 LLM 调用

-

平均耗时

-

秒/任务

质量深度

检验维度

-

维度命中率

-

越高越准确

对抗模式

-

红队发现的攻击模式

金丝雀基准

-

回归测试任务

Checker Performance

每种验证器的实际使用次数与通过率，数据来自所有 verify.json。

加载中...

Layer 成功率对比

Coach & Evolution

Active Patterns

-

Coach 检测规则

总干预

-

Evolution Rules

-

Experience Bank

-