Patronus 数字世界仿真:Agent 部署前的「虚拟沙盒」评测架构
2026-06-25 22:00:00
Patronus 仿真架构
工作流程
构建数字世界 → Agent 执行任务 → 自动评分 → 反馈微调
vs 静态 Benchmark
| 静态集 | Patronus 数字世界 |
|---|---|
| 固定题目 | 动态环境 |
| 单次评测 | 百万场景变体 |
| 上线后才发现问题 | 上线前压力测试 |
客户类型
- 模型厂商:发布前 red-team
- 企业:部署前合规/可靠性验证
生态位
| 公司 | 切入面 |
|---|---|
| Scaled Cognition | 模型 不出错 |
| Patronus | 环境 先练 |
| Coval | 语音 通道 |
算力投入
5000 万 B 轮 将投入 世界模型训练与服务算力 规模化。