Patronus 数字世界仿真:Agent 部署前的「虚拟沙盒」评测架构

2026-06-25 22:00:00

Patronus 仿真架构

工作流程

构建数字世界 → Agent 执行任务 → 自动评分 → 反馈微调

vs 静态 Benchmark

静态集 Patronus 数字世界
固定题目 动态环境
单次评测 百万场景变体
上线后才发现问题 上线前压力测试

客户类型

  • 模型厂商:发布前 red-team
  • 企业:部署前合规/可靠性验证

生态位

公司 切入面
Scaled Cognition 模型 不出错
Patronus 环境 先练
Coval 语音 通道

算力投入

5000 万 B 轮 将投入 世界模型训练与服务算力 规模化。