Recursive 自动化 AI 研究系统连破三项基准:训练配方到 GPU 内核优化

2026-06-11 20:30:00

2026年6月11日,Recursive 公布其 自动化 AI 研究系统 的早期结果,展示 AI 自主发现科研改进的潜力。

三项 SOTA

基准 任务 Recursive 表现
NanoChat Autoresearch 固定算力下训练小语言模型 Validation BPB 0.9109,较 SOTA 0.9372 优 2.8%
NanoGPT Speedrun 最快达到目标 loss 77.5s vs 此前 79.7s
SOL-ExecBench GPU 内核优化 均值 0.754 vs 此前 0.699,距硬件极限差距缩小 18%

意义

第三项最接近生产:内核优化直接决定训练与推理成本。Recursive 系统通过自动提出新算法、重组已知想法、调优实现细节并在建模与优化间组合改进,在无人类社区持续投入的领域仍发现增益。

对软件业启示

若 AI 研究自动化规模化,MLOps、编译器与算子库 的迭代速度可能远超传统软件发布周期,云厂商与框架维护者需准备「机器速度」的补丁与回归体系。