DeepSeek V4助力数学证明:普林斯顿团队成本降500倍
2026-06-08 16:00:00
2026年6月8日,普林斯顿大学团队发布形式化数学证明系统Goedel-Architect,采用DeepSeek-V4-Flash作为核心推理引擎,在成本与成绩上均引发关注。
关键数据
系统在PutnamBench上通过率达75.6%,整项研究总成本约294美元,较此前Hilbert系统降低约500倍,刷新多项效率纪录。
技术意义
表明开源/低成本模型在高度结构化推理任务上已具备竞争力,科研与工业仿真领域可重新评估「必须用最贵闭源模型」的假设。
对软件研发的启发
形式化验证、合约审计与合规规则检查等「可证明正确性」场景,或将成为下一波AI落地的高价值垂直领域。