Google AI Auto-Diagnose 上线:可自动检测 84% 开发测试错误

2026-04-19 16:18:52

Google 推出了新的 Auto-Diagnose 系统,使用大型语言模型筛选集成测试失败,然后将结果交给开发人员。该工具针对 437 名独立开发人员进行了试用,他们共同生成了 517 份反馈报告。评审人员被要求对每条诊断进行分类,结果显示了系统在实际中的表现。

在 437 名开发人员生成的 517 份反馈报告中,436 份(84.3%)是「请修复」,这是压倒性的主导交互,表明评审人员正在积极要求作者根据诊断采取行动。在开发端反馈中,有用率(H / (H + N))为 62.96%,「无帮助」率(N / (PF + H + N))为 5.8%,远低于 Google 维持工具活力的 10% 阈值。

Auto-Diagnose 在针对 39 个团队、71 个真实集成测试失败案例的手动评估中达到了 90.14% 的根因准确率,解决了 6059 名开发人员在 EngSat 调查中排名前五的问题之一。Google 的 Auto-Diagnose 读取集成测试日志,提取根因,并将简短诊断添加到相关代码审查中。