Google AI Auto-Diagnose 上线：可自动检测 84% 开发测试错误

2026-04-19 16:18:52

Google 推出了新的 Auto-Diagnose 系统，使用大型语言模型筛选集成测试失败，然后将结果交给开发人员。该工具针对 437 名独立开发人员进行了试用，他们共同生成了 517 份反馈报告。评审人员被要求对每条诊断进行分类，结果显示了系统在实际中的表现。

在 437 名开发人员生成的 517 份反馈报告中，436 份（84.3%）是「请修复」，这是压倒性的主导交互，表明评审人员正在积极要求作者根据诊断采取行动。在开发端反馈中，有用率（H / (H + N)）为 62.96%，「无帮助」率（N / (PF + H + N)）为 5.8%，远低于 Google 维持工具活力的 10% 阈值。

Auto-Diagnose 在针对 39 个团队、71 个真实集成测试失败案例的手动评估中达到了 90.14% 的根因准确率，解决了 6059 名开发人员在 EngSat 调查中排名前五的问题之一。Google 的 Auto-Diagnose 读取集成测试日志，提取根因，并将简短诊断添加到相关代码审查中。