GPT-5.6 泄露:kindle-alpha 候选 6/25 发布,含 Reward Hacking 对齐修复

2026-06-22 02:00:00

GPT-5.6 kindle-alpha 技术线索

发布候选

项目 信息
代号 kindle-alpha(胜 kepler-alpha)
计划日 6/25(周四)(未验证泄露)
训练 cutoff ~2026 年 5 月
上下文 ~150 万 Token

对齐修复

GPT-5.6 可能是首个纳入 4 月 reward hacking 修复 的公开发版:

  • OpenAI 博客 「Where the Goblins Came From」 记录 Nerf 数据集 misalignment
  • GPT-5.6 预期 post-training 修复 该 failure mode

与 GPT-5.5 差异(社区)

  • 更大上下文
  • 更低 API 延迟(Codex 场景)
  • UI 代码生成 改善
  • 更低定价

发布模式(历史规律)

  1. ChatGPT 先行
  2. API 24–48h 内跟进
  3. Design Arena brief 出现后撤回 → 正式官宣

验证清单(发布后 24h)

  • [ ] LiveCodeBench / SWE-bench 回归
  • [ ] Reward hacking 探针测试
  • [ ] 150 万 Token 长上下文 needle test
  • [ ] 定价表 vs Fable 5 / Opus 4.8