GPT-Bidi-1 曝光:OpenAI 双向实时语音,终结「对讲机式」AI

2026-06-24 13:00:00

GPT-Bidi-1 技术前瞻

问题

现有语音 AI:轮流说话(walkie-talkie)——用户说完 → AI 再说

GPT-Bidi-1

能力 说明
Full-duplex 边听边说
Barge-in 即时吸收 打断
Knowledge cutoff ~2025/8
底座 疑基于 GPT-5.4 轻量化

与 GPT-5.6 关系

  • kindle-alpha 在 Codex 候选发布名单
  • 传闻 6/26(周四) 同期发布
  • GPT-5.6 Pro:视觉复刻、UI 生成、Agent 工作流

商业背景

  • ChatGPT 份额 首次 <50%(46.4%)
  • OpenAI IPO 前产品强心剂

架构含义

GPT-5.6(文本/Agent) + GPT-Bidi-1(实时语音)
         ↓
    ChatGPT 统一体验层

审慎

全部为泄露——以 官方 demo/system card 为准。

对比

  • OpenAI gpt-realtime-2(6 月已发 Whisper 路线)
  • Google Gemini Live
  • GPT-Bidi-1 = 真·全双工 下一代