← AI 動態 2026-05-08 The Decoder

OpenAI 推出新語音模型，實現 GPT-5 級別的實時對話

OpenAI 推出三款新語音模型，實現實時對話、翻譯和語音轉文字，核心模型 GPT-Realtime-2 的推理能力達到 GPT-5 紧別

OpenAI 的新語音模型包括 GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper，分別實現實時對話、翻譯和語音轉文字。其中，GPT-Realtime-2 的推理能力達到 GPT-5 級別，可以使用多個工具並行處理，且推理強度可以在五個級別中調整，讓開發者對模型的處理信息有更細緻的控制。這些模型的推出，將大大提高人機交互的智能化和效率。對於一般人來說，這意味著未來可以更加方便地與 AI 系統進行交流，例如進行實時翻譯、語音助手等應用。這項技術的進步，也將推動 AI 在各個領域的應用和發展，例如客服、醫療、教育等。

OpenAI 推出新語音模型，實現 GPT-5 級別的實時對話

相關講座