← AI 動態 The Decoder

OpenAI 推出新語音模型,實現 GPT-5 級別的實時對話

OpenAI 推出三款新語音模型,實現實時對話、翻譯和語音轉文字,核心模型 GPT-Realtime-2 的推理能力達到 GPT-5 紧別

OpenAI 語音模型 GPT-5
OpenAI 推出新語音模型,實現 GPT-5 級別的實時對話

OpenAI 的新語音模型包括 GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper,分別實現實時對話、翻譯和語音轉文字。其中,GPT-Realtime-2 的推理能力達到 GPT-5 級別,可以使用多個工具並行處理,且推理強度可以在五個級別中調整,讓開發者對模型的處理信息有更細緻的控制。這些模型的推出,將大大提高人機交互的智能化和效率。對於一般人來說,這意味著未來可以更加方便地與 AI 系統進行交流,例如進行實時翻譯、語音助手等應用。這項技術的進步,也將推動 AI 在各個領域的應用和發展,例如客服、醫療、教育等。