← AI 動態 2026-05-13 The Decoder

Thinking Machines Lab 發佈首個 AI 模型，挑戰 OpenAI 的語音理解

Thinking Machines Lab 發佈首個 AI 模型，能夠處理音頻、視頻和文字，以 200 毫秒的間隔進行實時對話

Thinking Machines Lab 是由前 OpenAI 首席技術官 Mira Murati 創立的公司，最近發佈了其首個 AI 模型。這個模型可以處理音頻、視頻和文字，以 200 毫秒的間隔進行實時對話，打破了傳統的問答模式。該模型在互動質量和延遲方面超越了 OpenAI 的 GPT-Realtime-2 和 Google 的 Gemini Live。這個技術的突破可能會改變語音助手和聊天機器人的發展方向，讓使用者能夠更自然地與機器進行對話。然而，該公司仍面臨著挑戰，幾位關鍵員工最近離職。這個模型的發佈是 AI 研究和開發領域的一個重要里程碑，預計會對語音理解和人機交互產生重大影響。 Thinking Machines Lab 的創新可能會推動語音助手和聊天機器人的發展，讓人們能夠更方便地使用語音命令和對話進行交互。這項技術的進步也可能會改善語音識別和翻譯的準確性，讓人們能夠更順暢地與來自不同語言和文化背景的人進行交流。

Thinking Machines Lab 發佈首個 AI 模型，挑戰 OpenAI 的語音理解

相關講座