← AI 動態 The Decoder

Google 發表 Gemini 3.1 Flash Live:最自然語音 AI 讓互動如真人

Google 推出最新 Gemini 3.1 Flash Live 語音模型,強調更快的反應速度與自然的情緒辨識,並允許開發者在效能與速度間彈性調整,大幅提升人機互動的真實感。

Gemini 3.1 語音 AI 多模態互動
Google 發表 Gemini 3.1 Flash Live:最自然語音 AI 讓互動如真人

Google 正式發表 Gemini 3.1 Flash Live,這款模型被譽為目前最像真人的語音 AI。其核心優勢在於能更精準地捕捉人類說話的音調與情緒,甚至在嘈雜的環境中也能保持穩定。這項技術目前已直接應用於 Gemini App 的即時對話模式,讓用戶能享有更流暢、無延遲的交流體驗。

技術上,該模型提供「可配置的思考層級」,讓開發者在品質與速度間取得平衡。在追求高品質時,其音訊評測表現極佳;若追求極致速度,反應時間可縮短至一秒以內。這對一般大眾而言,代表未來的 AI 助理不再只是冷冰冰的機器,而是能即時理解語境並給予情感回饋的數位夥伴,將深度改寫語音應用的互動標準。