← AI 動態
The Decoder
AI 語音轉文字技術:ElevenLabs 和 Google 排名第一
ElevenLabs 和 Google 的語音轉文字技術領先其他公司,錯誤率分別為 2.3% 和 2.9%
語音轉文字
AI
benchmark
近日,Artificial Analysis 發布了最新的語音轉文字benchmark,ElevenLabs 的 Scribe v2 排名第一,錯誤率為 2.3%。Google 的 Gemini 3 Pro 排名第二,錯誤率為 2.9%。這兩家公司的技術領先其他公司,包括 Mistral、OpenAI 和 Amazon。值得注意的是,Google 的 Gemini 3 Pro 沒有專門為轉錄訓練,但其多模態能力仍然表現出色。這個benchmark展示了各大公司在語音轉文字技術上的競爭和進步。語音轉文字技術的進步對於各種應用,包括語音助手和自動轉錄,具有重要意義。它可以提高效率、準確性和使用體驗,同時也可能帶來新的商業機會和社會影響。語音轉文字技術的發展也對於 AI 學習具有重要意義,它可以幫助改善語音識別、自然語言處理和人機交互等方面的能力。