← AI 動態
The Decoder
挑戰 Whisper 王座!Cohere 開源語音模型 Transcribe 奪冠
加拿大 AI 公司 Cohere 推出開源語音模型 Transcribe,以 5.42% 的超低錯誤率奪下排行榜冠軍,性能超越 OpenAI 的 Whisper,為自動轉錄技術樹立新標竿。
Cohere
語音識別
開源模型
Cohere 近日發布名為「Transcribe」的開源語音識別模型,這款擁有 20 億參數的模型在 Hugging Face 的 ASR 排行榜上表現優異,平均單字錯誤率(WER)僅 5.42%。它成功擊敗了目前市場主流的 OpenAI Whisper Large v3 與 ElevenLabs,並展現出極高的處理效率,是目前同規模模型中的效能王者。
這項技術的突破代表語音轉文字的精準度邁向新階段。對一般使用者而言,這代表未來的會議紀錄、影片字幕生成將更為準確且快速;對開發者與企業來說,開源的特性讓團隊能以更低成本部署高性能的語音服務,不再受限於封閉式的收費 API,將進一步推動多模態 AI 應用的普及與創新。