← AI 動態 The Decoder

xAI推出Custom Voices功能,僅需一分鐘錄音即可複製語音

xAI的新功能Custom Voices可讓用戶僅需一分鐘的錄音即可複製自己的語音

xAI Custom Voices 語音複製
xAI推出Custom Voices功能,僅需一分鐘錄音即可複製語音

xAI的Custom Voices功能是基於公司最近推出的Grok Speech-to-Text和Text-to-Speech API。這個功能只需要用戶錄製約一分鐘的自然語音,然後就可以在兩分鐘內生成可用的語音模型。這個模型可以直接應用於公司的文本轉語音和語音代理API中。為了防止濫用,xAI採用了兩步驗證過程,第一步是用戶讀取密碼短語,系統實時檢查,第二步是系統比較錄製的語音特徵以確認是同一個人在說話。這個功能對於開發人員來說非常有用,因為它可以讓他們快速輕鬆地為AI應用程序創建個性化的語音模型。另外,這個功能也可能對語音助手、客服系統等領域產生重要影響。