← AI 動態
The Decoder
微軟開源「Harrier」嵌入模型,支援超過100種語言
微軟的Bing團隊開源了一個名為Harrier的嵌入模型,支援超過100種語言,表現優於OpenAI和Amazon的模型
自然語言處理
多語言支持
嵌入模型
微軟的Bing團隊最近開源了一個名為Harrier的嵌入模型,該模型支援超過100種語言,且在多語言的MTEB v2 benchmark上取得了最佳成績。Harrier的訓練資料包括超過20億個實例和GPT-5的合成資料,具有32,000個token的上下文窗口。這個模型的開源對於自然語言處理和多語言支持的研究和應用具有重要意義。 Harrier的開源也意味著開發者和研究人員可以自由使用和修改這個模型,以應用於各種實際場景中。這個模型的開源對於推動AI技術的發展和普及具有重要意義。