← AI 動態 The Decoder

小米發布 MiMo 三大 AI 模型:對標 Claude 高性能 Agent,進軍機器人與語音生態

小米推出 MiMo 系列三大 AI 模型,包含大語言、多模態與語音合成模型。旗艦模型 MiMo-V2-Pro 在程式碼與代理人任務表現優異,能自主操作軟體與購物,展現強大 AI Agent 潛力。

小米 MiMo AI Agent 多模態模型
小米發布 MiMo 三大 AI 模型:對標 Claude 高性能 Agent,進軍機器人與語音生態

小米近日推出三款 MiMo AI 模型,旨在構建完整的 AI 代理人(Agent)平台。旗艦型號 MiMo-V2-Pro 在程式編寫與任務執行能力上,已能與頂尖的 Claude Opus 4.6 並駕齊驅,且 API 成本僅為其一小部分。先前該模型曾以「Hunter Alpha」代號在 OpenRouter 榜單奪冠,實力令業界驚艷。

除了語言能力,多模態模型 MiMo-V2-Omni 具備視覺與聽覺能力,能自主進行瀏覽器操作(如網購)或分析行車紀錄器影像以識別風險。這項技術的突破意謂著 AI 將從「對話框」走向「實體世界」,未來將與小米的機器人及語音助理深度結合,實現更自然的語音互動。對一般人而言,這代表語音助手將轉型為數位管家,能主動代辦行程安排或處理繁瑣的線上任務。