← AI 動態 The Decoder

智譜 AI 發表 GLM-5V-Turbo:設計圖秒變程式碼,多模態代理邁向新里程碑

智譜 AI 推出全新多模態模型 GLM-5V-Turbo,能將 UI 設計稿或影片直接轉換為可執行的前端程式碼,並優化了 AI 代理在複雜介面中的感知與執行能力。

智譜AI 多模態模型 自動代碼生成
智譜 AI 發表 GLM-5V-Turbo:設計圖秒變程式碼,多模態代理邁向新里程碑

智譜 AI 近期發表的 GLM-5V-Turbo 標誌著開發流程的重大變革。這款多模態模型最核心的突破在於其強大的視覺理解力,開發者只需提供 UI 設計截圖甚至操作錄影,模型便能精準識別視覺元素,並直接生成高品質的前端程式碼。這不僅大幅縮短了產品開發的週期,也降低了設計與技術實作之間的溝通成本。

技術層面上,GLM-5V-Turbo 搭載了自主研發的視覺編碼器,專為「AI 代理(Agent)」工作流設計。它將感知、規劃與執行整合在單一流程中,使其在處理圖形使用者介面(GUI)任務時表現卓越。這意味著 AI 不再只是被動地回答問題,而是能真正理解介面邏輯並動手完成開發工作,對於未來自動化編程與智慧企業應用的普及具有深遠影響。