← AI 動態
The Decoder
Luma AI 發表 Uni-1 全能影像模型:具備推理能力的 AI,挑戰 Google 影像生成霸主地位
Luma AI 推出 Uni-1 模型,首度將影像理解與生成整合至單一架構。該模型能在生成前進行邏輯推理與場景規劃,在人類偏好測試中表現優異,成為影像生成領域的強力競爭者。
Luma AI
Uni-1
多模態生成
Uni-1 的核心突破在於其採用的「自回歸 Transformer」架構,這讓模型不再只是單純的像素生成,而是能像大語言模型一樣對指令進行推理。在生成圖片前,Uni-1 會先拆解複雜指令並規劃場景構圖,這種「先思考、後繪圖」的特性,大幅提升了生成結果的精準度與邏輯一致性。
在業界權威的 Elo 人類偏好評測中,Uni-1 在綜合表現、風格編輯與參考圖生成等類別均位居第一,展現出超越目前主流工具的潛力。對於一般使用者與企業而言,這意味著未來能透過更簡潔的指令,獲得更具藝術感且符合邏輯的高品質影像。目前 Uni-1 已開放免費測試,未來也將推出 API 服務,大幅降低開發者導入高品質多模態 AI 的門檻。