← AI 動態 2026-03-24 The Decoder

Luma AI 發表 Uni-1 全能影像模型：具備推理能力的 AI，挑戰 Google 影像生成霸主地位

Luma AI 推出 Uni-1 模型，首度將影像理解與生成整合至單一架構。該模型能在生成前進行邏輯推理與場景規劃，在人類偏好測試中表現優異，成為影像生成領域的強力競爭者。

Uni-1 的核心突破在於其採用的「自回歸 Transformer」架構，這讓模型不再只是單純的像素生成，而是能像大語言模型一樣對指令進行推理。在生成圖片前，Uni-1 會先拆解複雜指令並規劃場景構圖，這種「先思考、後繪圖」的特性，大幅提升了生成結果的精準度與邏輯一致性。

在業界權威的 Elo 人類偏好評測中，Uni-1 在綜合表現、風格編輯與參考圖生成等類別均位居第一，展現出超越目前主流工具的潛力。對於一般使用者與企業而言，這意味著未來能透過更簡潔的指令，獲得更具藝術感且符合邏輯的高品質影像。目前 Uni-1 已開放免費測試，未來也將推出 API 服務，大幅降低開發者導入高品質多模態 AI 的門檻。

Luma AI 發表 Uni-1 全能影像模型：具備推理能力的 AI，挑戰 Google 影像生成霸主地位

相關講座