← AI 動態 Simon Willison

OpenAI 發表 ChatGPT Images 2.0:影像生成技術迎來 GPT-5 級別重大突破

OpenAI 推出 ChatGPT Images 2.0 影像模型,Sam Altman 稱其進步幅度巨大。透過複雜細節測試,展現了新一代 AI 在處理精細視覺指令與多模態辨識上的驚人實力。

OpenAI 生成式AI 多模態模型
OpenAI 發表 ChatGPT Images 2.0:影像生成技術迎來 GPT-5 級別重大突破

OpenAI 正式發布最新影像生成模型 ChatGPT Images 2.0,執行長 Sam Altman 形容這次技術跳躍如同 GPT-3 進化至 GPT-5。這項更新象徵著生成式 AI 在理解複雜指令與細節控管上進入全新階段,讓影像生成不再只是隨機拼湊,而是具備更高程度的邏輯與空間感。

知名開發者 Simon Willison 針對此模型進行「威利在哪裡」風格的高難度測試,要求模型在複雜群眾中放入特定物件。測試結果顯示,相較於前代模型與其他競爭對手,新一代模型在處理微小細節(如手持無線電的浣熊)的精準度顯著提升。這對於需要精確視覺排版、廣告設計或虛擬場景建構的專業人士來說,將大幅降低溝通與修正成本。

多模態能力的強化是此次更新的技術亮點,這意味著 AI 能更精準地「理解」畫面中物件的空間關聯。對一般大眾而言,這代表生成的圖片將更符合直覺且更少物理邏輯錯誤,進一步拉近了數位創意構思與高品質視覺呈現之間的距離。