← AI 動態 2026-04-22 Simon Willison

OpenAI 發表 ChatGPT Images 2.0：影像生成技術迎來 GPT-5 級別重大突破

OpenAI 推出 ChatGPT Images 2.0 影像模型，Sam Altman 稱其進步幅度巨大。透過複雜細節測試，展現了新一代 AI 在處理精細視覺指令與多模態辨識上的驚人實力。

OpenAI 正式發布最新影像生成模型 ChatGPT Images 2.0，執行長 Sam Altman 形容這次技術跳躍如同 GPT-3 進化至 GPT-5。這項更新象徵著生成式 AI 在理解複雜指令與細節控管上進入全新階段，讓影像生成不再只是隨機拼湊，而是具備更高程度的邏輯與空間感。

知名開發者 Simon Willison 針對此模型進行「威利在哪裡」風格的高難度測試，要求模型在複雜群眾中放入特定物件。測試結果顯示，相較於前代模型與其他競爭對手，新一代模型在處理微小細節（如手持無線電的浣熊）的精準度顯著提升。這對於需要精確視覺排版、廣告設計或虛擬場景建構的專業人士來說，將大幅降低溝通與修正成本。

多模態能力的強化是此次更新的技術亮點，這意味著 AI 能更精準地「理解」畫面中物件的空間關聯。對一般大眾而言，這代表生成的圖片將更符合直覺且更少物理邏輯錯誤，進一步拉近了數位創意構思與高品質視覺呈現之間的距離。

查看原文 →

OpenAI 發表 ChatGPT Images 2.0：影像生成技術迎來 GPT-5 級別重大突破

相關講座