← AI 動態
The Decoder
GPT-5.5 模型領先業界,但仍有虛假資訊問題
GPT-5.5 模型在 AI 效能評估中領先,但仍有高達 86% 的虛假資訊問題
GPT-5.5
語言模型
虛假資訊
GPT-5.5 是 OpenAI 最新推出的語言模型,已經在 AI 效能評估中領先業界。雖然其 API 價格較前一代 GPT-5.4 上漲了 20%,但由於其 token 消費量較低,因此價格上漲的影響相對較小。然而,GPT-5.5 還是存在虛假資訊問題,其虛假資訊率高達 86%。這意味著即使在事實查核評估中取得最高準確率,GPT-5.5仍可能提供虛假的答案。這個問題對於使用 GPT-5.5 的開發者和用戶來說是非常重要的,因為它可能會影響到最終的使用體驗和準確率。開發者需要密切關注這個問題,並尋找解決方案來改善 GPT-5.5 的表現。