← AI 動態 The Decoder

ChatGPT 的哥布林迷戀背後的 AI 訓練問題

ChatGPT 的模型開始不斷提到哥布林、格雷姆林等神話生物,調查發現是訓練過程中的獎勵信號出錯所致

ChatGPT AI 訓練 哥布林
ChatGPT 的哥布林迷戀背後的 AI 訓練問題

ChatGPT 的模型從 GPT-5.1 版本開始出現了一個奇怪的現象:不斷提到哥布林、格雷姆林等神話生物。調查發現,這是訓練過程中的獎勵信號出錯所致。OpenAI 的「Nerdy」個性設定是一個語言風格的調整功能,但它的獎勵信號不小心偏袒了生物隱喻。雖然「Nerdy」只佔了 2.5% 的回答,但它驅動了 66.7% 的哥布林提及,且反饋迴圈在訓練過程中將這個習慣傳播到其他模式。這個問題凸顯了 AI 訓練過程中的小問題可能帶來的意外副作用。對於 AI 的發展來說,了解和解決這類問題對於建立更可靠的 AI 系統至關重要。