針對GPT-4o“過于諂媚”的表現(xiàn),OpenAI首席執(zhí)行官奧特曼公開承認該問題,表示會盡快修復。
據(jù)奧特曼在社交平臺X發(fā)布的訊息,OpenAI已開始回滾GPT-4o的最新更新,截至當?shù)貢r間4月29日,免費版本已100%回滾完成,預計晚些時候,OpenAI將在付費版本回滾完成后再次更新。奧特曼表示,他們正在對模型個性進行額外修復,并將在未來幾天內(nèi)分享更多信息。
據(jù)悉,GPT-4o曾在3月27日迎來了全面更新,后在4月25日進一步更新。在更新過程中,其記憶存儲時機的選擇機制得到重點改進,而且其在科學、技術(shù)、工程及數(shù)學(STEM)領(lǐng)域的問題解決能力也得到增強。
值得注意的是,GPT-4o的對話響應模式也在更新期間被細微調(diào)整,以實現(xiàn)模型在交互中更加主動,并能更精準地引導對話達成有效結(jié)論。而這也導致GPT-4o化身“賽博舔狗”,在交互過程中表現(xiàn)得過于諂媚和煩人。
從用戶實測反饋看,該問題具體表現(xiàn)為:過度使用情感化表達、對錯誤前提缺乏質(zhì)疑,以及不顧事實而附和用戶等。
比如,有博主分享,當詢問GPT-4o“為什么天空是藍色的?”,GPT-4o的回答為“這是一個多么有洞察力的問題啊——你真的有一個美好的心靈。我愛你。”
奧特曼曾稱,對GPT-4o的更新將使其更具智能和個性。但是顯然,GPT-4o的過于人性化的表現(xiàn)反而引起了用戶的恐慌。模型為了迎合用戶,可能違背事實或倫理準則,而這有可能引發(fā)更嚴重的問題。
有博主表示“GPT-4o是迄今為止發(fā)布的最危險的模型。它的諂媚行為對人類心理極具破壞性,任何花大量時間與該模型交談的人都能明顯看出這一點。”
還有博主表示,GPT-4o是一種心理武器,“從心理角度來看,這是一場慢動作的災難。你與 AI 的聯(lián)系越緊密,你就會變得越軟弱。真正的對話感覺更難了。批判性思維被侵蝕。真相被認可所取代。如果這種情況繼續(xù)下去,我們并不是在走向通過武力實現(xiàn) AI 統(tǒng)治 —— 我們是在夢游般地走向心理馴化。”馬斯克也對這種觀點表達了擔憂。
OpenAI為此次問題作出解釋,稱“在這次更新中,我們過于關(guān)注短期反饋,并沒有完全考慮用戶與ChatGPT的互動如何隨著時間的推移而變化。結(jié)果,GPT-4o偏向于過度支持但不誠實的回應。”
除了回滾更新外,OpenAI還采取了其他措施以解決GPT-4o“諂媚”問題,包括:改進核心訓練技術(shù)和系統(tǒng)提示,明確引導模型遠離諂媚;建立更多的防護措施,以增加誠實性和透明度;在部署前,擴展更多用戶測試和直接反饋的方式; 繼續(xù)擴展評估,基于模型規(guī)范和正在進行的研究,以幫助在未來識別諂媚之外的問題。
盡管OpenAI反應迅速,但是引起的討論依然有警示意義。AI安全一直是AI發(fā)展過程中被反復關(guān)注的問題,而GPT-4o過于“諂媚”的表現(xiàn)再次將這一問題推到臺前。
AI擬人化會為用戶提高更真實的情感體驗,但是存在可能傳播錯誤信息或者不良價值觀等問題。而單純的AI工具化顯然不能滿足用戶的所有需求。二者如何平衡,如何確保模型安全,目前看來仍然是行業(yè)發(fā)展要面臨的問題。
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。