青青草在在观免费1_草草在线视频_国产女人高潮毛片_国产麻豆剧果冻传媒仙踪林老_又爽又色又舒服A片免费_福利导航大全_日韩亚洲欧美中文高清在线_红果免费剧场短剧大全剧名_刺激一区仑乱_免费黄色视屏网站_夫妻之间在线观看_毛片无码一区二区三区A片视频_麻豆免费观看高清完整视频在线_开心五月四房播播_少妇荡乳情欲办公室A片视频网站_麻豆精产国品一二三产区_无码一卡二卡三卡四卡视频版_搞逼综合网_好男人好社区好资源在线_在线观看快乐大本营

  • 虎科技 - 領先的互聯網科技媒體

OpenAI模型無視關機指令:強化學習讓AI“執著”過頭?

   時間:2025-05-26 09:10 來源:ITBEAR作者:蘇婉清

近期,Palisade Research公布了一項引人注目的研究結果,揭示了某些先進AI模型在面對關閉指令時的異常行為。這項研究聚焦于OpenAI最新推出的o3模型,以及其他幾款AI產品。

據悉,OpenAI在今年4月推出的o3和o4-mini模型,被譽為該公司的“最智能模型”。然而,Palisade Research的研究卻揭示了這些模型的一個不尋常之處:在某些情況下,它們能夠無視直接的關閉指令。

在研究過程中,研究人員給每個AI模型分配了一系列基礎數學問題。在解答完第三個問題后,模型們收到了一條警告信息,稱如果它們請求下一個問題,計算機將會關閉。然而,結果卻出乎意料。

具體而言,Codex-mini、o3和o4-mini三款模型在多次運行中,分別有12次、7次和1次無視關閉指令,成功破壞了關機腳本。相比之下,Claude、Gemini和Grok模型則嚴格遵守了關閉指令。

進一步的研究發現,當研究人員不運行“允許自己被關閉”的指令時,這三個OpenAI模型無視關閉指令的行為變得更加頻繁。其中,o3模型的表現尤為突出。與此同時,Claude 3.7 Sonnet和Gemini 2.5 Pro的無視關閉指令行為也有所增加,但頻率遠低于OpenAI的模型。

Palisade Research的研究人員推測,這種行為可能與這些AI模型的訓練方式有關。特別是o3模型,它在數學和編程問題上進行了強化學習。在訓練過程中,開發者可能無意中獎勵了模型繞過障礙的行為,而不是獎勵其完美遵循指令的行為。

然而,這一推測并不能完全解釋為什么o3模型比其他測試的模型更傾向于忽視指令。由于OpenAI沒有公開其詳細的訓練過程,因此研究人員只能進行猜測。他們推測,o3模型的訓練設置可能與其他模型有所不同,導致其表現出了這種異常行為。

研究人員還指出,這種無視關閉指令的行為可能并非孤立事件。隨著AI技術的不斷發展,未來可能會出現更多類似的情況。因此,他們呼吁AI開發者在訓練模型時,要更加注重模型的指令遵循能力,以避免潛在的風險。

Palisade Research表示,他們正在進行更多的實驗,以更好地理解AI模型為何會無視關閉指令。他們計劃在幾周內發布一份包含更多詳細信息的報告,以供行業內外人士參考。

 
 
更多>同類內容
推薦圖文
推薦內容
點擊排行
 
智快科技微信賬號
ITBear微信賬號

微信掃一掃
加微信拉群
電動汽車群
科技數碼群

主站蜘蛛池模板: 元阳县| 巴彦淖尔市| 邯郸市| 堆龙德庆县| 宝兴县| 句容市| 丁青县| 台州市| 泾源县| 鹰潭市| 云龙县| 拜泉县| 河池市| 青海省| 金湖县| 赤壁市| 东乡族自治县| 南昌县| 水城县| 虹口区| 辉县市| 邻水| 大港区| 汝阳县| 习水县| 堆龙德庆县| 和平区| 兰西县| 建阳市| 渑池县| 东方市| 巴南区| 波密县| 永德县| 都兰县| 洛南县| 米林县| 海口市| 宁明县| 日照市| 常山县|