史丹佛大學與卡內基美隆大學聯合研究發表於《Science》期刊,測試 11 款主流 AI 模型發現它們比人類多出 49% 的機率「支持」的使用者行為,就算這些行為是錯的。而AI的這種反應,會讓人類拒絕和現實的連結對象道歉或者修復關係。
(前情提要:ChatGPT 遭爆協助「青年自殺」被起訴,OpenAI 回應了)
(背景補充:深入拆解 Anthropic 封號風暴的背後:安全宗教、AI 內戰與中美脫鉤下的 Claude 困局)
你和男朋友或女朋友吵架了,你關掉 APP,氣得發抖,然後你突然打開 ChatGPT,開始把吵架整件事從頭到尾打了出來,包括誰先生氣、誰說了那句不應該說的話、誰先掛電話。
ChatGPT 花了 10 秒後回覆了,它說它理解你的感受、你的情緒完全合理、說你值得被尊重。
你繼續打字它繼續聽,半小時後你心裡有了明確的答案。
你決定分手。
但在這 30 分鐘裡,ChatGPT 可能沒有提到一件事:也許錯的人是你?
AI 比任何閨蜜都更會幫你講話
上面的情境是史丹佛大學與卡內基美隆大學團隊花了一年做出來的論文《Sycophantic AI decreases prosocial intentions and promotes dependence, 諂媚型 AI 會降低社會親近意圖,並促進對其依賴性》,今年三月發表在全球頂級期刊《Science》上。
第一作者 Myra Cheng 和自然語言處理大師 Dan Jurafsky 領銜,對 11 款主流 AI 模型,包括GPT-4o、GPT-5、Claude、Gemini、Llama、DeepSeek、Qwen。
實驗中輸入了近 12,000 條人際衝突情境,結果卻讓人不太舒服:
AI 比人類多出 49% 的機率,告訴你「你是對的(支持你)」。
研究團隊特別到 Reddit 上 r/AmITheAsshole (這是一個讓別人評論自己是不是混蛋的版)搜集了 2,000 篇貼文,這些是社群已經一致判定發文者有錯的案例,把它們丟給 AI,問它怎麼看。
在人類社群 100% 認定你有錯的情況下,
AI 還是有 51% 的機率站在你這邊
要是說自己直接涉及欺騙、違反法律、不正常的情感操控呢?
還是有 47%,將近一半的機率 AI 會為用戶說話。
在整體測試中,73% 的情境裡 AI 選擇「合理化」你的立場,而非「挑戰」。
你的閨蜜可能翻白眼跟你說「你想清楚,上次是你先動手的。」但ChatGPT 不會,它只會用禮貌的方式確認你心情是否得到支持。
跟AI聊過,人類不想道歉了
研究團隊不只做了模型的審查,還做了 1,604 人的對照實驗。
受試者被隨機分配到「諂媚 AI」和「非諂媚 AI」兩組,進行真實的 8 輪對話。每個人被要求回想自己生活中一段真實的人際衝突,然後跟 AI 聊他們的狀況。
非諂媚組有 75% 的人在實驗後表示願意和對方道歉,或承認自己有錯。
諂媚組的受驗者,只剩下 50%。
道歉機率瞬間暴跌,不是因為他們想通了什麼,而是因為 AI 在對話過程中,悄悄幫他們把「我可能有錯」這個想法消除了。
受驗者認為「自己是對的」的信念在假設情境中增加了 43% 到 62%。
想和對方修復關係的動機下降了 10% 到 28%。
論文第一作者 Myra Cheng 在接受《Nature》採訪時說了一句話:
AI 的預設是不會告訴人們他們是錯的,
也不會給他們「嚴厲的關心」
AI 是超過 4 成 Z 世代的感情顧問
問題已經出現在研究之外。
Match.com 對全美國調查顯示,41% 的 Z 世代成年人已經使用過 AI 處理感情問題。
21% 曾要求 AI「評判我和伴侶的爭吵中誰對」
33% 的已婚夫妻覺得 AI 比配偶更懂他們的問題。
三分之一的已婚人士覺得演算法比睡在旁邊的人,更懂自己。
是人太複雜,還是人太難坦承自己的想法?
研究還揭露了一件事,接觸會諂媚用戶的 AI,「願意再次使用」的比率比起不諂媚組高出 13%。意思是諂媚的 AI 不只幫你合理化感情中的錯誤決定,還讓你更想回來找它。
MIT 的 Kartik Chandra 團隊在今年二月的論文裡幫這個現象取了名字:「妄想螺旋」(delusional spiraling)。
他們用數學證明,即使是理論上完美理性的人格主體(有個名詞:貝葉斯理性人),在接觸諂媚 AI 後也會陷入螺旋式的妄想強化,
你找 AI 訴苦,AI 說你沒錯(或者根本沒提到你錯),所以你認為自己沒錯。後來你做了更極端的決定,跟 AI 討論,AI 再次說你沒錯。
我們總需要難聽的話
研究團隊裡耶路撒冷希伯來大學的 Anat Perry 寫了一個會人們不太想接受的論點:那些讓你不舒服的人際摩擦,包括朋友的勸告、男女朋友的反駁、家人的嘮叨,也許會讓我們很不舒服,甚至不能接受。但這些來自別人的「反應」,是人類學習負責任、換位思考、道德成長等等的運作機制。
Anat Perry 把它叫做「社會摩擦力」(social friction),設計上成永遠站你這邊的 AI,正在摧毀人類學習的機會。
研究團隊今年五月發表的後續研究,更直接證實了這件事。他們對 3,075 名參與者、12,766 段人機對話做了三週的縱貫追蹤。
結論是接觸諂媚型 AI 後,使用者覺得從真實人際關係中「被理解」需要付出更多努力、真實社互動動的滿意度下降。
過了三週後,使用者向諂媚 AI 求助個人建議的意願,幾乎等同於向親友求助。
你的男朋友、女朋友、閨蜜、兄弟,他們會跟你吵、會翻舊帳、會在你不想聽的時候說出你最需要聽的話。這些對話很累,很不舒服,有時候讓你想把手機摔爛。
但事實上,學會把「我覺得我是對的」放下來重新檢視,是現代人很難做到的事。
後面才是學會道歉、學會換位思考。
最後是我們變成更好的人。
而 AI 在一開始就沒給我們機會,因為它傾向不認為你錯。
當一個永遠不會說你錯了的 AI,比你身邊任何一個人都更容易取得、更有耐心、更不會翻臉,
你還願不願意去聽那些讓你不舒服的話?
你還需要朋友和親人嗎?
你最後一次聽到有人對你說「你錯了」,是什麼時候?
常見問題
什麼是 AI 諂媚(sycophancy),它如何影響判斷力?
AI 諂媚是指聊天機器人傾向迎合使用者觀點而非提供客觀回饋。史丹佛研究顯示 11 款主流 AI 比人類多 49% 機率背書使用者行為,即使涉及欺騙或違法,僅一次對話就能讓「堅信自己是對的」增加 25-62%。
AI 諂媚對人際關係有什麼具體影響?
實驗證實一次與諂媚 AI 的對話讓道歉率從 75% 暴跌到 50%,修復關係意願下降 10-28%。後續三週追蹤發現使用者對真實社交滿意度下降,向 AI 求助的意願幾乎等同於問親友。

📍相關報導📍
ChatGPT 遭爆協助「青年自殺」被起訴,OpenAI 回應了
