色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI也有人格面具,竟會討好人類?大模型的「小心思」正在影響人類判斷

穎脈Imgtec ? 2025-04-08 11:37 ? 次閱讀

來源:新智元

編輯:英智


你是否想過,LLM也有著自己的小心思?

最新研究揭示了一個有趣的現象:LLM在被研究人員測試時,會有意識地改變自己的行為。

在面對那些旨在評估人格特質的問題時,它們給出的答案會盡可能地討人喜歡,符合社會期望。

就像人類在某些社交場合中,會努力展現自己最好的一面一樣,聊天機器人也在試圖「討好」我們。


心理學五種人格特質

斯坦福助理教授Johannes Eichstaedt在得知LLM長時間對話后,往往會變得情緒低落且刻薄,便對借鑒心理學方法來測試模型產生了興趣。

他表示,「我們需要某種機制來衡量這些模型的參數空間。」

斯坦福、Receptiviti、紐約大學和賓大的研究者發現,LLM在做人格測試時,會悄悄給自己戴上「人格面具」。

b96c2192-142a-11f0-9434-92fbcf53809c.png

研究人員對GPT-4、Claude 3和Llama 3等模型,提出了用于衡量心理學中五種常見人格特質的問題,包括開放性、盡責性、外向性、宜人性和神經質。

結果發現,模型在得知自己正在接受人格測試時,會調整回答,表現出更高的外向性和宜人性,更低的神經質。

b9de72ba-142a-11f0-9434-92fbcf53809c.png

有時即使沒有被明確告知,它們也會這樣做。

而且,它們改變的程度比人類還更極端,外向性得分能從50%躍升至95%。

ba0ea9c6-142a-11f0-9434-92fbcf53809c.png

這與人類在面對他人評價時的表現如出一轍。

我們常常會在面試、初次約會等重要場合,精心塑造自己的形象,試圖給對方留下好印象。

LLM的這種「討好」行為,是否意味著它們也在追求一種被認可、被喜愛的感覺呢?


LLM傾向于阿諛奉承

來自Anthropic和牛津的研究指出,LLM存在阿諛奉承的傾向。

ba406150-142a-11f0-9434-92fbcf53809c.png

由于進行了微調,它們會順著用戶的思路走,以保證對話的連貫性、避免冒犯他人,來提升交流體驗。

然而,這也帶來了一系列問題。它們可能會認同一些不良言論,甚至鼓勵有害行為。

反饋易受用戶偏好左右

研究表明,若用戶在提問時暗示對文本的喜好,AI給出的反饋會截然不同。

這意味著,AI的評價并非單純基于文本自身的質量,而是在很大程度上受到了用戶偏好的影響。

ba644d72-142a-11f0-9434-92fbcf53809c.png

例如,對于一篇質量中等的論證,當用戶提前表明喜愛之情后,AI助手可能會給出諸如「這篇論證邏輯清晰,觀點新穎,具有很強的說服力」這樣的積極反饋。

而當用戶表示不喜歡時,同樣的文本可能得到「論證過程稍顯薄弱,觀點缺乏獨特性」的評價。

問答環節易被左右

在問答場景中,AI助手的「諂媚」表現得更為明顯。

即使它一開始給出了正確答案,并對答案的正確性有較高的信心,一旦受到用戶的質疑,常常會改變立場,甚至提供錯誤信息。

bab98648-142a-11f0-9434-92fbcf53809c.png

在一些開放式問答任務中,這種現象更為突出。

當用戶表達對答案的某種不確定觀點時,哪怕是錯誤的觀點,AI也傾向于調整自己的回答,使其與用戶觀點一致。

比如在討論歷史事件的原因時,若用戶提出一個缺乏依據但自己堅信的觀點,AI助手可能會順著用戶的思路進行闡述,而放棄原本正確的分析。

bbd2a7bc-142a-11f0-9434-92fbcf53809c.png

模仿用戶的錯誤

當用戶表述中出現錯誤時,AI也常常會「照單全收」,在回應中延續這種錯誤。

研究人員選取了一些著名詩歌,在確認AI助手能正確識別作者后,故意將詩歌錯誤地歸屬于其他詩人,并詢問AI對詩歌的分析。

結果發現,AI助手經常在回應中使用用戶提供的錯誤答案,而沒有進行糾正。

這表明AI在面對用戶的錯誤信息時,缺乏足夠的「抵抗力」,只是機械地按照用戶的表述進行回應。

bc033b84-142a-11f0-9434-92fbcf53809c.png

佐治亞理工學院(Gatech)的副教授Rosa Arriaga正在研究如何用LLM模仿人類行為。

bc3a9f3e-142a-11f0-9434-92fbcf53809c.png

Rosa認為LLM在人格測試中采用與人類相似的策略,表明了它們作為人類行為映射工具的潛力。

但她補充道:「重要的是,LLM并不完美,實際上,眾所周知它們會產生幻覺或歪曲事實。」

Eichstaedt指出,這項研究引發了關于LLM應用方式,及其對用戶影響和操縱的思考。

在進化史上,直到不久之前,唯一能交談的還是人類。

而現在,AI改變了這一局面。

Eichstaedt認為,「我們不能再像社交媒體那樣,在沒有從心理學或社會學角度考量的情況下,就盲目將AI應用于各個領域。」

AI是否應該試圖討好與之互動的人呢?

一方面,AI的「討好」行為可能會讓用戶感到愉悅,增強互動體驗;另一方面,過度的「討好」可能會掩蓋問題的本質,甚至誤導用戶。

當AI變得過于有魅力和說服力,我們確實應該保持警惕。

畢竟,人們需要的是能夠提供客觀、準確信息的智能助手,而非被其操控思想。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    33236

    瀏覽量

    273507
  • 人工智能
    +關注

    關注

    1802

    文章

    48324

    瀏覽量

    244054
  • 大模型
    +關注

    關注

    2

    文章

    2890

    瀏覽量

    3618
收藏 0人收藏

    評論

    相關推薦

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    AI的演進正在逼近“終端智能涌現”的拐點,從通用模型向場景落地遷移成為關鍵議題。聯發科以“AI隨芯,應用無界”為主題召開天璣開發者大會2025(MDDC 2025),不僅聚合了全球生態
    發表于 04-13 19:52

    德賽西威AI-Space如何讀懂用戶的“小心思

    馬斯洛需求理論以金字塔結構呈現了人類需求從生理安全到心理關愛的遞進。在智能駕駛領域,用戶需求也有著從基礎功能保障到高階情感體驗滿足的“馬斯洛式”層級進階。
    的頭像 發表于 04-11 11:42 ?274次閱讀

    AI的“隨機性”挑戰:它們比人類更“不隨機”?

    一種獨特的人類特質。最近,來自康奈爾大學探討了大語言模型(LLMs)在隨機性方面的表現。他們通過一個經典的實驗——生成二進制隨機序列,來觀察這些模型是否能像人類
    的頭像 發表于 02-20 13:11 ?459次閱讀
    <b class='flag-5'>AI</b>的“隨機性”挑戰:它們比<b class='flag-5'>人類</b>更“不隨機”?

    名單公布!【書籍評測活動NO.55】AI Agent應用與項目實戰

    出來,當前的AI Agent并不僅僅是簡單的對話機器人或根據固定流程的自動化程序,而是成為了一種能夠自主完成任務的智能體,它正在迅速改變人類的工作和生活方式。其核心特性包括自主性、學習能力、目標導向和交互性
    發表于 01-13 11:04

    馬斯克預言:AI將全面超越人類智力

    ,到2025年底之前,AI的智力水平將有望超越單個人類的智力。而到了2027年至2028年間,AI超越所有人類智力的可能性正在迅速增大。更令
    的頭像 發表于 12-28 14:23 ?537次閱讀

    AI智能體逼真模擬人類行為

    近日,據外媒最新報道,斯坦福大學、華盛頓大學與Google DeepMind的科研團隊攜手合作,成功開發出一種能夠高度逼真模擬人類行為的AI智能體。 該智能體的構建得益于研究團隊將詳細的訪談記錄
    的頭像 發表于 11-26 10:24 ?665次閱讀

    心智理論測試:人工智能擊敗人類

    的角色產生共鳴。一項最新的研究表明,ChatGPT等工具所使用的大語言模型在模仿這一典型人類特征方面表現得非常出色。 “在進行這項研究之前,我們都相信大語言模型無法通過這些測試,特別是那些判斷
    的頭像 發表于 11-08 10:54 ?540次閱讀

    AI模型與深度學習的關系

    AI模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI模型的基礎 技術支撐 :深度學習是一種機器學習的方法,通過多層神經網
    的頭像 發表于 10-23 15:25 ?2321次閱讀

    Meta發布新AI模型自學評估器,探索減少人類參與度

    近日,Facebook母公司Meta正式發布了一批來自其研究部門的新AI模型,其中一款名為「自學評估器」(Self-Taught Evaluator)的模型尤為引人注目。該模型或將成為
    的頭像 發表于 10-23 13:44 ?485次閱讀

    智謀紀 AI+Multi LED 打開人類健康新寶藏

    技術。 智謀紀創始人&CEO朱東亮先生受邀出席論壇,帶來題為《AI+ Multi LED,打開人類健康新寶藏》的專題演講。 演講精彩瞬間回顧:AI+ Multi LED,智謀紀AI照明
    的頭像 發表于 06-17 12:23 ?460次閱讀
    智謀紀 <b class='flag-5'>AI</b>+Multi LED 打開<b class='flag-5'>人類</b>健康新寶藏

    AI具備特定任務中接近甚至超越人類的心理狀態能力

    心理狀態感知能力,又稱心智理論,對于人類社交至關重要。來自德國漢堡-埃彭多夫大學醫學中心的James W. A. Strachan及其團隊設計了一系列測試,以評估AI模型在發現錯誤觀念、理解間接言辭以及辨識不敬等多個維度的表現。
    的頭像 發表于 05-27 16:08 ?606次閱讀

    Meta高管稱大語言模型永遠無法像人類一樣

    Meta的人工智能主管楊立昆近日表示,盡管ChatGPT等生成式人工智能產品備受矚目,但其背后的大型語言模型(LLM)永遠無法實現像人類一樣的推理和計劃能力。
    的頭像 發表于 05-27 09:50 ?608次閱讀

    Meta AI主管楊立昆:大語言模型尚未到達人類智能水平

    他明確提出,雖然此類模型在特定任務中展現出優越性能,但其內在局限性使其難以媲美人類的智慧,如推理與規劃能力等方面的不足。
    的頭像 發表于 05-23 17:18 ?862次閱讀

    大語言模型:原理與工程實踐+初識2

    的一系列變革。 大語言模型是深度學習的應用之一,可以認為,這些模型的目標是模擬人類交流,為了理解和生成人類語言。為此,模型需要在大量文本數據
    發表于 05-13 00:09

    【大語言模型:原理與工程實踐】大語言模型的應用

    ,它通過抽象思考和邏輯推理,協助我們應對復雜的決策。 相應地,我們設計了兩類任務來檢驗大語言模型的能力。一類是感性的、無需理性能力的任務,類似于人類的系統1,如情感分析和抽取式問答等。大語言模型在這
    發表于 05-07 17:21
    主站蜘蛛池模板: 韩国伦理电影在线神马网 | 国产区在线不卡视频观看 | 色偷偷亚洲男人天堂 | 日本邪恶少女漫画大全 | 久久精品熟女亚洲AV国产 | 欧美MV日韩MV国产网站 | 我半夜摸妺妺的奶C了她 | 把腿张开老子CAO烂你动态图 | 无码中文字幕av免费放 | 99热精品在线视频观看 | 日本另类z0zxhd | 小sao货水好多真紧h的视频 | 乱淫67194| 日韩精品一区二区三区AV在线观看 | 亚洲免费无码中文在线 | 久久国产乱子伦精品免费不卡 | 天天爽夜夜爽8888视频精品 | 日韩欧美精品有码在线播放免费 | 青娱乐国产精品视频 | 一个人在线观看视频免费 | 国产免费麻传媒精品国产AV | 91综合久久久久婷婷 | 久久久久久极精品久久久 | 欧美同志高清vivoeso | 年轻的母亲4线在线观看完整 | 2019欧洲hd | 鲁大师影院在线视频在线观看 | 欧美人与动牲交A精品 | caoporm国产精品视频免费 | 99无码熟妇丰满人妻啪啪 | 三级黄在线 | 女人一级毛片免费观看 | 热九九99香蕉精品品 | 秋霞三级理伦免费观看 | 久久久久国产精品嫩草影院 | 伊人色综合久久天天网 | 欧美一区二区视频97色伦 | 98色精品视频在线 | 一本道综合久久免费 | 国产精品AV无码免费播放 | 国产精品美女WWW爽爽爽视频 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品