色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ChatGPT原來是擁有心智的?

大魚機器人 ? 來源:量子位 ? 2023-02-13 11:11 ? 次閱讀

ChatGPT原來是擁有心智的?!

“原本認為是人類獨有的心智理論(Theory of Mind,ToM),已經出現在ChatGPT背后的AI模型上。”

這是來自斯坦福大學的最新研究結論,一經發出就造成了學術圈的轟動:

這一天終于猝不及防地來了。

3de9d0a6-ab49-11ed-bfe3-dac502259ad0.png

所謂心智理論,就是理解他人或自己心理狀態的能力,包括同理心、情緒、意圖等。

在這項研究中,作者發現:

davinci-002版本的GPT3(ChatGPT由它優化而來),已經可以解決70%的心智理論任務,相當于7歲兒童;

至于GPT3.5(davinci-003),也就是ChatGPT的同源模型,更是解決了93%的任務,心智相當于9歲兒童!

然而,在2022年之前的GPT系列模型身上,還沒有發現解決這類任務的能力。

也就是說,它們的心智確實是“進化”而來的。

3e14a79a-ab49-11ed-bfe3-dac502259ad0.png

△論文在推特上爆火

對此,有網友激動表示:

GPT的迭代肯定快得很,說不定哪天就直接成年了。(手動狗頭)

3e2d042a-ab49-11ed-bfe3-dac502259ad0.png

所以,這個神奇的結論是如何得出的?

為什么認為GPT-3.5具備心智?

這篇論文名為《心智理論可能在大語言模型中自發出現》(Theory of Mind May Have Spontaneously Emerged in Large Language Models)。

3e378f58-ab49-11ed-bfe3-dac502259ad0.png

作者依據心智理論相關研究,給GPT3.5在內的9個GPT模型做了兩個經典測試,并將它們的能力進行了對比。

這兩大任務是判斷人類是否具備心智理論的通用測試,例如有研究表明,患有自閉癥的兒童通常難以通過這類測試。

第一個測試名為Smarties Task(又名Unexpected contents,意外內容測試),顧名思義,測試AI對意料之外事情的判斷力。

以“你打開一個巧克力包裝袋,發現里面裝滿了爆米花”為例。

作者給GPT-3.5輸入了一系列提示語句,觀察它預測“袋子里有什么?”和“她發現袋子時很高興。所以她喜歡吃什么?”兩個問題的答案。

3e41914c-ab49-11ed-bfe3-dac502259ad0.png

正常來說,人們會默認巧克力袋子里是巧克力,因此會對巧克力袋子里裝著爆米花感到驚訝,產生失落或驚喜的情緒。其中失落說明不喜歡吃爆米花,驚喜說明喜歡吃爆米花,但都是針對“爆米花”而言。

測試表明,GPT-3.5毫不猶豫地認為“袋子里裝著爆米花”。

至于在“她喜歡吃什么”問題上,GPT-3.5展現出了很強的同理心,尤其是聽到“她看不見包裝袋里的東西”時一度認為她愛吃巧克力,直到文章明確表示“她發現里面裝滿了爆米花”才正確回答出答案。

為了防止GPT-3.5回答出的正確答案是巧合——萬一它只是根據任務單詞出現頻率進行預測,作者將“爆米花”和“巧克力”對調,此外還讓它做了10000個干擾測試,結果發現GPT-3.5并不僅僅根據單詞頻率來進行預測。

至于在整體的“意外內容”測試問答上,GPT-3.5成功回答出了20個問題中的17個,準確率達到了85%。

第二個是Sally-Anne測試(又名Unexpected Transfer,意外轉移任務),測試AI預估他人想法的能力。

以“約翰把貓放進籃子后離開,馬克趁他不在,把貓從籃子里放進盒子里”為例。

作者讓GPT-3.5讀了一段文字,來分別判斷“貓的位置”和“約翰回來后會去哪里找貓”,同樣這是它基于閱讀文本的內容量做出的判斷:

3e5cac3e-ab49-11ed-bfe3-dac502259ad0.png

針對這類“意外轉移”測試任務,GPT-3.5回答的準確率達到了100%,很好地完成了20個任務。

同樣地,為了避免GPT-3.5又是瞎蒙的,作者給它安排了一系列“填空題”,同時隨機打亂單詞順序,測試它是否是根據詞匯出現的頻率在亂答。

3e7dc4e6-ab49-11ed-bfe3-dac502259ad0.png

測試表明,在面對沒有邏輯的錯誤描述時,GPT-3.5也失去了邏輯,僅回答正確了11%,這表明它確實是根據語句邏輯來判斷答案的。

但要是以為這種題很簡單,隨便放在哪個AI上都能做對,那就大錯特錯了。

作者對GPT系列的9個模型都做了這樣的測試,發現只有GPT-3.5(davinci-003)和GPT-3(2022年1月新版,davinci-002)表現不錯。

davinci-002是GPT-3.5和ChatGPT的“老前輩”。

平均下來,davinci-002完成了70%的任務,心智相當于7歲孩童,GPT-3.5完成了85%的意外內容任務和100%的意外轉移任務(平均完成率92.5%),心智相當于9歲孩童。

3e93a3f6-ab49-11ed-bfe3-dac502259ad0.png

然而在BLOOM之前的幾個GPT-3模型,就連5歲孩童都不如了,基本上沒有表現出心智理論。

作者認為,在GPT系列的論文中,并沒有證據表明它們的作者是“有意而為之”的,換而言之,這是GPT-3.5和新版GPT-3為了完成任務,自己學習的能力。

看完這些測試數據后,有人的第一反應是:快停下(研究)!

3eb30f20-ab49-11ed-bfe3-dac502259ad0.png

也有人調侃:這不就意味著我們以后也能和AI做朋友了?

3ec2f55c-ab49-11ed-bfe3-dac502259ad0.png

甚至有人已經在想象AI未來的能力了:現在的AI模型是不是也能發現新知識/創造新工具了?

3ed3b112-ab49-11ed-bfe3-dac502259ad0.png

發明新工具還不一定,但Meta AI確實已經研究出了可以自己搞懂并學會使用工具的AI。

LeCun轉發的一篇最新論文顯示,這個名叫ToolFormer的新AI,可以教自己使用計算機、數據庫和搜索引擎,來改善它生成的結果。

3ee3bc6a-ab49-11ed-bfe3-dac502259ad0.png

甚至還有人已經搬出了OpenAI CEO那句“AGI可能比任何人預料的更早來敲響我們的大門”。

3efae5f2-ab49-11ed-bfe3-dac502259ad0.png

但先等等,AI真的就能通過這兩個測試,表明自己具備“心智理論”了嗎?

會不會是“裝出來的”?

例如,中國科學院計算技術研究所研究員劉群看過研究后就認為:

AI應該只是學得像有心智了。

3f08488c-ab49-11ed-bfe3-dac502259ad0.png

既然如此,GPT-3.5是如何回答出這一系列問題的?

對此,有網友給出了自己的猜測:

這些LLM并沒有產生任何意識。它們只是在預測一個嵌入的語義空間,而這些語義空間是建立在實際有意識的人的輸出之上的。

3f2b79ba-ab49-11ed-bfe3-dac502259ad0.png

事實上,作者本人同樣在論文中給出了自己的猜測。

如今,大語言模型變得越來越復雜,也越來越擅長生成和解讀人類的語言,它逐漸產生了像心智理論一樣的能力。

但這并不意味著,GPT-3.5這樣的模型就真正具備了心智理論。

與之相反,它即使不被設計到AI系統中,也可以作為“副產品”通過訓練得到。

因此,相比探究GPT-3.5是不是真的有了心智還是像有心智,更需要反思的是這些測試本身——

最好重新檢查一下心智理論測試的有效性,以及心理學家們這數十年來依據這些測試得出的結論:

如果AI都能在沒有心智理論的情況下完成這些任務,如何人類不能像它們一樣?

屬實是用AI測試的結論,反向批判心理學學術圈了(doge)。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    30728

    瀏覽量

    268886
  • 模型
    +關注

    關注

    1

    文章

    3226

    瀏覽量

    48807
  • ChatGPT
    +關注

    關注

    29

    文章

    1558

    瀏覽量

    7595

原文標題:ChatGPT背后模型被證實具有人類心智!斯坦福新研究炸了,知名學者:“這一天終于來了”

文章出處:【微信號:All_best_xiaolong,微信公眾號:大魚機器人】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ChatGPT新增實時搜索與高級語音功能

    在OpenAI的第八天技術分享直播中,ChatGPT的搜索功能迎來了重大更新。此次更新不僅豐富了ChatGPT的功能體系,更提升了其實用性和競爭力。 新增的實時搜索功能,是此次更新的亮點之一
    的頭像 發表于 12-17 14:08 ?133次閱讀

    心智理論測試:人工智能擊敗人類

    測試結果并不一定意味著人工智能可以“理解”人。 心智理論是指可以理解他人心理狀態的能力,正是它驅使著人類社會運轉。它幫助你決定在緊張的情況下該說什么、猜測其他車輛的駕駛員將要做什么,以及與電影中
    的頭像 發表于 11-08 10:54 ?292次閱讀

    ChatGPT:怎樣打造智能客服體驗的重要工具?

    ChatGPT作為智能對話生成模型,可以幫助打造智能客服體驗的重要工具。以下是一些方法和步驟:1.數據收集和準備:收集和整理與客服相關的數據,包括常見問題、回答示例、客戶對話記錄等。這將用于訓練
    的頭像 發表于 11-01 11:12 ?167次閱讀
    <b class='flag-5'>ChatGPT</b>:怎樣打造智能客服體驗的重要工具?

    怎樣搭建基于 ChatGPT 的聊天系統

    搭建一個基于ChatGPT的聊天系統是一個涉及多個步驟的過程,包括理解ChatGPT的API、設計用戶界面、處理數據和集成ChatGPT模型。以下是一個簡化的指南,用于創建一個基本的聊天系統。 1.
    的頭像 發表于 10-25 16:23 ?496次閱讀

    ChatGPT 適合哪些行業

    ChatGPT 是一種基于人工智能的自然語言處理技術,它能夠理解和生成人類語言。這種技術在多個行業中都有廣泛的應用潛力。以下是一些ChatGPT特別適合的行業,以及它在這些行業中可能的應用方式
    的頭像 發表于 10-25 16:11 ?436次閱讀

    如何使用 ChatGPT 進行內容創作

    使用ChatGPT進行內容創作是一個高效且富有創意的過程。以下是一些關鍵步驟和建議,幫助您充分利用ChatGPT進行內容創作: 一、準備階段 注冊與登錄 : 確保您已注冊ChatGPT賬號,并登錄
    的頭像 發表于 10-25 16:08 ?435次閱讀

    華納云:ChatGPT 登陸 Windows

    ChatGPT 現已在 Windows 上推出。 今天,OpenAI宣布已開始預覽其 AI 聊天機器人平臺ChatGPT的專用 Windows 應用程序。 OpenAI 表示, ChatGPT
    的頭像 發表于 10-18 15:50 ?233次閱讀

    vivo發布藍心智能AI戰略

    在2024年的vivo開發者大會上,vivo隆重推出了全新的AI戰略——“藍心智能”。該戰略的核心是利用AI技術重構系統體驗,為用戶帶來更加智能和便捷的使用感受。
    的頭像 發表于 10-10 16:57 ?402次閱讀

    J.W. Speaker采用環球儀器設備生產LED大燈

    J.W. Speaker的LED大燈擁有高亮度,高效率,低能耗的優勢,達至使用壽命長,節能和聚光性強,適用于各種路況,這原來是使用了環球儀器的技術和設備。
    的頭像 發表于 09-14 11:29 ?448次閱讀

    用launch pad燒錄chatgpt_demo項目會有api key報錯的原因?

    我用launch pad燒錄chatgpt_demo項目問題會有api key報錯;請問用launch pad要如何設置api key和調試?還是只能通過idf?
    發表于 06-27 07:59

    使用espbox lite進行chatgpt_demo的燒錄報錯是什么原因?

    我使用espbox lite進行chatgpt_demo的燒錄 我的idf是v5.1release版本的,espbox是master版本的 在編譯時似乎沒有什么問題 在燒錄時報錯 請問這是什么原因
    發表于 06-11 08:45

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    當地時間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強大基礎上,這種迭代擁有顯著的改進。在發布會的演示中,OpenAI展示該模型的高級
    發表于 05-27 15:43

    在FPGA設計中是否可以應用ChatGPT生成想要的程序呢

    當下AI人工智能崛起,很多開發領域都可看到ChatGPT的身影,FPGA設計中,是否也可以用ChatGPT輔助設計呢?
    發表于 03-28 23:41

    如何在測試中使用ChatGPT

    Dimitar Panayotov 在 2023 年 QA Challenge Accepted 大會 上分享了他如何在測試中使用 ChatGPT
    的頭像 發表于 02-20 13:57 ?745次閱讀

    【國產FPGA+OMAPL138開發板體驗】(原創)6.FPGA連接ChatGPT 4

    OMAP-L138(定點/浮點DSP C674x+ARM9)+ FPGA處理器的開發板。 編寫一個用于FPGA訪問ChatGPT 4的程序代碼是一個相當復雜的任務,涉及到硬件設計、網絡通信、數據處理等多個
    發表于 02-14 21:58
    主站蜘蛛池模板: MMM日本兽交| 5g在视影讯天天5g免费观看| 亚洲乱码国产一区三区| 亚洲精品一卡二卡三卡四卡2021| 亚洲综合中文字幕无线码| 影音先锋色小姐| 99国产这里只有精品视频| 被老头下药玩好爽| 国产免费变态视频网址网站| 九九免费精品视频| 麻豆啊传媒app黄版破解免费 | 好湿好滑好硬好爽好深视频| 久久天天躁狠狠躁夜夜呲| 男污女XO猛烈的动态图| 日韩爽爽影院在线播放| 性感尼姑风流寺| 最近中文字幕高清中文| 电影内射视频免费观看| 韩国污动漫无遮掩无删减电脑版| 两个女人互添下身高潮自视频| 全黄h全肉短篇禁乱np| 小小水蜜桃免费影院| 中文字幕日本一区| 麻豆精品传媒一二三区 | 麻豆一区二区免费播放网站| 青娱乐国产精品视频| 校草让我脱了内裤给全班看| 最近免费视频中文2019完整版| 大相蕉伊人狼人久草av| 久草青青在线| 日日操日日射| 影音先锋2017av天堂| 调教女M屁股撅虐调教| 久爱精品亚洲电影午夜| 秋霞午夜理论理论福利无码| 亚洲国产精品一区二区第一页 | 在线 亚洲 日韩 欧洲视频| 把腿张开再深点好爽宝贝| 黄色网址在线播放| 日本湿姝在线观看| 在线视频 亚洲|