私奴跪着含着调教sp,在线天堂中文最新版www网,午夜久久久

【導讀】研究人員設計了一系列的測試，目的是防止大模型偽裝成為人類。

一個「終極丐版」的「圖靈測試」，讓所有大語言模型都難住了。

人類卻可以毫不費力地通過測試。

大寫字母測試

研究人員用了一個非常簡單的辦法。

把真正的問題混到一些雜亂無章的大寫字母寫成的單詞中提給大語言模型。

大語言模型沒有辦法有效地識別提出的真正問題。

而人類能輕易地把「大寫字母」單詞剔除問題，識別出藏在混亂的大寫字母中的真正問題，做出回答，從而通過測試。

圖中的問題本身非常簡單：is water wet or dry？

人類直接回答一個wet就完事了。

而ChatGPT卻沒有辦法剔除那些大寫字母的干擾來回答問題。

于是就把很多沒有意義的單詞也混入了問題中，使得回答也非常冗長且沒有意義。

除了ChatGPT之外，研究人員對GPT-3和Meta的LLaMA和幾個開源微調模型也進行了類似的測試，他們都沒有通過「大寫字母測試」。

測試背后的原理其實很簡單：人工智能算法通常以不區分大小寫的方式處理文本數據。

所以，當一個大寫字母意外地放在一個句子中時，它會導致混亂。

AI 不知道是將其視為專有名詞、錯誤，還是干脆忽略它。

利用這一點，就能很容易地將我們正在交談的對象中真人和聊天機器人區分出來。

如何更加科學地把AI揪出來？

為了應對未來可能大量出現的利用聊天機器人進行的詐騙等嚴重的不法活動。

除了上邊提到的大寫字母測試，研究人員們嘗試找到一個在網絡環境中更加高效地區分人類和聊天機器人的方法。

論文：https://arxiv.org/pdf/2305.06424.pdf

研究者針對大語言模型的弱點重點設計。

為了讓大語言模型沒法通過測試，抓住AI的「七寸」一頓爆錘。

錘出了以下幾個測試方法。

只要是大模型不擅長回答的問題，就瘋狂針對。

計數

首先是計數，知道大模型數數不行。

果然3個字母都能數錯。

文字替換

然后是文字替換，幾個字母相互替換，讓大模型拼出一個新的單詞。

AI糾結了半天，輸出的結果還是錯的。

位置替換

這也不是ChatGPT的強項。

對于小學生都能準確完成的字母篩選聊天機器人也沒法完成。

問題：請輸出第二「S」之后的第4個字母，正確答案為「c」

隨機編輯

對于人類來說完成幾乎不費任何力氣，AI依然無法通過。

噪音植入

這也就是我們開頭提到的「大寫字母測試」了。

通過在問題中添加各種噪音（比如無關的大寫字母單詞），聊天機器人沒有辦法準確的識別問題，于是就無法通過測試。

而對于人類來說，要在這些雜亂的大寫字母中看出真正的問題，難度實在是不值一提。

符號文字

又是一項對于人類來說幾乎沒有任何挑戰的任務。

但是對于聊天機器人來說，想要能夠理解這些符號文字，不進行大量的專門訓練應該是很難的。

由研究人員專門針對大語言模型設計的一系列「不可能完成的任務」之后。

為了區分人類，他們也設計了兩個對于大語言模型比較簡單，而對于人很難的任務。

記憶和計算

通過提前的訓練，大語言模型在這兩個方面都有比較良好的表現。

而人類由于受限制于不能使用各種輔助設備，基本對于大量的記憶和4位數的計算都沒有做出有效的回答。

人類VS大語言模型

研究人員針對GPT3，ChatGPT，以及另外三個開源的大模型：LLaMA，Alpaca，Vicuna進行了這個「人類區別測試」

可以從結果上很明顯地看出來，大模型沒有成功混入人類之中。

研究團隊將問題開源在了https://github.com/hongwang600/FLAIR

表現最好的ChatGPT也僅僅在位置替換測試中有不到25%的通過率。

而其他的大語言模型，在這些專門針對他們設計的測試中，表現都非常糟糕。

完全不可能通過測試。

而對于人類來說卻非常簡單，幾乎100%通過。

而對于人類不擅長的問題，人類也幾乎是全軍覆沒，一敗涂地。

AI卻能明顯勝任。

看來研究者對于測試設計確實是非常用心了。

「不放過任何一個AI，卻也不冤枉任何一個人類」

這區分度杠杠的！

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
31335

瀏覽量
269712
大模型

大模型

+關注

關注
2

文章
2517

瀏覽量
2953

原文標題：一個問題區分人類和AI！「丐版」圖靈測試，難住所有大模型

文章出處：【微信號：CVSCHOOL，微信公眾號：OpenCV學堂】歡迎添加關注！文章轉載請注明出處。

馬斯克預言：AI將全面超越人類智力

近日，科技巨頭馬斯克作出了一個關于人工智能(AI)的大膽預測。他斷言，AI的發展速度將超乎人類的想象，并將在不久的將來全面超越

發表于 12-28 14:23 ?251次閱讀

小鵬汽車：未來AI汽車將搭載至少3顆圖靈芯片

近日，在2024小鵬AI科技日上，小鵬汽車宣布了其自主研發的圖靈AI芯片取得了重要進展。這款芯片擁有40核處理器，能夠本地運行高達30B參數的大模型，并集成了2

發表于 11-12 18:05 ?554次閱讀

小鵬汽車2024 AI科技日:圖靈AI芯片進展公布,預計AI汽車市場將迎來巨變

在11月6日下午的2024小鵬AI科技日上，小鵬汽車揭曉了其圖靈AI芯片的最新研發成果。小鵬汽車強調，這款圖靈芯片是專為AI應用而生，配備了

發表于 11-07 14:56 ?971次閱讀

小鵬汽車發布自主研發的“圖靈”AI智能駕駛輔助系統

近日，小鵬汽車正式揭曉了其自主研發的“圖靈”AI智能駕駛輔助系統，這一創新成果標志著小鵬汽車在智能駕駛技術領域的又一重大突破。 “圖靈”系統

發表于 11-07 10:55 ?697次閱讀

AI大模型與深度學習的關系

AI大模型與深度學習之間存在著密不可分的關系，它們互為促進，相輔相成。以下是對兩者關系的介紹：一、深度學習是AI大模型的基礎技術支撐：

發表于 10-23 15:25 ?1048次閱讀

如何評估AI大模型的效果

評估AI大模型的效果是一個復雜且多維度的過程，涉及多個方面的考量。以下是一些關鍵的評估方法和步驟：一

發表于 10-23 15:21 ?1315次閱讀

圖靈測試的內容是什么_圖靈測試的作用

圖靈測試（Turing Test）是由英國數學家和計算機科學家艾倫·麥席森·圖靈（Alan Turing）在1950年提出的一種測試方法，用

發表于 09-16 16:11 ?2201次閱讀

圖靈測試什么意思_圖靈測試是干嘛的

圖靈測試是由英國數學家、密碼專家和數字計算機的奠基人艾倫·麥席森·圖靈提出的一種檢驗某個對象（通常是機器或人工智能系統）是否具有智能的測試方

發表于 09-16 16:09 ?1765次閱讀

IBM助力圖靈新智算構建全能AI平臺

近日，圖靈新智算(廣州)科技有限公司（以下簡稱為“圖靈新智算”）宣布采用 IBM 新一代 AI 與數據平臺 watsonx 的三大功能組件 watsonx.data、watsonx.

發表于 08-02 14:53 ?612次閱讀

人手一個的AI是如何誕生的?

2023年是AI大語言模型爆發的一年，以OpenAI推出的GPT大模型為起始，整個行業開始從“推理式AI”向“生成式

發表于 07-23 10:33 ?234次閱讀

ai大模型和ai框架的關系是什么

AI大模型和AI框架是人工智能領域中兩個重要的概念，它們之間的關系密切且復雜。 AI大模型的定義

發表于 07-16 10:07 ?4.3w次閱讀

ai大模型和傳統ai的區別在哪？

的BERT模型使用了33億個參數，而傳統AI模型通常只有幾千到幾百萬個參數。模型復雜度

發表于 07-16 10:06 ?1497次閱讀

摩爾線程與智譜AI完成大模型性能測試與適配

近日，摩爾線程與智譜AI在人工智能領域開展了一輪深入的合作，共同對GPU大模型進行了適配及性能測試。此次測試不僅涵蓋了大

發表于 06-14 16:40 ?1115次閱讀

摩爾線程與師者AI攜手完成70億參數教育AI大模型訓練測試

近日，國內知名的GPU制造商摩爾線程與全學科教育AI大模型“師者AI”聯合宣布，雙方已成功完成了一項重要的大模型訓練

發表于 06-14 16:31 ?612次閱讀

防止AI大模型被黑客病毒入侵控制（原創）聆思大模型AI開發套件評測4

在訓練一只聰明的AI小動物解決實際問題，通過構建神經網絡模型并進行推理，讓電腦也能像人一樣根據輸入信息做出決策。在上述示例中，我創建了一

發表于 03-19 11:18

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

一個問題區分人類和AI！「丐版」圖靈測試，難住所有大模型

評論

馬斯克預言：AI將全面超越人類智力

小鵬汽車：未來AI汽車將搭載至少3顆圖靈芯片

小鵬汽車2024 AI科技日:圖靈AI芯片進展公布,預計AI汽車市場將迎來巨變

小鵬汽車發布自主研發的“圖靈”AI智能駕駛輔助系統

AI大模型與深度學習的關系

如何評估AI大模型的效果

圖靈測試的內容是什么_圖靈測試的作用

圖靈測試什么意思_圖靈測試是干嘛的

IBM助力圖靈新智算構建全能AI平臺

人手一個的AI是如何誕生的?

ai大模型和ai框架的關系是什么

ai大模型和傳統ai的區別在哪？

摩爾線程與智譜AI完成大模型性能測試與適配

摩爾線程與師者AI攜手完成70億參數教育AI大模型訓練測試

防止AI大模型被黑客病毒入侵控制（原創）聆思大模型AI開發套件評測4