色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌聲稱Gemini超越GPT-4,你有何看法呢?

人工智能與大數據技術 ? 來源:CSDN ? 2023-12-14 09:54 ? 次閱讀

誰能想到,一夜之間,人們對于谷歌 Gemini 的看法竟發生了 180° 轉變。

昨天,谷歌在 X 上展示 Gemini 原生多模態能力的 6 分半鐘視頻下,幾乎是清一色的贊揚:

efe279ee-9a21-11ee-8b88-92fbcf53809c.png

eff0c878-9a21-11ee-8b88-92fbcf53809c.png

eff52e90-9a21-11ee-8b88-92fbcf53809c.png

而到了今天,Gemini 還是那個 Gemini,但網友已經不買賬了:

f003b7c6-9a21-11ee-8b88-92fbcf53809c.png

f00849f8-9a21-11ee-8b88-92fbcf53809c.png

發生了什么,才會讓人們的態度一夜轉變?原因在于那個 6 分半的 Gemini 演示視頻:它是假的,是經過剪輯的,甚至在被質疑后,谷歌還承認了!

1、Gemini 的視頻演示效果,是假的

相信看過 Gemini 演示視頻的人,多數都對它的“多模態能力”印象深刻。例如,Gemini 看到一只鴨子從草圖到填色的整個過程,可實時給出解釋和反饋,還能在換杯游戲中追蹤紙團、辨別各種手勢、重新排列行星草圖等——短短 6 分半的視頻,Gemini 給人的感覺是:仿佛可以實時觀察周圍世界并及時做出反應,還能與人類進行流暢的語音對話。

對于 Gemini 如此強大的能力,谷歌給出的解釋是:Gemini 是 AI 的新品種,即“原生多模態”。

“我們將 Gemini 設計為原生多模態,從一開始就針對不同模式進行了預訓練。然后我們使用額外的多模態數據對其進行微調,以進一步完善其有效性,這有助于 Gemini 從頭開始無縫地理解和推理各種輸入,因此遠遠優于現有的多模式模型。此外,Gemini 的多模態功能幾乎在每個領域都是最先進的。”

聽起來似乎有理有據,于是當一眾網友都沉浸于 Gemini 的強大、好奇它能否真正超越 GPT-4 的時候,彭博社作家 Parmy Olsen 突然發出了一個“不太和諧”的聲音:Gemini 的視頻演示效果,是假的。

一石激起千層浪!好在 Parmy Olsen 并沒有吊人胃口,很干脆地將谷歌的作假手法和證據全部公開:Gemini 并不能像視頻中那樣實時語音回答——它看到的只是視頻片段中的靜態圖像,其語音也只是在讀出人類給它的文本提示,且響應時間比視頻中展示的要長。

2、背后的人工提示過程,全部省略

舉個例子,Gemini 演示視頻中有一段識別動態手勢的片段:通過觀察左邊不斷變化的手勢,Gemini 回答道,“我知道你在干嘛!你在玩石頭剪刀布!”

這段視頻乍看之下,你是不是以為可以實時向 Gemini 展示不同的東西,并與它交流?但事實并非如此:Gemini 僅支持文本交流,并不能進行語音對話。

根據谷歌公布的文檔內容顯示,這段視頻顯然是經過“加工”的:

(1)先給 Gemini 陸續展示三張單個手勢的圖片,問它分別看到了什么;

(2)再把三張手勢圖片一起發給 Gemini,問它這是在干什么,并提示是一個“游戲”;

(3)通過以上一步步的提示和引導,Gemini 最終給出了答案:你在玩石頭剪刀布。

針對以上步驟,一位谷歌發言人解釋道:“為了測試 Gemini 在各種挑戰中的能力,我們通過捕捉錄像來制作演示。然后我們使用錄像中的靜態圖像幀提示 Gemini,并通過文本進行提示。”

Parmy Olsen 將其簡單翻譯了一下:“谷歌拍下了那雙手做很多事情的畫面,然后一張一張地向 Gemini 展示了這些鏡頭的照片。所以根本沒有語音對話,而是跟 ChatGPT 和 Bard 一樣的文本交流。”

此外,谷歌發言人還補充稱,用戶的配音都是從實際提示中摘錄的真實內容,用于生成隨后的Gemini輸出結果——對此,Parmy Olsen 的翻譯是:“你在視頻中聽到的聲音,只是在朗讀文字提示。”

也就是說,谷歌所展示的 Gemini 演示視頻,是省略了所有引導提示、跳過了等待響應的時間、并用配音合成的最終結果。

3、都是真實的,只是“為了簡潔”剪輯視頻

當然,Gemini 可能也真的做到了在視頻中展示的所有事情,但這兩種表現形式完全不同:

以文字形式,通過人工提示分步驟直接展示其多模態效果,對于 Gemini 的能力沒有過多修飾;

以視頻形式,經過剪輯、省略其背后大量引導過程的視頻來呈現,極大暗示了 Gemini 的實時高效。

由于 Parmy Olsen 的曝光,網友對于 Gemini 的態度瞬間改變,并發出了無數質疑。而對于被質疑造假的這個視頻,谷歌 DeepMind 研究副總裁 Oriol Vinyals 今天給出了回應:

“視頻中的所有用戶提示和輸出都是真實的,只是為了簡潔起見進行了縮短。該視頻展示了使用 Gemini 構建的多模態用戶體驗可能是什么樣子,我們制作該視頻是為了激發開發人員的靈感。”

換句話說,Oriol Vinyals 承認 Gemini 演示視頻經過了剪輯,原因是“為了簡潔”。不論其剪輯初衷是否真的只是為了“簡潔”,但不得不說:在谷歌沒明確說明視頻經過剪輯之前,多數人對于 Gemini 的速度、準確性以及與交互的基本模式,都產生了誤解。

如果在這個視頻開頭,谷歌就說“這是我們研究人員測試過的 Gemini 交互的理想化表現”,那網友就會有心理預期:哦,那這個視頻一半是現實,一半是理想化——但事實上,該視頻的開頭是,“本視頻重點介紹了我們與 Gemini 的一些有趣互動”,因此人們很難意識到這個視頻中 Gemini 的表現是經過“加工”的。

4、網友:“這就是虛假和誤導”

于是意料之中,Oriol Vinyals 的回應并沒有受到網友的理解,其 X 帖子下多是譴責谷歌虛假、夸大營銷:

“如果你想激勵開發者,那為什么不發布真實的內容呢?提示不可能既‘真實’又‘縮短’,這就是虛假和誤導。”

如今的 AI 初創公司,不就是像你們這樣夸張的演示來騙取資金的嗎?

“‘真實,縮短’,真的嗎?只是營銷罷了。”

另外值得一提的是,還有網友指出,谷歌Gemini 對比GPT-4 的測試基準也并不相同:“在MMLU測試中,Gemini下面有個灰色小字標CoT@32,即使用了思維鏈提示技巧、選取了32次中的最好結果,GSM8K 的性能也是用 Maj1@32 與 GPT-4 的 5-Shot CoT 進行對比的。”

f02f184e-9a21-11ee-8b88-92fbcf53809c.png

那么對于谷歌聲稱Gemini 超越GPT-4 的說法,你又有何看法呢?

本文轉自公眾號“CSDN”,ID:CSDNnews







審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6161

    瀏覽量

    105300
  • GPT
    GPT
    +關注

    關注

    0

    文章

    352

    瀏覽量

    15342
  • ChatGPT
    +關注

    關注

    29

    文章

    1558

    瀏覽量

    7595

原文標題:Gemini 超越 GPT-4 靠作弊?谷歌承認:是的,演示視頻經過了剪輯

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數據技術】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    Llama 3 與 GPT-4 比較

    隨著人工智能技術的飛速發展,我們見證了一代又一代的AI模型不斷突破界限,為各行各業帶來革命性的變化。在這場技術競賽中,Llama 3和GPT-4作為兩個備受矚目的模型,它們代表了當前AI領域的最前
    的頭像 發表于 10-27 14:17 ?333次閱讀

    OpenAI推出新模型CriticGPT,用GPT-4自我糾錯

    基于GPT-4的模型——CriticGPT,這款模型專為捕獲ChatGPT代碼輸出中的錯誤而設計,其獨特的作用在于,讓人們能夠用GPT-4來查找GPT-4的錯誤。
    的頭像 發表于 06-29 09:55 ?541次閱讀

    OpenAI API Key獲取:開發人員申請GPT-4 API Key教程

    ? OpenAI的GPT-4模型因其卓越的自然語言理解和生成能力,成為了許多開發者的首選工具。獲取GPT-4 API Key并將其應用于項目,如開發一個ChatGPT聊天應用,不僅是實踐人工智能技術
    的頭像 發表于 06-24 17:40 ?2335次閱讀
    OpenAI API Key獲取:開發人員申請<b class='flag-5'>GPT-4</b> API Key教程

    開發者如何調用OpenAI的GPT-4o API以及價格詳情指南

    ?目前,OpenAI新模型GPT-4o和GPT-4 Turbo的價格如下: GPT-4o 對比 GPT-4 Turbo GPT-4o 擁有與
    的頭像 發表于 05-29 16:00 ?1.1w次閱讀
    開發者如何調用OpenAI的<b class='flag-5'>GPT-4</b>o API以及價格詳情指南

    GPT-4人工智能模型預測公司未來盈利勝過人類分析師

    據悉,本次研究中,研究人員僅向GPT-4提供了匿名的財務數據,包括資產負債表和損益表,并要求其預測未來盈利增長。盡管未獲得其他信息,GPT-4仍能達到60%的準確度,遠超人類分析師的平均水平(53%-57%)。
    的頭像 發表于 05-27 16:41 ?583次閱讀

    阿里云正式發布通義千問2.5,中文性能全面趕超GPT-4 Turbo

    在通義大模型發布一周年之際,阿里云邁出了歷史性的一步。近日,阿里云正式發布通義千問2.5版本,其性能全面超越GPT-4 Turbo,榮登中文大模型之巔。
    的頭像 發表于 05-13 11:16 ?965次閱讀

    OpenAI計劃宣布ChatGPT和GPT-4更新

    人工智能領域的領軍企業OpenAI近日宣布,將于5月13日進行一場產品更新直播,屆時將揭曉ChatGPT和GPT-4的新進展。這一消息立即引發了外界對OpenAI下一項重大技術發布的廣泛猜測和期待。
    的頭像 發表于 05-13 11:06 ?581次閱讀

    阿里云發布通義千問2.5大模型,多項能力超越GPT-4

    阿里云隆重推出了通義千問 2.5 版,宣稱其“技術進步,全面超越GPT-4”,尤其是在中文環境中的多種任務(如文本理解、文本生成、知識問答及生活建議、臨時聊天及對話以及安全風險評估)方面表現出色,超越
    的頭像 發表于 05-09 14:17 ?950次閱讀

    訊飛星火大模型V3.5春季升級,多領域知識問答超越GPT-4 Turbo?

    劉慶峰指出,現如今,星火大模型在通用長文本處理能力方面已相當成熟,覆蓋長文檔信息抽取、知識問答、歸納總結、文本生成等諸多領域,整體表現已達GPT-4 Turbo今年4月最新版的97%水準;
    的頭像 發表于 04-26 14:26 ?1030次閱讀

    微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

    起初,Copilot作為Bing Chat AI助手推出,初期采用GPT-3.5模型,隨后升級至GPT-4取得顯著進步,如今再次更新至性能卓越的GPT-4 Turbo模型,這無疑將使得Copilot功能再上新臺階。
    的頭像 發表于 03-13 13:42 ?724次閱讀

    Anthropic推出Claude 3大型語言模型,在認知任務性能上創新高

    據官方披露,Claude 3 旗艦 Opus 在大學生和研究生范疇的學術知識、復雜數理任務了解部分超越 OpenAI 的 GPT-4 以及谷歌Gemini 1.0 Ultra。
    的頭像 發表于 03-05 11:16 ?497次閱讀

    全球最強大模型易主,GPT-4超越

    近日,AI領域的領軍企業Anthropic宣布推出全新的Claude 3系列模型,其中包括最強版Claude 3 Opus。據該公司稱,Claude 3系列在推理、數學、編碼、多語言理解和視覺方面全面超越了包括GPT-4在內的所有大型模型,重新樹立了行業基準。
    的頭像 發表于 03-05 09:58 ?648次閱讀

    Anthropic推出Claude 3系列模型,全面超越GPT-4,樹立AI新標桿

    近日,AI領域的領軍企業Anthropic震撼發布了全新的Claude 3系列模型,該系列模型在多模態和語言能力等關鍵領域展現出卓越性能,成功擊敗了此前被廣泛認為是全球最強AI模型的GPT-4,樹立了新的行業基準。
    的頭像 發表于 03-05 09:49 ?680次閱讀

    全球最強大模型易主:GPT-4超越,Claude 3系列嶄露頭角

    近日,人工智能領域迎來了一場革命性的突破。Anthropic公司發布了全新的Claude 3系列模型,該系列模型在多模態和語言能力等關鍵指標上展現出卓越性能,成功超越了此前被廣泛認為是全球最強AI模型的GPT-4,樹立了新的行業標桿。
    的頭像 發表于 03-05 09:42 ?643次閱讀

    谷歌推出Gemini for Workspace,提供AI輔助功能,定價信息頗受關注

    谷歌聲稱通過此篇博客文章詳盡地介紹了新的更新。最基礎的“Starter”套餐收費為每個月每人6美元,如果想使用“Gemini擴展”則需額外支付20美元(折合人民幣約為144元)。
    的頭像 發表于 02-22 10:38 ?695次閱讀
    主站蜘蛛池模板: 最新精品国产| 久久99免费视频| 日本69xxxx| 26uuu老色哥| 久久九九有精品国产23百花影院| 亚洲第一成年人网站| 国产成人啪精视频精东传媒网站| 欧美亚洲国内日韩自拍视频| 91av影院| 美国CERANETWORK超清| 在线播放日韩欧美亚洲日本| 激情内射亚洲一区二区三区| 亚洲第一伊人| 国产色青青视频在线观看| 色中色论坛网站| 俄罗斯1819y0u| 肉多荤文高h羞耻校园| 成人免费视频在线看| 琪琪午夜福利免费院| WRITEAS塞红酒瓶| 欧美视频精品一区二区三区| 99热在线观看精品| 男人和女人一级黄色大片| 91麻豆久久| 蜜芽丅v新网站在线观看| 76人遣返航班上71人呈阳性| 免费欧美大片| a级精品九九九大片免费看 | 免费精品国产人妻国语麻豆| 26uuu老色哥| 男人天堂黄色| bbbbbxxxxx肥胖| 青青青草国产| 大胸美女裸身色诱网站| 色欲AV久久综合人妻蜜桃| 国产成人亚洲精品老王| 新影音先锋男人色资源网| 国内精品九九视频| 亚洲伊人成综合人影院| 久久嫩草影院网站| 99视频精品在线|