Claude-3力壓GPT-4榮膺最佳大語言模型

近日，LMSYS Org發布最新的基準測試報告，顯示Cordulas公司的Claude-3在平臺大語言模型中的得分略勝OpenAI的GPT-4。

值得注意的是，LMSYS Org是由加州大學伯克利分校、加州大學圣地亞哥分校以及卡內基梅隆大學共同發起設立的研究組織。

日前，這家機構推出了一項名為Chatbot Arena的服務，這是針對大語言模型（LLM）進行評估的基準平臺，該平臺采用眾包形式對大型語言模型進行匿名隨機競爭打分，參考源于競技比賽領域中廣泛應用的Elo評分體系。

分數評價結果主要取決于用戶的投票意向，每次由系統隨機挑選兩個不同的大語言模型參與與用戶的對話，同時，為保障客觀性，匿名選擇哪個版本的大模型表現優秀至關重要。

自去年啟動以來，GPT-4一直占據評測榜單之首。然而，昨日，由Anthropos推出的Claude 3 Opus以微弱優勢戰勝了GPT-4，將OpenAI的LLM擠出了首位。

考慮到細微差距及誤差風險，委員會決定授予Claude 3與GPT-4并列第一的榮譽，GPT-4的另外一個預設版也被列入并列第一的行列。此外，更引人注目的是，Claude 3 Haiku成功躋身前十名。Haiku是Anthropos針對本地規模的新型模型，功能類似谷歌的GeminiNano。

相較Opus參數高達幾萬億，Haiku體型更為緊湊，運行速度更快。據LMSYS數據顯示，Haikn在評測成績中排名第七，與GPT-4表現不遑多讓。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

谷歌

谷歌

+關注

關注
27

文章
6171

瀏覽量
105508
語言模型

語言模型

+關注

關注
0

文章
527

瀏覽量
10290
GPT

GPT

+關注

關注
0

文章
354

瀏覽量
15419

Llama 3 與 GPT-4 比較

沿。一、技術架構 Llama 3和GPT-4都是基于深度學習的自然語言處理（NLP）模型，但它們的設計理念和技術細節有所不同。 Llama 3

發表于 10-27 14:17 ?384次閱讀

OpenAI推出新模型CriticGPT，用GPT-4自我糾錯

基于GPT-4的模型——CriticGPT，這款模型專為捕獲ChatGPT代碼輸出中的錯誤而設計，其獨特的作用在于，讓人們能夠用GPT-4來查找GP

發表于 06-29 09:55 ?554次閱讀

Anthropic 發布Claude 3.5 Sonnet模型運行速度是Claude 3 Opus的兩倍

Anthropic 發布Claude 3.5 Sonnet最新模型新模型在推理、知識和編碼能力評估方面超越了以前的版本和競爭對手GPT 4

發表于 06-21 15:43 ?837次閱讀

Anthropic Claude 3大模型重磅來襲！微美全息（WIMI.US）全力沖刺加入GPT革命！

在AI邏輯基準測試中超過了ChatGPT-4。 Claude 3 Opus 超越 GPT-4 ? Anthropic聲稱，Claude

發表于 03-27 10:59 ?365次閱讀

微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

起初，Copilot作為Bing Chat AI助手推出，初期采用GPT-3.5模型，隨后升級至GPT-4取得顯著進步，如今再次更新至性能卓越的GPT-4 Turbo

發表于 03-13 13:42 ?746次閱讀

Anthropic 發布 Claude 3 系列大模型和 AI 助手

的表現超越了 GPT-4/3.5 和 Gemini 1.0 Ultra/Pro。 ? 目前Opus 和 Sonnet 已可通過 claude網站和 Claude API 使用,而 Haiku 將在未來幾周內推出。

發表于 03-08 12:29 ?441次閱讀

新火種AI|秒殺GPT-4，狙殺GPT-5，橫空出世的Claude 3振奮人心！

的GPT-4被拉下神壇， Claude 3很可能對GPT-4實現全方位的碾壓。 Anthropic發布3個

發表于 03-06 22:22 ?682次閱讀

Anthropic發布Claude 3系列大語言模型，挑戰OpenAI領先地位

人工智能領域的創業公司Anthropic推出了其備受矚目的Claude 3系列大型語言模型。該系列包括Claude

發表于 03-06 18:11 ?1292次閱讀

全球最強大模型易主，Claude 3全面超越GPT-4

由谷歌和亞馬遜支持的AI初創公司Anthropic近日發布了其全新的Claude 3模型家族，該家族包含三個重要成員：Claude 3 Op

發表于 03-06 10:44 ?772次閱讀

OpenAI推出ChatGPT新功能：朗讀，支持37種語言，兼容GPT-4和GPT-3

據悉，“朗讀”功能支持37種語言，且能夠自主識別文本類型并對應相應的發音。值得關注的是，該功能對GPT-4以及GPT-3.5版本的ChatGPT均適用。此舉彰顯了OpenAI致力于“多模態交互”（multimodal capab

發表于 03-05 15:48 ?952次閱讀

Anthropic推出Claude 3大型語言模型，在認知任務性能上創新高

據官方披露，Claude 3 旗艦 Opus 在大學生和研究生范疇的學術知識、復雜數理任務了解部分超越 OpenAI 的 GPT-4 以及谷歌的 Gemini 1.0 Ultra。

發表于 03-05 11:16 ?527次閱讀

全球最強大模型易主，GPT-4被超越

近日，AI領域的領軍企業Anthropic宣布推出全新的Claude 3系列模型，其中包括最強版Claude 3 Opus。據該公司稱，

發表于 03-05 09:58 ?672次閱讀

Anthropic推出Claude 3系列模型，全面超越GPT-4，樹立AI新標桿

近日，AI領域的領軍企業Anthropic震撼發布了全新的Claude 3系列模型，該系列模型在多模態和語言能力等關鍵領域展現出卓越性能，成

發表于 03-05 09:49 ?697次閱讀

Anthropic發布Claude 3系列，超越GPT-4和Gemini Ultra

人工智能領域的領軍企業Anthropic宣布推出全新的Claude 3系列模型，包括Claude 3 Opus、

發表于 03-05 09:43 ?678次閱讀

全球最強大模型易主：GPT-4被超越，Claude 3系列嶄露頭角

近日，人工智能領域迎來了一場革命性的突破。Anthropic公司發布了全新的Claude 3系列模型，該系列模型在多模態和語言能力等關鍵指標

發表于 03-05 09:42 ?668次閱讀

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 對比各家主流MCU指標，國產MCU真的品質不佳？
Hot 模擬信號和數字信號的區別和特點

New 方正電機成為小鵬汽車驅動電機供應商，總需求量預計達35萬臺
New 雷諾-吉利動力總成合資企業HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

基于FPGA的實時時鐘設計

FPGA技術江湖
17小時前

293 閱讀

數模轉換器的應用和工作原理

巨霖
18小時前

353 閱讀

圖像顯示專用驅動芯片ZDP1440系列小技巧-如何提升環形進度條幀率

立功科技
19小時前

278 閱讀

擴頻時鐘技術分享：SSC技術是什么、SSC對測試高速總線信號的影響

美國力科TeledyneLeCroy
22小時前

331 閱讀

安森美解讀SiC制造都有哪些挑戰？粉末純度、SiC晶錠一致性

安森美
1天前

411 閱讀

汽車電子嵌入式軟件接口庫設計

笑過就走
142 KB

5積分

42下載

中國電信WLAN系統工程設計規范

159520
1.13 MB

免費

76下載

結點電壓法在三相變壓器暫態仿真中的應用

yezi888
199 KB

免費

39下載

p2pvc彩色終端視頻聊天

李舒桀
0.10 MB

免費

0下載

PolyORB Ada語言實現的分布式中間件

絕代雙驕
5.34 MB

2積分

3下載

飛凌嵌入式-ELFBOARD-ELF 2硬件知識分享之Debug

jf_02372380
9小時前

26 閱讀

進迭時空 K1 系列 8 核 64 位 RISC - V AI CPU 芯片介紹

ben111
1天前

246 閱讀

HarmonyOS NEXT 應用開發練習：AI智能語音播報

李洋水蛟龍
1天前

193 閱讀

大神幫忙給看看這個電路

jf_90500147
1天前

472 閱讀

【書籍評測活動NO.54】典型電子電路設計與測試

ElecFans小喇叭
1天前

2533 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

Claude-3力壓GPT-4榮膺最佳大語言模型

評論

Llama 3 與 GPT-4 比較

OpenAI推出新模型CriticGPT，用GPT-4自我糾錯

Anthropic 發布Claude 3.5 Sonnet模型運行速度是Claude 3 Opus的兩倍

Anthropic Claude 3大模型重磅來襲！微美全息（WIMI.US）全力沖刺加入GPT革命！

微軟Copilot全面更新為OpenAI的GPT-4 Turbo模型

Anthropic 發布 Claude 3 系列大模型和 AI 助手

新火種AI|秒殺GPT-4，狙殺GPT-5，橫空出世的Claude 3振奮人心！

Anthropic發布Claude 3系列大語言模型，挑戰OpenAI領先地位

全球最強大模型易主，Claude 3全面超越GPT-4

OpenAI推出ChatGPT新功能：朗讀，支持37種語言，兼容GPT-4和GPT-3

Anthropic推出Claude 3大型語言模型，在認知任務性能上創新高

全球最強大模型易主，GPT-4被超越

Anthropic推出Claude 3系列模型，全面超越GPT-4，樹立AI新標桿

Anthropic發布Claude 3系列，超越GPT-4和Gemini Ultra

全球最強大模型易主：GPT-4被超越，Claude 3系列嶄露頭角