谷歌開發出一個新的語言模型，包含了超過1．6萬億個參數

開發人工智能的語言模型，一直是人工智能的重要細分領域。人工智能語言模型應用包括搜索引擎、文字生成、個性化的對話工具以及軟件生成等。

2020年5月，OpenAI的一組研究人員發布了具有里程碑意義的AI模型GPT-3。GPT-3就是在570 GB的文本數據上訓練的語言模型，因此，就訓練數據和生成能力而言，GPT-3截至2020年都是最龐大的公開發布的語言模型。

此外，OpenAI的GPT-3一反之前死守基礎研究的思路，將 GPT-3 做成了一個服務，提供可以調用的 OpenAI API，并且向開放了少量體驗資格，使得拿到體驗資格的業界人士或學者等，開發出了一眾驚人的演示。

包括答題、翻譯、寫文章，甚至是數學計算和編寫代碼。而由GPT-3所寫的文章幾乎達到了以假亂真的地步，在 OpenAI 的測試中，人類評估人員也很難判斷出這篇新聞的真假，檢測準確率僅為 12%。

但現在，谷歌研究人員開發出一個新的語言模型，它包含了超過 1．6 萬億個參數，遠超 Open AI 開發的 GTP-3 的規模（1750 億個參數），成為迄今為止最大規模的人工智能語言模型，比之前谷歌開發過最大的語言模型 T5-XXL 的效率提高了 4 倍。

該語言模型使用 Switch Transformer 方法進行大規模訓練，這是一種“稀疏激活”技術，它只使用模型權重的子集或在模型中轉換輸入數據的參數，以有效降低計算密集度。

盡管在部分實驗中，該模型相比規模更小的模型得到了較低分數。但在相同的計算資源下，預訓練速度提高了7倍。這些改進擴展到多語言設置中，我們在所有101種語言中測量mT5基本版本的增益。最后，我們通過在“巨大的干凈的爬蟲語料庫”上預先訓練多達萬億個參數的模型，提高了語言模型的當前規模，并實現了比T5-XXL模型4倍的加速。

研究人員認為，稀疏性可以在未來賦予該模型在一系列不同媒體下多模態的優勢。這也為人工智能語言模型的深入研究提供了更多方向的參考。

責任編輯：xj

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
30728

瀏覽量
268892
人工智能

人工智能

+關注

關注
1791

文章
47183

瀏覽量
238266
語言模型

語言模型

+關注

關注
0

文章
520

瀏覽量
10268

AI大語言模型開發步驟

開發一個高效、準確的大語言模型是一個復雜且多階段的過

發表于 12-19 11:29 ?55次閱讀

大語言模型開發框架是什么

大語言模型開發框架是指用于訓練、推理和部署大型語言模型的軟件工具和庫。下面，AI部落小編為您介紹大語言

發表于 12-06 10:28 ?115次閱讀

大語言模型開發語言是什么

在人工智能領域，大語言模型（Large Language Models, LLMs）背后，離不開高效的開發語言和工具的支持。下面，AI部落小編為您介紹大

發表于 12-04 11:44 ?96次閱讀

云端語言模型開發方法

云端語言模型的開發是一個復雜而系統的過程，涉及數據準備、模型選擇、訓練優化、部署應用等多個環節。

發表于 12-02 10:48 ?113次閱讀

從零開始訓練一個大語言模型需要投資多少錢？

一，前言 ? 在AI領域，訓練一個大型語言模型（LLM）是一

發表于 11-08 14:15 ?200次閱讀

大語言模型如何開發

大語言模型的開發是一個復雜且細致的過程，涵蓋了數據準備、模型架構設計、訓練、微調和部署等多個階段

發表于 11-04 10:14 ?135次閱讀

聯發科新一代天璣旗艦芯片針對谷歌大語言模型Gemini Nano優化

近日，聯發科宣布了一個重要的技術進展——新一代天璣旗艦芯片已經針對谷歌的大語言模型Gemini

發表于 10-09 16:44 ?472次閱讀

谷歌發布新型大語言模型Gemma 2

在人工智能領域，大語言模型一直是研究的熱點。近日，全球科技巨頭谷歌宣布，面向全球研究人員和開發人員，正式發布了其最新研發的大

發表于 06-29 09:48 ?433次閱讀

谷歌不行？股價卻新高！Meta逆天？蒸發1.6萬億…微軟：都是弟弟

一夜蒸發了1.6萬億。只有微軟繼續超預期，看著另外兩位不靠譜的對手微微一笑，拿回全球市值第一的交椅。谷歌

發表于 05-09 08:04 ?136次閱讀

【大語言模型：原理與工程實踐】大語言模型的應用

類任務上表現出色，甚至在零樣本條件下也能取得良好效果。另一類則需要逐步推理才能完成的任務，類似于人類的系統2，如數字推理等。然而，隨著參數量的增加，大語言模型在這類任務上并未出現質的飛

發表于 05-07 17:21

【大語言模型：原理與工程實踐】大語言模型的基礎技術

特定任務對模型進行微調。這種方法的成功不僅是自然語言處理發展的一個轉折點，還為許多現實世界的應用場帶來了前所未有的性能提升。從廣為人知的GPT到BERT,預訓練的

發表于 05-05 12:17

谷歌模型框架是什么軟件？谷歌模型框架怎么用？

谷歌模型框架通常指的是谷歌開發的用于機器學習和人工智能的軟件框架，其中最著名的是TensorFlow。TensorFlow是一

發表于 03-01 16:25 ?870次閱讀

谷歌模型軟件有哪些功能

谷歌模型軟件通常指的是谷歌推出的一系列人工智能模型和軟件工具，其中最具代表性的是Google Gemini。Google Gemini是

發表于 03-01 16:20 ?651次閱讀

只修改一個關鍵參數，就會毀了整個百億參數大模型？

2022 年開始，我們發現 Multilingual BERT 是一個經過大規模跨語言訓練驗證的模型實例，其展示出了優異的跨語言遷移能力。具

發表于 02-20 14:51 ?776次閱讀

Stability AI推出迄今為止更小、更高效的1.6B語言模型

Stability AI 宣布推出迄今為止最強大的小語言模型之一 Stable LM 2 1.6B。

發表于 01-23 10:11 ?796次閱讀

精選推薦
更多

文章

資料

帖子

折疊屏2024的新東西、好東西、舊東西

腦極體
1天前

641 閱讀

艾為車規氛圍燈驅動芯片AW23003QNR-Q1解析已過AEC-Q100認證

艾為之家
1天前

620 閱讀

使用Keithley源表進行DC-DC電源管理芯片效率測試

泰克科技
2天前

875 閱讀

Mate70首銷兩周超越前代！字節掀AI價格戰！本周熱點科技新聞點評

章鷹觀察
2天前

826 閱讀

基于英特爾開發板開發ROS應用

英特爾物聯網
2天前

456 閱讀

用于組件之間應用過渡的openharmony庫

姚小熊27
0.18 MB

免費

1下載

bk-bcs藍鯨容器管理平臺

陳鍵
28.24 MB

免費

0下載

MeshViewer 3D mesh顯示工具

張華
0.01 MB

免費

0下載

ACNC G代碼解析器和CNC控制器

路過秋天
2.29 MB

2積分

3下載

Hippo4J動態可觀測線程池框架

卞輪輝
1.89 MB

2積分

4下載

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】+小白折騰瑞薩RA系列全過程02

jf_80431208
1天前

201 閱讀

【敏矽微ME32G070開發板免費體驗】新建工程（MDK）

吉吉祥
2天前

378 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】按鍵點燈：使用輪詢方式和中斷方式實現

jf_64583430
2天前

326 閱讀

淺談加密芯片的一種破解方法和對應加密方案改進設計

jf_38636298
3天前

1148 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】4、Amazon FreeRTOS初探，第一個程序

lustao
3天前

2224 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

谷歌開發出一個新的語言模型，包含了超過1．6萬億個參數

評論

AI大語言模型開發步驟

大語言模型開發框架是什么

大語言模型開發語言是什么

云端語言模型開發方法

從零開始訓練一個大語言模型需要投資多少錢？

大語言模型如何開發

聯發科新一代天璣旗艦芯片針對谷歌大語言模型Gemini Nano優化

谷歌發布新型大語言模型Gemma 2

谷歌不行？股價卻新高！Meta逆天？蒸發1.6萬億…微軟：都是弟弟

【大語言模型：原理與工程實踐】大語言模型的應用

【大語言模型：原理與工程實踐】大語言模型的基礎技術

谷歌模型框架是什么軟件？谷歌模型框架怎么用？

谷歌模型軟件有哪些功能

只修改一個關鍵參數，就會毀了整個百億參數大模型？

Stability AI推出迄今為止更小、更高效的1.6B語言模型