英偉達推出歸一化Transformer，革命性提升LLM訓練速度

英偉達團隊近日在AI領域投下了一枚震撼彈，他們提出了一種全新的神經網絡架構——歸一化Transformer(nGPT)。這一創新架構基于超球面(hypersphere)進行表示學習，為AI領域帶來了新的突破。

相較于傳統的Transformer架構，nGPT在保持原有精度的同時，直接將大型語言模型(LLM)的訓練速度提升了高達20倍。這一顯著的性能提升，無疑將極大地推動AI技術的發展和應用。

在nGPT中，所有的向量(包括嵌入向量、多層感知機(MLP)向量、注意力矩陣向量以及隱藏狀態向量)都被歸一化為單位范數(unit norm)。這一設計不僅簡化了模型訓練過程，還提高了模型的穩定性和泛化能力。

英偉達團隊的這一創新成果，無疑為AI領域注入了新的活力。nGPT架構的提出，不僅將推動AI技術的進一步發展，還將為各種應用場景提供更加高效、準確的解決方案。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

神經網絡

神經網絡

+關注

關注
42

文章
4771

瀏覽量
100714
英偉達

英偉達

+關注

關注
22

文章
3770

瀏覽量
90986
Transformer

Transformer

+關注

關注
0

文章
143

瀏覽量
5995
LLM

LLM

+關注

關注
0

文章
286

瀏覽量
327

什么是LLM？LLM在自然語言處理中的應用

隨著人工智能技術的飛速發展，自然語言處理（NLP）領域迎來了革命性的進步。其中，大型語言模型（LLM）的出現，標志著我們對語言理解能力的一次飛躍。LLM通過深度學習和海量數據

發表于 11-19 15:32 ?523次閱讀

如何訓練自己的LLM模型

訓練自己的大型語言模型（LLM）是一個復雜且資源密集的過程，涉及到大量的數據、計算資源和專業知識。以下是訓練LLM模型的

發表于 11-08 09:30 ?507次閱讀

LLM和傳統機器學習的區別

和訓練方法 LLM：預訓練和微調： LLM通常采用預訓練（Pre-training）和微調（Fine-tuning）的方法。預

發表于 11-08 09:25 ?409次閱讀

英偉達Blackwell可支持10萬億參數模型AI訓練，實時大語言模型推理

、NVLink交換機、Spectrum以太網交換機和Quantum InfiniBand交換機。 ? 英偉達稱，Blackwell擁有6項革命性技術，可支持多達10萬億參數的模型進行AI訓練

發表于 09-04 09:10 ?2887次閱讀

英偉達推出創新液冷技術

英偉達，這家領先的AI芯片制造商，近期在散熱技術上實現了重大突破，推出了創新的液冷技術。其即將問世的GB200服務器機架，將采用革命性的液體冷卻方式，摒棄傳統空氣冷卻，通過液體在硬件管

發表于 08-13 15:24 ?787次閱讀

llm模型訓練一般用什么系統

LLM（Large Language Model，大型語言模型）是近年來在自然語言處理領域取得顯著成果的一種深度學習模型。它通常需要大量的計算資源和數據來進行訓練。以下是關于LLM模型

發表于 07-09 10:02 ?397次閱讀

llm模型有哪些格式

：基于Transformer的模型 Transformer是一種基于自注意力機制的模型，廣泛應用于NLP領域。基于Transformer的LLM

發表于 07-09 09:59 ?596次閱讀

英偉達推出AI模型推理服務NVIDIA NIM

英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程，為全球的2800萬

發表于 06-04 09:15 ?674次閱讀

【大規模語言模型：從理論到實踐】- 每日進步一點點

的訓練效率、穩定性和泛化能力。以下是關于大模型訓練歸一化的詳細介紹：一、歸一化的目的和重要

發表于 05-31 19:54

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

2024年3月19日，[英偉達]CEO[黃仁勛]在GTC大會上公布了新一代AI芯片架構BLACKWELL，并推出基于該架構的超級芯片GB200，將助推數據處理、工程模擬、電子設計自動

發表于 05-13 17:16

英偉達推出有2080億晶體管的GB200處理器

英偉達在最新一屆的GTC大會上隆重推出了全新的GB200處理器，這款處理器基于革命性的Blackwell架構，并配備了驚人的2080億個晶體

發表于 03-20 11:10 ?778次閱讀

英偉達發布新一代AI芯片B200

在美國加州圣何塞舉辦的英偉達GTC生態大會上，英偉達CEO黃仁勛以一場震撼人心的演講，正式推出了

發表于 03-20 10:07 ?965次閱讀

英偉達發布性能大幅提升的新款B200 AI GPU

英偉達宣稱，B200在性能上比以往最好的GPU快30倍不止。由它構成的服務器集群相比上一代，運算能力飛躍性提升，甚至能使大語言模型的

發表于 03-20 09:37 ?790次閱讀

長電科技推出了一項革命性的高精度熱阻測試與仿真模擬驗證技術

在芯片封裝技術日益邁向高密度、高性能的今天，長電科技引領創新，推出了一項革命性的高精度熱阻測試與仿真模擬驗證技術。

發表于 03-08 13:33 ?525次閱讀

英偉達推出新產品，助力AIPC實現革命性升級

一直以來，英偉達的競爭對手如英特爾與AMD均對“AI PC”寄予厚望。他們認為，AI軟件在PC端運行會比依賴網絡更為安全且響應速度更快。由此可見，英

發表于 01-09 14:43 ?609次閱讀

科技綠洲
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot javascript的成熟分類
Hot java和javaweb和javascript的區別

New 使用CAN總線進行數據采集的方法
New CAN總線與其他通信協議對比

精選推薦
更多

文章

資料

帖子

折疊屏2024的新東西、好東西、舊東西

腦極體
1天前

501 閱讀

艾為車規氛圍燈驅動芯片AW23003QNR-Q1解析已過AEC-Q100認證

艾為之家
1天前

489 閱讀

使用Keithley源表進行DC-DC電源管理芯片效率測試

泰克科技
2天前

758 閱讀

Mate70首銷兩周超越前代！字節掀AI價格戰！本周熱點科技新聞點評

章鷹觀察
2天前

745 閱讀

基于英特爾開發板開發ROS應用

英特爾物聯網
2天前

426 閱讀

CAN應用層協議詳解之DeviceNet協議

Hx
360KB

1積分

19下載

濾波電路大全，收藏以備不時之需！

o_dream
0.95 MB

免費

42下載

HarmonyOS庫之基于zxing和zbar提供易使用的二維碼掃描功能

姚小熊27
5.32 MB

免費

5下載

ProjectMonitor大型CI顯示聚合器

王偉
0.88 MB

免費

0下載

openMVG開源SFM軟件

楊勇
16.30 MB

免費

0下載

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】+小白折騰瑞薩RA系列全過程02

jf_80431208
21小時前

88 閱讀

【敏矽微ME32G070開發板免費體驗】新建工程（MDK）

吉吉祥
1天前

284 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】按鍵點燈：使用輪詢方式和中斷方式實現

jf_64583430
1天前

255 閱讀

淺談加密芯片的一種破解方法和對應加密方案改進設計

jf_38636298
2天前

973 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】4、Amazon FreeRTOS初探，第一個程序

lustao
2天前

1967 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

英偉達推出歸一化Transformer，革命性提升LLM訓練速度

評論

什么是LLM？LLM在自然語言處理中的應用

如何訓練自己的LLM模型

LLM和傳統機器學習的區別

英偉達Blackwell可支持10萬億參數模型AI訓練，實時大語言模型推理

英偉達推出創新液冷技術

llm模型訓練一般用什么系統

llm模型有哪些格式

英偉達推出AI模型推理服務NVIDIA NIM

【大規模語言模型：從理論到實踐】- 每日進步一點點

進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

英偉達推出有2080億晶體管的GB200處理器

英偉達發布新一代AI芯片B200

英偉達發布性能大幅提升的新款B200 AI GPU

長電科技推出了一項革命性的高精度熱阻測試與仿真模擬驗證技術

英偉達推出新產品，助力AIPC實現革命性升級