色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

大模型學習筆記

Apple最近發表了一篇文章，可以在iphone, MAC 上運行大模型：【LLM in a flash: Efficient Large Language Model Inference with Limited Memory】。

主要解決的問題是在DRAM中無法存放完整的模型和計算，但是Flash Memory可以存放完整的模型。但是Flash帶寬較低，LLM in Flash通過盡量減少從Flash中加載參數的數量，優化在DRAM中的內存管理，實現在Flash帶寬有限的條件下提高計算速度的目的。

這篇文章很多都是工程上的細節，很少理論。下面是這篇論文的總結，如有不對的地方，歡迎私信。

利用FeedForward 層的稀疏度，只加載FeedForward層輸入非0和預測輸出非0的參數

通過Window Sliding 只加載增量的參數，復用之前的計算，減少需要加載的參數。

將up-projection的row和down-projection的column放在一起存放，這樣在flash中可以一次讀取比較大的chunk，提高flash的帶寬利用效率。

如下圖所示，chunk越大，帶寬也就越大，初始加載chunk的latency可以被平攤。

1. 大模型在FeedForward layer有超過90%的稀疏度。將embedding和attention 矩陣一直保存在DRAM中。Attention 的權重占據了model總量的1/3。對于FeedForward Layer，只有非稀疏的部分被動態的加載進去DRAM。

2. 預測Relu層的稀疏性。在attention層的輸出后面增加low-rank predictor，預測在relu層之后可能是0的元素。

經過優化后，最終只需要加載2%的FeedForward層的參數到DRAM中。

3. Sliding Window

每次滑動窗口，在生成新的token后，刪掉不在window內的neuron，增加新的neuron。

上圖右側為一個window size為5的示意圖，粉色的是要刪除的元素，藍色的是新加入的元素。

上圖左側是如何在aggregated usage和incremental transfer中保持平衡，window設置的越大，每次新需要加載neruon也就越少，但是需要在memory中累計保存的空間占用的也就越大。

上圖左側的目標就是如何讓aggregated usage和incremental transfer都比較小。

譯者疑問：這個window就是Longformer: The Long-Document Transformer中的sliding window嗎？歡迎私信。

4.內存管理

內存管理也是因為sliding window引入的。

譯者注：

就像c++中vector的維護一樣，如果每次刪除vector中間的一個元素，都需要導致該元素后面所有元素的移動。

下圖描述的就是刪除和加入新neuron的內容。

最后文章還提出了比較有意思的一點，他們主要進行了稀疏化的優化，在計算和加載參數方面。他們也嘗試了通過和當前neuron關系緊密的 “closest friend”綁定，每次加載neuron時，也都加載他的closest friend。

作者說但是這樣帶來了負面作用，因為存在一些closest friend是很多neuron的closest friend (譯者注：類似于大眾之友)，這些neuron被頻繁的加載到DRAM中，反而降低了性能。

審核編輯：湯梓紅

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

DRAM

DRAM

+關注

關注
40

文章
2311

瀏覽量
183446
Mac

Mac

+關注

關注
0

文章
1104

瀏覽量
51458
大模型

大模型

+關注

關注
2

文章
2423

瀏覽量
2643
LLM

LLM

+關注

關注
0

文章
286

瀏覽量
327

原文標題：大模型筆記【2】 LLM in Flash

文章出處：【微信號：處理器與AI芯片，微信公眾號：處理器與AI芯片】歡迎添加關注！文章轉載請注明出處。

PADS應用學習筆記

本內容提供了PADS應用學習筆記，PADS2007學習及Power PCb使用經驗

發表于 11-24 10:42 ?1.1w次閱讀

記錄一下Linux設備模型學習歷程

Linux設備模型學習筆記1KobjectKobject, Kset和KtypeUeventsysfs文件系統wowo這里寫的很好了:內核等看wowo寫的很有幫助我寫一下我的理解。記錄一下自己的

發表于 02-17 06:05

Allegro學習筆記

Allegro學習筆記不收積分，需要的看下

發表于 11-23 17:41 ?0次下載

模擬電路學習筆記

模擬電子的相關知識學習教材資料——模擬電路學習筆記

發表于 09-20 16:10 ?0次下載

機器學習的個人學習筆記

本文檔的主要內容詳細介紹的是機器學習的個人學習筆記免費下載。

發表于 03-01 09:28 ?22次下載

機器<b class='flag-5'>學習</b>的個人<b class='flag-5'>學習</b><b class='flag-5'>筆記</b>

Altera FPGA CPLD學習筆記

Altera FPGA CPLD學習筆記(肇慶理士電源技術有限)-Altera FPGA CPLD學習筆記? ? ? ? ? ? ? ? ?

發表于 09-18 10:54 ?82次下載

Altera FPGA CPLD<b class='flag-5'>學習</b><b class='flag-5'>筆記</b>

Linux設備模型學習筆記(1)

Linux設備模型學習筆記1KobjectKobject, Kset和KtypeUeventsysfs文件系統wowo這里寫的很好了:http://www.wowotech.net

發表于 12-22 18:52 ?0次下載

Linux設備<b class='flag-5'>模型</b><b class='flag-5'>學習</b><b class='flag-5'>筆記</b>(1)

RT-Thread 內核學習筆記 - 設備模型rt_device的理解

RT-Thread 內核學習筆記 - 內核對象rt_objectRT-Thread 內核學習筆記 - 內核對象管理RT-Thread 內核學習

發表于 01-25 18:19 ?8次下載

Sentaurus TCAD學習筆記

半導體仿真Sentaurus TCAD 學習筆記，僅供學習

發表于 08-07 14:54 ?4次下載

Allegro學習筆記.zip

Allegro學習筆記

發表于 12-30 09:19 ?6次下載

處理器與AI芯片
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot Gem5 Arm Fullsystem仿真
Hot 大模型筆記之gem5運行模型框架LLama介紹

New 談談GPU的使用壽命
New 為什么GPU的壽命如此之短

精選推薦
更多

文章

資料

帖子

折疊屏2024的新東西、好東西、舊東西

腦極體
1天前

546 閱讀

艾為車規氛圍燈驅動芯片AW23003QNR-Q1解析已過AEC-Q100認證

艾為之家
1天前

559 閱讀

使用Keithley源表進行DC-DC電源管理芯片效率測試

泰克科技
2天前

809 閱讀

Mate70首銷兩周超越前代！字節掀AI價格戰！本周熱點科技新聞點評

章鷹觀察
2天前

775 閱讀

基于英特爾開發板開發ROS應用

英特爾物聯網
2天前

437 閱讀

多層片式瓷介電容器(MLCC)

賈小龍
322

10積分

122下載

大道至簡之編程思維

labyrinth0
928 KB

免費

0下載

DPO抓住DSO抓不住的波形瞬間

bigbangboom
233 KB

5積分

31下載

STM32各模塊寄存器與庫函數手冊

guozhixi
4632KB

免費

770下載

模擬電子技術基礎

feng_2022
5.50 MB

1積分

184下載

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】+小白折騰瑞薩RA系列全過程02

jf_80431208
1天前

148 閱讀

【敏矽微ME32G070開發板免費體驗】新建工程（MDK）

吉吉祥
2天前

327 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】按鍵點燈：使用輪詢方式和中斷方式實現

jf_64583430
2天前

286 閱讀

淺談加密芯片的一種破解方法和對應加密方案改進設計

jf_38636298
3天前

1049 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】4、Amazon FreeRTOS初探，第一個程序

lustao
3天前

2092 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

大模型學習筆記

評論

PADS應用學習筆記

記錄一下Linux設備模型學習歷程

Allegro學習筆記

模擬電路學習筆記

PADS_2007學習筆記

Ansoft學習筆記

Java設計模式學習筆記

ARM學習筆記

機器學習的個人學習筆記

Altera FPGA CPLD學習筆記

【學習筆記】單片機匯編學習

Linux設備模型學習筆記(1)

RT-Thread 內核學習筆記 - 設備模型rt_device的理解

Sentaurus TCAD學習筆記

Allegro學習筆記.zip