色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

ADS算力芯片的多模型架構研究

iotmag ? 來源:物聯網技術 ? 作者:物聯網技術 ? 2022-07-04 14:28 ? 次閱讀

在過去十幾年里,深度神經網絡(DNN)得到了廣泛應用,例如移動手機,AR/VRIoT自動駕駛等領域。復雜的用例導致多DNN模型應用的出現,例如VR的應用包含很多子任務:通過目標檢測來避免與附近障礙物沖突,通過對手或手勢的追蹤來預測輸入,通過對眼睛的追蹤來完成中心點渲染等,這些子任務可以使用不同的DNN模型來完成。像自動駕駛汽車也是利用一系列DNN的算法來實現感知功能,每個DNN來完成特定任務。然而不同的DNN模型其網絡層和算子也千差萬別,即使是在一個DNN模型中也可能會使用異構的操作算子和類型。

此外,Torch、TensorFlow和Caffe等主流的深度學習框架,依然采用順序的方式來處理inference 任務,每個模型一個進程。因此也導致目前NPU架構還只是專注于單個DNN任務的加速和優化,這已經遠遠不能滿足多DNN模型應用的性能需求,更迫切需要底層新型的NPU計算架構對多模型任務進行加速和優化。而可重配NPU雖然可以適配神經網絡層的多樣性,但是需要額外的硬件資源來支持(比如交換單元,互聯和控制模塊等),還會導致因重配網絡層帶來的額外功耗。

34c298a4-fb5f-11ec-ba43-dac502259ad0.png

開發NPU來支持多任務模型面臨許多挑戰:DNN負載的多樣性提高了NPU設計的復雜度;多個DNN之間的聯動性,導致DNN之間的調度變得困難;如何在可重配和定制化取得平衡變得更具挑戰。此外這類NPU在設計時還引入了額外的性能標準考量:因多個DNN模型之間的數據共享造成的延時,多個DNN模型之間如何進行有效的資源分配等。

目前的設計研究的方向大體可以分成以下幾點:多個DNN模型之間并行化執行,重新設計NPU架構來有效支持DNN模型的多樣性,調度策略的優化等。

34d33e98-fb5f-11ec-ba43-dac502259ad0.png

DNN之間的并行性和調度策略:

可以使用時分復用和空間協同定位等并行性策略。調度算法則大概可以分為三個方向:靜態與動態調度,針對時間與空間的調度,以及基于軟件或者硬件的調度。

時分復用是傳統優先級搶占策略的升級版,允許inter-DNN的流水線操作,來提高系統資源的利用率(PE和memory等)。這種策略專注調度算法的優化,好處是對NPU硬件的改動比較少。

空間協同定位則專注于多個DNN模型執行的并行性,也就是不同DNN模型可以同時占用NPU硬件資源的不同部分。這要求在設計NPU階段就要預知各個DNN網絡的特性以及優先級,以預定義那部分NPU硬件單元分配給特定的DNN網絡使用。分配的策略可以選擇DNN運行過程中的動態分配,或者是靜態分配。靜態分配依賴于硬件調度器,軟件干預較少。空間協同定位的好處是可以更好的提高系統的性能,但是對硬件改動比較大。

動態調度與靜態調度則是根據用戶用例的特定目標來選擇使用動態調度或者靜態調度。

動態調度的靈活性更高,會根據實際DNN任務的需求重新分配資源。動態調度主要依賴于時分復用,或者利用動態可組合引擎 (需要在硬件中加入動態調度器),算法則多數選擇preemptive策略或者AI-MT的早期驅逐算法等。

對于定制化的靜態調度策略,可以更好的提高NPU的性能。這種調度策略是指在NPU設計階段就已經定制好特定硬件模塊去處理特定神經網絡層或者特定的操作。這種調度策略性能高,但是硬件改動比較大。

34f0e808-fb5f-11ec-ba43-dac502259ad0.png

異構NPU架構:

結合動態可重構和定制化的靜態調度策略,在NPU中設計多個子加速器,每個子加速器都是針對于特定的神經網絡層或者特定的網絡操作。這樣調度器可以適配多個DNN模型的網絡層到合適的子加速器上運行,還可以調度來自于不同DNN模型的網絡層在多個子加速器上同步運行。這樣做既可以節省重構架構帶來的額外硬件資源消耗,又可以提高不同網絡層處理的靈活性。

異構NPU架構的研究設計可以主要從這三個方面考慮:

1)如何根據不同網絡層的特性設計多種子加速器;

2)如何在不同的子加速器之間進行資源分布;

3)如何調度滿足內存限制的特定網絡層在合適的子加速器上執行。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    796

    瀏覽量

    37840
  • 神經網絡
    +關注

    關注

    42

    文章

    4771

    瀏覽量

    100715
  • 算力芯片
    +關注

    關注

    0

    文章

    46

    瀏覽量

    4516

原文標題:ADS算力芯片的多模型架構研究

文章出處:【微信號:iotmag,微信公眾號:iotmag】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    ChatGPT背后的芯片

    今年以來可以說是最熱的賽道,而AI大模型的需求爆發,也帶動了AI服務器中各種類型的芯片需求,所以本期核芯觀察將關注ChatGPT背后所用到的
    的頭像 發表于 05-21 00:01 ?3477次閱讀
    ChatGPT背后的<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>

    名單公布!【書籍評測活動NO.41】大模型時代的基礎架構:大模型中心建設指南

    工作日內未聯系,視為放棄本次試用評測資格! 書籍介紹 大模型是近年來引人注目的熱點之一。大模型蓬勃發展的基礎,是針對其需求設計的及基礎架構
    發表于 08-16 18:33

    模型時代的需求

    現在AI已進入大模型時代,各企業都爭相部署大模型,但如何保證大模型,以及相關的穩定性和性能,是一個極為重要的問題,帶著這個極為重要的問
    發表于 08-20 09:04

    名單公布!【書籍評測活動NO.43】 芯片 | 高性能 CPU/GPU/NPU 微架構分析

    追求單核心性能轉向追求并行度,關注并研究芯片,這個方向是絕對沒錯的。這些年作者在自己所工作的量化金融行業取得的成績有目共睹,他作為
    發表于 09-02 10:09

    【「大模型時代的基礎架構」閱讀體驗】+ 未知領域的感受

    國慶前就收到《大模型時代的基礎架構》一書,感謝電子發燒友論壇。歡度國慶之余,今天才靜下心來體驗此書,書不厚,200余頁,彩色圖例,印刷精美! 當初申請此書,主要是看到副標題“大模型
    發表于 10-08 10:40

    【「芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--全書概覽

    、GPU、NPU,給我們剖析了芯片的微架構。書中有對芯片方案商處理器的講解,理論聯系實際,使讀者能更好理解
    發表于 10-15 22:08

    網絡的架構

    網絡的核心特征,是它通過,實現了對資源、網絡資源的全面接管,可以讓網絡實時感知用戶的
    的頭像 發表于 08-17 09:32 ?5333次閱讀

    1000TOPS背后的“大芯片

    不斷發展的人工智能也對芯片提出更高的要求。人工智能的應用對于最大的挑戰依然來自于核心數據中心的
    的頭像 發表于 12-12 15:53 ?3519次閱讀

    AI研究框架(2023)

    Transfomer架構模型訓練對的消耗呈指數級增長。2023年1月,ChatGPT計劃再向微軟融資100億美金,該融資將是新一代大模型
    的頭像 發表于 06-15 14:54 ?844次閱讀
    AI<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>研究</b>框架(2023)

    科大訊飛、華為強強聯合:攻關卡脖子問題

    科大訊飛擁有自研大模型訓練平臺,具備訓練和數據閉環全流程設計、大模型訓練和推理一體化設計、大規模異構兼容、支持混合云架構易拓展等優勢,華
    的頭像 發表于 08-22 16:17 ?1799次閱讀

    打通AI芯片到大模型訓練的橋梁,開放加速設計指南強力助推

    等產業議題進行研討分享。 面向大模型時代的計算需求,創新已不僅是單個處理器微架構芯片工藝的突破,而需要產業攜手進行軟硬件全棧系統
    的頭像 發表于 10-17 16:51 ?853次閱讀
    打通AI<b class='flag-5'>芯片</b>到大<b class='flag-5'>模型</b>訓練的<b class='flag-5'>算</b><b class='flag-5'>力</b>橋梁,開放加速設計指南強力助推

    PODsys:大模型AI平臺部署的開源“神器”

    模型是通用人工智能的底座,但大模型訓練對平臺的依賴非常大。大模型
    的頭像 發表于 11-08 09:17 ?903次閱讀
    PODsys:大<b class='flag-5'>模型</b>AI<b class='flag-5'>算</b><b class='flag-5'>力</b>平臺部署的開源“神器”

    淺談為AI大而生的存-體芯片

    模型爆火之后,存一體獲得了更多的關注與機會,其原因之一是因為存一體芯片的裸相比傳統
    發表于 12-06 15:00 ?387次閱讀
    淺談為AI大<b class='flag-5'>算</b><b class='flag-5'>力</b>而生的存<b class='flag-5'>算</b>-體<b class='flag-5'>芯片</b>

    數據語料庫、算法框架和芯片在AI大模型中的作用和影響

    數據語料庫、算法框架和芯片的確是影響AI大模型發展的三大重要因素。
    的頭像 發表于 03-01 09:42 ?1074次閱讀

    一體架構創新助力國產大AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應用論壇》上,億鑄科技高級副總裁徐芳發表了題為《存一體架構創新助力國產大
    的頭像 發表于 10-23 14:48 ?284次閱讀
    主站蜘蛛池模板: 日本xxxxxxxxx老师59| 野花社区视频WWW高清| 超碰在线视频caoporn| 美女坐脸vk| 在线看片韩国免费人成视频| 黄小飞二人转| 亚洲精品不卡在线| 国产一区2区| 学生妹被爆插到高潮无遮挡| 高清观看ZSHH96的视频素材 | 欧美另类z0z000高清| 中文字幕乱码亚洲无线三区| 九九热在线视频精品店| 亚洲日本一区二区三区在线不卡| 国产午夜精AV在线麻豆| 无限资源在线观看高清| 国产成人高清视频| 神马午夜不卡片| 高清欧美性猛交xxxx黑人猛交| 秋霞网在线伦理影片| 扒开黑女人p大荫蒂老女人| 欧美亚洲日韩欧洲不卡| china chinese中国人玩| 年轻的老师5理伦片| AV一区AV久久AV无码| 欧亚一卡二卡日本一卡二卡| www红色一片| 日本吃孕妇奶水免费观看| 白丝萝莉喷水| 色狗综合网| 国产精品亚洲一区二区三区久久| 校园纯肉H教室第一次| 国产午夜AV无码无片久久96| 亚洲精品第一页| 久久国产伦子伦精品| 中文中幕无码亚洲在线| 蜜柚视频网在线观看免费| adc年龄确认大驾光临入口| 秋霞电影网午夜鲁丝片| 第一次处破女完整版电影| 无码一区二区在线欧洲|