色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于7nm工藝的FPGA加速芯片-ACAP

454398 ? 來源:AI加速微信公眾號 ? 作者:AI加速微信公眾號 ? 2020-11-05 14:55 ? 次閱讀

引言

隨著人工智能5G的興起,數據處理對芯片的算力和帶寬要求更高。為了布局未來,助力人工智能和5G,賽靈思也推出了自己的FPGA加速芯片-ACAP。ACAP是一款基于7nm工藝,集成了通用處理器(PS),FPGA(PL),math engine以及network-on-chip的革命性芯片。特別是新增的ME結構,是一個類似于GPU的多核并發計算單元,可以大大提高數據處理能力。同時ME支持軟件語言C,C++,這有利于擴大FPGA的使用用戶,同時方便了設計開發。

ME結構簡介

ME結構由很多ME核組成的二維陣列結構,核之間可以實現數據通信。ME陣列通過NoC可以和PL以及PS端進行通信,NoC是一種互聯總線,其提供了ME陣列到PL側的高帶寬通路。ME核包含了BRAM,DSP以及控制邏輯。ME具有以下特點:

1) 有一個RISC處理器,能夠支持32bit標量數據運算,包括sin/cos,開方,乘法等操作;

2) 向量乘法計算單元。這是一個由DSP組成的陣列,能夠支持32個16bitx8bit,64個16x8bit,128個8x8bit計算。還支持8個單精度乘法計算;

3) 指令控制結構支持load和save,向量乘法等操作,這些操作統一用一個指令字段描述;

4) 含有多路AXI stream,可以實現高速數據通信;

5) 含有一個128bit寬1K深的程序存儲器,支持指令壓縮,可通過AXI-MM進行配置;

6) 含有多個數據存儲器,分成多個bank,共有32KB容量;

7) 含有配置接口,用于ME核的配置和調試;

8) 含有debug/trace/profile功能,用于程序追蹤和調試;

ME核的工作頻率達到1GHz,電壓0.7V,具有較低功耗。ME支持多種形式的數據傳送,包括AXI-MM,AXI-stream,以及ME之間共享的bank進行數據直接交互。

為了保證性能的可預測性,ME之間數據通信不存在緩存一致性。但是ME和PS之間通信是需要緩存一致性功能的,ME和PS端共享DDR中一段內存。當PS處理完數據發送給ME時,是要保證處理的數據都已經存儲到DDR中了。而ME處理完數據寫到DDR中后,也要讓PS知道數據已經寫完。ME可以使用虛擬地址去訪問PS的存儲或者DDR,ME地址會經過PS端的MMU進行解析。

為了保證某些過程的安全性(比如對TrustZone的保護,或者防止ME陣列的重要信息被讀取),ME提供了一些保護措施。主要包括對ME訪問的保護,AXI-MM傳輸的安全性保護,AXI-stream數據訪問的保護等。

ME陣列可以在功能上被分割成多個子陣列使用,這可以用于一些需要ME陣列完成多種功能的任務。其中ME核,AXI-stream,數據存儲訪問等模塊都可以被分割。只有AXI-MM不能被分割。NoC中可以支持對控制信息的修改,從而可以給不同子陣列發送不同的控制信息。每個ME核含有256Kb的數據存儲器和128Kb的程序存儲器,對于一個300個ME核的芯片就含有77Mb數據存儲和38Mb程序存儲,這么大的空間,保證數據準確性是很關鍵的。因此不論是數據存儲器還是程序存儲器都提供了ECC校驗,以防止軟件錯誤產生的數據錯誤問題。程序存儲器每144bit包含128bit有效數據和8bitECC校驗位。8bit校驗位可以在每64bit數據中糾正1bit數據和檢測出2bit數據錯誤。存儲數據出錯會生成錯誤事件,反饋給debug或者profile模塊報告這些錯誤。

ME陣列被分配了4個1GB的地址映射區域,目前芯片只有一個ME陣列,所以只使用了1GB地址映射空間。ME的地址含有整體陣列的offset,陣列的行列編號,以及ME核中存儲地址。這些信息可以確定往哪個ME中的存儲位置讀寫數據。

ME中有4個時鐘:ME核時鐘,高頻,可到1GHz,用于ME中的數據傳輸和運算。NoC時鐘,數據時鐘,用于從PL到ME的數據輸送。PL側時鐘以及NPI時鐘,NPI時鐘用于調試追蹤等。

數據傳輸結構

為了保證不同設備之間的數據交換,我們需要滿足兩個條件:一個是數據實際的流通,這個包含數據傳輸通路和數據存儲;當然也不必包含有存儲,流水線處理的數據只有數據流通;另外一個是發送者和收發者之間的同步。接受者接收數據只有在發送者發出數據之后,同時發送者發送數據必須等接受者準備好接收數據。因此一些同步信號是必須的。

ME陣列中能夠實現數據交互的設備有:

1) 本地存儲bank。每個ME包含8個bank,這些bank可以用于和周圍4個ME進行數據通信。ME通過load和save指令來讀寫本地存儲器。如果ME的寫和另外一個ME的讀同時發生,可以通過ping/pong操作同步。

2) Stream-network可用于所有ME之間數據交互。而且stream本身是具有同步信號的,所以無需增加額外同步信號。

3) AXI-MM接口能夠用于ME和PL端甚至是外部存儲器進行通信。

保證數據同步的裝置有:

1) ME本地原子鎖。這個鎖可以保證生產者和消費者的數據訪問沖突解決。如果鎖被置為1,表示可以被讀,如果為0表示可以寫。

2) Shim-DMA鎖。用于同步不同DMA通道,或者DMA通道和AXI-MM通道;

3) 信號量機制。對于ME和PS端的數據通信,還可以通過軟件層次的信號量機制來進行同步,因為PS端可以通過AXI-MM接口實現和ME之間的數據同步;

4) Stream網絡自身附帶的同步特性,用于不同ME之間交換數據。

PL和ME由于處于不同時鐘區域,ME是高頻時鐘,而PL側時鐘頻率較低。為了實現數據跨時鐘域傳輸,芯片提供了shim接口,shim中含有異步FIFO。FPGA可以以64bit或者32bit將數據寫入FIFO,而ME將FIFO中數據讀出進行運算。ME獲得數據有兩種方式,一種是通過DMA將數據讀出寫入到ping/pong buffer,這樣可以實現ME核中兩個函數的計算任務。如果ME中不需要ping/pong操作,可以不同各國DMA將數據存儲到buffer。可以從stream直接獲得數據進行計算。

接下來我們看看ME內部數據如何通信:

1) ME內部不同操作之間可以使用shared memory來進行數據交互,但是每次只允許一個操作來訪問shared memory,即讀寫無法同時進行;

2) 兩個相鄰ME可以通過shared memory來進行數據交互,通過ping/pong buffer可以實現一個寫一個讀;

3) 對于不相鄰的ME,也可以使用ping/pong buffer。但是這個時候ME無法直接去訪問另外一個ME的存儲,但是每個ME都可以建立自己的ping/pong buffer,這兩組buffer可以通過DMA進行數據交互;

4) 不同的ME之間還可以通過AXI-stream接口進行數據交互;

5) 有時候一個大型計算要在幾個ME之間完成,這就需要不同ME之間進行高速數據通信,相鄰的ME之間還有級聯總線,可以實現兩個ME之間的累加運算,這個總線位寬達到384bit;

6) ME還可以直接從外部存儲器中獲得數據,它將數據請求包發送給ME-shim,這個請求包含有包頭和數據請求信息,包頭中有原和目的地址,數據請求中含有數據長度信息。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1635

    文章

    21837

    瀏覽量

    608349
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4830

    瀏覽量

    129778
  • 人工智能
    +關注

    關注

    1800

    文章

    48083

    瀏覽量

    242164
  • 數據存儲器
    +關注

    關注

    1

    文章

    69

    瀏覽量

    17845
  • ACAP
    +關注

    關注

    1

    文章

    54

    瀏覽量

    8241
收藏 人收藏

    評論

    相關推薦

    芯片封裝中的FOPLP工藝介紹

    ,行業對載板和晶圓制程金屬化產品的需求進一步擴大。 由于摩爾定律在7nm以下的微觀科技領域已經難以維持之前的發展速度,優異的后端封裝工藝對于滿足低延遲、更高帶寬和具有成本效益的半導體芯片的需求變得越來越重要。 ? 而扇出型封裝因
    的頭像 發表于 01-20 11:02 ?630次閱讀
    <b class='flag-5'>芯片</b>封裝中的FOPLP<b class='flag-5'>工藝</b>介紹

    芯片制造的7個前道工藝

    本文簡單介紹了芯片制造的7個前道工藝。 ? 在探索現代科技的微觀奇跡中,芯片制造無疑扮演著核心角色,它不僅是信息技術飛速發展的基石,也是連接數字世界與現實生活的橋梁。本文將帶您深入
    的頭像 發表于 01-08 11:48 ?777次閱讀
    <b class='flag-5'>芯片</b>制造的<b class='flag-5'>7</b>個前道<b class='flag-5'>工藝</b>

    7納米工藝面臨的各種挑戰與解決方案

    本文介紹了7納米工藝面臨的各種挑戰與解決方案。 一、什么是7納米工藝? 在談論7納米工藝之前,我
    的頭像 發表于 12-17 11:32 ?767次閱讀

    臺積電產能爆棚:3nm與5nm工藝供不應求

    臺積電近期成為了高性能芯片代工領域的明星企業,其產能被各大科技巨頭瘋搶。據最新消息,臺積電的3nm和5nm工藝產能利用率均達到了極高水平,其中3nm
    的頭像 發表于 11-14 14:20 ?593次閱讀

    今日看點丨 傳蘋果2025年采用自研Wi-Fi芯片 臺積電7nm制造;富士膠片開始銷售用于半導體EUV光刻的材料

    半年的新產品(例如iPhone 17)計劃采用自家的Wi-Fi芯片,采用臺積電N77nm工藝制造,支持最新的Wi-Fi 7規格。蘋果預計
    發表于 11-01 10:57 ?956次閱讀

    FPGA加速深度學習模型的案例

    FPGA(現場可編程門陣列)加速深度學習模型是當前硬件加速領域的一個熱門研究方向。以下是一些FPGA加速深度學習模型的案例: 一、基于
    的頭像 發表于 10-25 09:22 ?589次閱讀

    所謂的7nm芯片上沒有一個圖形是7nm

    最近網上因為光刻機的事情,網上又是一陣熱鬧。好多人又開始討論起28nm/7nm的事情了有意無意之間,我也看了不少網上關于國產自主7nm工藝的文章。不過這些文章里更多是抒情和遐想,卻很少
    的頭像 發表于 10-08 17:12 ?555次閱讀
    所謂的<b class='flag-5'>7nm</b><b class='flag-5'>芯片</b>上沒有一個圖形是<b class='flag-5'>7nm</b>的

    臺積電產能分化:6/7nm降價應對低利用率,3/5nm漲價因供不應求

    摩根士丹利的報告,以及最新的市場觀察,臺積電在6/7nm與3/5nm兩大制程節點上的產能利用情況及價格策略呈現出截然不同的態勢。
    的頭像 發表于 07-11 09:59 ?725次閱讀

    三星奪得首個2nm芯片代工大單,加速AI芯片制造競賽

    在半導體行業的激烈競爭中,三星電子于7月9日宣布了一項重大突破,成功贏得了日本人工智能(AI)企業Preferred Networks(PFN)的訂單,為其生產基于尖端2nm工藝和先進封裝技術的AI
    的頭像 發表于 07-11 09:52 ?672次閱讀

    PMP22165.1-適用于 Xilinx 通用自適應計算加速平臺 (ACAP) 的電源 PCB layout 設計

    電子發燒友網站提供《PMP22165.1-適用于 Xilinx 通用自適應計算加速平臺 (ACAP) 的電源 PCB layout 設計.pdf》資料免費下載
    發表于 05-19 10:45 ?0次下載
    PMP22165.1-適用于 Xilinx 通用自適應計算<b class='flag-5'>加速</b>平臺 (<b class='flag-5'>ACAP</b>) 的電源 PCB layout 設計

    存內計算——助力實現28nm等效7nm功效

    可重構芯片嘗試在芯片內布設可編程的計算資源,根據計算任務的數據流特點,動態構造出最適合的計算架構,國內團隊設計并在12nm工藝下制造的CGRA芯片
    的頭像 發表于 05-17 15:03 ?2254次閱讀
    存內計算——助力實現28<b class='flag-5'>nm</b>等效<b class='flag-5'>7nm</b>功效

    BittWare提供基于英特爾Agilex? 7 FPGA最新加速

    BittWare 當前的加速板產品組合包括最新的英特爾 Agilex 7 FPGA F、I 和 M 系列,包括 Compute Express Link (CXL) 和 PCIe* 5.0
    的頭像 發表于 04-30 15:22 ?982次閱讀
    BittWare提供基于英特爾Agilex? <b class='flag-5'>7</b> <b class='flag-5'>FPGA</b>最新<b class='flag-5'>加速</b>板

    FPGA芯片你了解多少?

    2019年正式銷售,目前已經向國內數百家客戶發貨,填補了國產高端 FPGA的空白,目前公司基于28nm工藝制程的FPGA產品已多達數十款。 安路科技成立于2011年,公司的主營業務為
    發表于 04-17 11:13

    2024年全球與中國7nm智能座艙芯片行業總體規模、主要企業國內外市場占有率及排名

    7nm智能座艙芯片市場報告主要研究: 7nm智能座艙芯片市場規模: 產能、產量、銷售、產值、價格、成本、利潤等 7nm智能座艙
    發表于 03-16 14:52

    Ethernovia推出全球首款采用7nm工藝的汽車PHY收發器系列樣品

    硅谷初創企業 Ethernovia宣布推出全球首款采用 7nm 工藝的單端口和四端口 10G 至 1G 汽車 PHY 收發器系列樣品,將在汽車領域帶來巨大變革,滿足軟件定義車輛 (SDV) 不斷增長的帶寬需求
    的頭像 發表于 03-15 09:07 ?1110次閱讀
    Ethernovia推出全球首款采用<b class='flag-5'>7nm</b><b class='flag-5'>工藝</b>的汽車PHY收發器系列樣品
    主站蜘蛛池模板: 国产又粗又猛又爽又黄的免费视频 | 国产人妻人伦精品久久无码 | 天天靠天天擦天天摸 | 高清AV熟女一区 | 久久青青草视频在线观 | 国产树林野战在线播放 | 日韩亚洲欧美中文高清在线 | 九九久久国产精品免费热6 九九久久国产精品大片 | 日本枯瘦娇小 | 久久青草免费91线频观看站街 | 国产亚洲精品久久久久久国 | 久久久无码精品一区二区三区 | 欧美日韩精品久久久免费观看 | 久久99re6国产在线播放 | 国产麻豆精品久久一二三 | 色欲国产麻豆一精品一AV一免费 | 人妻中文字幕无码久久AV爆 | 国产人妻XXXX精品HD电影 | 超碰caoporen国产 | 果冻传媒在线观看完整版免费 | av在线色 | 大香伊人中文字幕精品 | 无码国产成人777爽死 | 亚洲视频不卡 | 久久视频在线视频观看天天看视频 | 牛牛在线精品视频 | 十九岁在线观看免费完整版电影 | 精品无码久久久久久动漫 | 亲爱的妈妈6韩国电影免费观看 | 果冻传媒剧情在线观看 | 99国产精品| 黑人BBCVIDEOS极品| 日韩AV爽爽爽久久久久久 | 国产在线精品国自产拍影院午夜 | 在镜头里被CAO翻了H | 日韩娇小性hd | 手机看片一区二区 | 亚洲高清在线天堂精品 | 亚洲欧美中文字幕网站大全 | 日韩欧美亚洲精品综合在线 | 麻豆久久国产亚洲精品超碰热 |