色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

下一代深度學習加速器:英特爾Xe

佐思汽車研究 ? 來源:YXQ ? 2019-05-24 10:20 ? 次閱讀

在超算領域,中美之間無聲的競爭還在進行中,2018年美國憑借橡樹嶺國家實驗室的Summit超算奪回了失落5年的TOP500冠軍寶座。在HPC超算市場上,關鍵的還是下一代百億億次超算,也就是Exascale超算,目前中國有三套E級超算,而英特爾、Cray公司在2019年3月17日獲得了美國能源部5億美元的合同。

美國能源部長里克佩里說:“實現百億億次超算是必不可少的,它不僅可以提升科學計算,還要改善美國人的日常生活。”“Aurora及下一代百億億次超算將HPC、AI等技術應用于癌癥研究、氣候模擬、退伍軍人健康治療等領域,基于百億億次超算的創新將會對我們的社會產生極為重要的影響。”美國首臺百億億次超算將大量應用英特爾的最新技術,主處理器是下一代Xeon至強,還有新一代Xe加速卡、OptaneDC內存、秘密武器CXL以及英特爾的OneAI軟件,而整個系統則是基于Cray公司的Shasta系統,包括至少200個機柜、Slingshot高性能可擴展互聯架構及Shasta軟件堆棧。

該項目計劃在2021年的時間內完成,并且每秒能夠進行Quintillion的運算,即400 petaflops。從這個角度來看,這比Million浮點運算高出一百萬倍 - 而平均每個處理器的約為200 GFLOP。這筆交易價值5億美元,其中Cray將獲得1.46億美元的資金,而Intel將獲得剩余的3.54億美元。

圖一:Aurora技術革新(圖片來源:英特爾

從上圖可以看出Xe 是加速器,但目前還不清楚Quintillionops mark的功率分布。

圖二:英特爾GPU可擴展性(來源:英特爾

英特爾野心勃勃,Xe將從10nm節點開始,為未來幾代圖形奠定基礎,并將遵循Intel的單一堆棧軟件哲學,即希望軟件開發人員能夠利用CPU、GPU、FPGA和AI,所有這些都使用同一套API,英特爾稱之為One API,One API作為Direct3D層和GPU之間的中介(據稱他們也有Linux解決方案),并允許用戶無縫擴展多個GPU。這表明Intel也準備打造一個類似CUDA的生態系統。

圖三:英特爾Xe路線圖(圖片來源:英特爾

不過這些都不是重點,英特爾將第一次在GPU領域使用MCM封裝形式,這正是英偉達夢寐以求的技術,而英特爾即將量產,第一批X2 GPU的暫定時間表也已經公布:2020年6月31日。隨后是2021年的X4。看起來Intel計劃每年增加兩個核心,所以到2024年應該會到X8。

Xe將是英特爾異構計算的關鍵構成,之前英特爾對GPU加速一直持懷疑態度,但自從有了Xe后,英特爾改變了態度,英特爾Xe將加強英特爾以數據為中心的廣泛產品組合,為最廣泛的計算工作負載提供領先的產品,滿足其對標量、矢量、矩陣和空間計算架構的綜合需求。但英特爾并未透露太多細節,不過從Aurora采購Xe即可看出,GPU加速已經被英特爾認同。

目前制造高性能 GPU 有一個很嚴重的限制 — 「芯片尺寸的限制」,因為目前現有技術的***受限于光刻模板、光刻光源,幾乎不可能制造出更大的 GPU 核心,極限是800平方毫米。即使英偉達的技術如何進步,核心尺寸不能無止境變大已經成為英偉達 繼續提升 GPU 性能的瓶頸。MCM 的封裝方式與 NANDFlash 的做法有點類似,容量不夠就將 Layer堆棧起來,除了制造方式簡單且具成本優勢之外,還可以提高產品的性能。

此外隨著CPU核心數逐漸從個位數提升到十位數范圍,monolithic多核心的局限越來越大,除了制造難度大、良率低的問題,也因為它不夠靈活,因為處理器除了核心數量之外,還要考慮到內存信道、PCIe信道等IO核心的搭配,英特爾的Skylake-SP架構所示,為了配合不同核心的處理器,英特爾在它上面使用了XCC、LCC、HCC三種不同的內部架構,這樣做無疑是增加了芯片的復雜性。

圖四:英偉達RC-18 GPU陣列(圖片來源:英偉達

英偉達為了應付 GPU 核心面積的瓶頸,已計劃開發一個名為「RC 18」的多矩陣概念,以最優化的方式整合多個 GPU 模塊,達至最高流處理器數、減少通訊層級和鏈路長度,并可以縮小芯片面積。根據英偉達研究部主管 William J. Dally的說法,「RC-18」是為深度學習執行和實現可擴展性的實驗,每個芯片內部具有基于TSMC 16nm 工藝及承載 8700 萬個晶體管的 16 個 PE(處理組件),因此可以從非常小的尺寸中擴展。16 個 PE 用于控制 CPU Core,片上全局緩沖儲存器,并安裝了八個 GRS 鏈路。在實際芯片中,GRS 鏈路組占據相當大的面積,每芯片 GRS 的 I/O 帶寬達到 100 GB/s。

圖五:英偉達RC18內部框架圖(圖片來源:英偉達

英偉達的RC18概念設計。英偉達目前RC18概念產品只做到了8700萬個晶體管,與GPU動輒百億級晶體管相比,差距至少有5年,目前英偉達將精力全部轉移到光線追蹤上,靠RT核來做賣點,只字不提曾經信誓旦旦的MCM。而英特爾的MCM成功了,畢竟英特爾在芯片封裝領域技術積累遠比英偉達要深厚的多。

AMD在CPU上大量運用MCM技術,但是在GPU上始終無法突破量產工藝瓶頸,理論上似乎很簡單,但就是良率太低,無法量產。這是因為AMD沒有自己的晶圓廠,從未從事過芯片封裝,芯片封裝都是交給第三方,而英特爾擁有全球最大的晶圓廠,也擁有最優秀的芯片封裝工藝,當然這背后是日本廠家新光電氣和Ibiden的鼎力支持,日本在封裝材料和工藝方面擁有絕對優勢。同時英特爾還有自己的Flash存儲器晶圓廠。可以借鑒Flash存儲器的MCM封裝經驗。

MCM不僅性能一流,同時也成本大幅度降低,AMD透露,如果將32核封裝到一塊芯片中成本是1,那它們的MCM方式只有0.59,換言之,節省了41%的成本。MCM還允許一個芯片中使用不同工藝的die(裸晶),比如I/O部分不需要那么先進的工藝,28納米足夠,CPU部分就用7納米,不僅降低成本,還復用了以前的I/O設計,降低先進制程工藝的風險,研發成果復用率高,縮短研發周期等。

圖六:單一架構和MCM對比(圖片來源:AMD

上圖為AMD MCM與單芯片對比。

英特爾Xe 2 GPU性能見上表。性價比極高。

為配合MCM,英特爾在軟件方面也有所動作,英特爾2019年4月9日舉行了Interconnect Day 2019 ,當中詳細介紹了處理器與處理器之間的Compute Express Link(CXL)超高速互聯新標準。雖然現階段構思僅供數據中心的服務器使用,顯然這也是為GPU準備的。英特爾 CXL 標準的原意——作為 CPU 與 Accelerator 加速器(如 FPGA / GPU 顯示適配器)之間的互聯通信

一直以來, CPU 都是透過主板上的 PCIe插槽及 PCIe 協議與顯示適配器溝通,但當英特爾 聯合阿里巴巴、 Cisco、 Dell EMC 、 Facebook 、 Google 、 HPE 、華為及微軟組成強大陣容的聯盟后,就發表了 CXL 的開放標準,以解決目前 PCIe 協議于 CPU 與顯示適配器之間的高延遲及帶寬不足的問題。透過 CXL 協議, CPU 與 GPU 之間就形同連成單一個龐大的堆棧內存池( Stacked Memory ), CPU Cache 和 GPU HBM2 內存猶如放在一起,有效降低兩者之間的延遲,故此能大幅提升數據運算效率,令AI人工智能機器學習、媒體服務、高效能運算( HPC )及云端服務變得非常快速。

MCM沒有理論上的突破,突破的只是制造工藝,MCM在奔騰時代已經出現過了,而今monolithic多核已經走到了極限,唯有MCM能救場。而在服務器用CPU領域,MCM將可能是唯一方向,典型的如Cascade Lake-AP 48核處理器,它實際上是兩個24核的Cascade Lake處理器通過MCM方式組合出來的,也不是原生48核。如今的MCM多芯片設計在技術水平上也跟當年簡單粗暴的膠水多核不一樣了,主要擔心的延遲問題上,英特爾之前提到他們的EMIB技術相比單片電路的延遲只增加了10%,而別的技術方案中延遲甚至會增加50%之多。

monolithic多核的困境實際上是整個人類面臨的瓶頸,近百年來,人類在物理學體系理論上未有任何突破,只是在細枝末節上做修修補補,所謂人工智能不過是概率論,幾十年甚至近百年前的理論還是根基,所謂提升,不過是算力成指數倍的堆砌。

另外,供應鏈的重要性一再凸顯,那種追求短平快,強調分工,只做自己擅長的戰略長遠上必然會遇到無法超越的瓶頸,英偉達和AMD無法戰勝英特爾,不再技術層面,而是供應鏈層面。這么多年以來,AMD都是努力追趕英特爾,但AMD將工廠賣掉之后是個純粹的Fabless,需要看Foundry晶圓代工廠的臉色,晶圓代工廠自然要優先照顧大客戶,臺積電自然要優先照顧蘋果、華為和高通,遇上產能吃緊,AMD的訂單就會往后排。這就意味著AMD的供貨不夠穩定,或者說AMD無法掌控產量,對下游整機廠來說,有可能導致旺季缺貨,這是個致命的缺點,特別是淡旺季分明的筆記本電腦CPU領域,英特爾一直擁有絕對優勢。英特爾單靠全球最大的12英寸晶圓產能也足以擁有在半導體領域的霸主位置。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    9953

    瀏覽量

    171705
  • 深度學習
    +關注

    關注

    73

    文章

    5500

    瀏覽量

    121118

原文標題:下一代深度學習加速器:英特爾Xe

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    英特爾發布全新企業AI體化方案

    近日,英特爾正式推出了全新的企業AI體化方案。該方案以英特爾至強處理英特爾Gaudi 2D AI
    的頭像 發表于 12-03 11:20 ?214次閱讀

    英特爾聯合中科創達構建下一代智能座艙平臺

    近日,英特爾 AI 座艙暨車載獨立顯卡發布會在深圳盛大舉行。英特爾震撼發布其首款車載獨立顯卡 dGPU,旨在為 AI 座艙的廣泛普及筑牢澎湃的算力基石。作為英特爾的戰略合作伙伴,中科創達受邀出席此次
    的頭像 發表于 11-17 11:11 ?490次閱讀

    10月29日英特爾將發布新一代酷睿Ultra Series 2處理及圖形產品線

     近日,據外媒報道,英特爾已定于10月29日舉辦Partner Alliance BaseCamp活動,該活動備受業界矚目,因為英特爾預計將在會上發布其備受期待的下一代酷睿Ultra Series 2移動處理
    的頭像 發表于 10-16 15:18 ?562次閱讀

    英特爾發布Gaudi3 AI加速器,押注低成本優勢挑戰市場

    英特爾近期震撼發布了專為AI工作負載設計的Gaudi3加速器,這款新芯片雖在速度上不及英偉達熱門型號H100與H200 GPU,但英特爾巧妙地將競爭優勢聚焦于其更為親民的價格與總擁有成本(TCO)上。
    的頭像 發表于 09-26 16:16 ?812次閱讀

    英特爾下代 CPU 還值得信任嗎?

    市場競爭加劇和技術迭代加速英特爾面臨著前所未有的挑戰。在這樣的背景下,我們不禁要問:英特爾下一代CPU是否還值得我們的信任?
    的頭像 發表于 09-04 13:57 ?332次閱讀
    <b class='flag-5'>英特爾</b>下代 CPU 還值得信任嗎?

    下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI中更快的嵌入處理

    電子發燒友網站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI中更快的嵌入處理.pdf》資料免費下載
    發表于 08-15 11:06 ?0次下載
    <b class='flag-5'>下一代</b>高功能新<b class='flag-5'>一代</b>AI<b class='flag-5'>加速器</b>(DRP-AI3):10x在高級AI系統高級AI中更快的嵌入處理

    龍芯中科胡偉武:3B6600 八核桌面 CPU 性能將達到英特爾中高端酷睿 12~13 水平

    據稱龍芯中科目前正在研發下一代桌面端處理 3B6600 與 3B7000 系列,在本月《中國電子報》透露的采訪中,龍芯中科董事長胡偉武透露了關于新處理的更多信息。 胡偉武稱,龍芯于2023 年
    發表于 08-13 11:16

    英特爾發布AI創作應用AI Playground,將于今夏正式上線!

    在2024年臺北國際電腦展上,英特爾詳細介紹了即將推出的Lunar Lake系列產品,并展示了下一代英特爾銳炫GPU(代號為Battlemage)的基礎架構Xe2。此外,
    的頭像 發表于 06-14 09:44 ?467次閱讀
    <b class='flag-5'>英特爾</b>發布AI創作應用AI Playground,將于今夏正式上線!

    英特爾發布新一代Lunar Lake處理

    在近期舉辦的中國臺北國際電腦展(Computex)上,英特爾CEO蓋爾辛格向全球展示了其最新的技術成果。他發布了第六至強處理,并重點強調了Gaudi AI加速器的出色性價比。更引人
    的頭像 發表于 06-05 11:23 ?916次閱讀

    英特爾加大玻璃基板技術布局力度

    近日,全球領先的半導體制造商英特爾宣布,將大幅增加對多家設備和材料供應商的訂單,旨在生產基于玻璃基板技術的下一代先進封裝產品。這戰略舉措預示著英特爾對于未來封裝技術的
    的頭像 發表于 05-20 11:10 ?522次閱讀

    使用英特爾Agilex3和Agilex5器件構建下一代數據中心平臺管理方案

    憑借小巧的外形和高 I/O 規模等優勢,低功耗、高度靈活且經過成本優化的英特爾 Agilex 3 和英特爾 Agilex 5 FPGA 以及 SoC FPGA 提供了下一代平臺管理解決方案所需的功能和特性。
    的頭像 發表于 04-26 14:31 ?1193次閱讀
    使用<b class='flag-5'>英特爾</b>Agilex3和Agilex5器件構建<b class='flag-5'>下一代</b>數據中心平臺管理方案

    英特爾展示下一代至強處理,助力vRAN性能顯著提升

    里程碑事件不僅凸顯了移動行業推動vRAN和Open RAN發展的長期投入,也表明了英特爾正在持續踐行其以領先的產品路線圖助力行業發展的堅定承諾。代號為Granite Rapids–D的下一代至強處理將于2025年發布,這款處理
    的頭像 發表于 03-01 15:43 ?426次閱讀
    <b class='flag-5'>英特爾</b>展示<b class='flag-5'>下一代</b>至強處理<b class='flag-5'>器</b>,助力vRAN性能顯著提升

    Sarcina Technology加入英特爾聯盟

    加速器設計服務聯盟。 Sarcina Technology已加入英特爾代工服務,并將其先進的封裝專業知識引入英特爾代工服務加速器設計服務聯盟。其針對人工智能應用的2.5D硅中介層封裝
    的頭像 發表于 02-05 12:05 ?415次閱讀

    英特爾子公司Mobileye與馬興達合作打造下一代智能駕駛技術

    美國芯片巨頭英特爾的子公司Mobileye,近日宣布與印度汽車制造商馬興達拉(Mahindra & Mahindra)達成項重要合作。根據協議,Mobileye將為馬興達拉的下一代汽車提供先進的駕駛輔助系統(ADAS)技術。
    的頭像 發表于 01-12 17:05 ?1061次閱讀

    Valens與英特爾宣布建立戰略合作關系,共同開發下一代A-PHY產品

    MIPI A-PHY標準的芯片組,以滿足市場對這創新連接解決方案的強勁需求。雙方合作的起點是通過英特爾的領先技術在汽車行業開發下一代A-PHY產品,本次合作進步加強了Valens和
    的頭像 發表于 01-09 11:38 ?734次閱讀
    主站蜘蛛池模板: 我们日本在线观看免费动漫下载| 草莓视频在线看免费高清观看| 高清国产一区| 日韩中文无线码在线视频| www.精品久久| 色姐妹久久综合在线av| 丰满的女朋友韩国版在线观看| 青青草国产精品久久| 99热最新在线| 天天澡夜夜澡人人澡| 国产精品视频人人做人人爽| yellow免费影视大全| 一道本av免费不卡播放| 黄色网址在线看| 色戒2小时38分在线观看| WWW婷婷AV久久久影片| 日韩成人性视频| 国产色情短视频在线网站| 忘忧草秋观看未满十八| 国产成人精品电影| 99精产国品一二产区在线| 亚洲视频国产在线精品| 日本精品久久无码影院| 久久婷婷久久一区二区三区 | 日日噜噜噜噜夜夜爽亚洲精品| 国产精品成人网| 国产人妻人伦精品A区| 国产精品亚洲AV毛片一区二区三区 | 亚洲一区成人| 亚洲精品国产高清嫩草影院| 天天爽夜夜爽夜夜爽| 亚洲精品伊人久久久久| 亚洲qvod图片区电影| 一个人免费观看HD完整版| 午夜天堂一区人妻| 色狗综合网| 秋霞电影网午夜免费鲁丝片| 免费无码又爽又黄又刺激网站| 久久www99re在线播放| 好大好硬好爽好深好硬视频| 国产精品伊人|