色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾在Hot Chips大會上發(fā)布了首款A(yù)I處理器

DPVg_AI_era ? 來源:lq ? 2019-09-01 07:45 ? 次閱讀

英特爾在Hot Chips大會上發(fā)布了首款AI處理器,專為大型計算中心設(shè)計。該芯片基于10納米Ice Lake處理器,專為大型數(shù)據(jù)中心設(shè)計,可以用最少的能耗來處理高工作負載。本文帶來這款芯片的詳細設(shè)計細節(jié)。

近日在Hot Chips 2019大會上,英特爾發(fā)布了首款A(yù)I處理器,專為大型計算中心設(shè)計。

英特爾表示,該芯片由位于以色列海法的研發(fā)中心開發(fā),名為Nervana NNP-I或Springhill,基于10納米Ice Lake處理器,可以用最少的能耗來處理高工作負載。

英特爾表示,隨著AI領(lǐng)域?qū)?fù)雜計算的需求日益增加,這款新的硬件芯片將有助于大型企業(yè)使用英特爾Xeon處理器。

在Hot Chips大會上,他們提供了這款A(yù)I芯片的更多設(shè)計細節(jié)。

英特爾首款A(yù)I芯片設(shè)計細節(jié)

英特爾正采取數(shù)項不同的舉措,通過其“無處不在的AI”('AI everywhere)戰(zhàn)略,擴大其在蓬勃發(fā)展的AI市場的影響力。該公司廣泛的產(chǎn)品包括GPUFPGA和定制ASIC,用于應(yīng)對AI領(lǐng)域的不同挑戰(zhàn),其中一些解決方案專為計算密集型的訓(xùn)練任務(wù)而設(shè)計,用于為目標(biāo)識別、語音翻譯、語音合成等工作負載創(chuàng)建復(fù)雜的神經(jīng)網(wǎng)絡(luò),將產(chǎn)生的訓(xùn)練模型作為輕量級代碼運行的單獨解決方案稱為推理。

英特爾的Spring Hill Nervana神經(jīng)網(wǎng)絡(luò)推理處理器(NNP-I) 1000,我們在下文中簡稱為NNP-I,用于處理數(shù)據(jù)中心的輕量級推理工作負載。這款芯片足夠小,可以安裝在標(biāo)準(zhǔn)的M.2設(shè)備上,然后插入主板上的標(biāo)準(zhǔn)M.2端口,從而將Xeon服務(wù)器從推理密集型工作負載中解放出來,將更大的芯片釋放出來用于一般計算任務(wù)。用于訓(xùn)練的神經(jīng)網(wǎng)絡(luò)處理器 (NPP-T)作為英特爾的Nervana解決方案用于訓(xùn)練工作負載,但這兩種設(shè)備的底層架構(gòu)有很大的不同。

英特爾修改了10nm Ice Lake處理器,去掉了兩個計算核心和圖形引擎,以適應(yīng)12個推理計算引擎(ICE)。ICE加速器具有基于硬件的單元間同步,與兩個IA核共享一個連貫的結(jié)構(gòu)和24MB的L3緩存,這兩個IA核具有Sunny Cove微架構(gòu)。

IA核心是標(biāo)準(zhǔn)的Ice Lake核心,支持AVX-512和VNNI指令,可加速卷積神經(jīng)網(wǎng)絡(luò),而一個完全集成的電壓調(diào)節(jié)模塊(FIVR)動態(tài)地向組件供電,將更多的功率預(yù)算分配給最活躍的on-die單元。該芯片配備了兩個LPDDR4X內(nèi)存控制器,連接到封裝內(nèi)存,你可以將其視為M.2 PCB左下方的單個組件。控制器提供高達4.2 GT/s (68 GB/s)的吞吐量,并支持 in-band ECC。

英特爾尚未透露LPDDR4的容量,也沒有透露有關(guān)M.2設(shè)備的其他細節(jié)。我們知道英特爾將這個軟件包安裝在不同形式的插入卡上,比如上面的M.2版本,它可以插入服務(wù)器主板上的標(biāo)準(zhǔn)M.2端口,或者插入標(biāo)準(zhǔn)的PCIe插槽的更大的附加卡。與谷歌的TPU等為人AI設(shè)計的定制芯片不同,這款設(shè)備基本上與所有現(xiàn)有的現(xiàn)代服務(wù)器硬件兼容。這種方法也是可擴展的:你可以根據(jù)需要向服務(wù)器添加盡可能多的NNP-I,特別是對于包含多個M.2端口的PCIe提升板。

該設(shè)備通過PCIe 3.0 x4或x8接口與主機通信,但不使用NVMe協(xié)議。相反,它作為一個標(biāo)準(zhǔn)的PCIe設(shè)備運行。英特爾將提供一種軟件,可以將推理“作業(yè)”完全編排到加速器上,當(dāng)工作完成時,該軟件將通知Xeon CPU。卸載消除了Xeon與其他類型的加速器在PCIe總線上的來回通信,這對CPU來說是一種負擔(dān),因為它會生成中斷并需要數(shù)據(jù)移動。相反,NNP-I是一個獨立的系統(tǒng),具有自己的I/O調(diào)節(jié)(PCH),允許它訪問處理所需的數(shù)據(jù)。

該設(shè)備可以支持從10W到50W的不同功率范圍,這對性能有影響。M.2接口的15W限制阻礙了插入標(biāo)準(zhǔn)M.2插座的設(shè)備的功率傳輸,但NNP-I在更大的外接卡中可以在最高TDP額定值下運行,這意味著它們提供了更好的性能。在INT8操作中,TOP/s的范圍從48到92。根據(jù)配置的TDP,芯片的效率為每瓦特2~4.8 TOP/s,但該指標(biāo)不包括總包功率。

推理計算引擎內(nèi)部

深入研究ICE引擎可以發(fā)現(xiàn),每個ICE單元都有額外的4MB SRAM,有助于減少芯內(nèi)數(shù)據(jù)移動,這在功耗和時間方面總是比實際的計算操作更昂貴。深度學(xué)習(xí)計算網(wǎng)格(DL Compute Grid)是一個張量引擎,通過數(shù)據(jù)和控制結(jié)構(gòu)連接到SRAM和VP6 DSP。DSP引擎可以用于沒有專門針對固定功能DL計算網(wǎng)格進行優(yōu)化的算法。此外,其他代碼可以在Ice Lake核心上使用VNNI運行,使多個模型可以同時在設(shè)備上運行,也為快速移動的AI空間提供了一些必需的前向兼容性。

DL Compute Grid支持FP16和INT8,但也支持INT4、2和1,以支持未來可能對AI算法進行的調(diào)整。令人驚訝的是,它不支持bfloat16。通過調(diào)整工作負載在ICE單元之間的分布方式,可以優(yōu)化fabric的帶寬或延遲,如下表所示。

這里我們可以看到DL Compute Grid的特寫視圖,它被設(shè)計得很靈活,以最大化其4D并行計算能力,以及用于矢量處理的Tensilicon Vision P6 DSP。Tensilica DSP引擎是一個廣泛的VLIW機器,支持INT8, 16, 32,和FP16。該引擎是完全可編程的,并具有一個雙向管道和DL Compute Grid,可在兩個硬件同步單元之間快速傳輸數(shù)據(jù)。。

芯片的內(nèi)存子系統(tǒng)

回到內(nèi)存子系統(tǒng),可以看到每個計算單元中所做的設(shè)計決策背后的許多合理化。這里我們可以看到硬件控制的L3緩存被分成8個3MB的片段,在AI核心和ICE單元之間共享。該設(shè)計經(jīng)過優(yōu)化,使數(shù)據(jù)盡可能接近計算引擎,并具有四個不同的層。

圖表左側(cè)的一系列blocks量化了通過內(nèi)存結(jié)構(gòu)的每一層移動數(shù)據(jù)的延遲。從DRAM到DLCompute Grid的數(shù)據(jù)傳輸被設(shè)置為基線,我們可以看到分層結(jié)構(gòu)中的每一層將數(shù)據(jù)傳輸?shù)膃ngine的速度是多么快。從L3緩存訪問比DRAM快10倍,而存儲在DL Compute Grid中的數(shù)據(jù)比DRAM快1000倍。

總之,分層設(shè)計允許Xeon向設(shè)備卸載幾種不同類型的神經(jīng)網(wǎng)絡(luò),每一層都支持一定的精度。請注意,上面的金字塔是根據(jù)每瓦特的性能排列的。

英特爾與ResNet50共享性能數(shù)據(jù),運行速度為每秒3600 次推理,芯片設(shè)置為10W TDP。這相當(dāng)于每瓦特4.8 TOP/s的效率測量,符合公司的設(shè)計目標(biāo)。值得注意的是,芯片在較低的TDP范圍內(nèi)效率更高,因此在較高的性能設(shè)置下效率可能會有所不同。這些數(shù)字也只適用于ASIC,不包括整個M.2設(shè)備的功耗。英特爾表示,未來將分享更多的性能數(shù)據(jù)。

英特爾提供了一個編譯器,可以為NNP-I的加速器定制代碼,并正在與Facebook合作,以確保Glo編譯器也支持NNP-I的加速器。Facebook是英特爾在開發(fā)期間的“定義”合作伙伴。該設(shè)備還支持所有標(biāo)準(zhǔn)框架,如PyTorch和TensorFlow等,幾乎沒有任何更改。英特爾堅持認為,任何能夠使用Xeons進行推理的人都可以使用NNP-I。

在數(shù)據(jù)中心,推理應(yīng)用遠比訓(xùn)練普遍,價格合理的低功耗設(shè)備將集體銷售給超大規(guī)模和云服務(wù)提供商(CSP),意思是這可以成為英特爾的一個利潤豐厚的細分市場。該公司本身并沒有打算將這些設(shè)備推向零售市場,但確實希望CSP在未來通過基于云的實例來公開它們。

英特爾已經(jīng)研發(fā)了兩代NNP-I。該公司將在今年年底前開始批量生產(chǎn),NNP-I已經(jīng)開始提供樣品。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    455

    文章

    50714

    瀏覽量

    423155
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    9949

    瀏覽量

    171694
  • AI處理器
    +關(guān)注

    關(guān)注

    0

    文章

    92

    瀏覽量

    9489

原文標(biāo)題:英特爾首款A(yù)I芯片終于面世!10nm工藝,以色列團隊設(shè)計細節(jié)曝光

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    英特爾向聯(lián)想交付18A工藝CPU樣品

    2024聯(lián)想創(chuàng)新科技大會上英特爾CEO帕特·基辛格(Pat Gelsinger)向聯(lián)想交付了采用最先進Intel 18A(1.8nm
    的頭像 發(fā)表于 10-18 16:57 ?789次閱讀

    英特爾至強品牌新戰(zhàn)略發(fā)布

    品牌是企業(yè)使命和發(fā)展的象征,也承載著產(chǎn)品特質(zhì)和市場認可。英特爾GTC科技體驗中心的英特爾 至強 6 能效核處理器發(fā)布會上
    的頭像 發(fā)表于 10-12 10:13 ?431次閱讀

    英特爾發(fā)布酷睿Ultra 200S系列臺式機處理器

    近日,英特爾正式推出了酷睿Ultra 200S系列處理器家族,為臺式機平臺帶來了全新的AI PC功能。此次發(fā)布處理器家族涵蓋了5
    的頭像 發(fā)表于 10-11 17:36 ?492次閱讀

    英特爾發(fā)布至強6性能核處理器,攜手生態(tài)加速數(shù)據(jù)中心算力升級

    9月26日,英特爾正式發(fā)布英特爾? 至強? 6性能核處理器(代號Granite Rapids),為AI、數(shù)據(jù)分析、科學(xué)計算等計算密集型業(yè)務(wù)提
    的頭像 發(fā)表于 09-27 10:54 ?3832次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>發(fā)布</b>至強6性能核<b class='flag-5'>處理器</b>,攜手生態(tài)加速數(shù)據(jù)中心算力升級

    英特爾發(fā)布至強6處理器產(chǎn)品

    以“綠色向新,釋放新質(zhì)生產(chǎn)力”為主題的英特爾至強6能效核處理器新品發(fā)布會在北京舉行。會上英特爾重磅推出首
    的頭像 發(fā)表于 09-23 15:48 ?359次閱讀

    英特爾亮相2024云棲大會,共話AI時代發(fā)展新機

    近日,英特爾亮相2024云棲大會,與阿里云及一眾行業(yè)合作伙伴共同探討AI時代云計算的前沿技術(shù)和在諸多領(lǐng)域的先進解決方案。會上英特爾預(yù)覽
    的頭像 發(fā)表于 09-23 09:18 ?371次閱讀
    <b class='flag-5'>英特爾</b>亮相2024云棲<b class='flag-5'>大會</b>,共話<b class='flag-5'>AI</b>時代發(fā)展新機

    英特爾至強6系列處理器:全能核心,滿足各種工作需求

    英特爾去年Hot Chips大會上宣布,全新至強6系列處理器分為全能效核與全性能核兩大產(chǎn)品線,
    的頭像 發(fā)表于 08-30 15:15 ?532次閱讀

    英特爾至強6處理器上市

    北京這座古都的現(xiàn)代舞臺上,英特爾?舉行了一場別開生面的新品發(fā)布會,主題為“綠色向新,釋放新質(zhì)生產(chǎn)力”。此次盛會聚焦英特爾至強? 6能效核
    的頭像 發(fā)表于 06-11 09:51 ?566次閱讀

    英特爾CEO:AI時代英特爾動力不減

    英特爾CEO帕特·基辛格堅信,AI技術(shù)的飛速發(fā)展之下,英特爾處理器仍能保持其核心地位。基辛格公開表示,摩爾定律仍然有效,而
    的頭像 發(fā)表于 06-06 10:04 ?419次閱讀

    已有超過500AI模型英特爾酷睿Ultra處理器上得以優(yōu)化運行

    近日,英特爾宣布全新英特爾 酷睿 Ultra處理器上,有超過500AI模型得以優(yōu)化運行。
    的頭像 發(fā)表于 05-11 09:31 ?713次閱讀

    英特爾酷睿Ultra處理器突破500個AI模型優(yōu)化

    英特爾最新推出的英特爾? 酷睿? Ultra處理器上宣布,超過500AI模型已得到優(yōu)化運行。
    的頭像 發(fā)表于 05-09 11:18 ?761次閱讀

    英特爾重磅發(fā)布全新AI戰(zhàn)略,攜手生態(tài)共同釋放企業(yè)AAI潛力

    近期舉行的Intel Vision 2024大會上英特爾重磅發(fā)布其開放的、可擴展的全新AI戰(zhàn)略,同時公布
    的頭像 發(fā)表于 04-28 11:11 ?555次閱讀
    <b class='flag-5'>英特爾</b>重磅<b class='flag-5'>發(fā)布</b>全新<b class='flag-5'>AI</b>戰(zhàn)略,攜手生態(tài)共同釋放企業(yè)AAI潛力

    英特爾和AMD處理器的區(qū)別和特點

    。 性能是處理器最重要的特點之一。在過去的幾十年里,英特爾一直是處理器性能的主導(dǎo)者。他們的處理器單核和多核性能上表現(xiàn)出色,提供更好的速度和
    的頭像 發(fā)表于 01-30 14:28 ?2492次閱讀

    成都匯陽關(guān)于成英特爾推出多款新品,24 年或成為 AI PC 出貨元年

    英特爾發(fā)布酷睿 14 代系列新品,臺式+移動場景全覆蓋】 CES 2024 大會上英特爾推出了酷睿第 14 代臺式和移動端
    的頭像 發(fā)表于 01-18 10:10 ?593次閱讀

    英特爾酷睿14代處理器系列發(fā)布,Arrowlake/LunarLake24年問世

    處理器英特爾
    looger123
    發(fā)布于 :2024年01月10日 17:44:38
    主站蜘蛛池模板: 被老总按在办公桌吸奶头| 久久机热视频 这里只有精品首页| 老头扒开粉缝亲我下面| 手机毛片免费看| 607080老太太AW| 韩国伦理三级| 甜宠溺H宝贝嗯撞PLAY啊| 99久久精品国产一区二区三区| 护士日本xx厕所| 天上人间影院久久国产| x8国产精品视频| 麻豆国产精品AV色拍综合| 亚洲精品第五页中文字幕| 高清午夜福利电影在线| 男生在床上脱美女 胸| 又黄又湿免费高清视频| 国产在线亚洲v天堂a| 色欲AV精品人妻一二三区| hdxxxx58丝袜连裤袜| 老师小扫货水能么多叫出来| 亚洲精品国产拍在线观看| 国产精品18久久久久久欧美网址| 欧亚一卡二卡日本一卡二卡| 2022国产精品不卡a| 久久国产影院| 亚洲中文字幕一二三四区苍井空 | 国产一区二区波多野结衣| 四川老师边上网课边被啪视频| jizzhd中国| 欧美性最猛xxxx在线观看视频| 最近免费视频中文2019完整版| 花蝴蝶在线观看中字| 亚洲成人综合在线| 国产精品视频免费视频| 色mimi| 床上色APP下载免费版| 日本粉嫩学生毛绒绒| 草莓视频免费在线观看| 青青草在线 视频| qvod影院| 日本免费一本天堂在线|