- GPU要超越CPU擠身一線主角還得靠AI
今年GTC大會聚焦AI、VR/AR與無人汽車應(yīng)用
今年在美國圣荷西舉行的GTC技術(shù)大會(GPU Technology Conference),也因為AI、VR/AR、無人汽車的關(guān)系而格外備受矚目。今年總共吸引了全球超過5千人參加,更有將近上百位的全球媒體、分析師到場,還有多達(dá)2百家廠商參展,規(guī)模是歷年來最大。而做為主辦方的Nvidia今年氛圍也很不一樣,Nvidia不僅在現(xiàn)場同時發(fā)布多款與深度學(xué)習(xí)和AI有關(guān)GPU新品,還針對了原本就擅長的VR/AR與自動駕駛應(yīng)用領(lǐng)域推出了新的開發(fā)工具和產(chǎn)品,希望就此能讓VR/AR與自動駕駛可以更進一步應(yīng)用。
也正因為AI、VR/AR與自駕車讓GPU的應(yīng)用更廣了,因而造就了GPU在這次GTC大會扮演的重要性和應(yīng)用性明顯提高不少,特別是AI與深度學(xué)習(xí)的應(yīng)用方面,今年更成為會場上最炙手可熱的技術(shù)話題,在為期4天超過240場大小場的GPU主題講座中,有半數(shù)以上都圍繞著AI與深度學(xué)習(xí)而打轉(zhuǎn),這還不包括了來自2位人工智慧界的重量級AI大師,分別是IBM人工智慧研究和技術(shù)策略的IBM Watson 技術(shù)長Rob High與豐田汽車研究機構(gòu)執(zhí)行長Gill Pratt,今年都親自到場分享他們所觀察到的最夯AI技術(shù)和應(yīng)用新進展。
Nvidia執(zhí)行長黃仁勛在今年主題演說中也強調(diào)GPU未來角色的重要性,將替深度學(xué)習(xí)與AI開啟一種前所未有的全新運算模式(Computing Model),將促使深度學(xué)習(xí)成為未來企業(yè)甚至每個人,都不能加以忽視的大事(Big Deal ),甚至將開啟另一種AI即平臺的新服務(wù)模式(AI-as-a-Platform)。而為了搶攻AI與深度學(xué)習(xí)市場,Nvidia今年甚至還罕見地,首度發(fā)表世上第一臺整套式深度學(xué)習(xí)專用的超級電腦DGX-1。
Nvidia執(zhí)行長黃仁勛在今年主題演說中數(shù)度強調(diào)GPU未來角色的重要性,將替深度學(xué)習(xí)與AI開啟一種前所未有的全新運算模式(Computing Model),將促使深度學(xué)習(xí)成為未來所有企業(yè)甚至每個人,都不能加以輕忽的大事(Big Deal ),甚至帶來一種AI即平臺的新服務(wù)模式(AI-as-a-Platform)。而為了搶攻AI與深度學(xué)習(xí)市場,Nvidia今年甚至還罕見地,首度發(fā)表世上第一臺整套式深度學(xué)習(xí)專用的超級電腦DGX-1。
AI專用服務(wù)器將助企業(yè)加快深度學(xué)習(xí)應(yīng)用
Nvidia在這臺深度學(xué)習(xí)專用的超級電腦DGX-1內(nèi),使用了服務(wù)器專用的GPU加速器Tesla P100為基礎(chǔ)而打造完成,Tesla P100采用了新一代Pascal架構(gòu)設(shè)計,比前一代Maxwell架構(gòu)的GPU加速器,在用來訓(xùn)練神經(jīng)網(wǎng)路的效能方面,Nvidia宣稱,Tesla P100足足有提升12倍之多。
Nvidia在這組超級電腦內(nèi)總共裝入8張Tesla P100加速卡,使得DGX-1在半精度(FP16)的浮點運算次數(shù)每秒高達(dá)有170TFLOPS,如此高度的運算能力,Nvidia甚至宣稱,只要有了DGX-1,就等同于擁用了250臺x86服務(wù)器而搭建的運算叢集規(guī)模,將有助于企業(yè)在深度學(xué)習(xí)方面獲得更好的應(yīng)用效果。
而靠著DGX-1的高度運算能力,也因而縮短了過去用來做為深度學(xué)習(xí)訓(xùn)練所需花費的冗長時間,若以單組2路Xeon E5服務(wù)器和DGX-1進行比較的話,根據(jù)Nvidia測試的結(jié)果,在做為AlexNet機器學(xué)習(xí)的模型訓(xùn)練方面,DGX-1完成訓(xùn)練所花費的時間要遠(yuǎn)比Xeon E5服務(wù)器還快許多,Xeon級服務(wù)器得要花150小時才能做完的訓(xùn)練,DGX-1只須2小時就能完成。若以訓(xùn)練機器辨識照片來舉例的話,所代表的是,每天被喂給DGX-1機器做訓(xùn)練的照片,數(shù)量高達(dá)有13億張。
除了GPU以外,這臺DGX-1還有配置了一個2路Xeon E5 CPU處理器,系統(tǒng)記憶體部分最大則可支援512GB DDR4的記憶體容量,并也配備有7TB大小的SSD硬碟,至于電力供給部份則是使用一臺3U高度3,200瓦的電源供應(yīng)設(shè)備,還支援了NVLink 混合式立方網(wǎng)格 (NVLink Hybrid Cube Mesh)技術(shù),可提供更高速GPU互連的能力,網(wǎng)路部分則提供了雙10GbE連接埠和一個100Gb的Quad InfiniBand高速網(wǎng)路介面,而使得每臺DGX-1機器的總傳輸頻寬,每秒最高可達(dá)768GB。
不僅如此,Nvidia在這臺DGX-1中加入許多新的深度學(xué)習(xí)軟體功能,像是新增加的Nvidia深度學(xué)習(xí)GPU訓(xùn)練系統(tǒng)(Deep Learning GPU Training System,DIGITS),可用來協(xié)助企業(yè)設(shè)計一個完整且互動的神經(jīng)網(wǎng)路,還支援了 CUDA深度神經(jīng)網(wǎng)路圖庫(CUDA Deep Neural Network library,cuDNN )的v5新版本,可用來做為設(shè)計神經(jīng)網(wǎng)路時可供GPU加速的函式圖庫。DGX-1系統(tǒng)內(nèi)也提供了一些深度學(xué)習(xí)優(yōu)化的框架,例如Caffe、Theano與Torch等,另還搭配一套云端管理存取的工具和一個容器應(yīng)用儲存庫(Repository )。
Nvidia這臺深度學(xué)習(xí)專用的超級電腦DGX-1,主要是使用了服務(wù)器專用GPU加速器Tesla P100來打造完成的AI專用服務(wù)器,因而在這臺機器內(nèi)總共裝入8張Tesla P100加速顯卡,使得DGX-1在半精度(FP16)的浮點運算次數(shù)每秒可高達(dá)170TFLOPS,如此高度的運算能力,Nvidia甚至宣稱,這幾乎等同于用250臺x86服務(wù)器而搭建的運算叢集規(guī)模,將助企業(yè)獲得更好的深度學(xué)習(xí)作用。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
相關(guān)閱讀:
- [電子說] Blackwell GB100能否在超級計算機和AI市場保持領(lǐng)先優(yōu)勢? 2023-10-24
- [電子說] 如何使用Rust創(chuàng)建一個基于ChatGPT的RAG助手 2023-10-24
- [電子說] 訊飛星火大模型V3.0正式發(fā)布,全面對標(biāo)ChatGPT 2023-10-24
- [電子說] 如何創(chuàng)建FPGA控制的機器人手臂 2023-10-24
- [電子說] 亞馬遜云科技生成式AI最新案例分析,助力企業(yè)業(yè)務(wù)創(chuàng)新迭代 2023-10-24
- [電子說] 怎樣延長半導(dǎo)體元器件的壽命呢? 2023-10-24
- [電子說] 新思科技攜手臺積公司加速N2工藝下的SoC創(chuàng)新 2023-10-24
- [電子說] 服務(wù)器硬盤通用基礎(chǔ)知識 2023-10-24
( 發(fā)表人:包永剛 )