GN7是全球首個公有云上基于NVIDIA T4以及vComputeServer的虛擬化實例,能夠加速人工智能、機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)的工作負(fù)載。
今日,騰訊云正式對外發(fā)布基于 NVIDIA T4 的虛擬GPU(vGPU)計算產(chǎn)品GN7實例,這也是全球首家公有云實現(xiàn)了基于NVIDIAT4GPU及NVIDIA vComputeServer軟件的vGPU實例。
基于多精度支持,NVIDIA T4擁有可加速深度學(xué)習(xí)訓(xùn)練和推理、機(jī)器學(xué)習(xí)以及數(shù)據(jù)科學(xué)工作負(fù)載的 Tensor Core,以及豐富的平臺堆棧,包括用于深度學(xué)習(xí)的cuDNN、用于數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的NVIDIARAPIDS、用于云工作站圖形的NVIDIAQuadro虛擬工作站和用于云游戲的NVIDIA游戲軟件。結(jié)合用于GPU虛擬化的 vComputeServer軟件,騰訊云客戶可以靈活選擇在虛擬環(huán)境中運行GPU加速的工作負(fù)載,從而在提高安全性和利用率的同時降低成本。
騰訊云副總裁劉穎表示:“人工智能的迅速發(fā)展對算力需求提出了各種挑戰(zhàn),而我們專注解決這些問題,為客戶提供全方位的產(chǎn)品解決方案。騰訊云GN7實例通過部署NVIDIA T4 GPU,提供豐富多樣的實例規(guī)格,滿足從計算視覺到語音以及NLP等不同層次的算力需求。NVIDIA vComputeServer進(jìn)一步豐富了算力粒度,為用戶提供了更多選擇的可能,最終為客戶節(jié)省成本。”
NVIDIA專業(yè)可視化業(yè)務(wù)副總裁Bob Pette表示:“企業(yè)正在迅速實施人工智能(AI)策略,AI策略需要依靠現(xiàn)代應(yīng)用程序才能實現(xiàn),而現(xiàn)代應(yīng)用程序則需強大算力的支持。如今,在NVIDIA vComputeServer的助力之下,騰訊云可以輕松地幫助客戶實施并擴(kuò)展數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、AI以及企業(yè)中的其他工作負(fù)載。”
多重特性,廣泛適用不同AI場景
憑借強大的計算能力和彈性能力,GN7實例在海量數(shù)據(jù)處理和人工智能領(lǐng)域都具有廣闊的應(yīng)用價值。它既可以滿足諸如搜索、大數(shù)據(jù)分析等需要對海量數(shù)據(jù)進(jìn)行處理的業(yè)務(wù)場景,也可以作為深度學(xué)習(xí)訓(xùn)練和推理的系統(tǒng)平臺。GN7實例的虛擬化特性也十分適合互聯(lián)網(wǎng)業(yè)務(wù)中人工智能業(yè)務(wù)的批量部署以及云游戲,AR/VR在云端的應(yīng)用。目前GN7實例已經(jīng)在騰訊云自有的智能鈦彈性模型服務(wù)(TI-EMS)上實現(xiàn)了應(yīng)用。該平臺通過使用vGPU做小模型推理,幫助用戶解決復(fù)雜模型部署和GPU利用成本效益等問題。
進(jìn)一步降低成本
GN7實例降低了GPU加速的初始投資成本,是初創(chuàng)企業(yè)、大學(xué)和企業(yè)在評估AI時的經(jīng)濟(jì)選擇。 NVIDIA vComputeServer軟件通過對NVIDIAT4進(jìn)行虛擬化,使多臺虛擬機(jī)(VM)可以同時訪問GPU或者使一臺虛擬機(jī)可以訪問多顆 GPU,從而實現(xiàn)性能的最大化。因此,騰訊云用戶可以根據(jù)工作負(fù)載的需求靈活選擇對應(yīng)的GPU加速量。
比如在進(jìn)行簡單模型推理這一類低算力需求的應(yīng)用時,用戶無須再像以往必須使用單顆物理GPU,而是可以根據(jù)自身業(yè)務(wù)具體類型對GPU算力的需求,靈活選擇匹配的vGPU資源,提升了計算資源的利用率,從而有效降低用戶的使用成本,避免因配置不足或配置過度而產(chǎn)生成本。比如,通過使用1/2 vGPU實例規(guī)格,成本相對單卡實例降低了50%。
更出色的安全性
一直以來,騰訊云都在致力于通過最新虛擬化技術(shù)研發(fā)為用戶提供最安全最便利的異構(gòu)計算產(chǎn)品。GN7實例具有更出色的性能與安全性,能夠安全隔離公有云上的實例。 相比過往進(jìn)程級別的虛擬化GPU,GN7的升級點在于其提供的設(shè)備級虛擬化vGPU是完全模擬出來一個GPU設(shè)備,在支持GPU硬件的絕大多數(shù)特性的同時,還能夠做到操作系統(tǒng)級別的隔離,而且不同的用戶使用也不用擔(dān)心資源爭搶的問題。
下周,在于蘇州舉辦的GTC大會上,騰訊云海將會演示NVIDIA GPU加速的云服務(wù),并介紹如何從云端部署AI工作負(fù)載。
責(zé)任編輯;zl
-
gpu
+關(guān)注
關(guān)注
28文章
4729瀏覽量
128890 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238263 -
騰訊云
+關(guān)注
關(guān)注
0文章
210瀏覽量
16782
發(fā)布評論請先 登錄
相關(guān)推薦
評論