NVIDIA發(fā)明的具有主動(dòng)電源管理系統(tǒng)的GPU,借助于人工智能技術(shù),在保證性能的前提下提供了更好的可靠性,并且可用于需要高度可靠性的計(jì)算場(chǎng)景中。
3D圖形顯卡在1999年NVIDIA公司推出GeForce 256時(shí)開始了其首次變革,這種硬件光影轉(zhuǎn)換技術(shù),極大的提高了計(jì)算機(jī)的圖像顯示性能,對(duì)游戲領(lǐng)域產(chǎn)生了重要的革命意義,同時(shí)也帶給了用戶極高的畫面真實(shí)感。
當(dāng)前,圖形處理器已經(jīng)無處不在,GPU不再僅僅用于圖形應(yīng)用,而是被廣泛用于密集計(jì)算操作的應(yīng)用程序,包括人工智能、實(shí)時(shí)識(shí)別和自動(dòng)駕駛等領(lǐng)域中。
就在2020年9月2日凌晨,NVIDIA發(fā)布了RTX30系列顯卡,分別為RTX3070、RTX3080和RTX3090,據(jù)悉,3070的性能比2080更強(qiáng),價(jià)格確更加便宜,3080的性能是2080的兩倍,價(jià)格卻和2080一樣,而3090則支持8K 60幀光線追蹤。
而隨著人工智能芯片的興起,不僅僅是各種人工智能訓(xùn)練需要借助于NVIDIA的圖形顯卡,NVIDIA也在嘗試將人工智能技術(shù)應(yīng)用在GPU圖形處理單元中。在18年,NVIDIA發(fā)布了一款全新的AI芯片,它將價(jià)值10000美元的性能,塞進(jìn)了一個(gè)售價(jià)僅為1299美元的小盒子,30W功耗就可以與1萬美元的工作站媲美。
無疑,這樣的技術(shù)對(duì)于AI芯片的功耗的要求非常高,因此需要電源控制器來最小化AI芯片的功率。為達(dá)此目的,NVIDIA在2020年2月13日發(fā)明了一項(xiàng)名為“指令和機(jī)器學(xué)習(xí)的能量特征有效地操作處理系統(tǒng)的技術(shù)”的發(fā)明專利(公開號(hào):US 2020/0050920 A1),申請(qǐng)人為NVIDIA公司。
根據(jù)該專利目前公開的資料,讓我們一起來看看這項(xiàng)AI芯片的動(dòng)態(tài)功率控制技術(shù)吧。
如上圖,為該專利中發(fā)明的AI芯片中主動(dòng)電源管理控制系統(tǒng)的示意圖,系統(tǒng)100中包含有多個(gè)GPU(102),這些GPU通過數(shù)字通信總線與其他部件互相通信。在供電方面,這些GPU由配電網(wǎng)110供電,電源管理單元140監(jiān)視著配電網(wǎng)供給的電流,同時(shí)電源管理單元接受由并行處理器116發(fā)送的功率控制指令。
基于GPU當(dāng)前的工作功率以及處理器所發(fā)送的信號(hào),電源管理單元可以預(yù)測(cè)處理器在未來時(shí)段所需要的電量,并控制提供給GPU的電壓,以便于為GPU提供適當(dāng)?shù)墓β省_@樣不僅可以保證GPU發(fā)揮穩(wěn)定的性能,同時(shí)也可以控制GPU的功耗,更重要的是,通過預(yù)先在需要高功率的時(shí)段來限制其功率,可以避免出現(xiàn)電流過載的情況,否則可能導(dǎo)致電路損壞或者電源過熱。
由此看來,電源管理模塊的預(yù)測(cè)工作是十分重要的,在NVIDIA的方案中,使用基于硬件的深度學(xué)習(xí)加速器對(duì)于深度神經(jīng)網(wǎng)絡(luò)進(jìn)行加速,從而對(duì)處理器的功耗進(jìn)行預(yù)測(cè)。
如上圖,為預(yù)測(cè)GPU功率的功率控制技術(shù)流程圖,首先,輸入功率監(jiān)視器采用ADC(數(shù)模轉(zhuǎn)換芯片)來對(duì)于提供給GPU的電源進(jìn)行采樣,采樣包括輸入的電流以及電壓,并將采樣結(jié)果轉(zhuǎn)換為數(shù)字信號(hào)輸出。
其次,并行處理器接收預(yù)測(cè)功率信號(hào)的指令,這樣可以確定預(yù)測(cè)的GPU功率與當(dāng)前功率之間的差值,在確定誤差之前,需要對(duì)預(yù)測(cè)功率進(jìn)行縮放,以使其與當(dāng)前功率處于正常的比例之中。
這種操作基于深度學(xué)習(xí)的方法,來更新自適應(yīng)PID控制器,因?yàn)椴⑿刑幚砥鞯墓ぷ髫?fù)載可以在短時(shí)間尺度上變化,因此,處理器可以主動(dòng)控制輸入到GPU的電源,并根據(jù)并行處理器中的工作負(fù)載變化來優(yōu)化處理器的性能和功耗。
如上圖,為這種具有學(xué)習(xí)機(jī)制的實(shí)現(xiàn)主動(dòng)電源管理技術(shù)的電路示意圖,其中電路400包括ADC(118)、濾波和縮放器電路420、狀態(tài)向量寄存器430、PID控制器440、電壓控制器450以及學(xué)習(xí)系統(tǒng)460。
該專利中特別提及,雖然處理器可以通過對(duì)于指令進(jìn)行解析,來估計(jì)是否需要更高或者更小的功率,但是處理器可能并不知道通過執(zhí)行這種指定的指令具體需要消耗多少功率。
這就像一個(gè)長(zhǎng)跑運(yùn)動(dòng)員,他可能大概知道在半程馬拉松比賽中可能會(huì)消耗多少卡路里的能量,但是通常無法預(yù)測(cè)小段路途中的具體卡路里能量消耗,因?yàn)榫唧w的能量消耗與太多的因素關(guān)聯(lián),例如環(huán)境條件、溫度、實(shí)際速度以及自身體重等的變化。
所以,具體的電源使用情況還是取決于處理器的軟件指令的特定順序,盡管處理器可以預(yù)估消耗的功耗,并對(duì)GPU的功率進(jìn)行大致的調(diào)整,但是由于制造工藝以及不同的計(jì)算任務(wù),因此并不能精準(zhǔn)的進(jìn)行功耗控制。
以上就是NVIDIA發(fā)明的基于人工智能的芯片功耗控制系統(tǒng),這種具有主動(dòng)電源管理系統(tǒng)的GPU智能芯片,在保證芯片性能的前提下具有更高的可靠性,因此可用于需要高度可靠性的計(jì)算環(huán)境,例如:數(shù)據(jù)種心、服務(wù)器環(huán)境等。此外,在目前較為火熱的智能駕駛領(lǐng)域中,這種方案不僅可以避免電流因?yàn)樗查g的下降而影響自動(dòng)駕駛的通信信號(hào),而且還可以通過實(shí)現(xiàn)更快的功率管理響應(yīng)來改善車輛的功耗消耗。
關(guān)于嘉德
深圳市嘉德知識(shí)產(chǎn)權(quán)服務(wù)有限公司由曾在華為等世界500強(qiáng)企業(yè)工作多年的知識(shí)產(chǎn)權(quán)專家、律師、專利代理人組成,熟悉中歐美知識(shí)產(chǎn)權(quán)法律理論和實(shí)務(wù),在全球知識(shí)產(chǎn)權(quán)申請(qǐng)、布局、訴訟、許可談判、交易、運(yùn)營(yíng)、標(biāo)準(zhǔn)專利協(xié)同創(chuàng)造、專利池建設(shè)、展會(huì)知識(shí)產(chǎn)權(quán)、跨境電商知識(shí)產(chǎn)權(quán)、知識(shí)產(chǎn)權(quán)海關(guān)保護(hù)等方面擁有豐富的經(jīng)驗(yàn)。
責(zé)任編輯:tzh
-
芯片
+關(guān)注
關(guān)注
456文章
50892瀏覽量
424347 -
gpu
+關(guān)注
關(guān)注
28文章
4743瀏覽量
129008 -
AI
+關(guān)注
關(guān)注
87文章
31000瀏覽量
269335 -
人工智能
+關(guān)注
關(guān)注
1792文章
47354瀏覽量
238825
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論