異質運算架構(HSA)將有助實現高效能、低功耗處理器設計。隨著HSA標準和軟體解決方案日益成熟,處理器研發人員將能利用此技術促進系統單芯片(SoC)內部的異質核心協同運作,并透過軟體將復雜任務分配至最合適的運算單元,進而兼顧高運算效率和低能源消耗。
異質運算的時代終于來臨,恰好能夠解救處理器設計者脫離為迎合摩爾定律的28奈米(nm)新制程成本增加問題。處理器設計師不必只是仰賴昂貴的低功率電晶體,而是可以透過系統架構改善,將軟體工作負載分配至不同異質運算單元,藉此協助降低能源消耗。
業界大廠合力推動 HSA技術受矚目
近年來,處理器能源效率的進步,多半是因為朝小型化半導體制程的迅速發展,隨著制造技術的推陳出新,每一電晶體的成本不斷提高,異質系統架構(Heterogenous System Architecture, HSA)等替代技術因此而崛起。
不同于仰賴相同通用中央處理器(CPU)核心的同質處理器架構,HSA連結多種運算核心,如CPU、繪圖處理器(GPU)、數位訊號處理器(DSP)、現場可編程閘陣列(FPGA)及固定功能硬體等,各類核心針對不同類型的應用工作負載而優化。
由超微半導體(AMD)、安謀國際(ARM)、Imagination、聯發科、高通(Qualcomm)、三星電子(Samsung Electronics)與德州儀器(TI)等所設立的“HSA基金會”,旨在確保應用程式能夠將任務分配至對于特定工作負載具有最高電源效率的超微次世代繪圖核心(GCN)運算單元,藉此妥善管理應用程式執行。HSA基金會建立一套連接異質運算核心的開放標準,讓各家業者得以各自發展支援共同軟體基礎架構的解決方案,從而實現具有高效能及高電源效率的異質應用。
同時支援x86/ARM架構 HSA實現跨平臺設計
超微半導體于2014年初發表A系列加速處理器(APU)--Kaveri,可支援HSA功能。軟體業者能夠利用該系統,設計出廣泛部署支援HSA之應用程式所需的軟體開發工具。
HSA 的重要特性之一是能跨平臺支援x86產品及安謀國際架構產品,并具備開發系統,可供開發支援HSA中間語言(HSAIL)的編譯器及其他工具,促進真正的可攜式應用。2014年6月首次公開發布HSA系統架構規格(暫定為版本1.0)后,現已有更多軟體開發團隊能夠得知HSA的詳情,進而利用更為簡單的 HSA異質運算編程模型開發出新的節電演算法。
由于目前系統效能擴展受限于電力消耗,超微半導體已著手研發支援高度平行任務,可于 CPU與GPU間無縫平移的異質運算形式。這項技術創新構成HSA的基礎,帶來加強能源效率,同時提升效能并維持可編程性的契機。而要整合CPU與GPU 于同一芯片,關鍵就在于GPU的設計。
每單位能源消耗所完成的工作是通用的能源效率指標。舉例來說,一臺筆記型電腦的效率越高,就能讓使用者以越少的電池耗電量及越低的發熱程度完成相同任務。就行動運算而言,美國能源之星計畫(United States Energy Star Program)制定一套典型耗能的合理概算標準;特別的是,這套標準是以“短期閑置”電力為主要依據。
一般而言,存取文件或打開網頁之后,使用者會花時間檢視結果。這樣的閑置期間在現代系統中可能短如按鍵輸入之間或影片訊框之間的間隔,這段時間處理器會進入低耗電狀態。因此,超微半導體將運算能力除以標準能源使用,定義為其行動裝置芯片的通常使用效率。例如,將兩臺效能相近的筆記型電腦相較,使用者必然偏好電池續航力較長的機種。同樣地,若將兩臺電池續航力相同的筆記型電腦相較,使用者必然也會傾向選擇效能較高且反應速度較快的那一臺。這兩種情況都能透過標準使用能源效率指標具體呈現。
超微半導體計畫于未來6年之內將標準使用能源效率提升二十五倍,且已委托市場分析公司Tirias Research技術分析師就此目標加以評估,并為超微半導體所做研究的結果統整成一份技術白皮書,公布于Tirias Research網站。
為達成二十五倍如此積極的目標,超微半導體將廣泛運用各種資源,除著重架構、設計及軟體等方面之外,還將輔以矽晶圓制程技術。具體而言,超微半導體將聚焦于以下三大面向:
這些改良有助于降低閑置耗電,并發揮快速完成工作以更快回復低耗電狀態的“加速進入閑置模式(Race To Idle)”優點。
.強化異質運算能力
HSA能夠幫助APU提升一般工作負載效能(如以PCMark 8 v2.0等產業標準為基準測試所示),以及新興的視覺導向互動工作負載(如自然使用者介面連同影像及語音辨識)。
.高電源效率實施的創新
透過運用如先進功率閘控、低電壓操作等技術以及進一步整合系統組件等做法,提升APU矽智財(IP)效率。
Tirias Research指出,將降低閑置耗電及智能化電源管理所達成的節電功效,同時與異質運算效能提升和程序改善相結合。超微半導體應能達成在2014?2020年之間實現二十五倍標準使用能源效率改善的目標。
超微半導體目前已將筆記型電腦中的GPU、記憶體控制器、輸入/輸出(I/O)控制器及周邊匯流排等系統組件全部都整合于單一晶粒中,可實現同時監控CPU 與GPU的精密化電源管理。這項技術能夠有效平衡兩種單元之間的電力最佳化,將散熱能力集中在最須要散熱的單元。除此之外,將GPU移至CPU晶粒,可以減少所需要之記憶體介面數量,同時還可以達到省電之效果。
超微半導體的智能電源管理以專用晶粒控制器追蹤功耗、溫度及各主要組件活動情形,使APU進一步提升效率。這種功率微控制器就像是“APU交響曲”的指揮,在正確的時間將處理重點導向正確的位置,其可快速回應熱事件,控制器能夠快速分配電力到CPU的特定部位,以發揮最大效能與效率。另外,也能判斷各單元何時最無活動現象,并將其運作降低至最小狀態或將之完全關閉。
處理元件若能以最短時間完成工作,然后進入最深休眠狀態,即達到其最大能源效率。這種“加速進入閑置模式”行為對于網頁瀏覽、文件編輯和相片編輯等多數消費者導向任務都很有助益。協調GPU與CPU的使用能夠使APU更快完成任務,然后降低功率、減少總耗能(能量=功率×時間)。此一耗電狀態過渡時間應極短,使單元盡快降低功率,讓處理器能夠在使用者進行按鍵輸入或影片訊框之間,就可進入閑置狀態。
借重HSA編程架構 處理器達成高效能/低功耗
超微半導體現正著手設計與1.0版HSA相容的新款APU,而HSA規格的目的在于協助軟體利用GPU及其他處理元件的功率與效能。以GPU而非CPU來執行高度平行碼時,APU能夠利用其GPU核心的能源效率,以及巨量平行運算來處理工作負載,更快完成任務。HSA編程架構可將工作負載導向最佳芯片資源,例如專為特定演算法所設計的加速器,其設計宗旨在于減少完成固定工作負載所需周期數量及電力消耗,并在行動裝置的功率限制內執行高階運算密集式應用程式,轉由GPU而非CPU處理之后,高階行動應用程式(如語音辨識、手勢辨識、臉部辨識等次世代使用者介面和相片索引)都能獲得次方程度的效能改善。
個人電腦處理器的效能隨時間而成長,但步調相對較慢。另一方面,由于設計者將更多芯片空間留給圖形處理,以支援4K解析度的顯示設備,GPU效能得以快速攀升。藉由HSA架構,超微半導體就能善用這種GPU效能成長。將GPU用于一般任務的優點,展現于個人電腦應用程式和基準測試中(圖1)。
圖1 標準35W行動處理器的GPU運算趨勢
OpenCL 是首批支援以GPU執行平行運算的業界標準編程語言之一,可供C程式發揮語言擴充的功效,為代碼的運算密集部分帶來次方程度的效能提升。采用OpenCL 1.x(以OpenCL 2.x全面啟用HSA的前身)加速時,PCMark 8 v2.0基準測試展現多達25%的增益(圖2)。
圖2 現有平臺經由GPU卸載所達成的PCMark 8 v2.0加速
回頭參考圖1所示,異質架構利用GPU效能的快速成長,而GPU效能遠勝近代CPU效能,GPU仍會是讓未來處理器實現更高效能與能源效率的關鍵。每一個 GPU都有多個“著色器”核心(超微半導體將其稱之為“串流處理單元”),每個核心都能處理整數或浮點運算,同時維持小于標準CPU核心的體積與耗電量。而且,由于每一個著色器核心都很小,所以單一晶粒可以整合數十甚至數百個著色器核心與個位數的通用CPU核心。因此,GPU可以對運用這么多處理核心的工作負載,產生次方以上程度的運算提升。上述所提及的每一種高階應用程式,都可利用GPU固有的平行運算能力,來達成如此驚人的效能增益,而且耗電量極低。
圖3顯示超微半導體從2008年“Puma”CPU處理器,到2020年預測APU的標準使用耗電降低趨勢。虛線表示至2015年的耗電趨勢,Tirias Research預測超越此點后至2020年之間降低速度會相對減緩,因為耗電已趨近于0瓦(W)。但Tirias Research預測2015年,異質運算將大幅提升,驅動與GPU能力相稱的更高效能水準。
圖3 APU的能源使用與運算趨勢
閑置耗電量降低,將可以幫助標準使用耗電,得以從相鄰的2008年平臺“Puma”CPU的近4W,降低至2014年“Kaveri”APU的1.6W,將會產生2.5倍的基準耗電量改善(兩種產品都適用于相同的35W筆記型電腦熱功率封包)。數量更多的CPU核心、更快的時脈速度,以及GPU運算協助,使得處理器效能得以改善,讓“Kaveri”的運算力比起“Puma”高達4.5倍。因此,相較于“Puma”,“Kaveri”提供十倍 (2.5×4.5)以上的標準使用能源效率增加,如標準耗能最大效能所示。
Tirias Research預估超微半導體將利用多項遠遠超越“Kaveri”的效能改善,在2015年達成下一次的大幅耗電降低。由于耗電漸趨于零,且開始以平臺組件功率為主,未來的閑置耗電降低步調必將趨緩。Tirias Research分析,根據超微半導體產品規畫,該公司可望在2008年至2020年之間實現標準使用耗電量的大幅降低,在此12年間達成16倍的改善,如圖3A線所示。
有鑒于GPU的效能預計將持續提升,且可運用此種異質運算能力(圖3中B實線)的應用程式將越來越多,Tirias Research預測超微半導體將于2020年達到對等點。在此點上,約有一半的尖峰值效能將來自GPU,另一半則來自CPU。保守估計,由于CPU及 GPU兩者都在持續進化,這種矽芯片資源分配方式能夠使2020年的未來APU相較于2014年的“Kaveri”產生四倍的運算效能提升。
Tirias Research相信更大的GPU和更趨平行的應用程式將有助于促進更顯著的效能改善。以此合理保守估計額外的四倍運算效能提升,結合至少六倍的標準使用耗電量降低,將可使超微半導體的最大效能對閑置耗電比在2014年至2020年之間展現高達二十五倍的改善。這是十分驚人的大幅變化,兼具兩方面之長,低閑置耗電既可以減少能源耗用,又能以高峰值效能支援未來的高階應用。
由于HSA可降低對于APU之CPU端的依賴程度,超微半導體將之視為改善高度平行工作負載效能與節電的必要方法。除了GPU之外,超微半導體現正配合智能型手機芯片開發者所需,將單一功能加速器整合于APU。這些專用加速器的設計目標是以最小晶粒面積提供最高能源效率表現,將耗電量降到最低。專用單元的缺點在于無法輕易適應新的演算法,因為可編程性的有限。而其他替代性可編程單元如以通訊與音訊處理見長的數位訊號處理器,可替CPU核心分擔相關任務。
例如,超微半導體已于其最新APU及GPU中加入數位音效處理器,藉此解除CPU處理音訊的負擔。對如音訊處理等工作負載而言,這些微小的架構新增可帶來極大的功率效率增益,相較于單獨以CPU處理,其增益可達兩倍至將近二十五倍不等。
超微半導體運用支援HSA的軟體結合其節電設計,讓筆記型電腦和平板電腦APU的電池續航力與峰值效能勝過現今水準。
評論
查看更多