電子發燒友網報道(文/周凱揚)在今年的AWS re:Invent上,云服務巨頭亞馬遜公開了兩款全新的自研芯片,一是基于Arm架構的新一代Gravition CPU,Gravition4,另一款則是時隔數年終于更新的Trainium2。
第四代自研Arm服務器CPU
從2018年11月,到今年的11月,Gravition這一亞馬遜自研的服務器CPU已經迭代了數個版本,Gravition4作為該系列最新的產品,自然也擁有最強大的性能表現。Gravition4集成了96個Arm Neoverse V2內核,每個內核配置了2MB的L2緩存,加上12個DDR5-5600通道。相比上一代,Gravition4的核心數多出了50%,計算性能提高了30%,L2緩存變為兩倍,內存帶寬也提高了75%,可以毫無疑問地說,Gravition4將成為AWS自研硬件服務器矩陣的新王牌。
不過AWS計算與網絡服務副總裁David Brown表示,跑分與現實應用負載相去甚遠,往往不能代表芯片的真實性能表現,所以亞馬遜更愿意用實際應用的成績來展示Gravition4的性能提升。在MySQL這樣的數據庫應用中,Gravition4展現出了高出Gravition3 40%的性能。在網頁應用上,Gravition4比上一代快30%,在大型Java應用中快45%。
而且毫不夸張地說,Gravition4也是目前對 ML硬件支持最為完善的CPU了。除了自研的Inferentia和Trainium系列芯片以外,亞馬遜也為Gravition4組合打造了支持英偉達A100、H100、英特爾Habana Gaudi、高通AI100的容器。
訓練芯片終于迎來第二代
在去年的AWS re:Invent上,亞馬遜公開了全新的Inferentia2芯片,這也是其自研AI芯片矩陣中的推理芯片,但其訓練芯片Trainium卻沒有同步更新,直到今年的AWS re:Invent上Trainium2的發布,才終于為這個3年前開辟的產品線帶來了新品。
如今爆發式的生成式AI應用需要利用龐大的數據集進行訓練,比如最近興起的靜態圖片生成視頻應用。這些基礎模型或大語言模型的參數從千億到萬億不等,需要更高的算力才能支撐起來。
更高的性能也是Trainium2本次升級的重點,根據亞馬遜提供的數據,相較于第一代Trainium芯片,Trainium2提供了4倍的訓練性能和3倍的內存容量,與此同時還將能效比提高至上一代的兩倍。在擴展性上,亞馬遜最高可提供 10萬顆Trainium2芯片互聯,從而實現高達65 exaflops的算力,提供超算級的性能。在這樣的規模下,訓練一個3000億參數的LLM只要數周時間。
不過,與已經進入預先使用階段且未來幾個月就將開放使用的Gravition4不同,Trainium2應該仍在量產過程中,亞馬遜表示明年某個時間才會投入使用。
寫在最后
從亞馬遜雷打不動的發布頻率來看,他們在自研服務器芯片的設計上相當積極,多次首發Arm Neoverse的最新核心。而且從服務器部署情況來看,他們也沒有在量產上遇到太多的問題,幾乎可以推測除了英偉達以外,亞馬遜應該就是臺積電先進封裝的最大使用者了。此外,亞馬遜對待第三方硬件的策略也相當聰明,亞馬遜并沒有選擇去追求極致的性能,而是借助自研芯片打造更具性價比的方案。
-
亞馬遜
+關注
關注
8文章
2668瀏覽量
83404
發布評論請先 登錄
相關推薦
評論