不久之前,Meta公開了他們在自研芯片上的進展,包括其第一代AI加速器MTIA,以及用于視頻轉碼的MSVP。作為有些“下坡路”傾向的互聯網大廠,Meta依然選擇自研硬件和芯片,可見Meta對AI的重視。
自研AI加速器MTIA
Meta過去的服務器架構主要依靠CPU來運行AI負載,但隨著AI模型對算力和內存的要求不斷提高,致使其不得不開始轉向特化的方案,比如GPU和NNPI之類的其他硬件加速器。可由于高性能GPU的成本持續走高,Meta很快就轉向了自研ASIC方案。
其實早在2020年,他們就設計了第一代的MTIA ASIC,不過當時僅僅只是用于MTIA的部分內部工作負載,主要是為Pytorch和Meta的推薦模型聯合設計出來的,用于推理加速。第一代MTIA基于臺積電7nm工藝打造,性能達到了102.4TOPS@INT8和51.2 TFLOPS@FP16,功耗僅有25W。
MTIA v1裸片 / Meta
單個MTIA加速器集成了64個處理單元(PE),最高128GB的片外LPDDR5內存和128MB的片上SRAM。值得一提的是,每個處理單元都由兩個RISC-V處理器核心構成,其中一個還配備了向量擴展。
從Meta公布的v1版系統設計上可以看出,MTIA加速器裝在了一個小型的雙M.2主板上,方便設計者輕松地集成在服務器中,通過PCIe 4.0 x8接口與主CPU相連,板卡功耗僅有35W。
當然了,作為OCP的創始者,Meta也在服務器的設計上采用了OCP的Yosemite V3規范,每個服務器包含12個加速器,并使用PCIe Switch相連,根據Meta的說法,加速器的數目和服務器的配置參數是為了優化目前及未來的負載而精心選擇的。
自研視頻轉碼芯片MSVP
值得注意的是,MTIA v1還只是他們在2020年開發的第一代AI加速器,Meta的目標是設計一系列推薦用MTIA ASIC。不過,MTIA v1在自研程度上或許沒有我們想象得那么深入,比如其RISC-V核心很可能是來自第三方IP廠商的。
而與MTIA一并公開的MSVP,卻是Meta首個真正意義上的內部自研ASIC方案,專為解決Meta的視頻點播和直播負載而設計,甚至考慮到了其AR/VR業務。Meta認為,這類轉碼芯片的存在,會為Meta未來在元宇宙上布局的生成式AI短視頻,提供更多支持。
MSVP / Meta
據Meta強調,Facebook網站上的視頻流量每天就有40億播放量,所以提升壓縮效率,提供更高的穩定性、可靠性以及近乎無限的擴展性,就成了他們對自研視頻轉碼芯片的要求。從MSVP的設計架構上來看,除了多處理器的CPU子系統外,芯片大部分由轉碼核心構成。
在解碼性能上,MSVP支持主流的H.264、HEVC、VP9和AV1編碼,最大支持10bit色深和YUV420色度采樣。而在編碼性能上,MSVP僅支持H.264和VP9編碼,最大支持8bit色深。
Meta給出的數據中,每個MSVP可以在最高圖像質量輸出時實現4K 15FPS的峰值轉碼速度,在標準圖像質量下實現4K 60FPS的轉碼速度,且單個PICe模塊的功耗只有10W左右。由于采用了硬件轉碼加速,MSVP是ibx264軟件編碼速度的9倍,是libVPX軟件編碼速度的50倍。
寫在最后
Meta最重要的一大營收來源就是廣告業務,所以相對其他互聯網公司,他們會將深度學習推薦模型(DLRM)放在第一位。隨著模型大小和復雜程度不斷增加,如何跟上這股趨勢同時保證ROI,就成了他們的主要問題。MTIA代表了他們在自研AI基礎設施上走出的重要一步。至于MSVP,則代表了Meta想要進一步發展短視頻、AR/VR內容的同時,減少網絡帶寬提高傳播力度的解決方案。未來Meta要想逆流而上,這些自研芯片無疑會提供不小的助力。
-
Meta
+關注
關注
0文章
270瀏覽量
11378 -
RISC-V
+關注
關注
45文章
2270瀏覽量
46129
發布評論請先 登錄
相關推薦
評論