在昨日舉行的華為全連接大會上,華為終于揭開了其自研AI芯片的神秘面紗。
據華為輪值總裁徐直軍介紹,華為這次推出的兩款芯片分別是昇騰910和昇騰310,這都是華為基于其自研的達芬奇架構打造的兩款新品。其中昇騰910是當前單芯片計算密度最大的AI芯片。該產品采用7nm工藝打造,最大功耗做到350w,其他參數也是表現優越:在半精度 (FP16)下,可以做到256 TeraFLOPS,在整數精度 (INT8)下,更是做到了512 TeraOPS,另外,該款芯片還支持128 通道的全高清視頻解碼器(H.264/265)。
華為昇騰910介紹
徐直軍表示,華為昇騰910在與英偉達和谷歌的芯片對比時,也擁有強大的領先優勢。芯片將在2019年Q2到來,這會在云端給華為帶來訓練和邏輯服務系列的強大支持,沖破現在市場被TPU和英偉達壟斷的局面。
華為昇騰910介紹
另外,華為還發布了昇騰310,按照徐直軍的說法,華為這款極致高效計算低功耗的AI SoC是針對邊緣AI而推出的產品。作為一款同樣采用達芬奇架構的芯片,華為昇騰310采用了12nm FFC工藝制造,在半精度 (FP16)情況下,可以做到8 TeraFLOPS,在整數精度 (INT8) 下,則能做到16 TeraOPS,還能支持16 通道全高清視頻解碼器 - H.264/265,而其最大功耗只有8W,這款芯片現在就已經能夠給客戶提供全方位的支持。
華為昇騰310介紹
華為方面表示,他們基于統一、可擴展架構的系列化 AI IP和芯片昇騰擁有nano、tiny、mini、lite和max五個系列,能提供橫跨全場景的最優TOPS/W支持。
徐直軍在接受采訪的時候向記者強調,華為的昇騰芯片將不會對外單獨銷售,而是以AI加速卡、加速模塊、服務器和一體機等模式對外銷售。華為的全棧AI戰略也在昇騰面世之后,得到了全方位補全。
華為的AI解決方案
在面向未來的AI機會,華為將會聚焦在投資基礎研究、打造全棧方案、投資開放生態和人才培養、解決方案增強和內部效率提升這五個方面。具體而言就是:
在計算視覺、 自然語言處理、 決策推理等領域構筑數據高效(更少的數據需求)、 能耗高效(更低的算力和能耗),安全可信、自動自治的機器學習基礎能力;
打造面向云、 邊緣和端等全場景的、 獨立的以及協同的、 全棧解決方案, 提供充裕的、 經濟的算力資源, 簡單易用、 高效率、 全流程的AI平臺;
面向全球, 持續與學術界、產業界和行業伙伴廣泛合作;
把AI思維和技術引入現有產品和服務, 實現更大價值、更強競爭力;
應用AI優化內部管理, 對準海量作業場景, 大幅度提升內部運營效率和質量;
華為這些新產品的推出,在業界引起了廣泛討論。無獨有偶,筆者也從知情人士處看到了華為的Arm服務器芯片的相關產品曝光。
華為7納米
Arm服務器芯片曝光
日前,華為正式對外披露了其新一代的Arm服務器芯片Hi 1620。
據知情人士告訴半導體行業觀察記者,華為這顆Arm服務器芯片是基于Arm V8 架構自主設計的,使用當前業界最先進的7nm工藝打造。據了解,華為在此芯片上提供32、48和64核的版本,最高支持2.6/3.0Ghz的主頻,能夠支持PCIE 4.0&CCIX。
華為方面表示,這是業界第一顆支持PCIE4.0的7納米Arm服務器芯片。從華為的PPT中我們可以看到,Hi 1620的48核版本的CPU和英特爾Skylake 8180 的SPECint 性能相當,但在功耗方面會比后者低20%。
華為Hi 1620的細節
作為一個涉足廣泛的企業,華為的Arm服務器芯片已經有了多代的發展。
從wikichip可以看到,2015年,華為推出了其第一代Arm服務器芯片Hi 1610,這個采用Arm Cortex-A57設計的16核芯片主頻最高只能做到2.1Ghz。
在2016年,中國十二五科技創新成就展上,華為展出了其第一臺ARM平臺服務器“泰山”(Taishan),配備自主研發ARM架構64位處理器“Hi1612”,采用臺積電16nm工藝打造,兼容ARMv8-A指令集。華為方面表示,除了存儲單元外,該處理器具有完整的自主知識產權,可應用于大數據分析、共有云、信息搜索等領域,并已在阿里巴巴試用。
2017年,華為又推出了HI 1616,這個采用Cortex-A72設計的32核芯片最高主頻可以做到3Ghz,再到今年Hi 1620。可以看到,雖然華為并沒有大肆宣傳其Arm服務器芯片,但是在過去的幾年也都保持每年一款的更新頻率。
華為Arm服務器芯片系列
考慮到華為本身在手機、云和存儲等方面的影響力,這個Arm服務器產品的到來,對于華為本身,是對自身產業鏈的進一步完善。能夠為客戶提供定制化、全方位的可控一條龍服務。
放大到整個中國集成電路產業來說,華為的這個系列產品線或許能在英特爾把持的服務器芯片市場殺出一條新路。但毫無疑問,這將會面臨來自國內外的多個競爭對手的挑戰。
暗流涌動的
Arm服務器芯片市場
近年來,隨著Intel服務器芯片的市場份額的日益攀升,國內自主可控需求的興起,Marvell收購Cavium、華芯通的成立、高通的淡出,Arm服務器芯片市場一直暗流涌動。雖然開始有些人在退出,但在Arm的推動下,也有新的玩家進入這個市場,華為就是當中一個代表。正如上文所說,從華為的業務上看,Arm服務器芯片業務對他們來說是一個產業鏈環節的補充。
除了華為之外,國內的飛騰、華芯通,美國的Ampere也都是Arm服務器市場的重要角色。
首先看一下飛騰方面。
早前,天津飛騰信息技術有限公司首席科學家竇強在接受半導體行業觀察等媒體采訪的時候提到,飛騰在2017年推出了飛騰FT2000+處理器,這個使用16nm工藝打造的芯片擁有64個內核、主頻可以做到1.8-2.3GHz,以標準spec測試的實測性能和英特爾2013年推出的至強處理器性能相當,飛騰也完成了服務器存儲、數據庫和中間件適配的相關工作。
在竇強看來,飛騰這個處理器性能和英特爾的產品相比還有很大的差距,甚至他們這款產品還是單路設計,不能滿足大規模的設計需求。但是飛騰未來會將其擴展兩路,甚至八路,以匹配高端服務器的處理器需求。
飛騰公司總經理谷虹之前說過,飛騰的CPU雖然是基于ARM技術架構研發,但包括CPU計算模塊在內的代碼部分均為公司歷時多年自主研發完成。這就使得飛騰能夠在這系列產品的自主可控上面,擁有更高的自主權。
來到華芯通,這是由貴州政府和高通共同成立的,專注于Arm服務器芯片的企業。
據鳳凰科技在今年五月的報道,華芯通自主研發的第一款服務器芯片——“華芯1號”已經于2017年年底試產流片成功,并將于今年下半年上市商用。而他們研發的第二代產品“華芯3號”目前已經在研制當中。
據報道,這款服務器芯片只有半張銀行卡大,集成了約10億個晶體管和2800多個管腳,芯片制程為10納米。通過內置自主安全模塊大大提升芯片安全系數,是“華芯1號”的一大亮點,它可以應用在高性能計算機上面,發揮迅速及時處理龐大數據的功能。
至于Ampere,則是由Intel前高管Renee James創立的。在半導體行業觀察之前對James女士發起的專訪中她提到,Ampere的核心團隊大部分來自Intel和AMD這些芯片巨頭,公司的大多數人在服務器的軟硬件領域擁有非常豐富的經驗,他們對服務器芯片和軟件的理解相當深入,這就使得他們成為Arm服務器領域的新興勢力。
在今年九月,Ampere推出了該公司旗下面向數據中心的第一代 64 位 Armv8-A架構的,16nm工藝打造的處理器,這款他們設計的 32 核 Armv8-A 處理器在Turbo 模式下主頻高達 3.3 GHz。處理器已獲得聯想及其他幾家原始設計制造商 (ODM) 的選擇。
按照他們的說法,這款處理器具有優秀的總體擁有成本 (TCO) 價值、強大的計算性能和內存容量以及豐富的 I/O,用來處理云工作負載,包括大數據、Web 層以及內存數據庫。
Ampere 還公布了未來多代產品路線圖,包括下一代 的7nm 產品等。這款產品將提供單插口和多插口選項,并于 2019 年上市,這將用于將來的超大規模云計算和邊緣計算。
上述可見,華為在Arm服務器芯片方面的領先優勢領先于全球的競爭對手。
總結
雖然華為的Arm服務器芯片迄今為止一枝獨秀,但我們可以看到,英特爾花費數十年打造下的服務器生態是無法撼動的。但華為依賴于其多年來積累的芯片設計經驗,又在一個領域走在了全球前年。加上華為本身在AI芯片、ISP芯片、手機SoC和其他各種芯片、終端和應用上的積累,華為未來在Arm服務器市場必將扮演一個重要角色。
至于未來,就看Arm如何聯合各大芯片供應商、軟件廠商在這個領域的生態上共同發力了。
文/半導體行業觀察 李壽鵬
點擊閱讀原文了解摩爾精英
原文標題:不止AI,華為曝光全球首顆7納米Arm服務器芯片
文章出處:【微信公眾號:半導體科技評論】歡迎添加關注!文章轉載請注明出處。
-
芯片
+關注
關注
455文章
50728瀏覽量
423182 -
服務器
+關注
關注
12文章
9127瀏覽量
85337 -
數據庫
+關注
關注
7文章
3794瀏覽量
64362
發布評論請先 登錄
相關推薦
評論