2019年,人工智能是最受矚目的領域,從醫療保健到招聘各個行業都在擁抱AI。縱觀全球,盡管軟件和算法演進很快,但硬件和算力的結合卻能使AI的落地場景演進成為可能。在AI市場,全球領先的公司英偉達,已經從游戲、超級計算機到神經網絡的大型計算應用領域建立業界標準,過去的半年中,以寒武紀、華為、阿里巴巴為代表中國軍團對云端AI市場不斷推出新品,對這個領域全球競爭秩序發起了沖擊。
中國云端AI市場,三大廠商密集發布新品上市
2019年6月20日,寒武紀宣布推出第二代云端AI芯片思云270及板卡產品。處理非稀疏深度學習模型的理論峰值性能提升至上一代MLU100的4倍,達到128TOPS(INT8);同時兼容INT4和INT16運算,理論峰值分別達到256TOPS和64TOPS;支持浮點運算和混合精度運算。
圖:寒武紀思云270芯片。
8月23日,華為正式發布算力最強的AI處理器Ascend910(昇騰910),同時推出了全場景AI計算框架MindSphore。實際測試結果表明,在算力方面,昇騰910完全達到了設計規格,即:半精度(FP16)算力達到256Tera-FLOPS,整數精度(INT8)算力達到512Tera-OPS;重要的是,達到規格算力所需功耗僅310W,明顯低于設計規格的350W。
圖:華為昇騰910現場展示。
9月25日,在杭州云棲大會上,達摩院院長張建鋒現場展示了阿里推出全球最強的AI芯片——含光800。這是一款云端神經網絡處理器,主打推理,重點應用于視覺場景,在業界標準的ResNet-50測試中,含光800推理性能達到78563IPS,比目前業界最好的AI芯片性能高4倍;能效比500IPS/W,是第二名的3.3倍。
圖:云棲大會上達摩院展臺上展出的含光800NPU。
圖:云棲大會上含光800NPU測試評估主動散熱PCIe板卡。
云端AI芯片市場為什么這么熱?
隨著物聯網技術的迅猛發展,全球聯網設備數量呈現爆發式增長,聯網設備的數量在2014年到2020年間的年復合增長率預計將達23.1%,到2020年物聯網設備數量達到501億。IDC預測2020年全球數據總量將突破40ZB,到2025年,全球聯網設備一年產生的數據量達到79.4ZB。在阿里云棲大會上,阿里巴巴董事長張勇提出的公開預測數據顯示,到2025年,全球一年產生的數據將達175ZB,是IDC預測的兩倍。
數據是數字經濟時代的石油,算力是數字經濟時代的發動機,把數據變成石油,其中AI芯片是關鍵。根據ABIResearch的第一份報告“云端AI芯片:市場前景和供應商定位”表示:云端AI推理和訓練所產生的AI芯片市場,預計將從2019年的42億美元增長到2024年的100億美元。終端AI芯片市場也將近80億美元。
與終端AI芯片相比,云端AI芯片通常具有更高的計算能力,更高的功耗,更大的物理占用面積,因此也相對更加昂貴。對于互聯網和云服務商,其自身對于AI芯片需求越大,意味著需要付出的成本更為高昂,這也是阿里巴巴、華為、亞馬遜等公司紛紛自研芯片的初始原因。
三位中國挑戰者的實力展示
到目前為止,云端AI市場一直由英偉達的GPU和英特爾的CPU主導,而現在的它們正面臨著HabanaLabs、高通等公司的挑戰。最近寒武紀、華為和阿里巴巴新品的發布,也正是宣布進入這一高地。
行業權威人士指出,考慮到國內高端人工智能技術的匱乏,人工智能硬件在中國還處于新興產業,市場潛力巨大,2019年,多家公司推出新品,很快與Nvidia展開激烈的競爭,是否能切分蛋糕,實力非常關鍵。
第一、在芯片性能方面,寒武紀“思元270”的性能參數有意向業界標桿英偉達TeslaT4看齊。“思元270”可支持INT16/INT8/INT4等多種定點精度計算,INT16的峰值性能為64Tops(64萬億次運算),INT8為128Tops,INT4為256Tops。
對比TeslaT4,FP16的峰值性能為65Tops,INT8為130Tops,INT4為260Tops。
功耗方面,“思元270”功耗為75w,與TeslaT4持平。
寒武紀在訓練領域的低精度整數運算實現了關鍵性突破,思元270訓練版板卡將可通過8位或16位定點運算提供卓越的人工智能訓練性能,該技術有望成為AI芯片發展的重要里程碑。
第二、華為輪值董事長徐直軍對業界表示:昇騰910總體技術表現超出預期,作為算力最強AI處理器,當之無愧。我們已經把昇騰910用于實際AI訓練任務。比如,在典型的ResNet50網絡的訓練中,昇騰910與MindSpore配合,與現有主流訓練單卡配合TensorFlow相比,顯示出接近2倍的性能提升。
如同手機市場,華為在AI戰略商擺出了挑戰對手的姿態,手機市場上華為自有品牌手機加上自有麒麟芯片技術,把握住5G手機的領先優勢,在AI市場,華為拿出昇騰910+MindSphere的硬件與架構服務組合,還有自主的訓練架構以及整合能力。雖然這個組合在海外市場能否開展業務令人懷疑,但在價格和效能驅動夏,華為在AI市場更有競爭力,特別是智慧城市、自動駕駛車輛、物聯網和之后會醫療等熱門應用上,華為自有技術加上軟硬整合,相信可以啟動更大的市場。
第三、阿里巴巴首席技術官張劍鋒表示,含光800的云端推理能力出眾。1個含光800算力等于10個普通GPU,在業界標準的ResNet-50測試中,峰值性能達到78563IPS,每秒處理7.8萬張圖片,是目前全球最高性能的AI推理芯片,每瓦可以處理500張照片。同樣以推理能力來說,含光800的推理能力是英偉達T4(1721IPS)的五倍,是英偉達P4的46倍,能效比是第二名HabanaLabs的Goya的3.3倍,是寒武紀MLU270的3.5倍。
在現場演示中,杭州城市大腦實時處理主城區的交通視頻,需要40顆傳統的GPU,延時300ms,使用含光800僅需要4顆,延時減低到150ms。在拍立淘商品庫每天新增的10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800可以縮短至5分鐘。軟硬件協同的極致設計體現了巨大市場前景。
結語
行業專家認為,人工智能將有可能得到規模化使用,大規模新技術會在未來二三十年取得突破。人工智能將給社會提供更多的效率,國家會因為人工智能發生翻天覆地的變化。
面對人工智能帶來的改變,國家自身的發展會取決于這個國家的能力,取決于行業成熟性和算法、算力、基礎設施的提供,比如超級計算機、超大規模的系統等一系列的支撐。作為中國本土云端AI芯片的主要供應商,寒武紀、華為和阿里平頭哥,雖然現在比英偉達的實力還有差距,但在中國巨大的市場潛力和應用帶動下,會有更多可能開發出先進產品,未來如何,讓我們拭目以待。
-
華為
+關注
關注
216文章
34411瀏覽量
251492 -
阿里巴巴
+關注
關注
7文章
1613瀏覽量
47164 -
英偉達
+關注
關注
22文章
3770瀏覽量
90982 -
寒武紀
+關注
關注
11文章
186瀏覽量
73882 -
AI芯片
+關注
關注
17文章
1879瀏覽量
34989
發布評論請先 登錄
相關推薦
評論