近日,知乎網友提出一個勁爆問題——如何看待寒武紀新一代人工智能芯片規格?問題一出便引發熱議,疑似寒武紀下一代產品“思元270”提前被曝光,有望在低精度訓練領域實現重大突破,性能或超越NVIDIA最新一代芯片!
AI芯片領域又有大爆料!
近日,知乎突然出現了一個勁爆提問 “如何看待寒武紀新一代人工智能芯片(疑似思元/MLU270)規格?”,提問者以匿名方式貼出了疑似寒武紀下一代云端AI芯片MLU270的相關信息,包括芯片外觀以及某些具體參數。
知乎鏈接:
https://www.zhihu.com/question/322886889
知乎用戶曝光的寒武紀下一代云端AI芯片——思元270(MLU270)
根據問題和回答記錄中顯示,似乎已有多家廠商接觸到了相關資料,經他人在網上披露信息后,寒武紀下一代芯片規格被提前曝光。
在智能芯片領域,寒武紀被稱為這一行業的先行者,“先行者”的行蹤被泄露,自然會吸引眾多從業者的關注與討論——“新一代的云端AI芯片規格到底如何?”。該提問在短時間內就受到了知乎網友的廣泛關注,閱讀次數迅速過萬。
獨家爆料:“思元”年初悄然注冊,數據遭泄,性能或超越NVIDIA最新一代芯片
據泄露照片顯示,寒武紀的新一代云端AI芯片MLU270已于今年年初研制成功,主要包括如下五點特性:
基于臺積電16nm工藝打造。
架構代號從上一代的MLUv01升級到了MLUv02。
內建視頻解碼單元(似乎是專門為視頻處理市場配置)。
但按照寒武紀一直把MLU系列芯片定位為通用智能芯片來看,MLU270應該能夠繼續支持語音和自然語言處理等重要AI任務。
峰值方面,這顆芯片提供int4 256Tops, int8 128Tops的驚人性能,功耗為75w,與全球AI芯片龍頭NVIDIA的最新一代Tesla T4基本持平。
在圍繞新品的討論中,這款新品是否與國際業內巨頭NVIDIA持平也是知乎網友熱議的一點。
大多數網友的看法都是持積極態度。雖然NVIDIA在國際范圍內頗有“一家獨大”的態勢,但卓越的學術成就以及融資優勢仍讓很多網友看好寒武紀:對于前途大好的AI芯片市場,玩家越多,越有意思——“有新的競爭者加入進來對業內每一家都是好事”。
但也有網友認為超越NVIDIA絕非易事,峰值高低并不能直接決定市場上的勝負,如何接近核心客戶可能是寒武紀需要跨過的更高門檻,也是能否與NVIDIA等巨頭一決勝負的關鍵。
另外,業內反饋Tesla T4在75w功耗條件下實測性能距離理論峰值有較大差距,不知寒武紀能否突破這一瓶頸,未來尚需相關用戶公布實測結果。
寒武紀思元270芯片內部分技術參數
值得注意的是,照片中出現的”思元”這個名字,很可能是寒武紀云端芯片品牌
MLU(Machine learning unit)的中文名。筆者順藤摸瓜,查了一下國家商標局的網站(http://sbj.saic.gov.cn/sbcx/),發現寒武紀已經在年初注冊了“思元”商標。
國家商標局網站,寒武紀注冊“思元”信息
有網友在網站回答題主時反饋,“MLU”這個名詞有些拗口,平時和同事交流時容易和“MCU”混淆。新的“思元”品牌,貌似可以解決這個小問題,也有利于打開市場知名度。
知乎匿名用戶評論
來自同行的疑惑:“思元270”專注AI推斷任務還是兼做訓練任務?
耐人尋味的另一點是,照片中只包括了整數性能的數據,也沒有交代是這顆芯片是專注人工智能的推斷任務還是兼做訓練任務,令一些同行感到疑惑。
查閱寒武紀以往公開信息,發現寒武紀不存在任何一款代號是MLU270的芯片產品。寒武紀的上一代產品MLU100已經公布,是專注于推理的AI芯片,而且發布時間尚不滿一年,不太可能是同一產品線自相殘殺式的迭代,更有可能是專注于訓練的新產品。
寒武紀上一代芯片——MLU100
照片中僅公布了低精度整數性能,存在兩種可能性:
一是表格中有意遺漏了浮點數據;
二是寒武紀在低精度訓練領域實現了關鍵性突破。
而新智元從業內傳聞看更傾向于第二種可能性。
實際上,低精度訓練的需求在業界由來已久。算法工程師使用GPU做訓練,通常使用其浮點運算單元,主要是因為在有監督學習的BP算法中,只有精確的浮點運算才能記錄訓練時很小的增量。而浮點運算單元占用的芯片面積和功耗相比于整數運算器都要大很多倍,導致單位芯片面積的處理能力要差很多。
目前業界在人工智能的推斷類應用上,發現整數運算可以不影響模型的精度,因此用于推斷的芯片已經大量集成了整數運算器或低精度浮點運算器。但業界一直在嘗試是否有機會用代價更低的整數運算器實現更為復雜的訓練功能,這樣可以在不增加芯片面積和功耗的前提下,大幅提升芯片做訓練的運算能力。但這個問題在業界也還沒有普適的解決方案。
如果寒武紀真的在低精度訓練領域實現了突破,那將會是AI芯片領域的重大消息。新智元在發稿前嘗試聯系寒武紀確認該技術信息,但目前尚未有回復。
思元270系列板卡實物照片
據了解,寒武紀在過去三年一直保持每年一代的產品迭代速度。在終端領域:
2016年推出寒武紀1A處理器IP;
2017年推出雙核的寒武紀1H;
2018年推出寒武紀1M。
迄今已經服務于數千萬臺終端設備。
寒武紀CEO陳天石曾表示,寒武紀的云端智能芯片產品,迭代速度會和終端產品一樣快。從這一次的消息泄露來看也確實如此,從去年初的MLU100到今年的MLU270。能夠以一年一代的速度進行研發的,國內也僅有華為海思一家在消費類手機芯片能做到。
在發稿前,新智元專門回顧了寒武紀去年發布會的新聞,發現陳天石博士在去年曾提到一款名為“MLU200”的云端芯片。這次泄露的MLU270芯片已經研制成功,但是否就是去年發布會時陳天石提到的MLU200,抑或是寒武紀還另有名為MLU200的產品?
無論如何,大型AI芯片能在一年時間迭代一代確實令人意外,但如果寒武紀能夠同時研發多款高復雜度的芯片,這可能意味著寒武紀已經具備非常完備的芯片研發能力,在邁向AI芯片新巨頭的道路上又前進了一步。
我們今天如何造芯?回望寒武紀三年AI修行之路
那么,寒武紀在智能芯片這條路上到底是如何發展的呢?新智元對此做了一下梳理:
2016年發布的寒武紀1A處理器(Cambricon-1A),是世界首款商用深度學習專用處理器。
2017年8月,寒武紀科技一億美元的A輪融資消息傳出,在A輪融資后估值達到10億美元,成為全球AI芯片領域第一個獨角獸初創公司。
2016年發布的寒武紀1A處理器(Cambricon-1A)
2017年11月,寒武紀召開自成立以來的首場發布會,公布了系列新品及公司未來路線圖——“3年內占領10億智能AI終端,占領中國云端高性能芯片1/3市場份額”。發布會上,寒武紀三款全新的智能處理器IP產品亮相:面向低功耗場景視覺應用的寒武紀1H8、擁有更廣泛通用性和更高性能的寒武紀1H16,以及面向智能駕駛領域的寒武紀1M。
2017年11月寒武紀首場發布會
2018年5月,寒武紀發布第三代IP產品Cambricon 1M,以及最新一代云端AI芯片MLU100和板卡產品。其中,MLU100采用寒武紀最新的MLUv01架構和TSMC 16nm的先進工藝,可工作在平衡模式(1GHz主頻)和高性能模式(1.3GHz主頻)下,平衡模式下的等效理論峰值速度達每秒128萬億次定點運算,高性能模式下的等效理論峰值速度更可達每秒166.4萬億次定點運算,但典型板級功耗僅為80瓦,峰值功耗不超過110瓦。
2018年5月發布的寒武紀MLU100
2018年6月,寒武紀宣布完成數億美元的B輪融資,投后整體估值達25億美元,繼續領跑全球智能芯片創業公司。
按照寒武紀慣例,今年上半年應該會有一次發布會。在這次發布會上是否能夠順利地看到此次遭泄露的“思元270”,又是否真如曝光數據所示,峰值高達256Tops,亦或像網友猜測的那樣,在低精度訓練領域中實現了關鍵性突破?值得期待。
那么根據此次曝光的資料,你更傾向于哪種猜測呢?
-
寒武紀
+關注
關注
11文章
186瀏覽量
73882 -
AI芯片
+關注
關注
17文章
1879瀏覽量
34992 -
自然語言處理
+關注
關注
1文章
618瀏覽量
13552
發布評論請先 登錄
相關推薦
評論