作為AI芯片后入者的三星正提著大刀趕來:據(jù)外媒爆料,三星已經(jīng)接近完成一款AI芯片的研發(fā),其性能已經(jīng)堪比蘋果的A11和華為麒麟970,三星極有可能在2月25日舉行的MWC 2018大會上發(fā)布Galaxy S9的同時,展示其新AI技術的能力。
據(jù)《韓國先驅報》網(wǎng)站報道,三星電子已經(jīng)基本完成第一款神經(jīng)處理單元(NPU)的開發(fā)工作,準備在今年晚些時候部署到設備上。NPU被廣泛稱為AI芯片,據(jù)稱三星將在即將發(fā)布的智能手機上搭載這款芯片,此舉有助于其手機趕超競爭對手。
“據(jù)三星內部人士爆料,三星已經(jīng)基本完成了服務器AI芯片的開發(fā)工作,預計該芯片將出售給服務器廠商。”一名AI專家告訴《韓國先驅報》。
除了CPU、GPU等之外,智能手機上再加上NPU的話,手機本身就可以在沒有云服務器幫助的情況下處理、分析和存儲智能手機上產生的數(shù)據(jù)。NPU被廣泛認為是智能手機的大腦。
目前,三星在這個領域落后于蘋果和華為這兩個最大的競爭對手,后兩者都已經(jīng)推出了移動端的AI芯片。蘋果公司去年發(fā)布了iPhone X,使用NPU實現(xiàn)臉部識別和動畫表情符號等人們熟知的功能。緊接著,華為推出了一款能夠隨時間學習用戶習慣的NPU,部署在Mate 10 Pro手機上。
盡管三星對于這個市場是后來者,但那位“AI專家”對韓國先驅報稱,“三星已經(jīng)達到蘋果和華為的技術水平,而且在今年下半年肯定會推出更好的芯片。”據(jù)報道,三星的芯片每秒運行的速度超過了蘋果的A11和華為的麒麟970。
此外,同一消息人士透露,三星可能將在2月25日舉行的MWC 2018大會上發(fā)布Galaxy S9的同時,展示其新AI技術的能力。
據(jù)稱三星在人工智能相關項目上投入了大量資金,并與韓國各大學的教授和研究人員合作,以制造出相比競爭對手更安全、更高效的芯片。
該消息人士透露,三星還正在為Galaxy Note 9智能手機開發(fā)一款增強的NPU,該款手機預計在今年9月份發(fā)布。就像之前的Galaxy Note 7和Note 8一樣,Note 9可能成為三星的一個轉折點。
AI手機進入戰(zhàn)國時代,芯片研發(fā)馬太效應漸顯
正如上文所說,三星的這款AI芯片,主要的競爭對手是蘋果和華為。目前,蘋果的iPhoneX和華為的Mate10(Pro)、V10等系列手機均已經(jīng)使用人工智能芯片,成為AI手機的領導者。
iPhone X中的“A11生物神經(jīng)網(wǎng)絡引擎”(A11 bionic neural engine)芯片,每秒運算次數(shù)最高可達6000億次,相當于0.6TFlops(寒武紀NPU則是1.92TFlops,每秒可以進行19200次浮點運算),采用了六核心設計,由2個高性能核心與4個高能效核心組成。相比A10,其中兩個性能核心的速度提升了25%,四個能效核心的速度提升了70%。工藝方面,A11采用了臺積電10nm FinFET工藝,集成了43億個晶體管。
A11能幫助加速人工智能任務,包括Face ID,Animoji和AR應用程序。A11同時支持Core ML,這是蘋果在WWDC開發(fā)者大會上推出的一款新型機器學習框架。Core ML支持所有主要的神經(jīng)網(wǎng)絡,如DNN、RNN、CNN等,開發(fā)者可以把訓練完成的機器學習模型封裝進App之中。
華為麒麟970芯片,首次采用臺積電10nm工藝,集成55億個晶體管(驍龍835是31億顆,蘋果A10是33億顆),功耗降低20%。采用4個Cortex A73 核心,4個Cortex A53 核心,GPU為具有12個核心的 Mali-G72 MP12,每秒處理速度可達萬億次。麒麟970芯片內置全新升級自研相機雙ISP,支持人工智能場景識別、人臉追焦、智能運動場景檢測,同時夜拍效果再次升級。基帶方面,麒麟970采用了更先進的4.5G LTE技術,支持全球最高是LTE Cat.18規(guī)格,實現(xiàn)目前業(yè)界最高的1.2Gbps峰值下載速率。同時內建TEE和inSE安全引擎,擁有更高的安全性。
不過,三星、蘋果、華為“三國殺”的局面不會持續(xù)很久。
由于智能手機的競爭進入到嚴重的同質化階段,跟全面屏一樣,人工智能芯片將會是手機廠商下一個“標配”的重點。除了三星、蘋果、華為三巨頭,還有很多廠商涌入智能手機和AI芯片的競爭,例如最近傳聞將于2018年下半年上市的小米——2017年2月,小米自主研發(fā)的手機芯片澎湃S1問世,成為國產手機中第二家擁有自主研發(fā)芯片能力的手機廠商。
人工智能芯片對手機性能提升、人機交互等功能上有巨大的想象空間,AI手機特別是高端旗艦AI手機的研發(fā)能力是能夠拉開與對手差距的重要一步,手機市場格局也會隨著研發(fā)能力逐漸分化,強者更強,弱者更弱的馬太效應將逐漸凸顯。
移動端AI芯片,誰能笑到最后?
由于GPU存在功耗瓶頸,同時用戶越來越關心個人隱私安全與時效性,終端智能芯片的發(fā)展順應時代所需。
終端的智能芯片則需要同時具備高性能與低功耗的特征。此外,終端也涵蓋了不同的應用場景,都需要針對具體需求,在功耗、延遲、數(shù)據(jù)吞吐量、加速器方案的選擇上做出調整和優(yōu)化。
新智元對部分移動端能夠支撐AI功能的芯片做了梳理:
谷歌:Pixel VisualCore
2017年10月,Google在其官方博客上公開了Pixel2中使用的一顆專用圖像處理協(xié)處理器——Pixel VisualCore。這是Google在用于服務器的TPU之后推出的第二顆芯片,這次針對的是移動端。Pixel VisualCore由Google與Intel合作設計開發(fā),主要用于圖像處理和機器學習。這塊芯片由8個IPU(每個包含512個ALU)+1個Cortex-A53核心組成,最大可提供3TFLOPS浮點運算能力。
說到手機芯片,怎能不提高通。高通在2017年12月初正式發(fā)布了驍龍845移動平臺。驍龍845處理器采用10納米LPP制程工藝,其中GPU采用Adreno 630,X20 LTE調制解調器、WiFi、影像方面使用Spectra 280ISP,以及Hexagon 685DSP協(xié)處理器、音質方面使用高通Aqstic Audio、CPU采用四個2.8GHz大核+四個1.8GHz小核+2MB緩存的Kryo 385 CPU、移動安全芯片,另在845中新增了一塊獨立內存。AI方面,驍龍845主要通過Kryo 385定制架構、Adreno 630、Hexagon 685在終端異步運算數(shù)據(jù)。相比835,驍龍845在AI上的計算能力是835的三倍,目前已經(jīng)可以支持S845GoogleTensorFlow、Facebook Caffe以及Open NeuralNetwork Exchange在內的多款主流深度學習框架。
Movidius VPU Myriad2
2016年9月,Intel發(fā)表聲明收購了Movidius。Movidius專注于研發(fā)高性能視覺處理芯片。現(xiàn)任CEO是原來德州儀器OMAP部門的總經(jīng)理,它的技術指導委員會也是實力強大,擁有半導體和處理器行業(yè)的元老級人物——被蘋果收購的 P.A.Semi 創(chuàng)始人丹尼爾·多伯普爾(Daniel Dobberpuhl),卡內基梅隆大學計算機科學/計算機視覺專家金出武雄,以及前蘋果 iPhone 和 iPod 部門工程副總裁、資深工程師大衛(wèi)·圖普曼(David Tupman)三人坐鎮(zhèn)。
其最新一代的Myriad2視覺處理器主要由SPARC處理器作為主控制器,加上專門的DSP處理器和硬件加速電路來處理專門的視覺和圖像信號。這是一款以DSP架構為基礎的視覺處理器,在視覺相關的應用領域有極高的能耗比,可以將視覺計算普及到幾乎所有的嵌入式系統(tǒng)中。該芯片已被大量應用在Google 3D項目Tango手機、大疆無人機、FLIR智能紅外攝像機、海康深眸系列攝像機、華睿智能工業(yè)相機等產品中。
寒武紀 1H8和1H16
寒武紀于2016年發(fā)布了全球首款商用深度學習專用處理器IP——寒武紀1A處理器。寒武紀1A的橫空出世打破了多項記錄,受到了業(yè)界廣泛關注,入選了第三屆世界互聯(lián)網(wǎng)大會評選的十五項“世界互聯(lián)網(wǎng)領先科技成果”。2017年11月,在公司首次發(fā)布會上,CEO陳天石介紹了三款全新的智能處理器IP產品,其中就包括面向低功耗場景視覺應用的寒武紀1H8、擁有更廣泛通用性和更高性能的寒武紀1H16。
陳天石介紹說,與寒武紀1A相比,新品在功耗、能效比、成本開銷等方面進行了優(yōu)化,性能功耗比再次實現(xiàn)飛躍,適用范圍覆蓋了圖像識別、安防監(jiān)控、智能駕駛、無人機、語音識別、自然語言處理等各個重點應用領域。
地平線旭日和征程
2017年12月20日,地平線在北京舉行發(fā)布會,推出的征程(Journey)和旭日(Sunrise)兩款面向計算機視覺的處理器,分別用于無人駕駛和智能攝像頭。旭日和征程都屬于嵌入式人工智能視覺芯片,分別面向智能駕駛和智能攝像頭。地平線首席芯片架構師周峰對新智元介紹,這兩款芯片,芯片性能可達到1Tops,實時處理1080P@30幀,每幀可同時對200個目標進行檢測、跟蹤、識別。 典型功耗做到1.5w。
深鑒聽濤
2017年10月24日,深鑒科技召開發(fā)布會,正式對外宣布完成約4000萬美元A+輪融資,由螞蟻金服與三星風投領投。CEO姚頌還公布了一系列芯片計劃,由深鑒自主研發(fā)的芯片“聽濤”、“觀海”將于2018年第三季度面市。
其中,“聽濤”將于2018年上半年完成產品裝載,該系列芯片采用臺積電28納米制程,核心使用深鑒自己的亞里士多德架構,峰值性能1.1瓦 4.1 TOPS。亞里士多德架構針對卷積神經(jīng)網(wǎng)絡而設計。目前,卷積神經(jīng)網(wǎng)絡一般用來處理圖像相關的智能問題,而此架構靈活與可擴展的特性使它可被應用于各種不同規(guī)格的終端中。
異構智能:NovuTensor
在今年 CES 上,NovuMind(中文名稱“異構智能”)向業(yè)界首次展示其自主研發(fā)的第一款高性能、低功耗的 AI 芯片 NovuTensor,號稱可能是除了 TPU 之外,世界上跑得最快的單芯片。
NovuMind 方面表示,這是截至目前世界上唯一能夠實際運行的、性能達到主流 GPU/TPU 水平而性能/功耗比卻遠超主流 GPU/TPU 的芯片——在功耗 12w 的情況下,NovuTensor 每秒可識別 300 張圖像,每張圖像上,最多可檢測 8192 個目標,相比目前最先進的桌面服務器 GPU(250W,每秒可識別 666 張圖像),僅使用 1/20 電力即可達到其性能的 1/2;而相比目前最先進的移動端或嵌入式芯片,相同用電的情況下,性能是其三倍以上。據(jù)了解,本次 CES 展示的僅僅是 FPGA 版本,等正在流片的 ASIC 芯片正式出廠,性能將提高 4 倍,耗電將減少一半,耗能不超過 5 瓦、可進行 15 萬億次運算的超高性能。
GTI光矛處理器
成立于2017年初的Gyrfalcon Technology Inc.(簡稱GTI)近期以“光矛處理器 Lightspeeur 2801S”引發(fā)業(yè)內關注,這也是一家由中國芯片老兵創(chuàng)立的公司,總部位于美國硅谷。其芯片方案基于APiM架構,有28000個并行神經(jīng)計算核,真正支持片上并行與原位計算,不需要使用外部存儲單元,克服了由存儲器帶寬而導致的性能瓶頸,在效率能耗比方面表現(xiàn)卓越,達到9.3Tops/Watt,無論在訓練模式還是推理模式下均可提供高密度計算性能。
在今年的CES上,GTI推出了內置Lightspeeur 2801S芯片的Laceli 人工智能計算棒,可以在1瓦的功率下提供超過每秒9.3萬億次浮點運算的性能,超越英特爾Movidius的神經(jīng)計算棒,后者每瓦功率范圍的運算力則是0.1萬億次。Laceli 人工智能計算棒可以在多種深度學習場景中應用,包括圖像和視頻識別、理解及描述, 自然語言理解、自然語言處理等。
-
三星電子
+關注
關注
34文章
15859瀏覽量
180985 -
華為
+關注
關注
216文章
34411瀏覽量
251501 -
蘋果
+關注
關注
61文章
24395瀏覽量
198554 -
AI芯片
+關注
關注
17文章
1879瀏覽量
34990
原文標題:三星將推首款AI芯片NPU,性能超華為蘋果,智能終端AI芯大PK
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論