近年來,隨著越來越多的人工智能(AI)與機器學(xué)習(xí)(ML)成功案例出現(xiàn),它們已經(jīng)從一個相對模糊的計算機科學(xué)概念迅速發(fā)展成為實現(xiàn)智能化的必備技術(shù)。國際權(quán)威基金評級機構(gòu)Morningstar預(yù)測,2021年全球AI芯片市場規(guī)模有可能超過200億美元。2017年5月Grand View Research 的最新報告稱,全球深度學(xué)習(xí)市場規(guī)模預(yù)計在2025年達到102億美元。
機器學(xué)習(xí)算法和深度學(xué)習(xí)芯片組在取得不斷突破的同時,AI也持續(xù)向不同垂直行業(yè)領(lǐng)域、邊緣終端縱橫滲透,從軟/硬兩方面實現(xiàn)降本增效及體驗升級,而整個AI產(chǎn)業(yè)生態(tài)正在構(gòu)建,新的秩序正在形成,市場玩家已遠不止IT巨頭與“獨角獸們”,包括Arm在內(nèi)的IP設(shè)計公司、通用或?qū)S眯酒尽鹘y(tǒng)電子、通信巨頭也紛紛開展自己的AI生態(tài)布局。
近日在Arm Tech Day上,Arm多部門的技術(shù)專家首次聯(lián)手為業(yè)界闡述了Arm AI/ML發(fā)展觀和最新戰(zhàn)略布局。針對不同AI需求層次、發(fā)展路徑、市場空白,Arm又會如何應(yīng)對呢?
Arm機器學(xué)習(xí)事業(yè)部技術(shù)總監(jiān)Ian Bratt在Arm Tech Day上發(fā)表演講
“慢工出細活”,Arm穩(wěn)步推進AI平臺搭建
在智能化的行業(yè)大背景下,機器學(xué)習(xí)可以被應(yīng)用于公司中每個崗位,并可能影響到各行各業(yè)各家公司,眾多玩家紛紛涌入該領(lǐng)域。不過隨著高速5G網(wǎng)絡(luò)時代的到來,Arm機器學(xué)習(xí)事業(yè)部技術(shù)總監(jiān)Ian Bratt認為, AI應(yīng)用場景所要求的低時延與快速響應(yīng)、將實時數(shù)據(jù)傳輸至云端的成本與出于對數(shù)據(jù)安全性的保護,機器學(xué)習(xí)正在由數(shù)據(jù)中心走向邊緣設(shè)備,而在邊緣端部署機器學(xué)習(xí)的關(guān)鍵并不在于某一款處理器,圍繞的其實是更為宏觀的生態(tài)系統(tǒng)。
Arm一直在扎實而積極地布局AI/ML領(lǐng)域,通過不斷推出創(chuàng)新架構(gòu)與高性能IP加強AI/ML的計算力。“2017年3月,Arm推出全新DynamIQ技術(shù),代表了多核處理設(shè)計行業(yè)的轉(zhuǎn)折點,其靈活多樣性將重新定義更多類別設(shè)備的多核體驗,覆蓋從端到云的安全、通用平臺,利用針對AI/ML的全新處理器指令集以實現(xiàn)更先進的人工智能;
2018年2月, Arm為了實現(xiàn)在邊緣的AI/ML工作負載推出了Project Trillium項目,這是一套包括Arm ML處理器與OD(Object Detection)處理器在內(nèi)的高度可擴展處理器的IP組合,能夠在大量提升計算需求的同時,也保持出色的能效表現(xiàn)。后文要提到的ML處理器則是專門針對機器學(xué)習(xí)而重新設(shè)計的,它基于高度可擴展的Arm機器學(xué)習(xí)架構(gòu),并達到了機器學(xué)習(xí)應(yīng)用場景要求的最高性能和效率;
2018年6月,Arm發(fā)布全新計算和多媒體IP套件,包括基于DynamIQ技術(shù)的Cortex-A76 CPU,Mali-G76 GPU與Mali-V76 VPU,對Arm Project Trillium項目完美補充,也將高性能計算力由移動端覆蓋到筆記本端。”Arm市場營銷資深總監(jiān)Ian Smythe介紹了Arm針對不用層次、環(huán)節(jié)AI/ML需求的扎實創(chuàng)新節(jié)奏。
Arm全新計算和多媒體IP套件優(yōu)化了AI/ML在設(shè)備端的使用
此外,有研究分析顯示:目前中國AI開發(fā)者正在接受從封閉的單機系統(tǒng)轉(zhuǎn)向快捷靈活的開源框架的新一代AI技術(shù)演進。而據(jù)悉,Arm Project Trillium絕不是要與現(xiàn)有的成熟神經(jīng)網(wǎng)絡(luò)開源框架(如Caffe、TensorFlow等)競爭。實質(zhì)上,它依靠類似于Arm NN等神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)軟件橋接了現(xiàn)有神經(jīng)網(wǎng)絡(luò)框架與在嵌入式 Linux 平臺上運行的底層處理硬件(例如 CPU、GPU 、Arm 機器學(xué)習(xí)處理器或合作伙伴IP),讓開發(fā)人員繼續(xù)使用他們首選的框架和工具,無縫轉(zhuǎn)換結(jié)果后可在底層平臺上運行,真正達到無處不在的機器學(xué)習(xí)應(yīng)用。
Arm Project Trillium平臺架構(gòu)
“從0開始”設(shè)計ML處理器架構(gòu),Arm補全AI市場空白
雖然目前市場上幾乎所有機器學(xué)習(xí)工作負載,利用針對機器學(xué)習(xí)應(yīng)用優(yōu)化的最新Cortex-A76處理器應(yīng)對已完全沒有問題,但Arm機器學(xué)習(xí)事業(yè)部技術(shù)總監(jiān)Ian Bratt始終認為,機器學(xué)習(xí)作為一種全新的技術(shù),如果想在該領(lǐng)域更進一步,比如獲得更高的計算密度,Arm也必須要“從0開始”設(shè)計一個全新的處理器架構(gòu),從而實現(xiàn)未來最高效率、最高吞吐量且靈活的機器學(xué)習(xí)負載處理。
由于Arm在CPU和GPU處理器領(lǐng)域擁有世界領(lǐng)先的技術(shù),因此Arm專用機器學(xué)習(xí)處理器在設(shè)計時很好結(jié)合了在CPU與GPU方面的領(lǐng)先技術(shù),實現(xiàn)了高效的卷積、高效的數(shù)據(jù)移動與可編程性和靈活性,目標是能夠在7nm制程工藝之下,實現(xiàn)3 TOPs/W的性能。據(jù)Ian Bratt介紹,Arm 第一代ML處理器設(shè)計的高峰吞吐量是每秒4.6 TOPs,同時有針對激活和權(quán)重專門的硬件壓縮,利用了Cortex-M的技術(shù)來支持Android NNAPI和Arm NN計算節(jié)點。同時Arm也專門配置了一套開源軟件堆棧實現(xiàn)在ML處理器上成功便捷的部署ML。
Arm ML專用處理器的幾大特征
除了開發(fā)機器學(xué)習(xí)專用處理器外,Arm目標檢測處理器目前也已經(jīng)發(fā)展到了第二代,支持全高清、每秒60幀的實時處理。在與Arm其他處理器進行協(xié)同工作時,OD處理器能進行預(yù)處理,先甄別出來每幀畫面上的關(guān)鍵要素,再傳給其他的處理器去處理,大幅度降低其他處理器的工作量。目前第一代OD處理器已經(jīng)成功用于英國Hive,以及中國海康威視的監(jiān)控攝像頭。
Arm NN神經(jīng)網(wǎng)絡(luò)SDK則鋪平了個別神經(jīng)網(wǎng)絡(luò)框架在 Arm 架構(gòu)核心上執(zhí)行的道路,讓開發(fā)者可以無障礙在 Arm 平臺上執(zhí)行主流 AI 應(yīng)用。通過上述技術(shù)解決方案,Arm 補全了AI市場的空白,也足夠應(yīng)對幾乎所有應(yīng)用場景的AI/ML需求。
Arm NN SDK鋪平了個別神經(jīng)網(wǎng)絡(luò)框架在Arm架構(gòu)核心上執(zhí)行的道路
不同的AI需求層次,Arm如何滿足?
但是,AI與ML畢竟不能“開箱即用”,需要打下堅實的基礎(chǔ)才能應(yīng)用。正如AI “馬斯洛”需求層次論認為,如果把AI/ML看作是需求金字塔的頂端,自我實現(xiàn)(AI/ML)非常棒,但首先需要食物、水和庇護所(數(shù)據(jù)素養(yǎng)、數(shù)據(jù)采集和基礎(chǔ)設(shè)施)。
數(shù)據(jù)需要有牢靠的基礎(chǔ),然后才可以高效地運用AI和ML
(圖片來源:hackernoon)
AI需求金字塔的底部基礎(chǔ)是利用傳感器進行數(shù)據(jù)采集,與未來萬物互聯(lián)時代Arm所預(yù)測的2035年將會有1萬億臺互聯(lián)設(shè)備一致,龐大的終端設(shè)備網(wǎng)將進行一手的數(shù)據(jù)采集。而如果把終端設(shè)備市場比作一個舞臺,那Arm毫無疑問將是真正的幕后主導(dǎo)者,畢竟通過采用出售IP的經(jīng)營模式,迄今為止Arm設(shè)計了全球95%的智能手機芯片架構(gòu)。
而后Arm傾力打造的AI/ML平臺(Project Trillium)則是高可擴展的,從低至2~20 GOPs,到高至70 TOPs的場景應(yīng)用,都有相應(yīng)產(chǎn)品支持。正因如此,Arm提供的機器學(xué)習(xí)能力也并不僅限于旗艦產(chǎn)品,通過支持各種硬件類型和可擴展性選項,從低成本智能手機到昂貴的服務(wù)器,各種產(chǎn)品均可受益。Arm始終認為,在做機器學(xué)習(xí)處理時,除了需要有完整的生態(tài)平臺支持外,相較大數(shù)據(jù)廠商聚焦于云端AI,更要從小做起、聚焦邊緣端的計算力,滿足另一種AI/ML發(fā)展方向的需求。
坐享Arm頂級“朋友圈”,助推中國AI新勢力崛起
眾所周知,中國有著全球最多的數(shù)據(jù)量以及巨大的應(yīng)用市場,在AI狂飆突進了三、四年之久后開始面臨商業(yè)化落地的現(xiàn)實問題,眾多公司也正圍繞AI構(gòu)建完善的產(chǎn)業(yè)生態(tài)鏈。在行業(yè)細分領(lǐng)域,AI結(jié)合醫(yī)療、自動駕駛、語音交互、通用或?qū)S眯酒瘸尸F(xiàn)出各種新業(yè)態(tài)。
雖然國外廠商在通用芯片領(lǐng)域占據(jù)了先發(fā)優(yōu)勢,云端訓(xùn)練領(lǐng)先國內(nèi),但國產(chǎn)品牌也在積極尋求從AI專用芯片及嵌入式領(lǐng)域?qū)崿F(xiàn)突圍的良機,AI通用技術(shù)公司開始向產(chǎn)業(yè)鏈上下游延伸,用整套解決方案深耕垂直領(lǐng)域。截至2018年5月8日,全國人工智能企業(yè)數(shù)量達到4040家,其中獲得過風(fēng)險投資的公司達1237家。
Arm China開放平臺加速AI技術(shù)落地和應(yīng)用部署
Arm正攜手國內(nèi)合作伙伴,精心耕耘中國市場,積極推動提升中國AI硬實力的國際競爭力,而Arm頂級“朋友圈”資源也將作為有力支撐。除了在技術(shù)創(chuàng)新方面專為AI設(shè)計的指令集擴展、專用AI加速硬件IP和配套的軟件解決方案推出外,在生態(tài)創(chuàng)新方面,Arm積極與AI產(chǎn)業(yè)各個關(guān)鍵節(jié)點進行合作,力圖打通從芯片、硬件方案、計算庫、深度學(xué)習(xí)框架到應(yīng)用的全產(chǎn)業(yè)鏈;在平臺建設(shè)方面,Arm在國家政府和產(chǎn)業(yè)伙伴的支持下成立了Arm開放人工智能實驗室(Open AI Lab)與Arm人工智能生態(tài)聯(lián)盟(AIEC),致力于嵌入式人工智能技術(shù)的普及。在今年3月發(fā)布的《2017中國獨角獸企業(yè)發(fā)展報告》中,AIEC聯(lián)盟成員商湯科技、寒武紀科技、優(yōu)必選科技等多家人工智能企業(yè)榜上有名,圖像識別、智能語音、AI芯片成為主要創(chuàng)業(yè)方向。
“雙引擎”加速AI/ML多場景落地
放眼萬物互聯(lián)邁向萬物智能時代,智能終端不僅需要具備靈活性強、功耗低的特點,同時還要擁有快速的AI/ML處理能力,這就需要高能耗比硬件芯片與高效算法的完美協(xié)作。在這一大趨勢下,Arm正扮演協(xié)跑者的角色,不斷推出突破性能極限的處理器芯片與神經(jīng)網(wǎng)絡(luò)機器學(xué)習(xí)軟件,在通用平臺Project Trillium架構(gòu)的指導(dǎo)下,“雙引擎”加速AI/ML在多場景的落地,讓全球AI領(lǐng)先開發(fā)技術(shù)和資源惠及中國,同時推動中國AI技術(shù)輻射全球。
-
ARM
+關(guān)注
關(guān)注
134文章
9088瀏覽量
367405 -
AI
+關(guān)注
關(guān)注
87文章
30763瀏覽量
268906
原文標題:AI的“馬斯洛”需求層次,Arm如何滿足?
文章出處:【微信號:arm_china,微信公眾號:Arm芯聞】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論