經歷了十數年的高速發展之后,以智能手機為代表的移動設備開始邁入下半場。大家對新設備的關注重點從過往的多核、RAM和ROM大小轉移到了人工智能、3D游戲和混合現實等新方向上來。這就吸引了包括高通、華為、蘋果和聯發科等眾多移動SoC廠商密鑼緊鼓地投入其中。作為全球移動芯片基石的Arm也正在加緊布局,擁抱新時代。
Arm資深市場營銷總監Ian Smythe表示,現代人類使用設備的的方式增加了對設備性能的期望值,這就促使Arm達到一個新的愿景——所有人都能夠使用這些新技術。這就要求Arm讓這些處理器能夠勝任各種各樣的計算任務,這首先體現在人工智能方面。其實Arm現在在人工方面的表示也不錯。根據IDC的調查數據顯示,現在市場上有人工智能能力的設備,80%是基于Arm的處理器實現的。但在Ian Smythe看來,這還不夠。
Arm的人工智能策略
根據他的看法,人工智能將會無處不在,應用也會多元化,實現人工智能的關鍵——機器學習往“邊緣”轉移是一個必然的趨勢,因為只有在“邊緣”部署,才能解決帶寬、功耗、成本、延遲、可靠性和安全等幾方面的問題。針對AI的這些特點,Arm升級了他們的AI布局,首先祭出了他們的項目:機器學習運算平臺Project Trillium。這是一套包括新的高度可擴展處理器的Arm IP組合,這些產品可以提供增強的機器學習和神經網絡功能。
Arm Project Trillium項目
從上圖我們可以看出,在Arm的這個項目里,Arm本身的CPU、GPU、ML(Machine Learning)和OD(Obeject Detect)處理器,加上合作伙伴的DSP、FPGA等加速器IP會是整個項目中最基本的硬件支持。
在中間的軟件產品層,Project Trillium提供了專門針對Arm硬件優化的軟件庫,其中包括了Arm NN、CMSIS-NN、Compute Library和Object Detection Libraries。
在應用方面,項目會對TsensorFlow、Caffe、Caffe2、Mxnet和Android NNAPI等主流框架的支持。
Ian Smythe告訴記者:“Arm Project Trillium提供了相應的接入硬件、軟件的框架,并相應地為CPU和GPU提供了針對機器學習的加速,這樣開發人員就能更好地基于Arm的所有硬件去進行開發,還能非常方便地獲得這些開發框架和一些工具系統”。那就意味著開發者如果要開發一個手機應用,不需要去擔心這個手機硬件本身的適配性能問題,只需要關心出來的手機應用的性能是最好的。
舉個例子,如果開發人員用的是安卓神經網絡的API,那么底層的硬件無論是CPU、GPU還是OD、ML都不重要,因為Project Trillium都能夠實現最優的處理器的性能,同時也會提供去訪問這些Arm底層硬件處理器的軟件庫,這樣就可以節約開發人員大量的精力。
CPU和GPU是Arm AI芯片先鋒
由上可知,底層硬件是Arm人工智能策略的關鍵,而其實對于這些芯片的應用,Arm方面也有了明確清晰的定位。如應用廣泛的CPU和GPU將會是他們的AI芯片先鋒。
首先是Cortex-A系列處理器。Ian Smythe表示,經過了多年的迭代,Arm的Cortex-A系列處理器的SIMD性能有了極大的提升,尤其是在引入了DynamIQ技術之后,這系列處理器對人工智能的支持有了質的飛躍。
DynamIQ是Arm公司針對機器學習和人工智能應用,面向新一代Cortex-A處理器推出的技術,不同于之前的多核處理設計,DynamIQ能夠對單一計算集群上的大小核進行配置,例如1+3或者1+7的SoC設計配置,而這在過去是不可能的。
Arm DynamIQ的作用
據Arm介紹,第一代采用DynamIQ的Cortex-A系列處理器在優化應用后,能夠在未來三到五年內實現比基于Cortex-A73的設備高50倍的人工智能性能,最多可將CPU和SoC上特定硬件加速器的反應速度提升10倍;
同時,SoC設計者還可以在單個集群中最多部署8個核心,而且每一個核心都可以有不同的性能特性。這些先進的能力可以為機器學習和人工智能帶去更快的響應速度。全新設計的內存子系統也將實現更快的數據讀取和更加高效的節能特性;
另外還能通過對每一個處理器進行獨立的頻率控制,高效地在不同的任務間切換最合適的處理器,所以能夠在嚴苛的發熱限制實現更高的性能。當然還有更安全的自動安全系統,能夠讓合作伙伴在故障情況下也能實現安全運行。
Arm同時也為Cortex-M系列其引入包括機器學習、內核加速的計算庫,也就是CMSIS-NN,這就讓這系列的處理器能夠很好地支持機器學習的算法。
Arm Cortex-A、Cortex-M和GPU對ML的支持
至于Mali-GPU,由于GPU本身的產品特性,讓它成為Arm人工智能策略中不可或缺的一部分。作為智能手機領域出貨量最大的一系列產品,搭載Mali-GPU的SoC在去年出貨總計達到12億套。高度的客戶認同感,驅使Arm更積極地將它推向了人工智能,完善AI芯片布局。
Arm的GPU架構
日前,Arm更是推出了Bifrost架構之下的第二代產品Mali-G52 。作為Arm GPU的新一代架構,全新的Bifrost 針對幾大方向做了改良:分別是藉由Claused Shaders 技術,以及基于查表索引的向量著色架構與Wire Light 管線設計所帶來的能源效率(Energy Efficiency)提升、結合CCI-550,可讓CPU和GPU存取同一快取區塊的異構計算(Heterogeneous computing)的一致性最佳化,以及最重要的Vulkan API 支援。這讓G52能更好的滿足產品的設計要求。
Mali –G52 GPU
據Ian Smythe介紹,這個GPU采用了典型的四核布局,不同于上一代產品的四線程執行引擎,新的GPU將這個數據提高到八線程,因此在復雜的指令方面,就能實現兩倍的性能提升;另外,通過添加一些具體的指令,G52能夠更好地支持機器學習,在性能方面也有了更大的改善。這樣的提升勢必會給中端設備帶來非常高質量的表現。
Mali G52出色的機器學習性能
從測試結果也看到,G52較上一代提高了30%的性能密度,能效提高了15%,機器學習性能更是上一代的3.6倍。
ML和OD處理器是重要組成部分
除了CPU和GPU,Arm AI芯片庫里還有ML和OD處理器這兩個重要部分。在前面介紹Project Trillium的時候,我們曾經提到了這兩個產品。這一段里,我們會深入探討Arm對這兩個芯片的期望。
其實關于Arm 的AI芯片,市場上有很多說法,最多的是在大家都在爭先恐后擁有人工智能,華為甚至在Kirin 970中引入了寒武紀的NPU芯片,作為智能手機芯片的最大IP供應商的Arm似乎無動于衷,但隨著Project Trillium的公布,Arm的專門AI芯片終于揭開了其神秘面紗。
Ian Smythe告訴記者,ML和OD處理器是Arm公司從零開始的設計。與CPU和GPU相比,他們的性能和效率有了大幅的提升;另外,Arm還很有想法地加入DSP的功能。這讓這兩系列處理器非常適合于機器學習。首先我們先來了解一下ML處理器。
據Arm方面介紹,這個全新架構的處理器是7nm工藝下實現的,擁有非常高的性能性能密度,能夠實現每平方毫米多達4.6萬億次的計算能力。這款處理器將會在2018年中,通過合作伙伴推向市場。
Arm ML處理器
OD處理器則是Arm AI芯片領域的另一個關注點。這是Arm公司基于2016年收購的Apical公司的技術開發的第二代產品。后者作為影像處理與嵌入式機器視覺技術市場的絕對專家,讓我們堅信Arm OD處理器的實力。
Arm OD處理器
Ian Smythe指出,新一代的OD處理器能夠實現非常高速的目標檢測:在每秒鐘可以實現無限次數量的幀的鑒別,這樣就可以以非常搞的速度去檢測豐富的內容。
比如說我們可以想象一個場景,在這個場景中OD處理器能以60FPS的速度,在全高清的環境下實時識別無限數量的物體,并找到這個識別目標物體的原數據,然后把原數據發給下一個要進行處理的處理器。
如果我們把Arm機器學習處理器和目標檢測處理器合起來用,必然能很好地提升計算機的視覺能力。
更多的多媒體套件輔助
對于Arm包括AI在內的很多應用,想顯示出來,就必須要有更好的多媒體條件支持,而Arm本身就是這樣一個角色。在CPU、GPU和AI芯片之外,Arm還有DPU和VPU這樣的產品,他們將是將Arm產品性能結果展示到用戶面前的一個重要橋梁,Arm在日前也對其做了更新,首先就是Mali-D51。
Arm的多媒體套件賦能下一代技術
據介紹,Mali-D51是第一款基于Komeda架構構建的主流顯示處理器,擁有2017年出品的高端顯示處理器Mali-D71的眾多優勢,并將之整合至迄今為止Arm旗下最小的DPU上。,實現的性能包括:
與上一代的Mali-DP650相比較,D51實現了兩倍的面積效率,30%的系統功耗額,內存延遲也降低了50%;場景復雜度也加倍,還與Mali-D71一樣支持8層圖像處理能力。Ian Smythe表示,經過全面優化,D51可與Mali多媒體套件中的其他IP無縫協作,結合Assertive Display 5技術使用,甚至可將HDR(高動態范圍圖像)帶入主流設備;結合CoreLink MMU-600,可提升系統內存管理效率。
Arm的顯示解決方案
視頻處理器V52則是Arm的另一個高質量產品。與上一代的V61相比,V52在每一個核的解碼性能是翻了一番,能夠實現了4K,每秒30幀的高畫質顯示支持;在硅面積方面,與V61相比,同樣實現4K60顯示的情況下,V52的硅面積與后者相比,減少了38%。
而在解碼質量方面,V52同樣也有了20%的提升。換句話說,就是在達到同樣的圖像質量的前提之下,在比特數上面V52能夠減少20%。對于一些非常關鍵的應用,比如說視頻會議而言,如果帶寬條件有限的話,其實這種更少的比特數是非常關鍵的。
這顆芯片能支持現在市面上包括HEVC、VP9、VP8、H.264、AVS+、Legacy在內的幾乎所有標準。能夠滿足越來越多4K內容制作需求。
在GPU方面,Arm還帶來了全新的G31。這是他們Bifrost架構家族中,G30系列的第一款GPU。主要是針對可能低端配置的智能手機和數字電視應用。它的總硅面積降低了20%,在性能密度上有20%的提高,同時在UI的性能方面有12%的提升。
這款產品具備可配置性的特點,讓開發者在執行引擎方面,可以選擇一個或者是兩個;同時在顯示時鐘也可以配置每個是一個像素還是兩個像素。據介紹,這款極小的GPU還能夠以極低的成本支持OpenGL ES3.2和Vulkan,這勢必將幫助開發者在低端產品里實現更高的性能。
在Arm這些的產品賦能下,一個全新的科技世界即將到來,你準備好迎接了嗎?
-
AI
+關注
關注
87文章
30996瀏覽量
269290 -
人工智能
+關注
關注
1791文章
47350瀏覽量
238754 -
AI處理器
+關注
關注
0文章
92瀏覽量
9491
原文標題:AI處理器領銜,Arm全面賦能未來科技
文章出處:【微信號:MooreNEWS,微信公眾號:摩爾芯聞】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論