“自動駕駛所需要的計算力,是過去任何一臺計算機都沒有達到過的。” NVIDIA的掌門人黃仁勛曾在公開場合不止一次的說過這句話。
這句話背后,還有另一層意思。2010年之后,GPU類處理器內(nèi)部的晶體管數(shù)量還保持著快速增長的勢頭,而CPU已經(jīng)出現(xiàn)了明顯的放緩。
“摩爾定律已經(jīng)終結(jié),晶體管數(shù)每年增長50%,但CPU的性能每年僅增長10%,設(shè)計人員無法再創(chuàng)造出可以實現(xiàn)更高指令級并行性的CPU架構(gòu)?!痹?017年的GTC China上,NVIDIA的掌門人黃仁勛如是說。
NVIDIA是一家研發(fā)生產(chǎn)GPU的公司,對GPU自然有區(qū)別于他人的崇拜,捧GPU貶CPU可以理解。但,摩爾定律確實失效了。
NVIDIA是一家傳統(tǒng)消費電子廠商,但在汽車領(lǐng)域也不是完全的新手。早在2005年,NVIDIA就開發(fā)了用于3D導(dǎo)航信息系統(tǒng)的Tegra處理器,2011年用在了奧迪A8豪華車型上。
到目前為止,NVIDIA的汽車電子業(yè)務(wù)占該公司47億美元銷售額的4%。2015年,NVIDIA發(fā)布了針對自動駕駛的DRIVE PX系列,開啟了自動駕駛領(lǐng)域的馳騁,一時也成為了市場寵兒,股價扶搖直上。
支撐起這一切的,是NVIDIAGPU給自動駕駛帶來的想象——DRIVE PX運算力強大,是自動駕駛必備的運算力平臺。這正應(yīng)驗了黃教主開頭所說的話,此話不僅被競爭對手英特爾聽了去,同時也被股民聽了去。
那么,自動駕駛到底需耗費多少算力?誰是算力的最大消耗者?GPU碾壓CPU,NVIDIA超車英特爾已成定局?
視覺處理是大頭
自動駕駛的實現(xiàn),需要依賴感知傳感器對道路環(huán)境的信息進行采集,包括超聲波、攝像頭、毫米波雷達、激光雷達等,采集的好的數(shù)據(jù)需要傳送到汽車中央處理器進行處理,用來識別障礙物、可行道路等,最后依據(jù)識別的結(jié)果,規(guī)劃路徑、制定速度,自動驅(qū)使汽車行駛。
整個過程需要在瞬時完成,延時必須要控制在毫秒甚至微秒級別,才能保證自動駕駛的行駛安全。
要完成瞬時處理、反饋、決策規(guī)劃、執(zhí)行的效果,對中央處理器的算力要求非常高。
最直觀的體現(xiàn),便是用于感知道路環(huán)境的攝像頭,通常密布車身,數(shù)量在12個左右,為了識別障礙物,處理器需要對多路攝像頭實時拍攝的數(shù)據(jù)進行解析,而單顆1080P的高清攝像頭每秒可以產(chǎn)生超過1G的數(shù)據(jù),數(shù)據(jù)量不可謂不大。而為了準(zhǔn)確識別圖像、視頻中的有效信息,業(yè)內(nèi)多采用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)。
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)尤其是幾百上千層的神經(jīng)網(wǎng)絡(luò)對高性能計算要求非常高,GPU對處理復(fù)雜運算擁有天然的優(yōu)勢:它有出色的并行矩陣計算能力,對于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和分類都可以提供顯著的加速效果。
適用于自動巡航功能的 NVIDIA DRIVE PX 2 計算平臺采用新型單處理器配置,功率僅為 10 瓦,可以幫助車輛利用深度神經(jīng)網(wǎng)絡(luò)處理來自多個攝像頭和傳感器的數(shù)據(jù),運算力達到了24 Tops。
Tops(Terra Operations per second)是一個單位,意為每秒運算10^12次,也稱萬億次。這種說法通常用于表示處理器的運算力。
但汽車是一個終端,對功耗要求苛刻,因此根據(jù)TI的官方報告,通常對效率、功耗、算力要求較高的時候,對運算力的表述更為貼切的是GOPS/W of TOPS/W,即消耗單位瓦數(shù)可以完成多少運算量。
業(yè)內(nèi)人士表示,在自動駕駛中,最耗費算力的當(dāng)屬視覺處理,占到全部算力需求的一半以上。而圖像處理是GPU的強項,CPU并不占優(yōu)勢,這一點已經(jīng)在傳統(tǒng)領(lǐng)域得到了驗證。
Mobileye的ADAS霸業(yè)
那么視覺處理中,不同等級自動駕駛中對算力的要求有什么區(qū)別?每一家公司在權(quán)衡之后,選擇特定的視覺芯片方案有什么原因?Minieye的CEO劉國清在面對《高工智能汽車》的提問時表示,這是一個業(yè)內(nèi)人士都知但不為外人道的話題。
嗯,聽起來很神秘,但想要找到答案其實也并不難。
Mobileye是自動駕駛領(lǐng)域視覺處理最領(lǐng)先的公司(這是基于其市場占有率以及車載領(lǐng)域的經(jīng)驗而言)。
從2004年開始,Mobileye相繼推出了EyeQ系列的視覺處理芯片,2010年上市的EyeQ2算力為 0.026Tops,功耗2.5w,支持L1的功能;2014年發(fā)布的EyeQ3每秒浮點運算為0.256萬億次,功耗為2.5w,支持L2;2015年發(fā)布EyeQ4每秒浮點運算可達2.5萬億次,功耗為3w,最高可支持L3;EyeQ5計劃于2020年量產(chǎn),單顆芯片的浮點運算能力為12Tops,TDP是5W。
Mobileye通過EyeQ芯片,驅(qū)動單顆攝像頭,可以采集路面信息,對周圍環(huán)境進行精細解讀,實現(xiàn)前碰撞預(yù)警(FCW)、前方車距監(jiān)測與預(yù)警系統(tǒng)(HMW)、車道偏離預(yù)警系統(tǒng)(LDW)、行人探測與防撞系統(tǒng)(PCW)、城市前碰撞警告 (UUFCW 與智能遠光燈控制系統(tǒng)(IHC)等功能,準(zhǔn)確預(yù)測前方道路可以出現(xiàn)的障礙和危險。
其識別準(zhǔn)確率達99.99%,到目前為止,已有超過千萬的出貨量,占市場份額超過70%。特斯拉的AutoPilot 1.0的硬件方案就選用了Mobileye的EyeQ3。
Mobileye通過使用專有的計算cores(加速器)實現(xiàn)功耗 - 性能成本目標(biāo),這些cores專門針對各種計算機視覺,信號處理和機器學(xué)習(xí)任務(wù)進行了優(yōu)化,其中包括深度神經(jīng)網(wǎng)絡(luò)。
這些加速器內(nèi)核專為滿足ADAS和自動駕駛市場的需求而設(shè)計。每個EyeQ ?芯片具有異質(zhì)的,完全可編程的加速器; 每種加速器類型都針對其自己的算法系列進行了優(yōu)化。
加速器體系結(jié)構(gòu)的多樣性使應(yīng)用程序能夠通過為每項任務(wù)使用最合適的內(nèi)核來節(jié)省計算時間和芯片功耗。優(yōu)化任務(wù)cores的分配從而保證了EyeQ ? 在低功耗范圍內(nèi)提供“超級計算機”功能,實現(xiàn)高性價比的被動散熱。
Mobileye的core是包含一組工作在1GHZ的工業(yè)級四核MIPS處理器,支持多線程技術(shù)能更好的進行數(shù)據(jù)的控制和管理; 多個專用的向量微碼處理器(VMP(Vector Microcode Processor,俗稱VMP)),用來應(yīng)對ADAS相關(guān)的圖像處理任務(wù)(如:縮放和預(yù)處理、翹曲、跟蹤、車道標(biāo)記檢測、道路幾何檢測、濾波和直方圖等);一顆軍工級MIPS Warrior CPU位于次級傳輸管理中心,用于處理片內(nèi)片外的通用數(shù)據(jù)。
自動駕駛算力之爭,NVIDIA領(lǐng)銜
Autopilot 2.0 使用了Drive PX2,DRIVE PX 2有多個版本,AutoCruise,搭載一顆Tegra Parker,主要支持高速公路自動駕駛和高精地圖繪制的計算;AutoChauffeur,搭載2顆Tegra Parker和2顆獨立的Pascal架構(gòu)GPU,支持點到點的自動駕駛;Fully Autonomous Driving,由多套Drive PX2組成的計算矩陣。
NVIDIA2015年推出了Drive PX系列,第一代Drive PX搭載TegraX1處理器和10GB內(nèi)存,能夠同時處理12個200萬像素攝像頭每秒60幀的拍攝圖像,單浮點計算能力為2Tops,深度學(xué)習(xí)計算能力為2.3Tops,可支持L2高級輔助駕駛計算需求。
2016年發(fā)布的Drive PX2,單精度計算能力達到8TFlops,深度學(xué)習(xí)計算能力達24Tops,TDP達250W,可滿足L3級別的自動駕駛需求。
Drive PX2采用16nm FinFET工藝,TDP 250W,支持12路攝像頭輸入、激光定位、雷達和超聲波傳感器。
它的目的是通過NVIDIA DIGITS打造一套車輛的深度學(xué)習(xí)訓(xùn)練平臺,讓每輛安裝Drive PX2的車輛都成為都成為NVIDIA DRIVENet深度神經(jīng)網(wǎng)絡(luò)一部分,它將包括3個卷積碼層,3700萬個神經(jīng)元。傳說如果一條信息要在整個網(wǎng)絡(luò)流經(jīng)一次,將會產(chǎn)生400億次操作。
根據(jù)黃仁勛在BCW 2017的表述,Drive PX2的方案是針對L3的方案(作為參考的是奧迪A8推出的有限場景下的L3級自動駕駛,采用的ZF ProAI正是使用了NVIDIA Tegra K1 SoC,及Drive PX2 AutoCruise版本,當(dāng)然負責(zé)視覺處理的還是Mobileye的EyeQ3),而Xavier則是針對L4的方案,Xavier的運算力達到了1Tops/W。Drive Xavier于2018年發(fā)布,算力可達30Tops,TDP為30W。
到目前為止,黃教主給L3、L4級別的自動駕駛算力,列出了自己心目中的標(biāo)準(zhǔn)。這一標(biāo)準(zhǔn)由于標(biāo)新立異,還未有人敢質(zhì)疑。
自動駕駛公司在進行新項目的研發(fā)時,也往往以NVIDIA的開發(fā)板為首。傳統(tǒng)的芯片巨頭英特爾,在巨資收購Mobileye后,心里還不踏實,因為Mobileye一直針對的是ADAS,其量產(chǎn)的EyeQ3芯片0.256Tops的算力,跟NVIDIA PX2的8/24Tops相比,似乎差了一個時代。
算力的焦慮在困擾著Inter這個巨頭,自動駕駛公司同樣也不輕松,開發(fā)中可以使用NVIDIA打底,量產(chǎn)方案卻少有人嘗鮮。
這一方面是源于價高非車規(guī)級,另一方面NVIDIA也需要汽車市場的驗證。另一頭Mobileye的EyeQ系列,基本為自用,不放心外人擅自開發(fā),NVIDIA和Mobileye的分手據(jù)傳也緣起于此。
那么,留給自動駕駛公司的芯片方案,還有哪些呢?市場應(yīng)聲者寥寥無幾,NXP、高通、英飛凌等公司,推出的都是針對較低自動駕駛等級的ADAS芯片方案,目前一些有量產(chǎn)項目的ADAS公司,采用的也多是這些傳統(tǒng)車載芯片領(lǐng)域廠商的產(chǎn)品。這些廠商之間的方案有什么異同?留待下一篇文章再述吧~
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4771瀏覽量
100720 -
NVIDIA
+關(guān)注
關(guān)注
14文章
4981瀏覽量
102995 -
自動駕駛
+關(guān)注
關(guān)注
784文章
13786瀏覽量
166400
原文標(biāo)題:自動駕駛的算力之爭,誰在孤獨求??? | GGAI視角
文章出處:【微信號:ilove-ev,微信公眾號:高工智能汽車】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論