色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Waymo對軟件算法過分重視,忽視了硬件平臺

佐思汽車研究 ? 來源:佐思汽車研究 ? 作者:佐思汽車研究 ? 2022-08-11 10:17 ? 次閱讀

Waymo早在2008年就開始投入自動駕駛,當時還屬于谷歌X事業部,不過14年過去,Waymo幾乎一事無成,聲音也越來越小,根本的原因就是Waymo對軟件算法過分重視,忽視了硬件平臺。這幾年英偉達高通自動駕駛芯片的崛起與Waymo的沒落形成鮮明對比。自動駕駛的軟件和硬件是硬幣的兩面,無法分割,整套解決方案必然包括軟件和硬件。單獨提供軟件或硬件都沒有出路,因為自動駕駛軟硬件配合度要求太高,很難移植。這主要是深度學習算法模型與硬件高度捆綁,兩者不匹配很容易導致效率低下,硬件的利用率低到10%以下是經常遇到的。

Waymo早期是采用英特爾芯片做計算平臺的,主要是基于服務器CPU至強和FPGA加速卡。

81e47c5e-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯網

Waymo計算平臺,其中以太網交換機應該也是用FPGA搭建的,因為這么高帶寬的以太網交換機現在還沒有量產,幾年前更不可能有了。只有FPGA能做到如此高的帶寬,代價是價格很高,至少在1000美元以上。還有兩個至強CPU之間應該還需要PCIe交換機。 FPGA可能是Arria 10 1150GX,目前售價大約2000美元,2013年時可能要4000美元以上。Altera的FPGA共有四大系列,分別是頂配的Stratix系列、成本與性能平衡的Arria系列、廉價的Cyclone系列、帶NVM的MAX系列。Stratix系列多在近萬美元以上,Arria系列大約在2000-5000美元之間,Cyclone系列多在10-20美元之間。Arria系列再細分10、V、II、GX四個系列,10系列為最新產品,于2013年推出,采用20納米工藝,GX為第一代產品,2007年推出,采用90納米工藝,II系列為2009年產品,采用40納米工藝,V系列為2011年產品,采用28納米工藝。10系列再分為帶ARM內核和不帶ARM內核兩大類。ARM內核為雙A9內核。 1150GX擁有標準FPGA的1150K個邏輯元素外,還擁有1518個硬核單精度浮點運算乘法器/加法器,3036個18*19乘法器。最終能夠獲得3340GMACS(等于每秒百萬次的定點乘累加運算),還有1366 GFLOPS的浮點運算能力。AI算力最高是26TOPS@Int8。在2013年這個算力可以算是非常驚人的,價格當然也很驚人。 FPGA是效率最高的運算單元,FPGA之所以比CPU甚至GPU能效高,本質上是無指令、無需共享內存的體系結構帶來的福利。馮氏結構中,由于執行單元(如CPU核)可能執行任意指令,就需要有指令存儲器、譯碼器、各種指令的運算器、分支跳轉處理邏輯。由于指令流的控制邏輯復雜,不可能有太多條獨立的指令流,因此GPU使用SIMD(單指令流多數據流)來讓多個執行單元以同樣的步調處理不同的數據,CPU也支持SIMD指令。而FPGA每個邏輯單元的功能在重編程(燒寫)時就已經確定,不需要指令。 FPGA中的寄存器和片上內存(BRAM)是屬于各自的控制邏輯的,無需不必要的仲裁和緩存。對于通信的需求,FPGA每個邏輯單元與周圍邏輯單元的連接在重編程(燒寫)時就已經確定,并不需要通過共享內存來通信。FPGA實際就像是一片SRAM,它沒有AI芯片難以克服的內存墻問題,有點像存內計算,但要比存內計算規模大太多了。FPGA的硬件利用率可輕松做到80%以上,因此FPGA的頻率都比較低。 但FPGA的布線沒有優化,有大面積的硅片資源閑置,浪費了,這導致其成本飛速上升,小規模的FPGA價格很低,一旦越過30-50萬邏輯單元,價格直線飛升。 Waymo的計算平臺單芯片成本就已超過4000美元,并且都是非車規的,顯然這無法量產。2019年以后,Waymo的聲音就慢慢沉寂,而軟硬一體的高通和英偉達發展越來越順利。 眼看英偉達和高通一飛沖天,Waymo也幡然悔悟,2021年就開始籌劃與三星推出自動駕駛芯片,正式推出可能在2023年底。和英偉達、高通相比,Waymo的劣勢在于英偉達和高通都是芯片巨頭,兩者出貨量巨大,特別是高通,能夠大幅度降低芯片成本。Waymo訂制芯片,出貨量必然是很低的,谷歌的TPU用在數據中心,成本敏感度不高,但汽車不行。同時谷歌的TPU出貨量相對自動駕駛汽車還是不低的。 要做到商業化,成本是必須考慮的。Waymo找到了三星做合作伙伴,三星每年手機CPU芯片上億,足以和高通抗衡,足以攤薄成本。三星與谷歌合作是從谷歌第一代手機芯片Tensor開始。高通的Snapdragon Ride平臺目前是SA8540p+SA9000。SA8540p近似于高通手機5納米芯片888,只不過SA8540p可能采用4大核4小核的設計,即4個Cortex-X1加4個A78。去掉了強調A55小核。高通以此還衍生出針對筆記本電腦的8cx gen3,與SA8540p非常近似,但去掉了5G modem。 能做手機SoC,就能做自動駕駛芯片,三星、蘋果、聯發科都可以。

81f050ce-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯網

谷歌第一代Tensor芯片,用于谷歌Pixel 6系列手機上,實際就是基于三星Exynos 2100的修改版。

第一代Tensor與三星Exynos2100對比

82073974-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯網

在NPU方面,Exynos 2100是壓倒性優勢的26TOPS,谷歌是5.7TOPS。不過在實際測試中,Exynos 2100優勢不明顯。

821210a6-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯網

驍龍888、谷歌Tensor與Exynos 2100的NNAPI即神經網絡測試跑分,谷歌Tensor優勢明顯。

8223d3ae-191b-11ed-ba43-dac502259ad0.png

NLP自然語言處理方面,谷歌Tensor優勢非常明顯。

圖片來源:互聯網

8233d420-191b-11ed-ba43-dac502259ad0.png

離線圖像分類跑分測試,Tensor差距也不算大。

圖片來源:互聯網

Waymo的自動駕駛芯片不大可能基于第一代Tensor,因為第二代Tensor已于2022年7月底量產了。Waymo的自動駕駛芯片很有可能基于第二代Tensor,目前未有基于第二代Tensor的消息,但很顯然,三星不會給谷歌做太多工作,應該就是Exynos 2200的修改版,畢竟第一代Tensor的具體型號就是Samsung ExynosTensor GS101,從型號就能看出,這是Exynos2100的修改版。

8249311c-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯網

Waymo的自動駕駛芯片芯片應該會基于三星4納米工藝。超大核應該還是兩個Cortex-x2,而不是Exynos的1個。兩個Cortex-710的中核,四個A510的小核。GPU方面估計也是基于AMD RNDA2代的GPU,足以和高通的Adreno 730一爭高下。 CPU和GPU沒有太多操作空間,NPU應該是谷歌擅長的。

谷歌歷代TPU對比

8255d75a-191b-11ed-ba43-dac502259ad0.png

圖片來源:互聯網

谷歌從2016年推出第一代TPU,2021年推出第四代,第四代TPU的算力沒有公開數據,只說比第三代的兩倍。第三代TPU的算力是360TOPS@Int8,那么第四代應該是720TOPS@Int8。不過TPU是針對數據中心的。針對邊緣計算,谷歌還有TPU EDGE,價格非常低廉,應該不超過10美元。 谷歌沒有公布TPU V4的算力,但給出了下表,用在各種算法模型上的消耗時間,完全可以超越頂級英偉達系統。

8267cbd6-191b-11ed-ba43-dac502259ad0.png

備注:這是在2021年中期測試的數據。

圖片來源:互聯網

Waymo的策略應該與高通一樣,也是一片SoC加一片加速器。SoC基于二代Tensor也就是基于三星Exynos 2200,其內部的NPU算力至少能到30TOPS。加速器應該基于4代TPU或5代TPU做修改而來,算力估計360TOPS。這樣一來,成本大大降低,應該不高于英偉達系統的成本。此外4代或5代TPU都應該委托三星而非臺積電代工,臺積電代工當然更好,但價格會遠高于三星,且谷歌的訂單數量太少,在產能緊張大客戶云集的臺積電那里肯定要排隊等待,因此谷歌一直選弱勢的三星做合作伙伴。 自谷歌開始搞自動駕駛以來,其定位就比較模糊,戰略經常變化,最初似乎是想提供全套軟件解決方案,然后是自己制造無人駕駛小車,再后是做無人出租車運營,現在似乎是回歸最初,提供包括硬件計算平臺在內的全套解決方案。主要是自動駕駛算法的門檻極低,單獨的算法沒多少價值,自動駕駛軟件里最有價值的應該是經過人工標注的數據集,這沒什么技術含量,完全靠人力和資金。如今Waymo試圖和英偉達或高通競爭,顯然已經晚了,Waymo的最終結局想必大家都已經能預測到。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1630

    文章

    21781

    瀏覽量

    604936
  • 芯片
    +關注

    關注

    456

    文章

    51075

    瀏覽量

    425861
  • 自動駕駛
    +關注

    關注

    784

    文章

    13910

    瀏覽量

    166760

原文標題:Waymo幡然悔悟,做自動駕駛必須自研芯片

文章出處:【微信號:zuosiqiche,微信公眾號:佐思汽車研究】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    RAID 5 硬件軟件 RAID 的區別

    磁盤陣列。 這些控制器內置獨立的處理器(CPU)和內存,專門用于處理RAID運算和數據傳輸。 軟件RAID : 由操作系統通過軟件來管理和實現,不依賴于專用硬件。 使用主機的CPU資
    的頭像 發表于 12-27 18:05 ?379次閱讀

    Moove攜手Waymo,共塑城市出行新未來

    近日,全球創新出行方案的佼佼者Moove,欣然揭曉與自動駕駛技術領航者Waymo的突破性車隊合作協議。這一攜手,標志著Waymo One應用平臺上首個此類商業伙伴關系的誕生。 根據雙方達成的協議
    的頭像 發表于 12-27 14:42 ?232次閱讀

    HAL庫在Arduino平臺上的使用

    ,適合于快速原型開發和教育。HAL(硬件抽象層)庫是一種在Arduino平臺上使用的軟件庫,它提供一種標準化的方式來訪問硬件功能,使得開發
    的頭像 發表于 12-02 14:04 ?384次閱讀

    【「從算法到電路—數字芯片算法的電路實現」閱讀體驗】+介紹基礎硬件算法模塊

    作為嵌入式開發者往往比較關注硬件軟件的協調。本書介紹除法器,信號發生器,濾波器,分頻器等基本算法的電路實現,雖然都是基礎內容,但是也是最常用到的基本模塊。 隨著逆全球化趨勢的出現
    發表于 11-21 17:05

    【「從算法到電路—數字芯片算法的電路實現」閱讀體驗】+一本介紹基礎硬件算法模塊實現的好書

    作為嵌入式開發者往往比較關注硬件軟件的協調。本書介紹除法器,信號發生器,濾波器,分頻器等基本算法的電路實現,雖然都是基礎內容,但是也是最常用到的基本模塊,本書的內容比較對本人胃口。
    發表于 11-20 13:42

    Waymo在洛杉磯全面開放無人駕駛出租車服務

    近日,Alphabet旗下的無人駕駛出租車公司Waymo宣布一個重大消息:其出租車服務Waymo One現已對洛杉磯的所有用戶全面開放。這一舉措標志著Waymo在無人駕駛出租車領域的
    的頭像 發表于 11-14 11:41 ?781次閱讀

    為什么FPGA屬于硬件,還需要搞算法

    交流學習,共同進步。 交流問題(一) Q:為什么FPGA屬于硬件,還需要搞算法? 剛入門準備學fpga但一開始學的是語法,感覺像是電路用軟件語言描述出來,fpga不用會pcb
    發表于 09-09 16:54

    請問是什么決定SPI閃存的特性,硬件還是軟件

    我想燒錄更大的軟件,我可以選擇 512 512 地圖,就像 1024 1024 一樣嗎?(或者地圖也是由硬件強加的?
    發表于 07-19 06:46

    深度學習算法在嵌入式平臺上的部署

    隨著人工智能技術的飛速發展,深度學習算法在各個領域的應用日益廣泛。然而,將深度學習算法部署到資源受限的嵌入式平臺上,仍然是一個具有挑戰性的任務。本文將從嵌入式平臺的特點、深度學習
    的頭像 發表于 07-15 10:03 ?1615次閱讀

    EasyGo使用筆記丨分布式光伏集群并網控制硬件在環仿真應用

    該模型的仿真驗證。最后,基于實時仿真器NetBox和DSP,構建完整的硬件在環仿真平臺。分別對各算法進行了測試,并與常規仿真方式下的效果進行對比,驗證分布式光伏集群并網控制
    發表于 07-12 17:20

    基于網絡的設計平臺Canva收購Affinity創意軟件套件

    基于網絡的設計平臺Canva收購Affinity創意軟件套件,將自己定位為Adobe數字設計行業的挑戰者。
    的頭像 發表于 04-01 17:29 ?847次閱讀

    fpga是硬件還是軟件

    FPGA(現場可編程門陣列)本質上是一種硬件設備,但它在功能實現上結合硬件軟件的特性。
    的頭像 發表于 03-27 14:14 ?965次閱讀

    為何高端FPGA都非常重視軟件

    不僅使軟件工程師能夠開發在嵌入式處理子系統上運行的代碼,而且還使這些軟件工程師能夠創建利用FPGA架構來加速其應用程序的加速器。 正如我們最近所寫,Xilinx剛剛發布他們的Vitis統一
    發表于 03-23 16:48

    fpga是硬件還是軟件

    FPGA(現場可編程門陣列)屬于硬件設備,而不是軟件。它是一種可編程的硬件設備,由大量的邏輯單元、存儲單元和互連資源組成,能夠實現復雜的數字電路和系統設計。
    的頭像 發表于 03-14 17:08 ?1967次閱讀

    什么是云平臺?軟件被云平臺攔截怎么辦

    平臺是一種基于云計算技術的服務平臺,它為用戶提供可彈性擴展的計算資源、存儲能力和其他服務,以支持用戶在云環境下進行開發、部署和管理應用程序。通過云平臺,用戶可以實現對于計算、存儲和
    的頭像 發表于 02-02 16:37 ?2437次閱讀
    主站蜘蛛池模板: 一本大道香蕉中文在线视频观看 | 97超碰97资源在线观看| 国产精品视频免费视频| 亚洲午夜精品A片久久不卡蜜桃 | 女人张开腿让男人桶爽免| 2020精品国产视| 国产在线播放精品视频| 亚洲欧美精品无码一区二在线 | 91欧洲在线视精品在亚洲| 国产精品九九久久精品视| 日韩欧美精品有码在线播放| AV一区AV久久AV无码| 美女久久久| 国产AV天堂亚洲AV麻豆| 日韩一区二区三区射精| ZZoo兽2皇| 免费亚洲视频| 国产爱豆果冻传媒在线观看视频 | 久久视频在线视频观看天天看视频| a色毛片免费视频| 日韩欧美中文字幕一区| 99精品视频在线免费观看| 手机在线观看你懂的| 久久亚洲AV成人无码动态图| 最新无码国产在线视频2020| 国自产精品手机在线视频| 你是淫荡的我的女王| 操中国老太太| 亚洲AV成人无码999WWW| 韩日美无码精品无码| 4388成人| 亚洲欧美在无码片一区二区| 欧美亚洲曰韩一本道| 鞋奴的视频VK| 捆绑调教网站| 亚洲人成77777在线视频| 国产精品一区二区AV交换| AAA级精品无码久久久国片| 亚洲乱码日产精品BD在线下载| 试看做受120秒免费午夜剧场| 日韩无码在线|