2022 年,在技術、政策法規接連取得突破后,自動駕駛真正開始從小范圍的試驗場,走向大規模商業化落地。與此同時,挑戰隨之而來。不同于其他行業,自動駕駛關乎駕乘人員的安全,并且需要實時地處理海量的信息做出最為安全、穩妥的決策,稍有閃失便會產生嚴重的后果。這意味著,自動駕駛汽車在正式上路之前,需要經過大量的訓練與仿真測試,伴隨而來的,是車企對于超大算力的需求。
IDC 近期發布的《現實+仿真,超大算力賦能自動駕駛》白皮書,探討了目前自動駕駛的發展情況以及車企在自動駕駛開發過程中的需求和挑戰。此外,該報告還介紹了 NVIDIA 在助力蔚來、大陸集團構建 AI 數據中心方面的實踐經驗。
以下,我們來看具體內容。
助力汽車行業主機廠:
蔚來采用 NVIDIA HGX 搭建 AI 平臺
蔚來是一家全球化的智能電動汽車公司,致力于通過提供高性能的智能電動汽車與極致的用戶體驗,為用戶創造愉悅的生活方式。
01
技術挑戰
蔚來研發自動駕駛汽車所用的數據采集車輛每年會產生百 PB 級別的數據,以及幾十億張圖像。其量產車也需要回流海量的道路數據,用于優化算法模型。這意味著蔚來的數據中心需要具備能力回流、篩選、標注海量用于 AI 模型訓練的數據。這一過程離不開穩健的技術基礎架構,包括覆蓋全場景鏈路的人工智能平臺和大規模機器學習系統。
02
方案亮點
蔚來使用 NVIDIA HGX 構建綜合全面的數據中心基礎設施,并在此基礎上開發 AI 驅動的軟件定義汽車,包括 ET7、ET5。
蔚來的可擴展 AI 基礎設施由 NVIDIA HGX 驅動,共配備 8 個 NVIDIA 數據中心 GPU 和 NVIDIA ConnectX-6 InfiniBand 網卡。這個可擴展的超級計算機集群中包含一組 NVME SSD 服務器,并通過高速 NVIDIA Quantum InfiniBand 網絡平臺相互連接。
借助 NVIDIA 數據中心 GPU,蔚來以縱向和橫向擴展方式搭建并應用 AI 平臺。對 NVIDIA Multi-Instance GPU 的合理使用,使得算法工程師在開發過程中的工作效率和集群資源利用率得到巨大提升,讓蔚來的模型開發效率提高了 20 倍,幫助蔚來更快地落地自動駕駛產品,向更新更快的架構發展。
此外,蔚來在 NVIDIA NVLink 和 NVIDIA Mellanox InfiniBand 的基礎上,構建了支持多卡和多機訓練的深度學習訓練框架,使用 NVIDIA Mellanox InfiniBand 和基于 NVIDIA Mellanox InfiniBand 的 RDMA 技術,構建了分布式的高性能文件讀取加速套件。
對于與 NVIDIA 的合作,蔚來 AI 平臺負責人白宇利表示:“量產車面臨的復雜場景是蔚來自動駕駛能力的試金石,同時,量產車產生的海量數據也是未來自動駕駛能力的護城河。NVIDIA 的高性能計算解決方案成為了蔚來在自動駕駛這條道路上的加速器。”
賦能汽車行業一級供應商:
大陸集團基于 NVIDIA DGX AI 系統建立高算力集群
大陸集團致力于為汽車行業提供最尖端的技術與最可靠的服務,其駕駛輔助平臺利用 AI 技術訓練車輛自主決策,從而為司機提供協助,并在未來最終實現自動駕駛。
01
技術挑戰
隨著系統的復雜程度不斷提升,傳統的軟件開發與機器學習模式開始體現出自身的局限性,大陸集團以深度學習與仿真測試作為開發人工智能解決方案的基礎。大陸集團用于訓練神經網絡的數據主要來自測試車隊。目前,車隊中的車輛每天行駛的總測試里程為 15,000 公里,收集約 100TB 的數據,相當于 50,000 小時長的電影。被記錄的數據還需要通過回放用于模擬實車訓練。
02
方案亮點
大陸集團與 NVIDIA 基于 NVIDIA DGX AI 系統建立高算力集群,其超級計算機包含超過 50 套 NVIDIA DGX 系統,以 NVIDIA Mellanox InfiniBand 網絡連接,用于加速開發自動駕駛解決方案。同時提供接口與云端資源連接。主要應用場景包括深度學習和仿真測試。
新的算力集群將開發周期從幾周縮短至幾個小時,使自動駕駛得以在中短期商業計劃中落實。此外,機器學習時間的縮短加快了新科技進入市場的速度。
“超級計算機是對未來的投資,”大陸公司駕駛輔助系統團隊的總項目負責人 Christian Schumacher 說,“最先進的系統可以縮短訓練神經網絡的時間,與過往相比,借助 NVIDIA 的支持,我們能夠在相同的單位時間內增加至少 14 倍的測試量。”
小結
NVIDIA 提供適用于自動駕駛汽車的基礎架構,包括開發自動駕駛技術所需的數據中心全套硬件、軟件和工作流參考架構,涵蓋從原始數據采集到驗證的每個環節,為神經網絡開發、訓練和驗證以及仿真測試提供了所需的端到端基礎模塊。
在蔚來案例中采用的 NIVDIA HGX,是適用于龐大數據集、復雜模型等 AI 場景的加速服務器平臺。HGX 整合了 NVIDIA 數據中心 GPU、NVIDIA NVLink、NVIDIA Mellanox InfiniBand 網絡及在 NGC(NVIDIA GPU Cloud)中經全面優化的 NVIDIA AI 軟件堆棧。同時,它樹立了新的計算密度標桿,將 5 PETAFLOPS 的 AI 性能濃縮,并用一個平臺取代了各種 AI 工作負載的傳統孤島式基礎架構。
而在兩個案例中均采用的 NVIDIA DGX POD,其參考架構結合 NVIDIA 加速計算架構、Mellanox 網絡架構和系統管理軟件,能夠為蔚來、大陸集團這樣的行業變革引領者,提供高性價比、即買即用、方便部署的解決方案,使超級計算能力變得易于訪問、安裝、管理,從而滿足自動駕駛復雜架構的需求。
此外,可拓展性也是推動 NVIDIA DGX POD 占領市場的另一個亮點。隨著人工智能的發展,機器學習的速度日益提升,每一次創新都有可能帶來算力需求的指數型增長。超算基礎設施的可拓展性是滿足這一需求的重要前提。
原文標題:現實+仿真:自動駕駛的隱秘競技場
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3800瀏覽量
91346
原文標題:現實+仿真:自動駕駛的隱秘競技場
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論