12月30日,位于上海的特斯拉工廠將開始交付Model 3。意味著,這家工廠將在開工357天后開始向客戶交付汽車,這將創下全球汽車制造商在華的新紀錄。
上海工廠是特斯拉全球計劃的一部分,目的是增強其在世界最大汽車市場的影響力,更重要的是本地化的工程研發團隊也即將落地,目的之一就是適應中國路況的自動駕駛功能優化。
?
目前,特斯拉在國內的Autopilot版本更新一直落后于美國市場。而在今年9月,交通運輸部部長***會見特斯拉CEO馬斯克時,雙方就自動駕駛技術發展交換了意見。顯然,特斯拉在過去一年時間,已經頻繁與中國的相關主管部門進行各種溝通,這在過去是不常見的。
彼時,交通運輸部特別強調了歡迎包括特斯拉在內的各國新能源汽車制造商、自動駕駛研發機構和企業與中國科研單位、企業加強技術交流和研發合作,不斷拓展合作范圍,共同推動自動駕駛技術落地。
而馬斯克表示,特斯拉愿與中方一道努力,持續加強在自動駕駛技術研發、標準制定等方面的交流與合作,期待得到中國交通運輸部的更多支持。
與此同時,最快于明年部署全自動駕駛系統的特斯拉,正在陸續披露一系列和自動駕駛功能相關的技術細節。
一、全自動駕駛底層技術陸續曝光
這其中,近日披露的一個專利對于其全球化部署意味深重。這個名為數據管道(data pipeline)和深度學習系統的專利,優化了用于深度學習的圖像處理過程,除了車端深度學習的流程優化之外,還特別提到了未來如何在全球市場共享數據。
按照專利的描述,從單一車輛上提取的圖像數據信息將與其他特斯拉用戶在全球范圍內收集的數據進行比較,一方面緩解駕駛員在自動駕駛時系統可能執行錯誤過程的擔憂,同時在特斯拉自動駕駛軟件穩定版本的性能基礎上加以改進,而且改進的過程比以前更有效率。
“通過這個過程,特斯拉能夠從車輛的攝像頭和傳感器捕捉的圖像中保持盡可能高的分辨率。這樣,神經網絡就可以更有效地從它所接收的數據包中學習。這使得神經網絡能夠以更有效的方式處理更好的圖像,從而為更快地改進自動駕駛技術打開了大門。”
而特斯拉的新數據管道和深度學習專利為更快的自動駕駛改進鋪平了道路。這項新專利,意味著特斯拉的數據傳輸管道可能是業內最大的之一,因為它從數十萬輛配備了大量傳感器的汽車中提取數據。
在應用中,特斯拉解釋了其系統正在解決的問題:
用于實現自動駕駛的深度學習系統通常依靠捕獲的傳感器數據作為輸入。在傳統的學習系統中,通過將捕獲的傳感器數據從傳感器格式轉換為與學習系統的初始輸入層兼容的格式,使捕獲的傳感器數據與深度學習系統兼容。
這種轉換可能包括壓縮和下采樣,從而降低原始傳感器數據的信號保真度。此外,更換傳感器可能需要一個新的轉換過程。因此,需要一種定制的數據管道,可以最大限度地從捕獲的傳感器數據中獲取信號信息,為深度學習網絡提供更高層次的信號信息,進行深度學習分析。
特斯拉在專利申請中描述了它的解決方案:
本發明公開了一種數據管道,該數據管道將傳感器數據作為獨立組件提取并提供給用于自動駕駛的深度學習網絡。在一些實施例中,使用深度學習網絡和從傳感器接收的輸入數據實現自動駕駛。
例如,安裝在車輛上的傳感器將車輛周圍環境的實時傳感器數據(如視覺、雷達和超聲波數據)提供給神經網絡,用于確定車輛控制響應。
在一些實施例中,網絡使用多層實現。根據傳感器數據的信號信息,將傳感器數據提取為兩個或多個不同的數據組件。例如,特征或邊緣數據可以從全局數據中分離出來,提取到不同的數據組件中。
而不同的數據組件保留了目標相關的數據,例如,數據最終會被深度學習網絡用來識別邊緣和其他特征。在一些實施例中,不同的數據組件作為存儲與識別特定目標功能高度相關的數據的容器,但它們本身并不識別或檢測功能。
不同的數據組件提取數據,以確保在機器學習網絡的適當階段進行準確的特征檢測。在某些實施例中,可以對不同的數據組件進行預處理,以增強其包含的特定信號信息。可以對數據組件進行壓縮或下采樣,以提高資源和計算效率。然后在系統的不同層將不同的數據組件提供給深度學習系統。
深度學習網絡能夠利用提取過程中保留的信號信息作為輸入,準確地識別和檢測與數據組件的目標數據(如邊緣、對象等)相關的特征。
例如,將特征和邊緣數據提供給網絡的第一層,將全局光照數據提供給網絡的后一層。通過提取不同的數據組件,每個組件保留各自的目標信號信息,網絡可以更有效地處理傳感器數據。
同時,不再接收傳感器數據作為網絡的初始輸入,而是在網絡的最適當層向網絡提供最有用的信息。在一些實施例中,由于不同的數據組件可以充分利用其各自組件的圖像分辨率來實現其預期目的,因此網絡將分析捕獲的傳感器數據的更完整版本。
例如,特征和邊緣的輸入可以利用特征和邊緣數據的整個分辨率、位范圍和位深度,而全局光照的輸入可以利用全局光照數據的整個分辨率、位范圍和位深度。
有趣的是,專利中列出的三位工程師中的兩位已經不在特斯拉工作了。至于剩下這位工程師是否還在特斯拉尚不清楚。這至少說明此項專利已經在內部應用較長時間。
二、實際行駛數據+深度學習+OTA
一直以來,特斯拉的神經網絡接受大量真實數據的訓練,這些數據是從用戶實際行駛收集來的。目前,所有的特斯拉車型都配備了某種版本的Autopilot,累計總共行駛了大約20億英里。
當特斯拉為Autopilot添加一個新功能時,它首先會向一小群“early access”用戶進行部署。從他們的車中記錄的數據然后被用來完善功能,隨后用戶群被擴大,然后更多的完善。一開始看起來粗糙和不可靠的新功能可以在幾周內改變。
更讓人驚訝的是,在今年彭博社的一次用戶調查中,特斯拉車主在很大程度上支持馬斯克的做法,即使自動駕駛偶爾會出問題。
以最新發布的智能召喚(也可以理解為L4的自主泊車)為例,盡管網絡上不少功能出故障的視頻,但調查結果顯示,高達70%的車主認可該功能。不過,一些安全倡導者批評特斯拉把客戶當作實驗品。
馬斯克表示,現實世界的訓練(提升自動駕駛功能)是減少車禍的最快途徑,也可能是唯一途徑。至少對于智能召喚來說,錯誤發生在停車場(低速),并且不太可能造成嚴重的傷害。
智能召喚是特斯拉實現自動駕駛的高頻場景之一,停車場對自動駕駛來說是出了名的難。一方面,不在道路法規管轄范圍內;另一方面,不同停車場的標記線、行駛路線不規則以及車流、人流混雜。
智能召喚需要對人類行為有深刻的理解。在智能召喚發布后的第一個月里,特斯拉車主們使用了100多萬次。馬斯克表示,這將有助于“讓我們能夠檢查這些角落里的情況,并從中進行快速學習”。
看看用戶的真實評論,或許你更能明白其中的道理。
“雖然這款軟件目前還處于測試階段,但在駕駛員的監督下使用已經足夠了。這是完全自動駕駛的先驅,隨著時間的推移,它會變得更加可靠,就像Autopilot一樣。”盡管我們經常會在網絡上看到一些車主對功能的濫用,但實際上大多是特斯拉車主仍然非常謹慎使用,并且期待功能的不斷完善。
作為軟件定義汽車最典型的代表,自動駕駛的真正商業化,應該是在車企、用戶及系統之間形成一個真正的閉環,從而基于真正有效的數據來反哺系統的不斷自我學習。
這或許也能解釋,為什么今年特斯拉收購了計算機視覺初創公司DeepScale。后者有一項名為SqueezeNet的解決方案,可以實現深度神經網絡在更小的設備上工作,并且允許以超高效的方式處理大量數據。
這在全自動駕駛時代尤其重要,因為系統從車輛的多傳感器中收集了大量數據。特斯拉基于自主研發的FSD芯片,基于DeepScale的技術幫助更好地優化硬件、數據處理和深度學習,而無線更新(OTA)則是一個高效的解決方案為系統不斷迭代提供助力。
然而,今天典型的CNN/DNN模型的空中更新需要大量的數據傳輸。DeepScale的另一項核心技術就是保證更小的模型需要更少的通信,使得頻繁的更新更加可行。
這包括較小的卷積神經網絡(CNNs)在分布式訓練中需要較少的服務器間通信;更小的CNNs需要更少的帶寬將新模型從云端導出到自動駕駛汽車上;較小的CNNs更適合部署在內存有限的FPGAs和其他硬件上。
使用SqueezeNet,可以實現與AlexNet相比模型尺寸減少50倍,同時達到或超過了AlexNet的top 1和top 5的精度。模型的縮減量遠高于SVD、網絡裁剪和深度壓縮。
同時,應用8位量化的深度壓縮,SqueezeNet得到一個0.66MB的模型(比32位的AlexNet小363×),與AlexNet的精度相當。此外,在SqueezeNet上采用6位量化和33%稀疏的深度壓縮,可以得到一個0.47MB的模型(比32位AlexNet小510×),并且具有同等的精度。
有趣的是,DeepScale的第一款產品是一款名為Carver21的感知軟件,專門用來優化自動駕駛汽車前置攝像頭的數據處理。這與一直堅持視覺優先的特斯拉非常匹配,同時其也擁有道路上最大的聯網車隊,大量的真實數據對于DeepScale也是最佳的實踐。
這就是DeepScale的SqueezeNet發揮作用的地方。由于其精確度與最先進的神經網絡相匹配,因此能夠對神經網絡進行有效的訓練,并保證神經網絡模型的最小化,并且保證硬件上的可用資源進行速度-精度的權衡。
DeepScale的全棧深度學習方法使人工智能軟件與各種處理器和傳感器緊密集成,實現可定制的自動駕駛功能。模塊負責從訓練、開發、部署,甚至數據收集/管理的每一個方面。
實時決策對任何無人駕駛汽車都至關重要。能夠在集中式的高計算環境中部署更多具有更高精度的深度學習功能是任何自動駕駛汽車制造商所希望的。而且,在這么小的計算空間里部署多個DNN正是DeepScale的解決方案非常適合特斯拉的原因。
而隨著特斯拉的車隊(搭載Autopilot)增加到100萬輛,它的月行駛里程將達到10億英里左右(相當于之前一年的數據),比Waymo的月行駛里程約100萬英里高出1000倍。這意味著特斯拉具有從0.001%的里程中收集大量邊緣訓練樣本的機會。
評論
查看更多