此文所討論的是指汽車的自動駕駛,不是飛機,也不是輪船。
在英文中我們它會叫做Autonomous Driving,強調了車具有了自主意識,有自我決策能力甚至可以完全的無人駕駛,也稱為Self-Driving , Driverless 或 Fully Automated Driving ,注意這些不同于Automated Driving,后者還停留在被動性的,沒有自我決策的能力,我們常說的高級輔助駕駛(ADAS-Advanced Driving Assistant System)大約可歸于此。
有不少機構對自動駕駛作過等級的劃分,但目前最主流的當屬SAE(Society of Automotive Engineers)的定義。目前最新版是201806的,參考如下鏈接:
SAE J3016_201806
根據系統參與駕駛的比重,失效時如何響應,以及它的設計運行范圍。它把自動駕駛的級別分成了5級,如下圖:
DDT Dynamic driving task 動態駕駛任務,指汽車在道路上行駛所需的所有實時控制操作,主要是一些決策控制類的行為,不包括行程安排、目的地和途徑地的選擇等戰略上的功能。
OEDR Object and event detection and response 是對車輛周邊環境監控和響應的意思,是感知和判斷,可以通過對物體和事件檢測、認知歸類和并作出后續響應。
DDT Fallback 動態駕駛任務支援,比如系統性的失效或者路況過于復雜超出了系統的判斷決策能力時,如何進行支援。可以看出在Level 2水平時要完全由司機來處理,到了Level 3時系統就有了一定的自主決策能力了。
ODD Operational Design Domain 是設計運行域的意思,指自動駕駛系統被設計的起作用的條件及適用范圍,比如行駛區域范圍,道路情況(直路、彎路的半徑)、車速等,以確保系統的能力在安全的環境之內。
結合下圖,對五個等級進一步解釋:
Level 1
具有一定的駕駛輔助功能,它在橫向或者縱向控制上二選一,比如加減速或者轉向的控制,高速公路上具有定速巡航,車道保持功能的車處于這個級別。但所有的駕駛的操作和決策都還是由人完成。
Level 2
可以同時支持橫向和縱向的控制,但駕駛員仍然需要實時監控環境,手要時刻放在方向盤上,同時要保證出問題時隨時進行接管。此時系統也還不具備決策能力,比如特斯拉的自動駕駛就處于這個級別,目前頂多也只能算是2.5級,如當它要變道時,你要打轉向燈告訴系統,系統才能啟動變道的功能。
Level 3
它與L2最大的區別是系統具備了一定的自我決策能力,它能在某些情況下實現完全的自動駕駛,但是駕駛員仍要隨時準備應對接管車輛,不同的是系統會在失效前給司機提示和預留一定的時間,比如當出現復雜環境系統無法響應時,它會做出反饋,可以預留十幾秒或者更長的時間等人來接管控制權,并保證在這個時間內不出問題。要注意領航和巡航是有很大差距的,L1、 L2只能實現巡航功能,就是跟著別的車后面走,到L3級別是可以實現領航了,就有了自主決策的能力,這個的技術難度和復雜度會增加很多。
2018年奧迪A8就達到了這個級別,它們稱為Audi AI 交通擁堵自動駕駛系統TJP(Traffic Jam Pilot)在交通擁堵的路段可以啟動自動駕駛功能,駕駛員就可以完全不用管了,這個還是比較實用的,但在中國由于政策法規限制,這個功能現在無法用的,比如我們規定你的手不能長時離開方向盤。因為Level 3時仍需要一個駕駛員,并且要根據系統提示接管對車輛的控制,但車在路況好的時候人長時間不用關注車的駕駛,所以司機更容易走神,此時忽然遇到一個復雜情況系統無法處理,而駕駛員此時可能也無法回過神來。所以有些公司或機構在調研后認為這個級別更不安全不靠譜,直接忽略此級別,直接上更高級別,比如Google的Waymo。而傳統的OEM和一級供應商可能會一個級別一個級別的去實現,不會采用相對激進的方式,也可能因為市場策略不同。
Level 4
在這個級別已經完全不需要人來參與了,但它是有限制的完全自動駕駛,比如在某個園區或者公園的內行駛,另外對速度等也有可能一定要求。百度和金龍客車合作的自動駕駛巴士“阿波龍”就屬于這個級別,并且在車內你看不到駕駛位,并且沒有了方向盤。它今年在很多地方都在試運營,這個已然不是PPT,是實實在在的產品了。
Level 5
這個級別是無限制的自動駕駛,可以理解為在一個城市內,或者城市間,在任何的復雜交通場景中,自動系統都能夠勝任。這個級別是非常難以實現的。
自動駕駛的技術
自動駕駛是一個知識密集且科技含量很高的技術,不基于點什么很難把它講的相對清楚。做自動駕駛的公司也很多,而對于學習研究,百度的Apollo開源平臺是一個很好的選擇,我就根據這個平臺,結合個人理解粗略地講下自動駕駛所需技術。
無論詩和遠方或是閑晃總會有一個目的,為了體驗駕駛樂趣的閑晃這里不討論,對自動駕駛而言,首先需要一個目的地。先告訴汽車讓它知道要去哪里,定位出自己在哪里,然后再解決如何去,如果這些都是由汽車自動完成,就實現了高級別的自動駕駛。
如下圖可以很好地解釋自動駕駛的內涵:
據此我們可大體猜測下要用到的技術:
定位和規劃
要知道自己在哪兒,要有定位系統,就要用到GPS, 對于要厘米級的定位需要RTK技術,要用到IMU來互補GPS更新頻率慢的問題,還需要用到激光雷達點云匹配定位以解決長時間沒有GPS信號的問題,如能過山谷或隧道。我們所說的在哪是汽車要實時知道自己在高精度地圖的坐標,在這個前提下,再有了目的地就可以實時路徑規劃給出車輛行進的大方向。
感知和預測
在行進的過程中,車輛要實時感知Perception周圍的環境,并實時預測Prediction下一步如何動作,且有各種突發狀況,這一部分可能是整個自動駕駛技術里最難的。要對目標進行Detection Classification,要Tracking,還涉及到傳感器的融合Fusions,需要用到各種技術如CNNs,Machine Learning等等。所需運算量相當大,所有自動駕駛的CPU的運算性能要求特別高,要用到GPU最好是AI芯片。
此處要用到各種傳感器組合使用,如Camera,LiDAR,Radar等,以實現冗余和高可靠性,具體原因參考下圖。
這個是業界比較主流的做法。
特斯拉(Tesla)老板不信這個,堅決不用激光雷達,全球第一個自動駕駛引發死亡的案件就由此產生了,當時司機坐在Model S上,聽說是在看哈里·波特,我想可能是西游記,然后系統就把白色的卡車車箱當作了空氣當作了Nothing,全速撞了上去,司機直接和佛祖打牌去了。
控制
預測出汽車如何動作,還需要平滑的控制汽車的制動,這時又涉及到自動控制算法,對于自動駕駛車輛有個要求是能夠線控的,比如剎車,油門,轉向等都是可以計算機發命令來控制的。
至此自動駕駛所需技術定位,路徑規劃,感知,預測,控制技術就簡單介紹完。另外我們注意到還有個聯網功能,常說的Telematics或T-Box,目前的4G因帶寬和延時還無法滿足自動駕駛的要求,主要的功能是影音娛樂的功能,當5G普及后可能實現車輛協同的自動駕駛,比如超視距感知等功能。
自動駕駛的意義
安全
最主要的原因是安全,因為根據世界衛生組織(World Health Organization)的調查統計數據,全世界每年有超過125萬人死于車禍,而80%的原因是司機的人為因素。 人會有疲勞駕駛,注意力不集中,以及情緒問題,如路怒癥,另外還有可能酒駕,人的響應速度也遠沒有傳感器的響應速度快。
另外其實我們人類的大腦的進化還不是非常適應現代社會形態,工業社會只有兩百多年,汽車的出現也就一百多年的歷史,而我們人類大腦底層是億萬年進化的結果,大部分的時間又是處在狩獵和農耕時期,所以當我們看到一條蛇或者一些其它動物會產生本能的恐懼,而面對危險不知道多少倍的鋼鐵怪獸汽車卻無動于衷,人類大腦其實可能遠沒有進化到符合現代社會的要求。所以人類自己開車可能并不是最安全的選擇,或許再過幾百年后有人駕駛汽車只會出現在汽車博物館里,那時的人們可以會摸著方向盤踩著油門對當時居然是人類自己駕駛汽車這個危險的東西而感到不可思議。
利益
安全是很重要,但對于各大公司來講這應當不是他們的驅動力,真正驅動他們投入巨大財力進行駕駛駕駛研發的是因為利益的追求和渴望以及對錯失這個市場的恐懼。資本都是逐利的,都在想著搶占這個很快到來的的萬億級的市場。據有研究報告顯示至2025年,自動駕駛市場規模將會達到2000億至 1.9 萬億美元。
顛覆
當然也有可能有人因為更遠大的目標比如改變世界,像喬布斯。
也有可能就是因為愛。
自動駕駛也確實可能成為一個顛覆性的技術。它可能會改變很多的行業甚至現在城市的格局。
自動駕駛的挑戰
但是自動駕駛會很順利的成為現實嗎,在我看來很難。我從兩個點簡單講一下:
莫拉維克悖論 (Moravec‘s paradox)
是說對于人工智能和機器人來講,人類所獨有的邏輯推理能力只需要非常少的計算能力就實現,比如AlphGo,但是無意識的技能和對機器的控制卻需要極大的運算能力和運算量。
有機構做過推算說,要讓完全自動駕駛窮盡所有道路場景,需要100輛車,200年 7*24小時的訓練,但這也不一定,可能會窮盡0.99可能的場景,但當仍會有不可預測性出現,那時計算機是束手無策的,遠沒有人類直覺應對保險。
舉一個例子,一個人類的小孩從來沒見過貓,你只需要給他一只貓,告訴他這是“貓咪”,下一次,當他見到不管什么顏色,什么樣子的貓,他都知道這是“貓咪”。電腦不一樣,就算你給它上百萬張貓的照片,各種顏色,各種姿勢,各種角度,你拿一只貓擺在它的攝像頭面前,讓它看個一年…… 它仍然不理解貓是什么,不能準確的判斷一個東西是否是貓。比如谷歌訓練計算機識別貓,當時Google研究人員利用一千臺電腦的1.6萬核處理器組建了一個機器學習神經網絡。他們用從YouTube視頻中提取出的1000萬幅200x200縮略圖訓練神經網絡來認識什么是貓。
人只需要一雙眼睛去感知周圍,然后靠感覺和經驗就可以把車開的很好,不像自動駕駛,要用各種傳感器的組合。人的駕駛目前才是真正的End-to-End ,直覺駕駛。
現在的機器學習”(machine learning),“深度學習”(deep learning),人工智能”(AI)其實跟人腦的思維方式有本質區別。
列車難題(Trolley Problem)
假設當所有的技術難題因為一些天才般的構架或者無數工程師的日夜努力都解決了,自動駕駛還很有可能遇見道德的審問,比如列車難題,這是一個很著名的哲學難題。
如圖中所示,當一輛有軌車行駛過來,此時他的剎車失靈了,而速度非常快,但他此時仍可以轉動方向盤,當它直行時會傷害到四個人,而轉彎的話會傷害到一個人,這列車要不要轉向呢,如果是你,你會怎么做呢?我想多數會選擇轉向殺死一個人來挽救四個人的生命。
此時我們在換個場景,假如列車無法轉向,只有直直的一條軌道,而在這之上有一個天橋,此時天橋上正好站著一個大胖子,他就站在軌道正上面,如果此時你把他推下去,可以正好卡在軌道中間讓列車停下來,犧牲了一個胖子來挽救四個人的生命,而此時你還會這樣做嗎?此時的選擇可能就困難的多了。哲學會引發我們的思考,當你開始思考一些事情時你就再也無法停下來了,它會讓我們對周圍熟悉的事物感到陌生,一切仿佛都沒有改變,但此時一切都已經不同了。
比如看過一個真實故事,在南京市的某路段,上班高峰的時段一輛出租車在正常行駛中,突然向路邊的路墩上撞了去,一下整個車就四腳朝天。原因是出租車司機王師傅在路上駕駛中,自己突然覺得眼圈發黑,身體不適要暈厥,這時路的一側有很多早上上班的行人,王師傅來不及過多的思考,果斷的把方向盤往另一側的路邊的石墩撞去,出租車整個的就翻了過來。
當自動駕駛系統遇到此類問題時,它會優先如何做了,是優先保護車上的乘客還是外面的行人?
自動駕駛將來可能會遇到越來越多這類的問題,它如何決策如何應對將是一個很大的難題。
可以預見自動駕駛面臨的挑戰遠不止這些,但無論如何都不會阻止此技術前行,因人類前行的步伐永遠不會停止,因此未來才有無限可能。
責任編輯:ct
評論
查看更多