智能駕駛時(shí)代離不開“規(guī)控”,但對用戶而言,“規(guī)控”可能是一個(gè)既陌生,卻又帶有很強(qiáng)技術(shù)感知的詞語。
本期Tech Talk,由蔚來自動(dòng)駕駛研發(fā)部門規(guī)控團(tuán)隊(duì)的Blake FAN、Eason QIN,以及全域智能駕駛體驗(yàn)團(tuán)隊(duì)的Simon WANG,為我們解讀“規(guī)控”的開發(fā)邏輯,揭秘NOP+增強(qiáng)領(lǐng)航輔助是如何“開車”的。
什么是決策規(guī)劃控制算法?
規(guī)控的全稱——決策規(guī)劃控制算法,對外簡稱“規(guī)控”,它是智能駕駛系統(tǒng)的核心組成部分之一。
Aquila蔚來超感系統(tǒng),
擁有包括超遠(yuǎn)距高精度激光雷達(dá)
在內(nèi)的33個(gè)高性能感知硬件
如果把Aquila蔚來超感系統(tǒng)比喻為智能駕駛系統(tǒng)的眼睛,那么規(guī)控就是智能駕駛系統(tǒng)大腦一般的存在。它的職責(zé),是負(fù)責(zé)安全且平穩(wěn)地駕駛車輛,讓用戶享受輕松、愉悅的出行體驗(yàn)。
簡單而言,規(guī)控算法決定了自車應(yīng)該何時(shí)讓行切入車輛、何時(shí)變道,以及何時(shí)進(jìn)出匝道;這些駕駛行為指令會(huì)傳遞給車輛控制端,實(shí)現(xiàn)細(xì)膩的、毫秒級的方向盤轉(zhuǎn)角以及加減速控制。
因此,規(guī)控的聰明程度也決定了智能駕駛系統(tǒng)的舒適性和通行效率的平衡。
如何成為一個(gè)優(yōu)秀的規(guī)控算法?
智能駕駛系統(tǒng)能夠像人一樣實(shí)現(xiàn)自如地開車,至少需要滿足兩個(gè)條件。
第一,是否能夠像人一樣獲取周圍的環(huán)境信息;第二,則是構(gòu)建像人一樣的思考方式和駕駛行為。
NOP+增強(qiáng)領(lǐng)航輔助功能開啟狀態(tài)
關(guān)于智能駕駛系統(tǒng)對自車周圍環(huán)境的感知,可以在《蔚來眼中的世界,有多特別?》這篇文章里找到答案。不過要讓其構(gòu)建像人一樣的思考方式,就需要投入研發(fā)精力,至少做到以下兩點(diǎn)。
第一,理解什么是優(yōu)秀的駕駛行為。
優(yōu)秀的駕駛行為由諸多要素組成,其中最重要的就是安全。智能駕駛狀態(tài)下的車輛,需要在復(fù)雜的環(huán)境中保持和其他交通參與者安全的交互,盡可能地平穩(wěn)駕駛,并且高效的到達(dá)終點(diǎn)。因此,安全、平穩(wěn)和高效,這三點(diǎn)就成為了智能駕駛規(guī)控模塊的開發(fā)目標(biāo)。
第二,構(gòu)建類人的駕駛思考方式。
這一點(diǎn)尤為重要。智能駕駛系統(tǒng)需要模仿人類駕駛員的思維方式,比如在獲知駕駛目的地信息(導(dǎo)航),當(dāng)前所處位置(定位),和周圍環(huán)境信息(地圖,感知)后,要進(jìn)行分層級思考。
這個(gè)思考的過程可以分為三個(gè)階段,比如思考是否該進(jìn)行超車、讓行、換道的決策規(guī)劃階段;思考安全、舒適、高效的運(yùn)行軌跡規(guī)劃階段;以及車輛如何執(zhí)行指令的控制階段。
智能駕駛系統(tǒng)規(guī)控工作流
基于上述三個(gè)層級的思考,接下來為大家展開詳細(xì)聊一聊。
首先,我們來拆解決策規(guī)劃(Behavior Planning)。NOP+的決策規(guī)劃不僅包含對周圍其他交通參與者行為的預(yù)測,也包含自車行為對周圍環(huán)境造成的影響。對所有這些自身和其他因素進(jìn)行整體建模,便構(gòu)成了NOP+的決策預(yù)測一體化。
好比棋手對弈,我們無法百分百精確預(yù)測對手下一步到底會(huì)怎么走,但通過對棋局當(dāng)前形勢的推演,優(yōu)秀的棋手知道怎么出手會(huì)獲得更高的勝率。因此,智能駕駛系統(tǒng)的決策目標(biāo)就是更加細(xì)致、深入地判斷“棋盤的‘勢’”,即形勢和收益。
為了能得到更高的勝率,智能駕駛車輛需要精確的識(shí)別與認(rèn)知周圍環(huán)境——類似棋盤中棋子的擺放位置;以及和障礙物之間的博弈關(guān)系——下這步棋后對手會(huì)怎么落子;在思考完成后需要在有限時(shí)間里選擇合適的響應(yīng)行為——下棋的策略。
在下面這個(gè)換道場景中,NOP+的算法在識(shí)別到前方慢車以及左方、右方和后方的車輛、環(huán)境信息后,會(huì)“觀察形勢”,推演執(zhí)行不同駕駛行為可能發(fā)生的結(jié)果。
這就是“博弈推演”,權(quán)衡利弊后,最后以安全、舒適的方式完成換道。
NOP+的決策算法需要考慮環(huán)境中所有可能發(fā)生交互的障礙物,當(dāng)環(huán)境發(fā)生變化時(shí),交互決策需要考慮的因素將會(huì)以指數(shù)級別增加。
比如在當(dāng)前時(shí)刻,有10個(gè)障礙物需要考慮是否避讓,那么決策的復(fù)雜度是2^10=1,024;在接下來(1秒、2秒......5秒)的每一個(gè)時(shí)刻是否要進(jìn)行避讓時(shí),復(fù)雜度將會(huì)變成1,024^5,大約是10^15。
優(yōu)秀的司機(jī)往往能夠通過預(yù)判性駕駛來降低風(fēng)險(xiǎn),提高通行效率和舒適性。因此,思考得越深,NOP+的駕駛行為預(yù)判就越好。
一個(gè)優(yōu)秀的棋手,每次落子前大約會(huì)推演5-8個(gè)回合的“博弈”,而智能駕駛需要在<0.1秒的時(shí)間內(nèi)完成更復(fù)雜的推演。為了能在超過10^15量級的策略中快速找到最優(yōu)解決方案,除了更強(qiáng)的硬件算力,更重要的是NOP+規(guī)控算法的設(shè)計(jì)與提升。
事實(shí)上,NOP+的決策算法用百萬量級的自動(dòng)駕駛數(shù)據(jù)進(jìn)行不斷的訓(xùn)練學(xué)習(xí),總結(jié)出“定勢”并記錄下來,從而在決策樹中實(shí)現(xiàn)快速精準(zhǔn)的搜索。我們將這個(gè)過程稱為:價(jià)值網(wǎng)絡(luò)學(xué)習(xí)(Deep Learning Policy Network),即通過深度學(xué)習(xí)網(wǎng)絡(luò),去學(xué)習(xí)優(yōu)秀司機(jī)對于駕駛交互的判斷邏輯。
隨著系統(tǒng)硬件能力的提升和數(shù)據(jù)的積累,在NOP+決策系統(tǒng)中考慮的因素也會(huì)更加的細(xì)化,從而能在千變?nèi)f化的世界中尋找出最優(yōu)的決策。
在拆解決策規(guī)劃后,我們來看看運(yùn)動(dòng)軌跡規(guī)劃(Motion Planning)是如何工作的。
當(dāng)車輛得到最優(yōu)決策后,運(yùn)動(dòng)軌跡規(guī)劃模塊需要將其轉(zhuǎn)化為車輛可以執(zhí)行的行駛路徑。一個(gè)好的行駛路徑需要在安全的條件下盡量優(yōu)化路徑的安全度,平滑性以及通行效率。
比如以下?lián)矶聢鼍案5膱鼍爸校囕v在規(guī)劃合理的剎車力度時(shí),不僅需要考慮前車的距離,也要盡可能的優(yōu)化減速度的變化幅度,做到安全平穩(wěn)舒適的剎停和起步(如Gif圖中左下方平滑的藍(lán)色加減速曲線)。
優(yōu)秀的駕駛是在安全、遵守交通規(guī)則的前提下,盡量在效率和舒適中達(dá)到平衡。但是在不同場景中,效率和舒適的平衡又是不一樣的。
比如北京、上海的道路和鄉(xiāng)村道路就很不一樣。在擁堵環(huán)境下,普通的城市道路和環(huán)路、高架又有很大區(qū)別。因此需要通過數(shù)據(jù)分析更深層次地理解周圍環(huán)境,在諸多因素中自適應(yīng)地去調(diào)節(jié)平衡關(guān)系。
例如,在Banyan 2.0.0的擁堵跟車場景中,系統(tǒng)通過大量數(shù)據(jù)學(xué)習(xí)老司機(jī)開車的駕駛方式,從而獲得安全、平穩(wěn)、舒適的駕駛體驗(yàn),隨著數(shù)據(jù)的積累,體驗(yàn)還可以不斷進(jìn)化。
最后一個(gè)層級,則是對指令的控制(Control)。在系統(tǒng)做出運(yùn)動(dòng)軌跡規(guī)劃后,需要控制讓車輛按照預(yù)判完成相應(yīng)的動(dòng)作。“控制”會(huì)系統(tǒng)性閉環(huán)考慮車輛的運(yùn)動(dòng)狀態(tài),以便更好地執(zhí)行指令,達(dá)到“手腦一致”。
NOP+:追求連續(xù)的點(diǎn)到點(diǎn)駕駛體驗(yàn)
傳統(tǒng)的輔助駕駛研發(fā),往往以單一功能為原點(diǎn)(例如大家熟悉的ACC自適應(yīng)巡航,LKA車道保持輔助,LCC車道居中輔助等),實(shí)現(xiàn)特定場景下的輔助駕駛。
但是,做好每一個(gè)單點(diǎn)功能,是否就能夠算智能駕駛?答案是否定的,現(xiàn)實(shí)遠(yuǎn)比想象的更難!
首先,現(xiàn)實(shí)中的場景往往更復(fù)雜,要求有多個(gè)單點(diǎn)功能的組合。試想一下人類的駕駛行為,變道時(shí)目標(biāo)車道有前后車的情況下,不僅僅要考慮變道的空間是否足夠,還需要考慮前后車未來的運(yùn)動(dòng)軌跡和速度變化。
除了思考復(fù)雜的道路場景,
NOP+還會(huì)根據(jù)天氣因素來控制車速,
安全始終是擺在首位的
如果此時(shí)第三車道也同時(shí)有車變道匯入呢?如果變道發(fā)生在匯入口附近呢?多種場景組合在一起會(huì)讓功能開發(fā)的復(fù)雜度呈現(xiàn)指數(shù)型的上升。
其次,場景變化存在連續(xù)性。單點(diǎn)開發(fā)的功能往往存在功能或狀態(tài)的離散變化,在適配體驗(yàn)的過程中銜接并不連續(xù)。比如,單點(diǎn)開發(fā)上下匝道會(huì)由于狀態(tài)的切換導(dǎo)致成功率下降。
NOP+通過整體開發(fā)統(tǒng)一建模的方式克服了上述痛點(diǎn)。就好像2000年初的手機(jī)智能化,廠商往往以某一個(gè)功能,如發(fā)短信、打電話、玩游戲、發(fā)郵件的角度進(jìn)行功能開發(fā),而今天大家顯然聚焦在打造一個(gè)高效互通的平臺(tái)系統(tǒng)上。
實(shí)際上,我們就致力于將規(guī)劃控制模塊打造成類似的平臺(tái)。它能夠覆蓋更多的功能,接受不同的感知源輸入,在硬件不斷迭代和數(shù)據(jù)不斷積累的基礎(chǔ)上,還能讓規(guī)劃控制算法自主進(jìn)化和學(xué)習(xí),為適配更復(fù)雜的駕駛場景提供底層原子化的能力和操作系統(tǒng)。
通過解讀“規(guī)控”的開發(fā)邏輯,不難發(fā)現(xiàn),一套優(yōu)秀的規(guī)控算法能為智能駕駛系統(tǒng)賦予思考邏輯,這也是NOP+能夠脫穎而出的關(guān)鍵。
最后,再分享一組數(shù)據(jù)給大家。截至2023年8月,NOP+累計(jì)使用里程超過8,300萬公里,當(dāng)下它正以每周超過500萬公里的速度快速“成長”。
NOP+的目標(biāo)很清晰,就是為用戶在日常通勤及長途出行中,提供更安全、輕松、愉悅的駕駛體驗(yàn)。
審核編輯:彭菁
-
硬件
+關(guān)注
關(guān)注
11文章
3345瀏覽量
66290 -
智能駕駛
+關(guān)注
關(guān)注
3文章
2538瀏覽量
48800 -
激光雷達(dá)
+關(guān)注
關(guān)注
968文章
3987瀏覽量
190066 -
蔚來
+關(guān)注
關(guān)注
1文章
485瀏覽量
14573
原文標(biāo)題:NOP+是如何“開車”的?
文章出處:【微信號:NIO-Wechat,微信公眾號:蔚來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論