我們要真正的形成中國的海量大數據,選擇適合我們的芯片。
9月8日,在CTDC首席技術官領袖峰會上,小鵬汽車自動駕駛副總裁谷俊麗博士發表了題為“AI car 和自動駕駛進化論”的主題演講,分享了小鵬汽車正在推動的中國式自動駕駛研發之路以及在這一領域的最近進展。
小鵬汽車自動駕駛副總裁谷俊麗博士
同期,谷俊麗博士宣布,小鵬汽車近期已經獲得美國加州自動駕駛路測許可。
小鵬汽車已經獲得美國加州自動駕駛路測許可
CTDC首席技術官領袖峰會是國內最頂級、最具前瞻性的互聯網峰會之一,聚集了業內頂尖的技術領導者。“AI智享未來”是本屆峰會的主題,功能汽車到智能汽車的變革也是本屆峰會探索的重要議題。
”自動駕駛國際化存在不少瓶頸,自動化駕駛進化的必然趨勢是軟件的強本地化。沒有中國實際駕駛場景數據的積累,很多自動駕駛功能在中國“水土不服”、甚至“目中無物”,無法適應中國的實際駕駛路況、交通密度和中國用戶的駕駛習慣,”谷俊麗博士表示:“小鵬汽車的目標是大規模量產具備六維感知能力的高智能互聯網汽車(AI Car),使得車輛能夠具備自我感知、物體感知、高精定位、預測未來、交互和事件及決策推理能力,提高自動駕駛在中國駕駛場景的安全和創新。”
今年年內,小鵬G3即將上市,并啟動交付。小鵬G3將搭載領先的自動駕駛硬件,配有20余個智能感應設備,適配本地化自動駕駛,并將提供覆蓋高頻生活場景的自動泊車功能。
以下為谷俊麗博士演講實錄:
謝謝大家!今天非常高興有機會和大家分享關于中國式自動駕駛的思考。
先簡單自我介紹一下,我去年10月份加入小鵬汽車,之前在特斯拉總部負責人工智能和自動駕駛,帶領團隊做了Autopilot。從對AI的思考,到自動駕駛的研發,我都是從最前期開始介入的,個人有一些感觸今天來跟大家分享。
我重點講解一下自動駕駛,它本身是一個AI驅動的技術,一個系統,我叫它AI Car。我會跟大家分享自動駕駛整體的國際上的進化論,以及在中國我們想怎么做。
首先,我先來總結一下,在中國,自動駕駛概念從2016年開始炒,到2017年炒到火爆,到現在我覺得公眾已經失去感知了,已經不知道自動駕駛是什么了。所以,我想講解一下自動駕駛到底是什么,以及西方的技術并不能真正拿到中國來使用,比如說特斯拉的Autopilot。
我先講解一下人類歷史的交通變革。我經常想,人類歷史的交通從擺脫原始的交通工具,比如說馬車、驢車,到現在林林總總的各種汽車,其實也只有一百年的時間。那發生了什么?
我們從原始到模擬的機械器件,然后通過(裝有)汽車輪子的福特Model T(T型車)往前演進,出現奧迪、奔馳這樣的品牌。我們在機械、控制層面,在發動機、燃油機層面做了一百年的工作,現在已經幾乎飽和了。
車正在悄然發生變化,它在從模擬的器件悄悄變成數字化的器件,就像21世紀初,我們還在用諾基亞的功能機,通過鍵盤來按,到后來慢慢地我們幾乎所有人都不再用一個滿是按鈕的手機了。從功能機到數字機到智能機的演變,同樣的革命正發生在車輛上。數字化要有傳感器,計算單元,要嵌到車上,且讓用戶感覺不出來,這是數字化的過程,是對車本身變革的過程。在這個基礎上,我們再做一些輔助駕駛、預警,然后脫手,眼睛可以離開的,各種智能化的工具功能,它是這么一個變革過程。
拋去外表發生的變化,在技術本身,自動駕駛讓我自學了很多專業,從做芯片到做AI算法,到軟件,到做自動駕駛。自動駕駛是我做過的最難的、最復雜的一個工程,沒有其一。為什么呢?因為拋開自動駕駛這幾個字,它里面涵蓋了人類過去一百年幾乎所有最重要的技術、信息革命的一些關鍵突破。我來講解一下在我眼中大家所說的自動駕駛包含哪幾代技術的框架。
自動駕駛第一代是由像特斯拉這樣的公司搞起來的,當時用的是采用融合供應商的方案,比如說目前主流的國外融合MobileEye,國內融合博世。國內的自動駕駛絕大部分由博世控制,這就是第一代集成方案。汽車本身是一個復雜的工程,是一個拼接的系統工程,就是把上萬個零部件集成到一起。造車本身不是一個造技術的過程,技術是由供應商在各個角度,比如說控制單元,發動機單元,電池單元以及感知算法單元,分別去突破的。這是第一代技術。
第一代技術有一個瓶頸,無法打通,供應商的東西是無法改變的。所以出現了第二代,自己選擇一個芯片,把車、數據以及自我編程打通,可以改變我的功能。這是第二代,在芯片以及自主研發的算法上做自己的軟硬一體的設計。
我們現在發現AI是一個對計算能力需求無窮盡的應用,尤其對自動駕駛,在私家車上做應用,它的場景是無限量的,你無法完全描述自動駕駛的車會遇到什么。所以,它對計算的需求也是無窮盡的。現在出現了很多公司,國際巨頭Waymo也好,特斯拉也好,都是自己做芯片,為什么?過去人類60年做的所有芯片是針對通用計算的。真正到車上,這種復雜的流水需要更強大的芯片。這是第三代。
大家想起自動駕駛,可能都想起各種各樣的車。Waymo的車上面架了一個像船一樣的盒子,Cruise的車上pony 面架了8到10個雷達。中國的很多自動駕駛公司,包括景馳,都是上面掛著很多東西。這是第四代自動駕駛,通常是說在特定場景下不需要人了,是完全的driverless,沒有駕駛員。
為了做到這一點,它很難,我先限定場景,再在車上針對這個場景掛各種傳感器,做各種計算單元。所以,到第四代,車就為自動駕駛設計的。你看它不像臺車,是因為傳統的車不涵蓋這個東西,現在兩者是一種嫁接關系,還不是一個產品的形態。
我從特斯拉來到小鵬,是想解決中國化的自動駕駛。我們第一代車,今年的量產車上會介于第一代跟第二代技術之間,我們會采用部分集成供應商,部分自主研發。這也是基于的我們自主研發的節奏,需要一定的時間去啟動。我們在第二代車上,2020年的車上,會將自動駕駛自主研發的通道從算法到芯片,一直到車上打通。
我們為什么要做這個事情?很多人來問我,不管是吉利,沃爾沃,特斯拉,都有這個產品,為什么還要再做?是,是有這個產品,但是在大部分的中國場景下沒人敢用,因為它不適合中國的駕駛場景。它會有水土不服,比如說中國路上的障礙物是不規則的,幾乎無法辨別在中國道路上遇到的所有障礙物。中國的交通規則是不規范的,因為中國文化跟西方文化是不一樣的,駕駛問題確實是反映人的文化問題、習慣問題以及社交問題。它不是簡單的在實驗室內的技術,有水土不服的問題,也就是說,為什么中國這么多車,但使用率不是特別高。
我個人認為,中國的自動駕駛只能中國人自己來解決。還有人在微博上提問我,說從來沒有聽任何一個技術是帶著國家邊界的。我倒不是說這是國家邊界,而是說整個通道,就像任督二脈,我們現在還沒有打通。我們要真正的形成中國的海量大數據,選擇適合我們的芯片。在這個基礎上,要搭建適合中國自動駕駛的傳感器系統,而這個系統一定要針對中國的場景,要涵蓋中國的一些特定軌跡、特定場景、特定交通動態。在這個基礎上,再做中國的算法研究。我認為在中國解決自動駕駛技術要比西方難十倍以上,這是一個框架性的問題,也是一個創新性的問題,也是需要很多技術積累的問題。一定要中國人自己來深耕解決。
第二部分,我想講解一下小鵬汽車對AI Car的定義。定義很重要。我認為車應該有三重智能才能在中國的馬路上開,這是一個科普性的概念吧。我們先說AI Car,它包含著很多東西,比如說有幾十個傳感器來感知環境,有互聯的功能,然后去取地圖,有云的功能、芯片的功能、人工智能實時的計算功能,自適應學習以及林林總總的功能。我來分解一下,它是怎么一種三重智能。
首先,我個人認為不僅僅依靠云端智能,車一定要自己會開,所以一定要在車上有實時的足夠感知環境的(比如看200米也好,150米也好)攝像頭加上雷達,再做融合。我們為什么要做這么多種類的傳感器?因為沒有一種傳感器能夠滿足駕駛所看到的環境的需求。比如,攝像頭能看到扁平的二維物體,雷達能看到速度跟三維,這兩者要加起來。如果有一種傳感器,能夠準確告知它的三維的方向以及它的語意,這也是對自動駕駛將會產生推動性作用的技術創新。
AI很重要。沒有人可以否認自動駕駛,本質上就是由AI推動的問題,AI將會對它周圍的傳感器拿來的數據進行識別,對其他車輛進行識別,從而作出自己的一些決策跟軌跡規劃。而AI要求的是高性能級的計算,所以一定要有高性能級別的芯片,且滿足車規,在車上運行。
可能這個問題大家一想覺得很簡單,我們不是有很多云,有很多GPU嗎?但那些是不完全滿足車規的,一輛車跑在馬路上,是五星級的安全規格,不允許隨時硬盤壞掉,隨時可以重啟。而任何云端的東西都存在故障率,這是不允許的。當然了,我們也要互聯,因為互聯可以告訴我們地圖,互聯可以告訴我們交通信息以及更多。剛才講的是個體智能。
車多了,可以增加群體智能,有十臺車開過這里,看到這里馬路斷了,就可以告訴后面的車,叫群體智能。就像蟻群一樣,車也可以做到同樣的智能。另外一個輔助智能,尤其是在中國很流行,我覺得中國政府做事情,彎道超車的概念,很難去避免。
比如說個體智能做不到這么多東西,那在馬路上加上各種東西,這就是輔助智能。怎么搞,這個東西沒在車上,這就是輔助智能,借助環境本身的感知能力。V2X讓車可以給各種東西發信號,但這只是一種愿景,很難做到把世界(改造),改造一輛車已經很難了,把世界都改了,裝上傳感器,且傳感器日異月新,也不是百分之百可靠的,這本身是個浩大的工程。所以,我個人認為它只是一個輔助性的東西。
接下來簡單分享一下我們說中國式自主研發,到底它的關鍵點跟我們自己的分解是怎樣的。做自動駕駛有這么多核心的東西,你規避不開,一定要去深耕,一定要去沉淀。比如芯片一定要有,沒有不要搞AI。第二,自主研發措施打通任督二脈,把數據,也就是代表場景跟車,跟算法連接起來,這是真正自動駕駛,是一個框架性的東西。海量中國場景大數據,不管你再怎么海量,世界天天變,所以這是一個永恒的難題。
我逐一分解一下,海量大數據場景,這個場景要在公開的任意的,不能是限定場景。我們經常有朋友開車,在硅谷開得好好的,一旦開到中國,發現什么都不行了,就是因為場景變了,一切都變了。所以,場景是一切的源泉,而場景體現在大數據里邊,而這個場景是要不加限制的,只要用戶開過的地方,你都要去開,去搜集。拿這個數據到云端經過組織之后,把它進行AI的創新,肯定是創新的,你要識別,所有的東西要做預測。然后把算法弄到車載上,不要再僅僅在云端控制車輛。弄到車載上,要在車上能算得動,才有產品。形成閉環之后,讓算法通過數據生長,讓算法在車上得到驗證。這是一個框架,跟智能得以演進。解決中國的自動駕駛一定要讓這個框架轉起來,要讓智能可演進,因為沒有人可以一步解決所有。
我總結了大家認為對AI的定義,每個人有不同的理解。在車上,我們需要AI的“六維感知”,第一維感知,得知道自己是怎么動的,怎么運轉,車輛動力學。第二維,要知道周圍是什么物體。第三維,要知道物體精準的在什么地方。第四維,時間維度,要知道互相之間它的預測,未來。人駕駛時的反應弧其實是很長的,比如是400毫秒,甚至比算法要長。但是人能夠駕駛很好,因為人對未來有預測,他是基于預測在開車,而算法總是基于歷史,過去看到的傳感器看到再算,算完決策,這個反應弧是基于過去在做預測。所以,我們為了彌補這種延時,要對每個車輛的軌跡,每個賬號的軌跡進行預測,別人可能不讓你加塞,別人可能會換道,你到底怎么想,你才能做出最好的一個決策。第五維,你做了一個決策,每個人開車不一樣,有的人就是我盡快走,有人要安全第一,有人要舒適第一。所以,你做決策要理解基于什么樣一種規則做的決策,這是第六維。六維感知之后才能真正的做到自動駕駛,我們現在的AI其實最多到了第二維,或者到第2.5維。
從2012年突破大數據的深度學習,給大家提供了一個很好的水平線,都水漲船高,在一個水平線上了,能夠識別上千物體、上萬物體的98%的精度。這是二維。到第三維,我們需要高精定位,高精地圖在量產車上量產方案做,現在是一個全世界都沒有完全解決的問題。所以,我們現在在二跟三之間,但我們同時可以在研究界以及算法界可以做第四維、第五維的一些突破,一些預言,但是,真正落到產品上還需要一些實踐跟積累。所以,自動駕駛真正做起來,是結合傳統經典算法,結合對scenarios的理解,有很多 scenarios,有很多場景。再結合AI做了各種各樣的復雜流水,所以為什么你看各個自動駕駛公司,有些人說我三個月車都可以開了,那接下來這兩年你在干嗎?在解決各種 scenarios,沒完沒了的scenarios,且這個車只要一換城市,發現什么東西都變了,要重新再搞一下,這就是自動駕駛的難處了。
另外,車不是一臺手機,也不是一個電腦,安全要第一。要做到安全是很復雜的,車本身有控制單元,有感知單元,現在又有芯片,各種各樣的東西加到一起。為了解決這個問題,我們在傳感器上,在控制單元上,在急剎車上都做了一些冗余,把安全以及智能分成了四個層次的框架系統,一層一層往上去漲。
我一個基本的原則就是,任何高級的智能都是不能以犧牲性命關天的安全性為原則。比如說,Uber前幾個月發生了一些車禍,就是AEB沒有啟發。這種情況下,不管整個車有多智能,我是不會去用的,因為AEB是性命攸關的。所以,在設計我們的系統上,第一步保證傳統一百年造車留下的精華不要被損害。第二層,有一個冗余。第三層、第四層,我再說高級的智能,如果高級的智能做不到,就回到下面的一些智能上去,保證人的性命安全,比智能的fancy的未來更重要。
最后,想跟大家分享一下我們的產品的智能演進。我說過,要解決自動駕駛問題,我不相信有一家廠商可以站出來說我落后的都解決了,這是不科學的,這個問題有它的科學性。所以它一定有一個演進的道路。
中國人駕駛的焦慮痛點跟外國人不一樣,比如說外國人很少有停車焦慮,停車場都很多。但是中國人停車焦慮是很大的,所以我們第一步先從停車焦慮開始解決,從耳朵,就是先用超聲波,基于超聲波的泊位,像蝙蝠探測一樣,要前后、左右有車輛才能去檢測,超聲波也是現在市場上,大部分的停車系統用的技術框架。我們在此基礎上加了視覺,車場空空的,超聲波探測不出來任何車位這是很傻的,是人不能理解的。所以加上視覺,讓他能夠看到各種停車位。最后再加上語音,讓人可以跟它交互,再到一些記憶性的東西,一步一步演進它的智能。
對于自動駕駛來講,駕駛焦慮,比如說春運的時候長途開高速公路的焦慮,比如說每天上下班,在一線城市每個人平均50分鐘、一個小時的堵車,上下早晚高峰的焦慮。這種焦慮已經使得車變成了除了家、公司之外非常重要的生存空間。
我們解決完駕駛焦慮之后,會從高速自動駕駛開始去做,L2就是人可以不允許脫手,手要實時在上面,L3可以允許脫手了,長途跋涉的時候,人的焦慮性、疲勞性可以得到更大程度的改善。到擁堵情況下,車可以自己跟停,handle一些換道,handle一些別人加塞的問題,解決早晚駕駛高峰的焦慮。
再到未來,城市十字路口怎么過,現在也是一個永恒的難題,怎么上下高速,是真正做到從A點到B點的自動駕駛的關鍵技術門檻。
到最后,其實就算這些技術問題都解決了,自動駕駛問題也沒有完全解決,因為人的駕駛習慣,用戶體驗是我們最重要解決的問題。每個人駕駛的習慣不一樣,有人喜歡激進型,有人喜歡平穩型,最后我們要解決個性化的駕駛問題,這是我們的演進之路,粗框架的。
同時,我們要說車內智能也要去做,當人越來越多的解放出來之后,雙腳、雙手、眼睛都解放了,人在車里干嗎?在真正做到無人駕駛之前,其實車是一個人機共同體,有一部分場景是車,有部分場景是人。只是在L2的時候,人大部分還要駕駛,車駕駛少部分場景,越往上車越來越多的不需要人去管。在這個過程中,我們要通過駕駛員狀態監測來告知系統,進行協同,人現在疲憊了,要給他十秒鐘的時間接管,或者是他現在看手機,要八秒鐘的時間來接管,要提前提醒他。才能夠說在車開的越來越多的情況下,能夠做到更好的無縫的更安全的功能的配合。
最后我想跟大家分享一下,我們現在自動駕駛中心是一個兩岸四地的跨國團隊,在廣州總部解決造車測試的問題,在硅谷有團隊解決軟件研發的問題,在上海,北京也都有團隊。
我們近期也有好消息,小鵬汽車在硅谷取得加州自動駕駛路測許可。希望在今年,我們只做少量的事情,其中一件最重要的事情就是把任督二脈打通,把框架建立起來,然后實現基本的功能,開始真正的上車做實驗。
我希望我們是一個做正確的事,用正確的方法做事的團隊,希望大家能夠關注我們接下來的成績和結果。
評論
查看更多