在發(fā)展自動(dòng)駕駛技術(shù)上,滴滴又在學(xué)術(shù)研究和產(chǎn)業(yè)合作上迎來新的進(jìn)展。
4 月 25 日,滴滴攜手加州大學(xué)伯克利分校 DeepDrive 深度學(xué)習(xí)自動(dòng)駕駛產(chǎn)業(yè)聯(lián)盟(Berkeley DeepDrive)在京舉辦 CVPR 2019 自動(dòng)駕駛預(yù)研討會(huì),會(huì)上滴滴正式宣布與 BDD 達(dá)成戰(zhàn)略合作。
(來源:BDD)
BDD 是由加州大學(xué)伯克利分校領(lǐng)導(dǎo)的研究應(yīng)用于汽車領(lǐng)域的計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)前沿技術(shù)的產(chǎn)業(yè)聯(lián)盟,全球范圍內(nèi)主要的自動(dòng)駕駛公司和不少科技公司都已經(jīng)加入這一產(chǎn)業(yè)聯(lián)盟。根據(jù)滴滴和 BDD 的介紹,這次雙方將圍繞智能駕駛大主題,在前沿研究及應(yīng)用落地、頂尖人才培養(yǎng)、學(xué)術(shù)交流等方向展開全方位的積極探索。
滴滴在自動(dòng)駕駛技術(shù)開發(fā)上的最大優(yōu)勢(shì)之一在于其擁有非常好的交通大數(shù)據(jù)。此前 3 月,滴滴聯(lián)合 BDD 啟動(dòng) CVPR 2019 WAD 自動(dòng)駕駛識(shí)別挑戰(zhàn)賽,滴滴就提供一個(gè)大規(guī)模、高質(zhì)量的真實(shí)駕駛場(chǎng)景視頻數(shù)據(jù)集D2-City(https://gaia.didichuxing.com/d2city),涵蓋 12 類行車和道路相關(guān)的目標(biāo)標(biāo)注。
在今年 CVPR 2019 上,雙方也將舉辦自動(dòng)駕駛研討會(huì)(WAD),基于伯克利 BDD100 K(史上最大規(guī)模自動(dòng)駕駛視頻數(shù)據(jù)集之一)、滴滴 D2-City 兩個(gè)大規(guī)模、高質(zhì)量真實(shí)駕駛場(chǎng)景視頻數(shù)據(jù)集,組織目標(biāo)檢測(cè)、目標(biāo)跟蹤遷移學(xué)習(xí)挑戰(zhàn)賽。
圖丨滴滴出行信息安全戰(zhàn)略副總裁、美國(guó)研究院院長(zhǎng)弓峰敏博士與 BDD 主任、伯克利人工智能研究院(BAIR)聯(lián)合主任 Trevor Darrell 教授(來源:滴滴)
而在最近的一項(xiàng)業(yè)內(nèi)評(píng)測(cè)上,滴滴的人臉檢測(cè)算法也嶄露頭角。
根據(jù)近日 WIDER FACE 公布的最新評(píng)測(cè)結(jié)果,滴滴 AI Labs 團(tuán)隊(duì)聯(lián)合北京郵電大學(xué) PRIS 團(tuán)隊(duì)提出的人臉檢測(cè)DFS 算法,在 Easy、Medium 和 Hard 三個(gè)評(píng)測(cè)子集的六項(xiàng)評(píng)估結(jié)果中取得了五項(xiàng)第一、一項(xiàng)第二的成績(jī)。
WIDER FACE 是目前業(yè)界公開的數(shù)據(jù)規(guī)模最大、檢測(cè)難度最高的人臉檢測(cè)數(shù)據(jù)集之一,由香港中文大學(xué)于 2016 年建立,共包含 32,203 張圖像和 393,703 個(gè)人臉標(biāo)注。其中 40% 的數(shù)據(jù)為訓(xùn)練集(Training),10% 的數(shù)據(jù)為驗(yàn)證集(Validation),50% 的數(shù)據(jù)為測(cè)試集(Testing)。每個(gè)集合中的數(shù)據(jù)根據(jù)人臉檢測(cè)的難易程度分為“Easy”、“Medium”、“Hard”。
其中,滴滴在“Easy”、“Medium”和“Hard”三個(gè)測(cè)試子集中,DFS 算法性能分別達(dá)到 96.3% AP,95.4% AP,90.7% AP。
由于匯集了人臉尺寸大小變化、拍照角度引起的人臉姿態(tài)變化、不同程度的人臉遮擋、表情變化、光照強(qiáng)弱差異以及化妝等多種影響因素,該數(shù)據(jù)集在全球人臉檢測(cè)領(lǐng)域極具挑戰(zhàn)性,每次評(píng)測(cè)均會(huì)吸引多家國(guó)內(nèi)外科技巨頭及高校院所(包含卡耐基梅隆大學(xué)、加州大學(xué)圣地亞哥分校、北航、浙大、京東、騰訊優(yōu)圖、百度、華為云、IBM 沃森研究院等)在這個(gè)數(shù)據(jù)集上驗(yàn)證了自己的算法效果。
圖 丨驗(yàn)證集性能曲線圖(來源:http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html)
圖 丨 測(cè)試集性能曲線圖(來源:http://shuoyang1213.me/WIDERFACE/WiderFace_Results.html)
DFS 算法以卷積神經(jīng)網(wǎng)絡(luò)中的特征融合為切入點(diǎn),為了防止高層特征圖上的語(yǔ)義信息覆蓋低層特征圖上的細(xì)節(jié)信息,提出了特征融合金字塔(Feature Fusion Pyramid)結(jié)構(gòu),其以空間和通道注意力機(jī)制的方式融合高低層特征,在不失細(xì)節(jié)信息的同時(shí)將語(yǔ)義信息作為上下文線索(contextual cues)增強(qiáng)低層特征;另外,DFS 算法提出了一種輔助訓(xùn)練單階段檢測(cè)器的語(yǔ)義分割分支(Semantic Segmentation branch),促使檢測(cè)網(wǎng)絡(luò)以一種自監(jiān)督的方式實(shí)現(xiàn)注意力機(jī)制以及學(xué)到更好的特征。
具體地說,DFS 算法獨(dú)特的語(yǔ)義分割分支分層地利用更強(qiáng)的語(yǔ)義分割監(jiān)督信息監(jiān)督訓(xùn)練網(wǎng)絡(luò),使得用于預(yù)測(cè)人臉的各級(jí)特征圖專注于各自最適宜檢測(cè)到的不同尺寸的人臉。
圖丨DFS 算法網(wǎng)絡(luò)框架圖
目前,滴滴平臺(tái)已經(jīng)在廣泛使用其開發(fā)的人臉檢測(cè)和識(shí)別技術(shù),用于司機(jī)人不符檢測(cè)、行程中車內(nèi)錄像時(shí)的乘客隱私保護(hù)等場(chǎng)景等。
圖丨滴滴的駕駛場(chǎng)景理解平臺(tái)(來源:DeepTech)
除此之外,根據(jù)滴滴AI Labs資深研究員車正平博士、李廣宇博士介紹,滴滴的AI Labs 也正在基于其海量真實(shí)駕駛數(shù)據(jù)開發(fā)一款駕駛場(chǎng)景理解平臺(tái),能基于駕駛場(chǎng)景理解、大數(shù)據(jù)分析與風(fēng)險(xiǎn)預(yù)測(cè)等能力提升出行安全與體驗(yàn),同時(shí)也在構(gòu)建智能駕駛模擬測(cè)試環(huán)境,加速滴滴智能駕駛系統(tǒng)優(yōu)化迭代。
-
計(jì)算機(jī)視覺
+關(guān)注
關(guān)注
8文章
1698瀏覽量
46023 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8422瀏覽量
132743 -
自動(dòng)駕駛
+關(guān)注
關(guān)注
784文章
13839瀏覽量
166556
原文標(biāo)題:滴滴自動(dòng)駕駛最新進(jìn)展:人臉檢測(cè)算法創(chuàng)紀(jì)錄,與伯克利產(chǎn)業(yè)聯(lián)盟達(dá)成合作
文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論