現如今,即使可以借助衛星圖像和繪制軟件,創建精確的道路圖也依然是一個費時費力的人力加工過程。許多地區,特別是在發展中國家也仍是空白。為了縮小這一差距,Facebook 的人工智能研究人員和工程師們開發了一種新的方法,該方法通過深度學習和弱監督學習,根據商用高分辨率衛星圖像來預測道路網絡。由此產生的模型為精確程度設定了一個新標準,因為它能夠較好地適應道路網絡中的地區差異,有效地預測全球范圍內的道路。
我們現在正與 Map With AI(一套新的專用道路圖編輯服務和工具)分享我們模型的具體細節,并向全球的繪制機構提供數據。Map With AI 包含一個編輯器界面 —— RapiD,它讓道路圖專家可以根據自己的需要很方便地查看、校驗和調整道路圖。
我們使用了 Map With AI 系統在 Facebook 的 OpenStreetMap(OSM)中繪制了泰國所有此前未曾繪制過的道路(超過了 30 萬英里),這是一項基于社會機構的工作,旨在創建免費的、可編輯的世界道路圖。我們僅僅花了一年半的時間就完成這個項目—— 這比有 100 個繪圖專家的團隊手工完成這項任務花費的時間減少一半多。
準確的繪制數據有助于我們更好地為世界各地的人們提供 Facebook Marketplace 和 Facebook Local 等技術產品。Map With AI 與 Facebook 人工智能的 population density maps 項目一樣,這些道路圖將為災難響應、城市規劃、開發項目和許多其他任務提供資源保障。例如,在 2018 年印度喀拉拉邦遭受洪水災害時,Facebook 利用 Map With AI 快速地繪制出了該地區的道路圖,協助了救災工作。
要使用 RapiD,用戶可以在道路圖上選擇一條道路,在提交給 OSM 系統之前,可以根據實際需要對其進行進一步的編輯。白線表示現有的 OSM 道路,紫紅線則表示 RapiD 的預測結果。選用 Maxar 衛星的圖像作為背景。
利用新技術實現更高效、更精確的繪圖功能
我們已經在幾個方面往前推進繪制道路圖的研究。在 2018 年的 CVPR 大會上,我們幫助組織了 DeepGlobe 衛星挑戰賽(DeepGlobe Satellite Challenge),通過提供數據集和競賽平臺來組織和評估計算機視覺和機器學習的解決方案,推進了衛星圖像分析的最高水平。我們還正在開發新的適合遙感問題空間的學習技術和架構,并研究弱監督學習技術,以在全球范圍內應用我們的道路繪制工作,還在與繪制團隊進行合作,在全球范圍內測試這些用于設計比例和構造方面的工具。
道路分割
在從衛星圖像中選取道路的過程中,我們利用了最近在使用完全卷積神經網絡(Fully Convolutional Neural Networks)進行語義分割,同時結合大規模弱監督學習方面的發展成果。道路檢測是語義分割方面的應用,其中道路是前景,圖像的其余部分作為背景。如下圖所示,過程的輸出是一個柵格化的道路圖,顯示了模型如何預測輸入的衛星圖像的每個像素是否屬于某個道路。對于道路分割,我們使用了 D-LinkNet 架構的修訂版本,它在 DeepGlobe 衛星道路獲取挑戰賽(the DeepGlobe Satellite Road Extraction Challenge)中獲勝。向量化和后處理技術可以獲取這些輸出并轉化為與地理空間數據庫(如 OSM 系統)兼容的道路向量。
左邊是分割模型每個像素的預測結果;紫紅色意味著像素有更高的概率屬于道路。右邊:合并的向量化道路與現有的 OSM 道路(白色),衛星圖像由 Maxar 提供
用弱監督學習模式在全球范圍繪制道路圖
作為上述泰國道路繪制項目的一部分,我們請一些專家檢查并修正人工智能系統識別的道路網絡。然后,我們使用這些手動更正的道路圖作為模型的訓練數據。這個項目繪制了整個泰國的公路網絡,因此我們對數據的準確性和完整性充滿了信心。我們發現,數據集訓練在泰國獲得了高精度的驗證結果,但在其它地區準確性卻急劇下降。由于該項目的目標是能夠繪制全球的道路圖,因此我們研究了如何使用其它地區增加的 OSM 數據來訓練一個新的模型。
但是,許多其它國家的道路圖仍然存在著巨大差距。因此,我們探索了獲取高質量的、地理多樣性的訓練數據的新方法。我們借鑒了以往關于弱監督圖像分類和基于 OSM數據訓練建筑檢測模型的工作,嘗試將這些弱監督學習的思想從分類轉換為語義分割。這項實驗需要識別具有足夠的、準確的數據覆蓋率的區域,然后將 OSM 數據庫的道路向量轉換為柵格化的語義分割標簽。對于這兩個挑戰,我們采取了一種直接的方法,即首先生成帶有噪音的、不太完美的訓練數據。
我們收集了一組像素為 2048 x 2048 的訓練數據,分辨率約為每像素 24 英寸。我們放棄了道路圖上少于 25 條路的區域,因為我們發現地圖上通常只包括一些主要的道路(通常沒有可以正確標注較短道路的先例)。對于剩余的區域,我們將道路向量進行柵格化,并使用結果標識作為訓練標簽。為了達到與 DeepGlobe 數據集相同的分辨率,我們隨機將每個圖像的像素剪裁到 1024 x 1024,從而生成了能覆蓋到 70 多萬平方英里地理范圍的大約 180 萬個區域,這個結果是 DeepGlobe 數據集覆蓋的約 630 平方英里的區域的 1000 倍。
為了從這些道路向量中創建分割標識,我們只需將每個道路向量柵格化為 5 個像素。語義分割標簽往往是趨向于像素的,但我們用這種探索式的方法所創建的標簽卻不是這樣的。由于道路的寬度和外形各不相同,這些柵格化了的向量無法完全獲取這些信息。此外,全球不同地區的道路是根據不同的衛星圖像源繪制的,因此并不總與用于訓練數據的圖像完全一致 。
用于 OSM 道路分割模型的訓練數據的地理分布可視化圖。由于實驗的時候衛星圖像是不可用的,因此一些區域并未在圖中出現
僅使用在數據收集過程中產生的噪聲標簽,我們就能夠產生與許多 DeepGlobe 挑戰賽參與者不相上下的結果。通過對 DeepGlobe 挑戰數據集中訓練數據的微調,我們的模型取得了最好的結果。
比這些微調的結果更值得注意的是,即使只在 OSM 數據上進行訓練,模型在全球范圍內運行的結果也非常不錯。大多數可用于訓練道路分割模型的數據集嚴重地偏向于特定的區域或發展水平的地區。例如,DeepGlobe 道路數據集僅包含來自印度、印度尼西亞和泰國的數據,而 SpaceNet 道路獲取挑戰賽(the SpaceNet Road Extraction Challenge)的數據集僅關注于一些主要的城市。我們創建的數據集跨越了六大洲和各種發展水平的地區,提供的訓練數據比其它可用的替代數據要多得多。
為了評估更大的、更多樣化的數據集對模型的標準化有多大的影響,我們評估了 OSM 訓練模型和 DeepGlobe 模型(在 DeepGlobe 數據上訓練)。我們在其它幾個數據集(拉斯維加斯、巴黎、上海等城市,請查閱論文獲取詳情)上對這兩個模型進行了評估,這些數據集均不在 DeepGlobe 數據集的地理分布范圍內。在這些測試集中,DeepGlobe 模型的平均聯合交叉(IoU,the mean Intersection over Union)得分為0.218,而 OSM 訓練模型的平均 IoU 得分為 0.355。相比之下,這些分數相對改善 62%,絕對改善 13.7%。
烏干達的坎帕拉,在一個道路圖相對繪制較好的地區進行道路獲取。從左到右:Maxar 衛星圖像、OSM(手動繪制)、THA/IND/IDN 訓練模型、全球 OSM 訓練模型。在 DeepGlobe 上訓練的模型在房屋之間繪制出許多本來不存在的道路,而在全球數據上訓練的模型表現不錯
能有效創建全新道路圖的AI工具
一旦模型識別出潛在的道路,我們就需要對其進行驗證并提交給 OSM。將這些數據提供給社區是一個重要環節,我們模型的結果雖然很好,但并不完美。地區的差異會影響道路分類的結果。一些結果錯誤地跟蹤了衛星圖像中的其它特征,如干涸的河床、狹窄的海岸線和運河。此外,模型可能無法找到一個區域內的所有道路,或者可能會忽略連接點和潛在的道路, 因此,我們的下一步是將模型的結果與有經驗的繪圖人員結合。為此,我們利用了道路圖繪制社區里已經熟悉的工具(iD, JavaOpenStreetMap, 和 Tasking Manager)。
我們的工作重點是構建 RapiD,它是一個應用廣泛的基于 Web 的 iD 道路圖編輯器的開源擴展。此外,我們構建了一個系統,將模型的結果與 OSM 中已有的數據結合,這一過程稱為合并,它既可以為如何將新道路加入到現有的數據提供建議,又可以防止模型建議的道路覆蓋現有道路數據。我們希望 RapiD 能夠讓道路圖繪制社區中的人們根據自己的實際情況來改進并利用這些工具。
RapiD 編輯器允許通過可視化的方式展現合并的道路,并高亮顯示新修改的地方,還為最常見的數據清理任務使用新的命令和快捷方式,例如調整道路的分類來適應周圍的環境。因為我們擴展了現有的編輯工具 iD,繪圖人員能夠使用熟悉的工具來處理新的數據。為了確保向 OSM 提交高質量的數據,我們采用了完整性校驗來捕獲模型結果可能出現的潛在問題。
道路圖繪制社區的前期反饋結果令人鼓舞:
“這個工具在建議的機器生成功能和手動繪制方式之間取得了良好的平衡。它能讓道路圖繪制者對圖上的內容有最后決定權,這有助于發現繪制過程中出現的問題。它的優勢是繪圖人員可以以更具互動性的方式開始繪圖。對 iD 的調整和添加的快捷鍵會使其功能更強大,足以滿足繪制人員的需要,”長期致力于 OSM 研究的 Martijn van Exel 說道, “這必然是 OSM 未來的一個關鍵點。沒有機器的幫助,我們無法繪制道路圖,更談不上繪制全世界。訣竅是找到那個點。OSM 是一個全人類的項目,道路圖反映了繪制者的興趣、技能、偏好等。”
“在我看來,RapiD 最獨特的優勢在于它可用于世界上最復雜的地理環境,這些地區對自動化的需求最為迫切。大多數現代的算法、訓練數據集和相關技術都是為那些基礎設施高度發達的地區而發明的。在發展中國家,例如非洲、東南亞、拉丁美洲,這些地方的道路沒有很好的命名、維護或是開發,即使是最專業的人眼也很難識別和正確地進行道路特征的分類,”一位共享車輛地域經理 Dimitry Kuzhanov 說道。
“RapiD 是向前邁出的重要一步,因為它將人工智能的能力與人類天生具有的智慧和對關聯性的理解力結合了起來。”Mapillary 的戰略合作伙伴經理 Edoardo Neerhut 這樣說道。
總之,好的工具可以增強道路圖繪制人員的能力,減少基于衛星數據繪制道路的繁瑣和耗時的工作,提高道路形狀的準確性,并為識別建議道路提供選項,即使繪制者選擇不使用這些建議。能提供不受專業繪制者能力和判斷限制的工具很重要。我們將根據這些繪制者的反饋不斷改進 RapiD,讓它的使用過程更加順暢。我們相信,由此產生的生產能力提高了衛星圖像在道路圖繪制方面的效率。
-
衛星
+關注
關注
18文章
1719瀏覽量
67153 -
人工智能
+關注
關注
1792文章
47442瀏覽量
239020
原文標題:超酷炫!Facebook用深度學習和弱監督學習繪制全球精準道路圖
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論