人,自行車,汽車或道路,天空,草地:圖像的哪些像素代表無人駕駛汽車前的不同前景人物或物體,哪些像素代表背景類別?這項稱為全景分割的任務是一個基本問題,已在許多領域中應用,例如自動駕駛汽車,機器人技術,增強現實,甚至在生物醫學圖像分析中。在弗萊堡大學計算機科學系,Abhinav Valada博士是機器人學習的助理教授,也是BrainLinks-BrainTools的成員,他專注于這個研究問題。Valada和他的團隊開發了最先進的“ EfficientPS”人工智能(AI)模型,該模型可以更快,更有效地對視覺場景進行連貫識別。
這項任務通常使用稱為深度學習的機器學習技術來解決,其中人工神經網絡弗賴堡研究人員解釋說,它們是從人腦中汲取靈感,從大量數據中學習。諸如Cityscapes之類的公共基準在衡量這些技術的進步方面起著重要作用。Valada團隊的成員Rohit Mohan說:“多年來,來自Google或Uber的研究團隊一直在這些基準測試中爭奪榜首。” 來自弗萊堡(Freiburg)的計算機科學家的方法已被開發出來,用于理解城市的城市場景,在“城市景觀”(Cityscapes)中排名第一,Cityscapes是最有影響力的自動駕駛場景理解研究的排行榜。EfficientPS還始終在其他標準基準數據集(例如KITTI,Mapillary Vistas和IDD)上設置新的最新技術。
在項目網站上,Valada展示了團隊如何在各種數據集上訓練不同AI模型的示例。結果疊加在相應的輸入圖像上,其中顏色顯示模型將像素分配給的對象類別。例如,汽車標記為藍色,人物標記為紅色,樹木標記為綠色,建筑物標記為灰色。此外,AI模型還在每個被視為獨立實體的對象周圍繪制邊框。弗萊堡大學的研究人員成功地訓練了該模型,以將所學的城市場景信息從斯圖加特轉移到紐約市。盡管AI模型不知道美國的城市長什么樣,但它能夠準確識別紐約市的場景。
Valada解釋說,以前解決該問題的大多數方法都具有較大的模型尺寸,并且在實際應用中(例如受資源嚴重限制的機器人技術)在計算上非常昂貴,“我們的EfficientPS不僅可以實現最新的性能,而且這也是計算效率最高,最快的方法。這進一步擴展了可以使用EfficientPS的應用程序。”
-
神經網絡
+關注
關注
42文章
4773瀏覽量
100877 -
深度學習
+關注
關注
73文章
5506瀏覽量
121260
發布評論請先 登錄
相關推薦
評論