圖像識別和GPU相輔相成,特別是在使用深度神經網絡(DNN)時。基于GPU的DNN在圖像識別領域的優勢已經在過去幾年在ImageNet大規模視覺識別挑戰(ILSVRC)中的成功得到了明確的證明,DNN最近實現了與訓練有素的人類相媲美的分類準確性,如圖1顯示。新的低功耗圖像識別挑戰(LPIRC)突出了移動和嵌入式設備上圖像識別的重要性。
具有卷積層的DNN是具有生物啟發性的人工神經網絡。這些網絡可能有五層或更多層,每層都有許多神經元。類似于突觸的鏈接連接層,將信息轉發到下一層。培訓過程調整鏈接上的權重,提高網絡對呈現給它的信息進行分類的能力。用于訓練DNN的數據越多,其分類性能就越好。這種大數據需求導致了GPU的大量使用,因為GPU在高度并行計算(如深度學習中使用的那些計算)上的高吞吐量設計。
ImageNet是一個很好的圖像資源,它擁有一個根據描述性名詞層次組織的大型圖像數據庫。ImageNet每年都會舉辦ILSVRC,為此參賽者開發了用于準確識別圖像中物體的算法。ImageNet提供了來自1000個不同對象類別的超過120萬張圖像的大型圖像集,用于訓練識別算法。學術界和工業界的參與者表現強勁,近年來與Google,斯坦福大學,加州大學伯克利分校和Adobe等競爭對手表現強勁。
低功耗挑戰
為了促進低功耗設備的圖像識別,普渡大學電氣和計算機工程副教授Yung-Hsiang Lu和UNC Chapel Hill計算機科學助理教授Alex Berg正在組織低功耗圖像識別挑戰(LPIRC),這是一場專注于識別圖像識別和節能最佳技術的競賽。LPIRC的注冊現已開放。
實現高性能同時保持低功耗可能具有挑戰性,因為這兩個參數經常一起增加。去年,NVIDIA發布了Jetson TK1開發套件,這是一款非常適合圖像處理和計算機視覺應用的低功耗GPU加速計算平臺。Jetson TK1的低功耗要求和圖像處理能力將使其成為LPIRC競爭對手的熱門平臺。
用于LPIRC的示例性任務包括在圖像中定位和分類對象,包括識別多個對象。許多ILSVRC團隊在年度ImageNet競賽中使用CNN,他們很可能是為LPIRC部署的機器學習體系結構之一。訪問LPIRC網站了解有關重要日期和競賽任務的信息。
免費Jetson TK1參與團隊開發工具包
Jetson TK1將成為本次比賽團隊的一項重要資產,峰值功率需求低于12.5瓦。Jetson TK1支持CUDA,cuDNN,OpenCV和流行的深度學習框架,如Caffe和Torch。Jetson本質上是一個微型超級計算機,可以直接與顯示器,鍵盤和鼠標或通過ssh連接使用,它預裝了Ubuntu Linux,因此入門很容易。
作為LPIRC的贊助商,NVIDIA為參賽車隊提供免費的Jetson TK1開發工具包,每位獲勝者將獲得NVIDIA GPU。如果您的團隊想要為LPIRC使用Jetson TK1,請填寫此申請表。NVIDIA將審查提案并為選定的申請人提供TK1 DevKits。
我的Jetson TK1深度學習設置
將訓練有素的網絡移植到Jetson TK1并進行分類很容易。圖1顯示了我的設置。對于額外的磁盤空間,我添加了一個外部硬盤驅動器并使用SATA接口連接它。我使用4端口USB 3.0集線器通過鼠標和鍵盤以及更多硬盤直接連接。
運行Caffe網絡演示的我的Jetson TK1設置。
我在我的Jetson TK1上制作了Caffe,所以我可以將它用于分類。Caffe的網絡演示例子是一個簡單而簡單的測試方法。Web演示在Jetson TK1上運行Web服務器,并且需要包含預訓練網絡的BVLC參考CaffeNet輔助數據。一旦建立并運行,使用Jetson TK1的IP地址端口500(例如192.168.1.5:5000)從本地網絡上的任何設備訪問演示。您可以使用以下-g標志以GPU加速運行Web演示:
python examples / web_demo / app.py -g
如下表所示,我使用該演示對具有和不具有GPU加速功能的五個圖像進行分類,以便使用Tegra K1的GPU與其CPU進行分類,從而加快分類速度。
圖像分類GPU(毫秒)無GPU(毫秒)加速(x)斗雞眼貓131655534.2在海上運送101055715.5谷倉135157914.3小狗156856773.6海盜船138556514.1平均132656494.3今天注冊低功耗圖像識別挑戰!
LPIRC的注冊現已開放。比賽將于2015年6月7日在設計自動化大會上舉行,所以現在就組建一個團隊,并為您的團隊填寫免費的NVIDIA Jetson TK1開發板的應用程序。
-
gpu
+關注
關注
28文章
4729瀏覽量
128890 -
圖像識別
+關注
關注
9文章
520瀏覽量
38267
發布評論請先 登錄
相關推薦
評論