在腦認知科學中有這么一個觀點,如果幾個神經元之間經常構成連通路,且通過這幾個神經元進行信息傳遞不如兩者直接通過在彼此中間“搭橋”進行信息傳遞來得快,那么大腦結構就會根據細胞結構上信息傳遞的頻率在兩者之間幫助生出一個神經元來幫助更高效的獲取與處理大腦信息。
從上面這個內容中我們可以發現,現在人工智能的發展并不足夠完美,但我們依然受類似的生物系統啟發從而提出神經網絡結構,并將之用于人工智能技術的發展。現在,通過融合強大計算資源和用于神經元的新型架構,神經網絡已然在計算機視覺和機器翻譯等很多領域都取得了最先進的成果。
然而相對來說,這樣的技術發展可都有各種嚴格的要求,尤其速度。那么我們現代人在大數據噴發的今天,是怎么做到計算與速度兩者皆備的呢?在此之前,我們不妨先來了解深度學習神經網絡的現狀。
深度學習神經網絡現狀
深度學習神經網絡系統目前已能夠為許多人提供最佳解決方案,并已用于圖像識別和自然語言處理的大型計算問題。更多的人使用傳統的處理來模仿神經網絡并創建一個系統,并通過觀察來學習。雖然我們在這個領域已經取得了很大進展,但基于Web的神經網絡高性能系統開發等多種技術,在功耗,成本和性能方面仍然存在重大挑戰。
此外,最廣泛使用的深度學習系統是卷積神經網絡(細胞神經網絡)。這些系統使用神經元的前饋人工網絡執行圖像識別。如有線電視新聞網是由層組成。其中,池化層通過最大值或值平均,池化減少變化圖像特定區域的共同特征。CNN層的數量與圖像識別的準確性相關;更多圖層需要更多系統性能。這些層可以獨立運行。
圖1:二維卷積層
多核處理系統使用外部存儲器緩沖每層之間的數據,這需要大量的內存與帶寬。到目前為止,神經網絡中性能最強的功能是卷積自己。傳統的處理器內核必須為每個內核執行大量指令。卷積需要大量的處理與帶寬。
實現CNN的有效實施有兩個主要挑戰。首先是能夠在管道中執行函數,將數據從上一個層傳遞到下一個。第二是有效地執行卷積函數。另外,這些功能應該用一種方法構建允許輕松重新編程不同類型的硬件和移植到未來的高級硬件,否則,每個新的實現都需要廣泛的重新優化。
在英特爾公司,FPGA 當稱實施神經網絡的必然之選,它可在同一設備上處理計算、邏輯和存儲資源中的不同算法。與其它同行對手的裝置相比,其性能更快,用戶可通過硬件來完成核心部分運算。加上軟件開發者可使用 OpenCL?1C 級編程標準,將 FPGA 作為標準 CPU 的加速器,更加無需處理硬件級設計。
“Why?因為它能將計算,邏輯和內存資源結合在一起共同使用。再加上英特爾?FPGASDK的幫助,使得它能夠適用于各種加速應用并使用更多復雜的算法。軟件開發人員也可以使用OpenCL C級編程標準。”
此外,英特爾已經開發出可擴展的卷積神經網絡參考設計,并用于使用OpenCL編程的深度學習系統。(使用OpenCL SDK構建的語言)這個設計首先是在Stratix?V器件系列上實現,現在適用于Arria?10器件。設計表現是使用兩個流行的CNN基準進行基準測試:CIFAR-10和ImageNet。(典型的GPU實現批處理圖像需要大量的外部存儲器帶寬。相比之下,FPGA可以一次性處理圖像,芯片上的數據重用率更高,外部使用更少內存帶寬。)
圖2:神經網絡數據通道
-
英特爾
+關注
關注
61文章
9983瀏覽量
171946 -
神經網絡
+關注
關注
42文章
4773瀏覽量
100890 -
深度學習
+關注
關注
73文章
5507瀏覽量
121272
原文標題:從“腦認知科學”看神經元之旅,你對深度神經網絡該有這樣的認知
文章出處:【微信號:FPGAer_Club,微信公眾號:FPGAer俱樂部】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論