比深度神經網絡速度還快的是什么?
或許光子DNN可以回答這個問題。
現在,美國研究者開發的一個光子神經網絡(photonic deep neural network,PDNN),讓圖像識別僅需1納秒。
1納秒是什么概念?它等于10-9秒,這與最先進的微芯片單時鐘周期(最小的時間單位)相當。
此外,研究者測試發現,PDNN對圖像進行2分類和4分類的準確率分別高達93.8%和89.8%。
誠然,如今的大型多層神經網絡高效且運算能力很強,但其也受到硬件的限制,往往需要消耗大量的電力資源等。
而賓夕法尼亞大學的工程師們研發的PDNN,能夠直接分析圖像,不需要時鐘、傳感器或大型存儲模塊,以有效降低耗能。相關研究成果于近日登上了Nature雜志。
光子DNN比傳統DNN更快
和傳統DNN相比,光子DNN的原理和性能有何不同?
先來看看傳統DNN:
圖a是傳統DNN的結構示意圖,包括一個數據排列單元,然后是輸入層、幾個隱藏層,和一個提供分類輸出的輸出層。
圖b展示了傳統N輸入神經元的結構:輸入的線性加權和,通過一個非線性激活函數,產生神經元的輸出。
圖c和圖d分別是一個PDNN芯片的神經網絡示意圖和N輸入神經元結構。
首先在一個5×6光柵耦合器上形成輸入圖像,然后將其排列成4個重疊的子圖像,子圖像的像素被傳送到第一層神經元,形成一個卷積層。
后面的神經元與它們的前一層完全連接,該網絡產生2個輸出,可最多為4種圖像信息分類。
對于這些神經元,其輸入都是光學信號。
在每個神經元中,線性計算是通過光學方式進行的,而非線性激活函數是通過光電子方式實現的,從而可使分類時間低于570ps(=0.57ns)。
論文的通訊作者,電氣工程師Firooz Aflatouni對這個PDNN的性能補充描述道:它每秒可以對近18億張圖像進行分類,而傳統的視頻幀率是每秒24至120幀。
這里的PDNN芯片電路被集成在僅9.3 mm2 的面積內,不需要時鐘、傳感器以及大型存儲模塊。
一個激光器被耦合到芯片內,為各個神經元提供光源;該芯片包含兩個5×6的光柵耦合器,分別作為輸入像素陣列和校準陣列。
不過,均勻分布的供給光每個神經元光提供了相同的輸出范圍,顯然這將允許將其擴展到更大規模的PDNN。
光子DNN芯片的圖像分類測試
研究者們讓這個PDNN微芯片識別手寫字母。
一組實驗測試了PDNN芯片的二分類性能:需要對共計216個「p」和「d」字母組成的數據集進行分類。
該芯片準確率高于93.8%。((92.8%+94.9%)/2)
另一組實驗測試了PDNN芯片的四分類性能:需對共計432個「p」、「d」、「a」、「t」字母組成的數據集進行分類。
該芯片分類準確率高于89.8%。
這些結果表明,即使有更多的類(如分四類情況),且存在打印機引起的變化和噪聲,PDNN芯片仍取得了較高的分類精度。
為了比較這個PDNN和傳統DNN的圖像分類準確性,研究者還測試了在Python中使用Keras庫實現的190個神經元組成的DNN,結果顯示:它在相同圖像上的分類準確率為96%。
審核編輯:郭婷
-
傳感器
+關注
關注
2552文章
51228瀏覽量
754693 -
芯片
+關注
關注
456文章
50951瀏覽量
424763 -
神經網絡
+關注
關注
42文章
4774瀏覽量
100898
原文標題:Nature | 低于1納秒光速圖像識別
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論