三星去年11月發布了Exynos9系列處理器新品Exynos9820,這是三星首款集成NPU的手機SoC,三星當時表示Exynos9820相比上一代9系列處理器Exynos9810人工智能性能提升7倍,并可以增強從照片到AR的性能。今年的CVPR,三星題為《通過優化量化間隔,借助任務損失學習量化深度神經網絡》的論文透露了三星NPU的核心技術。
深度學習算法是人工智能的核心要素,因為它們是讓計算機能夠像人類一樣思考和學習的過程。神經處理單元(NPU)是針對深度學習算法計算而優化的處理器,旨在同時有效地處理數千個深度學習計算。
三星電子上月宣布,通過擴大NPU技術開發,到2030年加強其在全球半導體行業的領導地位。三星最近在計算機視覺領域的頂級學術會議之一的CVPR(Computer Vision and Pattern Recognition)上更新了更多信息。
此更新是三星的嵌入式AI輕量級算法,在CVPR上引入了一篇題為《Learning to Quantize Deep Networks by Optimizing Quantization Intervals With Task Loss》(可翻譯為《通過優化量化間隔,借助任務損失學習量化深度神經網絡》)的論文。嵌入式設備的AI能力可以直接計算和處理數據,最新的算法解決方案比現有算法輕4倍、速度快8倍,主要目是解決終端AI的低功耗和高性能問題。
簡化深度學習過程
三星高級技術研究院(SAIT)宣布他們已經成功開發了嵌入式(On-Device)AI輕量級技術,其計算速度比現有的32位服務器深度學習數據快8倍。通過將數據調整為4位以下的組,在保持準確數據識別的同時,還能比現有深度學習算法更快,更節能。
三星新的嵌入式AI處理技術通過“學習”確定影響深度學習整體成績的重要數據的時間間隔。這種“量化間隔學習(QIL)1”通過重新組織,以小于其現有大小的比特位呈現的數據來保持數據準確性。SAIT進行的實驗成功地證明了在計算到小于4位的水平時,32位間隔內的服務器深度學習算法的量化如何提供比現有其它解決方案更高的精度。
當深度學習計算的數據以低于4位的位組表示時,除了加法和乘法的算術計算之外,還允許進行'和'和'或'邏輯運算。這意味著使用QIL的計算可以獲得與現有過程相同的結果,但只需要1/40至1/120甚至更少的晶體管。
由于該系統只需要較少的硬件和供電,可以將其直接安裝在獲得圖像數據或指紋傳感器中。
人工智能處理和深度學習的未來
該技術將有助于增強三星的半導體實力,也有利于加強其在AI時代的核心競爭力之一 ——嵌入式這被的AI處理。與使用AI云服務不同,嵌入式AI技術直接處理設備本身獲取的數據。
嵌入式設備上的AI技術可以降低建設云服務器的成本,因為它可以自主運行,并為虛擬現實、自動駕駛等應用提供快速穩定的性能。此外,嵌入式的AI技術可以用于本地個人生物信息(例如指紋,虹膜和面部掃描)認證,能夠保證安全性。
嵌入式AI技術的核心功能是能夠高速運算而不消耗過多的能量。三星的第一個解決方案是去年發布的Exynos 9(9820),這個SoC采用了三星專有的NPU。
雷鋒網當時報道,在NPU的支持下,Exynos9820相比Exynos99810人工智能性能提升7倍,并可以增強從照片到AR的性能。
“未來我們將生活在一個所有設備和傳感器都由AI驅動的世界中,”SAIT計算機視覺實驗室副總裁兼負責人Chang-Kyu Choi說。“三星的嵌入式AI技術未來將不僅應用于移動SoC,還將應用于存儲器、處理器和傳感器市場,以及其它新的市場。“
量化是通過將給定數據分組為有限數量級別的部分來減少數據中的位數的過程,這些部分可以用某些位值表示,并且被視為每個部分具有相同的值。
-
三星電子
+關注
關注
34文章
15859瀏覽量
180986 -
存儲器
+關注
關注
38文章
7484瀏覽量
163764 -
NPU
+關注
關注
2文章
279瀏覽量
18584
發布評論請先 登錄
相關推薦
評論