技術的進化階段是一個熟悉的地方,人工智能是近年來的主要技術,也不例外。在人工智能中 - 新一代增加了更多的MAC,多層量化,這個功能,那個功能 - 所有這些都是為了追逐改進的TOPS / Watt。
在此環境中,我們已成功通過我們的 CEVA NeuPro 平臺將 AI 邊緣解決方案引入各種市場。現在,用戶想要更多,但有時僅靠進化是不夠的。
起初,用戶強調易用性,以幫助他們引入這種新的AI邊緣技術。但隨著他們在先進人工智能技術方面的專業知識不斷加深,他們希望獲得所有可能的方法,將差異化融入到他們的產品中,并超越當前最先進的方法一個數量級。通過進化快速到達那里是不可能的;革命性的改進是必要的。他們想要的已經從易用性轉變為以最大吞吐量和最小功耗實現最大的算法靈活性。
測量
TOPS / W是一個不錯的營銷數字,但它太粗糙了,在實際應用中沒有用處。例如,在視覺推理中,每秒幀/瓦特 (FPS/W) 是一個更有意義的指標。在這種情況下,好分數的價值很容易理解。檢測前方的行人或汽車或從后方經過的汽車需要快速響應。幾乎沒有時間剎車或轉向,而且這兩個動作都不是瞬間的。推理引擎必須能夠以盡可能低的功率管理至少100 FPS,因為這只是汽車周圍眾多傳感器/人工智能系統之一。這需要更高的fps / W才能獲得競爭力。
市場機會是毋庸置疑的。預計汽車和電信應用將成為這一增長的最大貢獻者,而在汽車領域,智能成像繼續保持強勁。順便說一句,手機中的“多相機”趨勢也是如此。事實上,這種相機中的成像管道已經開始用神經網絡取代傳統算法,用于去噪、圖像穩定、超分辨率和其他新穎功能,所有這些都在非常有限的能量包絡中以60fps的速度運行。
重大進步需要什么
圍繞模擬AI和峰值神經網絡發生了一些有趣的事情,但產品制造商不想離他們今天可以擴展到數量的東西太遠。這種限制仍然留下了大量的算法潛力,但現在產品構建者希望能夠以更大的靈活性訪問所有這些算法,以最小的功耗擠出最大的性能。
優化可能性列表很長:廣泛的量化選項,winograd支持,跳過乘法零的稀疏性優化,激活和權重在一系列位大小上的數據類型多樣性,與神經乘法并行的矢量處理能力,數據壓縮以減少權重和激活的加載時間,矩陣分解支持,通過參考網絡提供高達50:1的加速度, 和下一代 NN 架構,如變壓器和 3D 卷積支持。
號召性用語
產品構建者現在在人工智能方面擁有更多經驗,他們知道他們想要構建什么以及如何構建它。他們需要的是一個提供他們已經理解的所有神經網絡組件算法的平臺,為他們的產品構建最佳解決方案。
這是一個夢想中的算法和優化列表,可提供高級邊緣 AI 所需的真正突破性功能、吞吐量和低功耗。但為什么只有夢想呢?高級產品構建者不再滿足于人工智能的漸進式改進。他們現在期望平臺與他們對可能性的深刻理解相一致。
審核編輯:郭婷
-
人工智能
+關注
關注
1792文章
47376瀏覽量
238877
發布評論請先 登錄
相關推薦
評論