我們生活在一個以數(shù)字處理為主的模擬世界中,其實在數(shù)字計算機興起以前,產(chǎn)業(yè)流行的模擬計算,只不過隨著CPU的走熱,模擬計算逐漸遇冷,但是隨著人工智能應用越來越流行,對更多計算資源、更多模型存儲容量以及更低功耗的需求變得越來越重要。目前用于人工智能應用的數(shù)字處理器難以滿足這些極具挑戰(zhàn)性的要求,于是,模擬計算再度被產(chǎn)業(yè)重視,與數(shù)字計算相比,模擬計算的速度和功效很有優(yōu)勢,在5月12日召開的第十三屆松山湖中國 IC 創(chuàng)新高峰論壇上,每刻深思智能科技(北京)有限責任公司就介紹了一款采用模擬計算的低功耗“感存算一體”智能芯片MKS2206。
據(jù)每刻深思(MakeSens)智能科技創(chuàng)始人鄒天琦介紹,MKS2206采用自主創(chuàng)新架構設計。該芯片能夠在復雜的識別任務中以低功耗、高精度、高性能和高穩(wěn)定性脫穎而出,因此在AR/VR/MR以及智能座艙等復雜人機感知和交互場景中廣泛部署。通過集成輕量級識別交互算法,顯著降低系統(tǒng)功耗,提升整體性能,并達到同行業(yè)領先水平。
他認為摩爾定律放緩的現(xiàn)象正在導致存儲和計算之間的頻繁數(shù)據(jù)遷移,這在整個過程中消耗了大量的能量。所以每刻深思提出模擬計算解決功耗問題,因為模擬信號無需進行模數(shù)轉(zhuǎn)換(ADC),從而大大提高了系統(tǒng)效能。
他指出摩爾定律放緩下面臨的很多問題:第一個是混合云架構,存儲計算之間不停搬移,這里面90%的功耗都是在搬移數(shù)據(jù)過程當中,并沒有用在數(shù)據(jù)處理過程當中。2、先進的制程,除了費用問題以外,還有很大的散熱問題,其實模擬計算最大的優(yōu)勢就是工藝,例如采用40nm工藝對標是數(shù)字芯片22nm以下性能。同時模擬計算需要的晶極管比數(shù)字要更少,在成本上有很好的優(yōu)勢。相比22納米以下的處理器,每刻深思可以把成本做到原來的70%。
他解釋說傳統(tǒng)方案當中,任何SOC信號進來,需要做高性能ADDA的轉(zhuǎn)換,在ADC的模數(shù)轉(zhuǎn)換當中,無論其他芯片做怎樣的軟硬件協(xié)同或優(yōu)化,這個ADC的量是少不了的,但是模擬計算因為本身SOC接的物理信號是模擬的,不需要做ADC轉(zhuǎn)換,這是最大的優(yōu)勢。從技術原理來說,放ADC之前,需要在模擬里面完成特征提取,包括基于存儲器神經(jīng)網(wǎng)絡的處理,這個是如何做到呢?
他以很簡單的成本預算為例,上圖是神經(jīng)網(wǎng)絡核心內(nèi)核。如果用數(shù)字芯片來說,要做邏輯搭建來完成數(shù)字成本預算,但是模擬有物理特性,本身可以用電壓作為輸入,可以用等效的權重來實現(xiàn)這個算法,可以很好基于機械特性來完成成本預算,達到很高的效率。
在上圖所示處理中,將部分數(shù)字信號處理(DSP) 任務前置預處理,精簡處理信息 ADC被移到模擬計算橫塊之后,僅在有效需求時被喚醒,降低無效功耗 原始信號中不必要的信息己被去除,主芯片只需計算精簡信息,提高了計算效率。
他指出,MK2206和之前模擬計算的相關性,無論是多模態(tài)也好,還是其他的也好,剩下的這些廠商,本身外面帶4個、6個,甚至8個攝象頭,需要看手勢識別的交互,需要用下面兩個攝像頭來做,也就是雙目的方式是最自然的。在后面架構當中,每刻深思跟主控芯片有中段信息的輸入來做融合。這一塊芯片是可以一直開啟適時感知周邊的環(huán)境,包括手勢的任務。這樣可以讓后面的AP在很多時候進行一個休眠狀態(tài),或者相對比較低的功耗去運行。
他指出在AR應用中,可能不需要用一些高端附加功能,只需要做一些基礎的實時的交互,并且把功耗做得非常低,這樣一個MKS處理器就可以實現(xiàn)這個任務,因為它把很多常態(tài)的任務,包括手勢的、對于功耗非常敏感的任務放在Offload到專用芯片上,并且實現(xiàn)極低功耗實時交互。這樣給很多方案廠和整機商提供更多選擇。
“其實我們不僅做電路,我們也把新品和算法做緊密集成,深度優(yōu)化,來實現(xiàn)完整的識別和跟蹤方案。這里面算法做了很多工作,從圖像預處理,大量采集器檢測跟蹤,后處理,還有顯示上手部重建,用很多工作量完成。”他強調(diào),“這里面原理很簡單,抓手勢特征點去完成手指節(jié)的識別,而不僅僅是手掌識別。我們做交互,希望用手指操作可以完成很多旋轉(zhuǎn)動作,這里面要做很多工作,要把很大的模型和很大數(shù)據(jù)量做輕量化。無論是量化,在識別功能上相對更小、更輕,實現(xiàn)更低功耗。”
他指出在手勢識別方面,每刻深思用了21個關鍵點坐標,不只是單手,左右手都可以區(qū)分,可以同時識別,同時處理幀率到60幀以上,識別精度小于10毫米。“如果用XR2跑的話,需要有將近1瓦功耗。但是2206峰值功耗保持在200毫瓦以內(nèi)。并且可以持續(xù)優(yōu)化。”他指出。
關于每刻深思產(chǎn)品規(guī)劃,他表示接下來是聚焦基于視覺的處理能力,也會集成XR定位,還有就是跟常態(tài)的視覺相關的任務都會放在交互芯片上,提供給相關的方案商客戶。
他表示每刻深思會基于2206實現(xiàn)小規(guī)模量產(chǎn)的基礎上,在2024年至2025年隨著VR、AR的爆發(fā),實現(xiàn)大規(guī)模定制,實現(xiàn)高速增長。”我們的目標是建立以自研芯片為核心的全芯片智能感知服務平臺!“他表示。
審核編輯 :李倩
-
芯片
+關注
關注
456文章
50892瀏覽量
424337 -
摩爾定律
+關注
關注
4文章
634瀏覽量
79077 -
智能芯片
+關注
關注
0文章
138瀏覽量
25252
原文標題:導入模擬計算,每刻深思發(fā)布低功耗感算一體智能芯片
文章出處:【微信號:motorcontrol365,微信公眾號:電機控制設計加油站】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論