電子發燒友網報道(文/李彎彎)AI時代,馮諾依曼架構下計算單元與存儲單元分離帶來的存儲墻問題愈發明顯,而存算一體被認為是解決存儲墻問題的有效方式。
如今國內外眾多企業都已經開展存算一體技術的研發,包括英特爾、SK海力士、IBM、美光、三星、臺積電、阿里等傳統芯片大廠,以及眾多新興AI和存儲企業,比如知存科技、后摩智能、蘋芯科技、億鑄科技、智芯科、千芯科技、九天睿芯、閃易半導體、恒爍半導體等。
那么目前各家企業的研究和量產情況進展如何呢?各家的技術路線有何差異?存算一體技術未來的整體趨勢如何?
傳統芯片大廠積極研發,展示最新進展
目前,三星電子、SK海力士、臺積電、美光、IBM、英特爾等都在進行存算一體技術的研究,其中有明顯進展是三星電子、SK海力士。
三星電子在多個技術路線進行嘗試,2021年初,三星發布基于HBM的新型內存,里面集成了AI處理器,該處理器可以實現高達1.2TFLOPS的計算能力,新型HBM-PIM(存內計算)芯片將AI引擎引入每個存儲庫,從而將處理操作轉移到HBM,可以減輕在內存和處理器之間搬運數據的負擔。三星表示新型HBM-PIM芯片,可以提供2倍的系統性能,同時能耗降低了70%以上。
今年1月三星電子又帶來新研究成果,該公司在頂級學術期刊Nature上發表了全球首個基于MRAM(磁性隨機存儲器)的存內計算研究。據介紹,三星電子的研究團隊通過構建新的MRAM陣列結構,用基于28nm CMOS工藝的MRAM陣列芯片運行了手寫數字識別和人臉檢測等AI算法,準確率分別為98%和93%。
SK海力士今年2月也公布了基于GDDR接口的DRAM存內計算的最新研究成果,并展示了其首款基于存內計算技術產品GDDR6-AiM的樣本。
GDDR6-AiM是將計算功能添加到數據傳輸速度為16Gbps的GDDR6內存產品中,與傳統DRAM相比,將GDDR6-AiM與CPU、GPU相結合的系統可在特定計算環境中將計算速度提高16倍。此外,由于存內計算在運算中減少了內存與CPU、GPU間的數據傳輸往來,大大降低了功耗,GDDR6-AiM可使功耗降低80%。
臺積電也在進行存內計算的研究,該公司的研究人員在2021年初的國際固態電路會議(ISSCC 2021)上提出了一種基于數字改良的SRAM設計存內計算方案,能支持更大的神經網絡。
此外美光也曾通過收購人工智能技術初創公司Fwdnxt,嘗試開發將內存和計算緊密結合的創新方案,IBM前幾年也在相變存儲(PCRAM)里實現了神經網絡計算功能,英特爾也早早提出了近內存計算戰略,將數據在存儲層級向上移動,使其更接近處理單元進行計算。
國內新興企業陸續融資,不少企業進展明顯
在存算一體技術推進研發、量產落地方面,國內新興AI和存儲企業進展明顯,包括知存科技、后摩智能、蘋芯科技、億鑄科技、智芯科、千芯科技、九天睿芯、閃易半導體、恒爍半導體等,其中知存科技、智芯科、九天睿芯、閃易半導體已經有產品量產。
知存科技
知存科技成立于2017年,目前已推出多款存內計算芯片,該公司2021年發布的WTM2101芯片,已經完成批量生產,該芯片采用Flash工藝,處理AI運算時工作功耗最低50uA,峰值算力下功耗低至5mA,神經網絡模型參數可達1.8MB,AI峰值算力達50Gops,適合可穿戴設備中的智能語音和智能健康服務。知存科技于2022年1月完成2億元B1輪融資。
后摩智能
后摩智能成立于2020年底,專注于存算一體技術的大算力AI芯片研發,提供大算力、低功耗的高能效比芯片及解決方案,應用于智能駕駛、泛機器人等邊緣端,及云端推理場景。該公司第一代芯片是基于SRAM的智能計算芯片,第二代芯片是基于RRAM等先進存儲工藝的芯片,后摩智能于2021年8月宣布完成首款芯片驗證流片,于2022年4月完成數億元人民幣Pre-A+輪融資。
蘋芯科技
蘋芯科技成立于2021年2月,是一家基于存算一體技術打造面向AI加速器芯片的公司。目前已開發多款基于SRAM的存內計算芯片,其首款可商用的存內計算加速單元S200目前正與客戶做技術驗證,蘋芯科技的存內計算產品主要用于可穿戴設備、無人機攝像頭、安防領域、機器人領域、智能家居等場景。2021年8月,蘋芯科技完成近千萬美元Pre-A輪融資。
億鑄科技
億鑄科技成立于2021年9月,主要基于ReRAM路線來實現大算力的存算一體芯片,億鑄科技主要為數據中心和自動駕駛等領域打造能效比十倍于現有技術的解決方案,研發能力覆蓋從存算一體底層器件,芯片設計到AI軟件棧。目前億鑄科技已完成過億元天使輪融資。
另外在ReRAM架構的全數字存算一體AI計算芯片領域,億鑄科技將會與昕原半導體聯手、緊密調試。昕原半導體基于Metal Wire工藝,在ReRAM器件的設計和制造工藝已經實現了全國產化,并已完成業界首款28nm制程ReRAM芯片流片,建成中國大陸首條中試線,擁有垂直一體化存儲器設計加制造的能力。
智芯科
智芯科(AistarTek)成立于2019年,主要致力于大算力低功耗的邊緣計算芯片設計,產品應用領域包括手機、自動駕駛、安防、無人機、機器人、AR/VR等。該公司此前表示,第一代AT680X針對超低功耗智能語音AIOT市場的量產版產品將在2021年9月份推向市場。2021年7月,智芯科宣布完成近億元的天使輪融資。
千芯科技
千芯科技(TensorChip)成立于2019年,在國內最早提出可重構存算一體AI芯片架構。公司的核心產品包括高算力低功耗的存算一體AI芯片/IP核,準備量產和投片的可重構存算AI芯片采用的是SRAM。目前已完成由前海融華匯金和新世界投資的數千萬元融資。
千芯科技主要推進面向云端推理和邊緣計算的AI芯片研發,產品可應用于云計算、自動駕駛、智能安防等領域,在云計算方面,技術團隊正在優化產品原型,將AI芯片技術與工業客戶的需求相結合,目前產品已完成樣機驗證,處于小批量驗證優化階段。
九天睿芯
九天睿芯成立于2018年6月,該公司基于類腦計算,以模數混和形式,實現感存算一體芯片的研發落地和量產銷售,該公司目前已完成億元級A輪融資。
九天睿芯已經推出包括ADA100和ADA200在內的多款芯片。ADA100是一款超低功耗低算力傳感器處理芯片,等效算力1Gops,應用于可穿戴/ARVR/AIoT設備如無線智能相機門鈴、門鎖、86開關等智能家居產品,于2021年11月量產,2022年批量出貨。
ADA200是低功耗中低算力視覺協處理器,算力1-2Tops,應用于低功耗無線攝像頭/ARVR/手機平板,將于2022年底量產,ADA200是基于最新感存算一體技術架構實現的模數混合AI視覺芯片,相比傳統數字芯片,具備更低功耗,以及超高的能效比。
閃易半導體
閃易半導體成立于2017年,是一家研發高性能、低功耗、低成本的存算一體化AI芯片的公司,首批芯片產品早在2020年就實現批量出貨。
公司主要推廣語音和圖像識別兩大解決方案,圖像識別產品首先面向需求量極大的消費類電子市場,包括智能手表/手環、AR/VR等可穿戴設備,以及在人臉識別智能門鎖中的應用,圖像識別產品還在防災減災、提升道路安全等多個泛安防場景中實現了批量應用。
恒爍半導體
恒爍半導體成立于2015年,是一家主營業務存儲芯片和MCU芯片的集成電路設計企業,自2019年起,開始研發基于NOR Flash架構的存算一體人工智能AI芯片(CINOR)。
對現有NOR Flash陣列進行改造后,2019 年底公司第一款CiNOR V1版在武漢新芯65nm NOR Flash制程上已經完成芯片設計并流片,成功驗證了CiNOR芯片原理和可行性,并實現了包括手寫識別、ECG檢測和人臉檢測等幾項應用。CiNOR V2芯片正在研發過程中。
阿里達摩院
2021年12月3日,阿里云微信公眾號發布消息稱,達摩院成功研發存算一體芯片。據介紹,這是全球首款基于DRAM的3D鍵合堆疊存算一體芯片,它可突破馮·諾依曼架構的性能瓶頸,滿足人工智能等場景對高帶寬、高容量內存和極致算力的需求。在特定AI場景中,該芯片性能提升10倍以上,效能比提升高達300倍。
新型存儲代表著存算一體內技術的未來
目前能做存算一體的存儲器包括Flash、SRAM、DRAM、RRAM(憶阻器)、MRAM(磁性存儲器)等,不同技術路線各有優劣勢,比如Flash具有密度比較高的優點,DRAM成本比較低,MRAM、RRAM等新型存儲器除了存儲密度較高之外,功耗也比較低等。未來隨著人工智能對高性能、低功耗處理需求的不斷增強,存算一體技術的開發和應用落地進程將會加速。
其中,在眾多存儲器中,新型存儲器RRAM、MRAM等被格外看好,此前有業內人士對電子發燒友表示,RRAM、MRAM這兩類新型存儲器代表著存內計算的未來,不過因為技術比較新,目前在工藝成熟度和商業化上還需要一些耐心。
事實上RRAM、MRAM等已經在逐漸取得進展。MRAM是一種基于自旋電子學的新型信息存儲器件,其核心結構由一個磁性隧道結和一個訪問晶體管構成,和其他存儲器相比,MRAM在運行速度、壽命和量產方面存在優勢。事實上,早在十幾年前就有企業研究和MRAM產品,包括飛思卡爾(被恩智浦并購)、東芝、高通等,過去幾年臺積電、英特爾、三星、SK海力士等晶圓代工廠和IDM也大力投入研發。
此外也有不少初創公司投入研究并取得進展,比如國外的Everspin、Avalanche、Crocus、 Spin Transfer Technology 已經能夠提供MRAM樣品,國內成立于2019年的亙存科技,已經于2020年完成產業鏈閉環建設,打通了上下游各關鍵環節,獲得數家來自國內外客戶的合作訂單和營收,涉及技術涵蓋STT-MRAM和 SOT-MRAM等。
RRAM是繼電阻、電容、電感之后的第四種電路基本元件,這種組件的電阻會隨著通過的電流量而改變,它本身就像一個矩陣排列,最適合進行點積乘法和累加運算,而這類運算占深度學習算法中的絕大部分。乘積累加操作可以通過將憶阻器這樣的可編程阻變元件直接集成到非易失性高密度存儲芯片中來實現,處理單元被嵌入存儲器中,可減少數據移動,也就是說憶阻器本身就已具備存內計算的特質,非常適合用于存算一體芯片技術方向。
目前已經有些RRAM進入小批量試產階段,而且此前清華大學微電子所、未來芯片技術高精尖創新中心錢鶴、吳華強教授團隊,與合作者共同研發出一款基于多個憶阻器陣列的存算一體系統,該系統在處理卷積神經網絡時的能效,比圖形處理器芯片高兩個數量級,單芯片算力高達1POPs,大幅提升計算設備的算力,而且功耗比傳統芯片降低了100倍。
可以看到,新型存儲器RRAM、MRAM等的優勢非常明顯,不過相比于Flash、SRAM、DRAM等存儲器,它們在開發上還有一些問題需要攻克,從當前的進展來看,預計未來幾年將會逐漸有產品走向商用。
小結
從統計情況來看,目前已經有基于SRAM、NOR Flash的存算一體產品批量生產,基本上是小算力產品,面向消費、泛安防等低功耗市場;此外可以看到,有不少企業正在研發面向邊緣端、云端推理場景的大算力產品,應用于數據中心、智能駕駛等領域,并且已經到了芯片驗證階段,而接下來,除了基于新型存儲器的存算一體將會逐漸走向商用,存算一體芯片產品也將從小算力終端消費類應用,逐漸走到面向大算力的智能駕駛、數據中心等應用。
-
技術
+關注
關注
0文章
431瀏覽量
58486 -
量產
+關注
關注
0文章
78瀏覽量
23093 -
存算一體
+關注
關注
0文章
102瀏覽量
4302
發布評論請先 登錄
相關推薦
評論