本周在IEEE國際電子元件會議上,IBM研究院(IBM Research)公布了在“計算內存架構”方面所取得的一項突破性成果,該架構可以為混合云平臺中的人工智能計算工作負載實現卓越的性能水平。
研究人員開發出了號稱第一個嵌入式磁阻隨機存取存儲器(Magnetoresistive Random-Access Memory)技術,采用14納米架構,并稱其是Spin Transfer Torque MRAM(STT-MRAM),這一新架構有助于解決數據密集型混合云和AI工作負載中的關鍵內存瓶頸。
IBM在博客文章中表示,隨著企業將那些要求最苛刻的工作負載遷移到混合云平臺,他們將面臨“計算內存瓶頸”的問題,這是由于系統中處理器比現有內存系統速度快得多而導致內存短缺的問題。
IBM表示,這種新型STT-MRAM架構可以解決內存和處理器之間的瓶頸,實現更高的內存性能。
STT-MRAM利用電子自旋將數據存儲在磁疇中,并將靜態RAM的高速度與傳統DRAM的更高密度結合在一起,從而提供了一種更可靠的內存架構。IBM表示,最后一級CPU緩存中部署STT-MRAM,將可以減少數據密集型工作負載所需的內存讀寫操作,從而降低系統延遲和功耗,同時增加帶寬。
IBM在今日發表的白皮書中稱,這項14納米嵌入式STT-MRAM CMOS技術是有史以來最先進的MRAM系統,將為混合云中的AI工作負載提供一個“效率更高、性能更高的系統”。
IBM在另外一份白皮書詳細介紹了這個新型架構所使用的高級磁性材料,這種材料讓STT-MRAM系統具有更高的密度,存儲量是原來的兩倍,從而大大提高了數據恢復性能。
IBM還透露了有關“模擬內存計算”研究的最新信息,這種技術將計算和內存結合到單一設備中,用于處理要求更為苛刻的AI工作負載。IBM說,這種專有硬件可以用于訓練越來越復雜的AI模型,能效大幅提升。
打造用于AI的專用模擬內存計算硬件,面對的挑戰之一,就是“突觸權重映射問題”。突觸權重用于指示神經網絡中兩個節點之間的連接強度,需要將其精確地映射到模擬非易失性內存設備上,以實現深度學習推理,但做到這一點面臨巨大挑戰,IBM說。
IBM在第一份題為《相變內存設備中進行深度學習推理編程的突觸權重精確度》白皮書中討論了依賴于脈沖編碼調制的、基于模擬電阻的存儲設備如何用于解決這一映射難題,并描述了一種通過分析和通過陣列級實驗準確映射突觸權重的方法。
在另外一份題為《“無輔助的真實模擬神經網絡訓練芯片》的白皮書描述了IBM模擬神經網絡芯片的概念,其本質上是一種“電阻處理單元”(RPU),具有出色的實時性能,堪比同類的數字系統,從而在運行AI推理時可實現承諾的“模擬優勢”。
責編AJX
-
IBM
+關注
關注
3文章
1755瀏覽量
74678 -
內存
+關注
關注
8文章
3019瀏覽量
74003 -
AI
+關注
關注
87文章
30728瀏覽量
268886 -
架構
+關注
關注
1文章
513瀏覽量
25468
發布評論請先 登錄
相關推薦
評論