大數(shù)據(jù)真的很厲害,相信很多人都感受到了,比如你剛逛完某寶開始刷某音,卻發(fā)現(xiàn)某音給你推送了你剛剛看過的商品的廣告,以及相似品類的帶貨直播;再比如某頭條每次給你推送的內(nèi)容都是你感興趣的。這些APP似乎比你更了解你自己。
“精準推薦”的背后,其實是大量具有挑戰(zhàn)性的開發(fā)工作,是人工智能技術(shù)的加持。AI加速器是推薦系統(tǒng)的關(guān)鍵技術(shù),它的速度和能效是預(yù)測準確性的關(guān)鍵。
2019年,Meta(前Facebook)呼吁業(yè)界在其開發(fā)的開源深度學習推薦模型(DLRM)基礎(chǔ)上進行推薦系統(tǒng)硬件加速的開發(fā)。Neuchips Inc.的開發(fā)團隊倍受啟發(fā),他們隨后設(shè)計出推薦模型容量更大的DLRM加速器Neuchips RecAccel-N3000。
RecAccel-N3000是專為數(shù)據(jù)中心的推薦模型而設(shè)計的,它能做到每焦耳能量實現(xiàn)100萬次DLRM推斷,舉個例子來說,也就是當芯片工作在20W時,每秒可進行2000萬次推斷。
這款A(yù)I加速器是使用新思科技的EDA工具開發(fā)的,并將采用臺積電7nm工藝制造,樣品計劃在2022年底完成。
正常來說,這一過程通常需要100多人花3到4年才能完成,但Neuchips僅30人的開發(fā)團隊在短短18個月內(nèi)就制造出了400mm2的人工智能芯片。今天的文章中我們將詳細介紹他們是如何做到的。
開創(chuàng)一種獨特的
“直連ASIC”開發(fā)方法
以DLRM為代表的人工智能推薦系統(tǒng),是利用云計算和大數(shù)據(jù)方面的最主要的機器學習應(yīng)用之一。優(yōu)化過的DLRM可以產(chǎn)生更加有效的推理結(jié)果,但卻需要平臺能夠在能耗和存儲不大幅增加的情況下提供更多的算力。
Neuchips開創(chuàng)了一種獨特的“直連ASIC”開發(fā)方法,通過專門構(gòu)建的特定領(lǐng)域AI加速器以及共同設(shè)計的編譯器和runtime軟件來進行加速。在該公司的異步、異構(gòu)數(shù)據(jù)流架構(gòu)中,用來優(yōu)化DLRM邏輯架構(gòu)的每種IP和處理器都是精心定制的。
此外,RecAccel-N3000還具有以下特點:
160MB片上SRAM
4x64帶有ECC的LPDDR5
高達128GB的卡上DRAM
多達16通道的PCI Express(PCIe)3.0、4.0和5.0
嵌入式安全硬件信任根模塊
為了能夠率先進入市場,Neuchips積極尋求能夠幫助該公司加快設(shè)計周期的支持、設(shè)計和驗證工具以及IP。Neuchips在人工智能芯片設(shè)計實驗室找到了所需的資源,這一實驗室是新思科技與臺灣工業(yè)技術(shù)研究院(ITRI)的合作項目。因為團隊內(nèi)的很多成員已經(jīng)非常熟悉新思科技的技術(shù),因此Neuchips很快決定與新思科技合作開展這一項目。
該人工智能芯片設(shè)計實驗室位于臺灣新竹的工研院總部,已獲得臺灣工業(yè)技術(shù)部門(DoIT)和經(jīng)濟部門(MOEA)技術(shù)發(fā)展計劃的支持。人工智能芯片設(shè)計實驗室的主要產(chǎn)品之一是基于ARC人工智能參考設(shè)計平臺的新思科技系統(tǒng)級解決方案,涵蓋了架構(gòu)設(shè)計、虛擬原型、系統(tǒng)驗證等。該設(shè)計平臺旨在幫助降低進入人工智能領(lǐng)域的門檻,縮短設(shè)計周期。
將芯片開發(fā)時間縮短一年以上
基于其獨特的特性,DLRM可能難以用通用的AI加速器來加速。Neuchips開發(fā)的RecAccel-N3000具有定制的硬件IP,可以加速Embedding、矩陣乘法和特征交互。Neuchips與新思科技合作,實現(xiàn)了由ARC AI參考設(shè)計平臺支持的早期硬件/軟件協(xié)同開發(fā),為芯片開發(fā)節(jié)省了一年多的時間。
借助該設(shè)計平臺,Neuchips團隊能夠在早期開發(fā)和驗證RecAccel-N3000特定領(lǐng)域人工智能加速器的PCIe 5.0子系統(tǒng)和LPDDR5子系統(tǒng),然后將其集成到整個芯片中。新思科技的云端ZeBu Server 4硬件加速系統(tǒng)用于驗證這些子系統(tǒng)以及整個RecAccel-N3000。
RecAccel-N3000采用了新思科技的一系列IP模塊,包括:
ARC HS48處理器
ARC EV72處理器
用于AMBA、LPDDR5和PCIe的接口IP
具有高級電源管理功能的內(nèi)存編譯器
硬件安全模塊,具有信任根,為數(shù)據(jù)中心的IT設(shè)備提供安全保障,確保啟動代碼的完整性和設(shè)備認證
使用經(jīng)驗證的新思科技IP幫助Neuchips團隊降低了集成風險,大幅縮短了設(shè)計周期。新思科技的應(yīng)用開發(fā)者還支持Neuchips優(yōu)化其基于云的芯片設(shè)計代碼、配置IP,并在基于FPGA的ZeBu Server 4系統(tǒng)上進行仿真和驗證,這將整個ASIC RTL仿真的時間從兩周縮短到了20分鐘左右。
助力RecAccel-N3000開發(fā)過程的其他設(shè)計和驗證工具包括 Design Compiler RTL綜合解決方案、VCS功能驗證解決方案、SpyGlass靜態(tài)和形式化驗證平臺、Verdi自動調(diào)試系統(tǒng)、Formality等效性檢查、PrimeTime靜態(tài)時序分析工具、PrimePower RTL to signoff功率分析工具以及IC Compiler II布局布線解決方案。
推薦系統(tǒng)在數(shù)智化世界中的應(yīng)用逐漸廣泛且日益精準, RecAccel-N3000的出現(xiàn)恰逢其時。通過加速數(shù)據(jù)中心的推薦,這一高性能、高能效、可擴展的人工智能平臺有望幫助各行各業(yè)實現(xiàn)個性化的用戶體驗。通過與新思科技、工研院以及臺灣半導(dǎo)體領(lǐng)域的其他公司的密切合作,Neuchips Inc.已經(jīng)實現(xiàn)了快速上市的目標,在提供有影響力的人工智能解決方案的競爭中取得了先機。
-
芯片
+關(guān)注
關(guān)注
455文章
50725瀏覽量
423173 -
人工智能
+關(guān)注
關(guān)注
1791文章
47202瀏覽量
238271 -
新思科技
+關(guān)注
關(guān)注
5文章
796瀏覽量
50334
發(fā)布評論請先 登錄
相關(guān)推薦
評論