隨著各類大模型和深度神經網絡涌現,如何制造出滿足人工智能發展、兼具大算力和高能效的下一代AI芯片,已成為國際前沿熱點。中國科協發布的2023重大科學問題中“如何實現低能耗人工智能”被排在首位。
2023年10月25日,清華大學團隊在超高性能計算芯片領域取得新突破。相關成果以“All-analog photo-electronic chip for high-speed vision tasks”為題發表在Nature上。這枚芯片基于純模擬光電融合計算架構,在包括ImageNet等智能視覺任務實測中,相同準確率下,比現有高性能GPU算力提升3000倍,能效提升400萬倍。
圖1 相關論文(來源Nature)
未來已來?光為載體的計算芯片
實現算力飛躍并非易事,特別是當前傳統的芯片架構,受限于電子晶體管大小逼近物理極限。全新計算架構成為破局的關鍵。光計算以其超高的并行度和速度,被認為是未來顛覆性計算架構的最有力競爭方案之一。光計算,顧名思義是將計算載體從電變為光,利用光在芯片中的傳播進行計算。面對以光速計算的誘人前景,數年來海內外知名科研團隊相繼提出多種設計,但要替代現有電子器件實現系統級應用,仍面臨重大瓶頸:一是如何在一枚芯片上集成大規模的計算單元(可控神經元),且約束誤差累計程度;二是實現高速高效的片上非線性;三是為兼容目前以電子信號為主體的信息社會,如何提供光計算與電子信號計算的高效接口。當前常見的模數轉換功耗,較光計算每步乘加運算高出多個數量級,掩蓋了光計算本身的性能優勢,導致光芯片難以在實際應用中體現出優越性。
系統級算力和能效,超現有芯片萬倍
為解決這一國際難題,清華大學團隊創造性地提出了模擬電融合模擬光的計算框架,構建可見光下的大規模多層衍射神經網絡實現視覺特征提取,利用光電流直接進行基于基爾霍夫定律的純模擬電子計算,兩者集成在同一枚芯片框架內,完成了“傳感前 傳感中 近傳感”的新型計算系統。極大地降低了對于高精度ADC的需求,消除傳統計算機視覺處理范式在模數轉換過程中速度、精度與功耗相互制約的物理瓶頸,在一枚芯片上突破大規模集成、高效非線性、高速光電接口三個關鍵瓶頸。
圖2. 光電計算芯片ACCEL的計算原理和芯片架構(來源Nature)
實測表現下,ACCEL芯片的系統級算力達到現有高性能芯片的數千倍。同時系統級能效達74.8 Peta-OPS/W,較現有的高性能GPU、TPU、光計算和模擬電計算架構,提升了兩千到數百萬倍。
在超低功耗下運行的ACCEL將有助于大幅度改善發熱問題,對于芯片的未來設計帶來全方位突破,并為超高速物理觀測提供算力基礎。同時對無人系統、自動駕駛等續航能力要求高的場景帶來重大利好。
表1. ACCEL和現有高性能芯片的系統級實測性能指標對比 (來源:Nature)非相干光直接計算
更進一步,ACCEL芯片還支持非相干光視覺場景的直接計算,如論文中演示的交通場景實驗。顯著拓展了ACCEL的應用領域,有望顛覆目前自動駕駛、機器人視覺、移動設備等領域先將圖片拍攝并保存在內存中后進行計算的思路,避免傳輸和ADC帶寬限制,在傳感過程中完成計算。
圖3. ACCEL可用于電子設備超低功耗人臉喚醒示意動圖(來源:清華大學)
開辟新路徑:顛覆性架構有望真正落地
清華攻關團隊提出的新型計算架構不僅對于光計算技術的應用部署意義重大,對未來其他高效能計算技術與當前電子信息系統的融合,亦深有啟發。
論文通訊作者之一,清華大學戴瓊海院士介紹道,“采用全新原理研發出計算系統是一座大山,而將新一代計算架構真正落地到現實生活,解決國計民生的重大需求,是攀過高峰后更重要的攻關。”Nature雜志特邀在Research Briefing發表的該研究專題評述也指出,“或許這項工作的出現,會讓新一代計算架構,比預想中早得多地進入日常生活(ACCEL might enable these architectures to play a part in our daily life much sooner than expected.)”。
清華大學戴瓊海院士、方璐副教授、喬飛副研究員、吳嘉敏助理教授為本文的共同通訊作者;博士生陳一彤、博士生麥麥提·那扎買提、許晗博士為共同一作;孟瑤博士、周天貺助理研究員、博士生李廣普、范靜濤研究員、魏琦副研究員共同參與了這項研究。
-
晶體管
+關注
關注
77文章
9683瀏覽量
138085 -
人工智能
+關注
關注
1791文章
47206瀏覽量
238272 -
智能視覺
+關注
關注
0文章
100瀏覽量
9205
原文標題:清華開發出超高性能計算芯片:速度比高端GPU提升3000倍,能效提升400萬倍!
文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論