近日,2023中國算力大會在寧夏銀川舉行,沐曦集成電路(上海)有限公司(下稱“沐曦”)聯合創始人、CTO兼首席硬件架構師彭莉受邀出席由中國信息通信研究院、中國互聯網協會聯合舉辦的智能計算論壇,并擔任演講嘉賓,探討后GPT時代算力需求激增帶來的挑戰以及GPU如何突破算力供需瓶頸、推動人工智能產業普惠化發展。
在題為“后GPT時代的算力需求”的演講中,彭莉預測大模型商業模式將分為通用計算市場和專用定制化市場兩大類:在通用計算市場,大語言模型將終結多數NLP任務,NLP技術水平被強行拉平,通用大模型或被大廠“壟斷”;而在專用定制化市場,開源大模型將呈現百花齊放的發展態勢,可針對私有數據、敏感數據進行快速定制和領域對齊,大模型開發和部署能力將趨于普及化。
彭莉指出,區別于傳統AI,生成式AI技術可以借助接入類ChatGPT應用發揮顯著的技術優勢,為大語言模型的開發降本增效,同時也對算力提出更高和更迫切的要求。由于大模型訓練的一次性成本被大規模推理攤薄,大模型盈利的一大難點是降低推理成本。沐曦致力于打造高效通用的GPU芯片及軟硬件一體的生態解決方案,通過GPU軟件生態優勢、硬件架構優勢、先進封裝等方面全面提升GPU算力,降低大模型訓練和推理的算力成本,在產品路線和生態戰略上均可滿足大模型對算力基礎設施的大規模需求,為推進智能產業可持續發展打造堅實的算力底座。
關于沐曦
沐曦致力于為異構計算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產品,推出曦思N系列GPU用于AI推理,曦云C系列GPU用于千億參數AI大模型訓練及通用計算,以及曦彩G系列GPU用于圖形渲染,滿足數據中心對“高能效”及“高通用性”的算力需求。沐曦產品均采用完全自主研發的GPU IP,擁有完全自主的指令集和架構,配以兼容主流GPU生態的完整軟件棧(MXMACA),具備高能效和高通用性的天然優勢,能夠為客戶構建軟硬件一體的全面生態解決方案,是“雙碳”背景下推動數據中心建設和產業數字化、智能化轉
-
集成電路
+關注
關注
5388文章
11561瀏覽量
362006 -
gpu
+關注
關注
28文章
4743瀏覽量
128995 -
智能計算
+關注
關注
0文章
179瀏覽量
16494 -
沐曦
+關注
關注
0文章
26瀏覽量
1167
原文標題:沐曦彭莉:后GPT時代GPU如何降低算力門檻
文章出處:【微信號:沐曦MetaX,微信公眾號:沐曦MetaX】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論