近日,摩爾線程與北京智源人工智能研究院(簡稱:智源研究院)已順利完成基于Triton語言的高性能算子庫FlagGems的適配工作。得益于摩爾線程自研統(tǒng)一系統(tǒng)計算架構(gòu)MUSA,雙方在短短一周多的時間里,即成功完成了近60個算子的功能驗證,精度符合交付標(biāo)準(zhǔn),并實現(xiàn)對Bert-large模型的全面支持。FlagGems算子庫在摩爾線程MUSA架構(gòu)上展現(xiàn)出了接近手寫算子的計算性能,且性能還在持續(xù)調(diào)優(yōu),極大加速了開源大模型在摩爾線程全功能GPU上的部署速度。
智源研究院在今年的智源大會上推出了FlagGems算子庫,這是一個使用Triton編程語言實現(xiàn)的高性能通用算子庫,旨在為大語言模型提供一系列可應(yīng)用于PyTorch框架的算子,加速模型的推理與訓(xùn)練,降低新算法的開發(fā)門檻,促進芯片架構(gòu)的創(chuàng)新。FlagGems算子庫以Triton編程語言的易用性和編譯器的標(biāo)準(zhǔn)接口為基礎(chǔ),為多元芯片提供了一套易適配、高性能的算子解決方案,推動基于Triton的統(tǒng)一、開源的軟硬件生態(tài)建設(shè)。
在適配過程中,摩爾線程與智源研究院團隊緊密合作,共同克服了一系列技術(shù)挑戰(zhàn),確保FlagGems算子庫在摩爾線程全功能GPU上的高效穩(wěn)定運行。摩爾線程研發(fā)團隊經(jīng)過充分調(diào)研論證,還形成了Triton編譯器在MUSA架構(gòu)上適配的完整方案,力求實現(xiàn)開發(fā)者在基于摩爾線程全功能GPU進行Triton開發(fā)算子過程中,也能獲得與原來一致的體驗,做到CUDA框架和MUSA框架的無縫遷移。
此次合作不僅充分展示了摩爾線程全功能GPU強大的兼容性、靈活性與擴展性,也為開發(fā)者和用戶帶來了更廣泛的選擇和更高效的開發(fā)體驗。摩爾線程和智源研究院將繼續(xù)深化合作,共同促進AI技術(shù)的發(fā)展和應(yīng)用,為中國大模型的發(fā)展貢獻力量。
關(guān)于智源研究院
北京智源人工智能研究院(簡稱:智源研究院)是北京市于2018年11月推動成立的新型研發(fā)機構(gòu)。智源研究院的核心目標(biāo)是聚焦人工智能原始創(chuàng)新和核心技術(shù),推動人工智能理論、方法、工具、系統(tǒng)和應(yīng)用取得變革性、顛覆性突破,支撐北京建設(shè)成為全球人工智能學(xué)術(shù)思想、基礎(chǔ)理論、頂尖人才、企業(yè)創(chuàng)新和發(fā)展政策的源頭。
關(guān)于摩爾線程
摩爾線程成立于2020年10月,以全功能GPU為核心,致力于向全球提供加速計算的基礎(chǔ)設(shè)施和一站式解決方案,為各行各業(yè)的數(shù)智化轉(zhuǎn)型提供強大的AI計算支持。
我們的目標(biāo)是成為具備國際競爭力的GPU領(lǐng)軍企業(yè),為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進的加速計算平臺。我們的愿景是為美好世界加速。
-
開源
+關(guān)注
關(guān)注
3文章
3309瀏覽量
42471 -
摩爾線程
+關(guān)注
關(guān)注
2文章
200瀏覽量
4560 -
大模型
+關(guān)注
關(guān)注
2文章
2423瀏覽量
2640
原文標(biāo)題:摩爾線程 × 智源研究院|完成基于Triton的大模型算子庫適配
文章出處:【微信號:moorethreads,微信公眾號:摩爾線程】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論