摩爾線程攜手智源研究院完成基于Triton的大模型算子庫適配

近日，摩爾線程與北京智源人工智能研究院（簡稱：智源研究院）已順利完成基于Triton語言的高性能算子庫FlagGems的適配工作。得益于摩爾線程自研統一系統計算架構MUSA，雙方在短短一周多的時間里，即成功完成了近60個算子的功能驗證，精度符合交付標準，并實現對Bert-large模型的全面支持。FlagGems算子庫在摩爾線程MUSA架構上展現出了接近手寫算子的計算性能，且性能還在持續調優，極大加速了開源大模型在摩爾線程全功能GPU上的部署速度。

智源研究院在今年的智源大會上推出了FlagGems算子庫，這是一個使用Triton編程語言實現的高性能通用算子庫，旨在為大語言模型提供一系列可應用于PyTorch框架的算子，加速模型的推理與訓練，降低新算法的開發門檻，促進芯片架構的創新。FlagGems算子庫以Triton編程語言的易用性和編譯器的標準接口為基礎，為多元芯片提供了一套易適配、高性能的算子解決方案，推動基于Triton的統一、開源的軟硬件生態建設。

在適配過程中，摩爾線程與智源研究院團隊緊密合作，共同克服了一系列技術挑戰，確保FlagGems算子庫在摩爾線程全功能GPU上的高效穩定運行。摩爾線程研發團隊經過充分調研論證，還形成了Triton編譯器在MUSA架構上適配的完整方案，力求實現開發者在基于摩爾線程全功能GPU進行Triton開發算子過程中，也能獲得與原來一致的體驗，做到CUDA框架和MUSA框架的無縫遷移。

此次合作不僅充分展示了摩爾線程全功能GPU強大的兼容性、靈活性與擴展性，也為開發者和用戶帶來了更廣泛的選擇和更高效的開發體驗。摩爾線程和智源研究院將繼續深化合作，共同促進AI技術的發展和應用，為中國大模型的發展貢獻力量。

關于智源研究院

北京智源人工智能研究院（簡稱：智源研究院）是北京市于2018年11月推動成立的新型研發機構。智源研究院的核心目標是聚焦人工智能原始創新和核心技術，推動人工智能理論、方法、工具、系統和應用取得變革性、顛覆性突破，支撐北京建設成為全球人工智能學術思想、基礎理論、頂尖人才、企業創新和發展政策的源頭。

關于摩爾線程

摩爾線程成立于2020年10月，以全功能GPU為核心，致力于向全球提供加速計算的基礎設施和一站式解決方案，為各行各業的數智化轉型提供強大的AI計算支持。

我們的目標是成為具備國際競爭力的GPU領軍企業，為融合人工智能和數字孿生的數智世界打造先進的加速計算平臺。我們的愿景是為美好世界加速。

阅读全文

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

開源

開源

+關注

關注
3

文章
3618

瀏覽量
43504
摩爾線程

摩爾線程

+關注

關注
2

文章
230

瀏覽量
5135
大模型

大模型

+關注

關注
2

文章
3035

瀏覽量
3840

原文標題：摩爾線程 × 智源研究院｜完成基于Triton的大模型算子庫適配

文章出處：【微信號：moorethreads，微信公眾號：摩爾線程】歡迎添加關注！文章轉載請注明出處。

摩爾線程
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 摩爾線程MTT S系列GPU與愛特云V2.0完成適配
Hot 摩爾線程攜手RealLink共同完成UE5在國產顯卡上的首次適配

New 摩爾線程亮相2025北京智源大會
New 摩爾線程MTT X300顯卡全新性能升級

发布文章

精選推薦
更多

文章

資料

帖子

扎根業務，這個618商業智能體先跑起來

腦極體
9小時前

274 閱讀

關于樹莓派5 超頻：你需要知道的一切！

上海晶珩電子科技有限公司
9小時前

227 閱讀

視美泰AIoT-3568A四核智慧終端主板重磅升級Android 15.0，助力全球AIoT市場再進階！

視美泰
10小時前

300 閱讀

PCB材料測試解決方案

羅德與施瓦茨中國
12小時前

240 閱讀

電子系統對LDO穩壓器的要求

東芝半導體
15小時前

248 閱讀

基于點擊事件和彈出列表文本組件的向上滑動面板

姚小熊27
0.10 MB

免費

1下載

pyscmpd Raspberry Pi上的音樂播放器

康輔佑
0.26 MB

免費

0下載

TinyPart由objective-C編寫的iOS模塊化框架

劉超
0.84 MB

免費

0下載

Valet鑰匙鏈中存儲數據的iOS庫

陳霞
0.19 MB

免費

0下載

MSO1000Z/DS1000Z 系列數字示波器用戶手冊

DSHY2010
3.11 MB

10積分

1下載

【RA4L1-SENSOR】沒有人比我更懂CoreMaker RA4L1-SENSOR

jf_69121293
1天前

186 閱讀

【RA4L1-SENSOR】+ RA4L1-SENSOR開發板之使用RTC顯示實時時間并在段碼屏LCD上顯示時間年月日時分秒完美切換

jf_43382582
1天前

178 閱讀

labview在生成EXE報錯我的運動控制VI的庫不存在，需要怎么解決

志尊寶
1天前

285 閱讀

HarmonyOS NEXT應用開發-Notification Kit（用戶通知服務）notificationManager.setBadgeNumber10+

李洋水蛟龍
1天前

172 閱讀

11種簡易實用小型開關電源原理圖

yuu_cool
2天前

190 閱讀

推薦專欄
更多

企業產品

資料

方案
更多