摩爾線程與無問芯穹宣布完成基于GPU千卡集群的3B規(guī)模大模型實(shí)訓(xùn)

摩爾線程聯(lián)合無問芯穹宣布，雙方已在本周正式完成基于國產(chǎn)全功能GPU千卡集群的3B規(guī)模大模型實(shí)訓(xùn)。該模型名為“MT-infini-3B”，在摩爾線程夸娥（KUAE）千卡智算集群與無問芯穹AIStudio PaaS平臺上完成了高效穩(wěn)定的訓(xùn)練。

本次實(shí)訓(xùn)充分驗(yàn)證了夸娥千卡智算集群在大模型訓(xùn)練場景下的可靠性，同時也在行業(yè)內(nèi)率先開啟了國產(chǎn)大語言模型與國產(chǎn)GPU千卡智算集群深度合作的新范式。

MT-infini-3B模型訓(xùn)練總用時13.2天，經(jīng)過精度調(diào)試，實(shí)現(xiàn)全程穩(wěn)定訓(xùn)練不中斷，集群訓(xùn)練穩(wěn)定性達(dá)到100%，千卡訓(xùn)練和單機(jī)相比擴(kuò)展效率超過90%。目前，實(shí)訓(xùn)出來的MT-infini-3B性能在同規(guī)模模型中躋身前列，相比在國際主流硬件上訓(xùn)練而成的其他模型，在C-Eval，MMLU，CMMLU等3個測試集上均實(shí)現(xiàn)性能領(lǐng)先。

MT-infini-3B性能表現(xiàn)

無問芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪表示：“國內(nèi)大模型與國產(chǎn)芯片的軟硬件協(xié)同發(fā)展，最終目標(biāo)是構(gòu)建一個成熟的生態(tài)系統(tǒng)。無問芯穹正在打造‘M種模型’和‘N種芯片’間的‘M×N’中間層產(chǎn)品，實(shí)現(xiàn)多種大模型算法在多元芯片上的高效、統(tǒng)一部署。摩爾線程是第一家接入無問芯穹并進(jìn)行千卡級別大模型訓(xùn)練的國產(chǎn)GPU公司，而‘MT-infini-3B’的訓(xùn)練是行業(yè)內(nèi)首次實(shí)現(xiàn)基于國產(chǎn)GPU芯片從0到1的端到端大模型實(shí)訓(xùn)案例。”

摩爾線程創(chuàng)始人兼CEO張建中表示：“無問芯穹在夸娥千卡智算集群上實(shí)現(xiàn)的從零開始的大模型訓(xùn)練，不僅是對摩爾線程技術(shù)實(shí)力的有力認(rèn)證，更是實(shí)現(xiàn)了國內(nèi)大模型訓(xùn)練的國產(chǎn)化閉環(huán)。摩爾線程夸娥千卡智算集群以全功能GPU為底座，提供軟硬一體化的全棧解決方案，具備高兼容性、高穩(wěn)定性、高擴(kuò)展性等綜合優(yōu)勢，我們致力于成為AGI時代大模型訓(xùn)練堅(jiān)實(shí)可靠的先進(jìn)基礎(chǔ)設(shè)施。”

此前，摩爾線程與無問芯穹已達(dá)成深度戰(zhàn)略合作。無問芯穹大模型開發(fā)與服務(wù)平臺“無穹Infini-AI”和摩爾線程大模型智算千卡集群夸娥已完成系統(tǒng)級融合適配，該平臺可以靈活調(diào)用夸娥的集群能力以完成大模型的訓(xùn)練、微調(diào)與推理任務(wù)。未來，雙方還將開展更多適配與測試，推動國產(chǎn)大模型技術(shù)的快速發(fā)展與應(yīng)用普及，為中國人工智能產(chǎn)業(yè)的蓬勃發(fā)展貢獻(xiàn)力量。

審核編輯：劉清

阅读全文

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

GPU芯片

GPU芯片

+關(guān)注

關(guān)注
1

文章
305

瀏覽量
6174
摩爾線程

摩爾線程

+關(guān)注

關(guān)注
2

文章
233

瀏覽量
5302
大模型

大模型

+關(guān)注

關(guān)注
2

文章
3111

瀏覽量
4009

原文標(biāo)題：摩爾線程攜手無問芯穹：基于夸娥千卡智算集群的“MT-infini-3B”大模型實(shí)訓(xùn)已完成

文章出處：【微信號：moorethreads，微信公眾號：摩爾線程】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

摩爾線程
專欄

0 文章 0 閱讀 0 粉絲 0 點(diǎn)贊

關(guān)注個人主頁

Hot 摩爾線程MTT S系列GPU與愛特云V2.0完成適配
Hot 摩爾線程攜手RealLink共同完成UE5在國產(chǎn)顯卡上的首次適配

New 摩爾線程亮相2025全球數(shù)字經(jīng)濟(jì)大會
New 摩爾線程率先支持騰訊混元-A13B模型

发布文章

精選推薦
更多

文章

資料

帖子

一文詳解霍爾傳感器

深圳市鈞敏科技有限公司
18小時前

464 閱讀

三大開發(fā)環(huán)境下的Standby RAM變量配置教程

瑞薩MCU小百科
18小時前

518 閱讀

簡單認(rèn)識安森美AI數(shù)據(jù)中心電源解決方案

安森美
20小時前

585 閱讀

移植 ZephyrRTOS 到思澈 SF32LB58 過程筆記之二建立板級定義

KiCad
22小時前

312 閱讀

德州儀器方案 | 使用熱插拔控制器應(yīng)對48V AI服務(wù)器的保護(hù)挑戰(zhàn)

德州儀器
23小時前

630 閱讀

三極管代換手冊下載

xymbmcu
22528

10積分

9142下載

Cerbos云原生應(yīng)用訪問控制引擎

李秀珍
1.43 MB

2積分

2下載

webapp-vim網(wǎng)站服務(wù)器

HTSX
0.00 MB

免費(fèi)

0下載

Ymuse Go編寫的MPD客戶端

劉英
0.20 MB

免費(fèi)

0下載

ADI公司串行端口開發(fā)和故障排除指南

flewfjk
343.09KB

免費(fèi)

6下載

【Milk-V Duo S 開發(fā)板免費(fèi)體驗(yàn)】網(wǎng)絡(luò)連接、分區(qū)擴(kuò)展、外殼設(shè)計(jì)

jf_07365693
1天前

299 閱讀

【BPI-CanMV-K230D-Zero開發(fā)板體驗(yàn)】05 WIFI連接及RTSP視頻推流

jf_83922529
2天前

149 閱讀

【Sipeed MaixCAM Pro開發(fā)板試用體驗(yàn)】+ 01 + MaixCAM Pro開箱

jf_05814630
2天前

152 閱讀

【嘉楠堪智K230開發(fā)板試用體驗(yàn)】01 Studio K230開發(fā)板開箱評測

jf_35140750
4天前

140 閱讀

【沁恒CH585開發(fā)板免費(fèi)試用體驗(yàn)】+點(diǎn)陣板的顯示驅(qū)動

jinglixixi
2天前

731 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多