四虎影视色费永久在线观看,亚洲日韩国产有码,羞羞视频免费观

摩爾線程聯合潞晨科技研發的預訓練語言模型MusaBert（MUSA為摩爾線程提出的通用元計算架構），在12月16日的中文語言理解領域權威CLUE榜單上進入TOP 10，最終以82.889得分在CLUE1.1總排行榜中排名（除人類成績以外）第9，并在AFQMC任務中以86.92分取得排名第一的成績，這意味著摩爾線程AI在語義理解與匹配能力上超越了人類水平。同時，這也是潞晨科技的AI大模型開發系統Colossal-AI在自然語言處理領域應用的重要進展。

（2022年12月16日CLUE1.1總排行榜最新成績）

相較于CLUE總排行榜TOP 10的其他中文預訓練模型，MusaBert僅包含3億參數量，是前十名中規模最小的模型，并且為單模型（single model），沒有進行任何集成。此外，摩爾線程基于MusaBert的語義嵌入模型MusaSim在AFQMC任務上擊敗一眾大規模模型，取得第一名，不僅為檢索系統、分類對話等更深度語義理解研究打下堅固基石，也證明了摩爾線程在中文自然語言處理領域和低資源大模型訓練方面的強大能力。

一直以來，語義理解都是NLP（自然語言處理）技術的重要目標，通過一系列AI算法，可將文本解析為結構化的、機器可讀的意圖與詞槽信息。通常來說，訓練數據的獲取與處理、模型的迭代和訓練等都是NLP技術的落地難點。MusaBert僅使用了極少的參數量便取得了比肩甚至超越百億參數大模型的成績，主要是得益于多方面獲得的突破性進展：

▼技術層面：摩爾線程擁有“軟硬一體”的技術能力，使得MusaBert能夠從底到上進行優化；摩爾線程多功能GPU內置AI加速和并行計算等硬件模塊，能夠提供AI和科學計算在內的全棧功能，能夠為AI推理計算加速、低資源大模型訓練等應用場景提供通用、高性價比、節能環保的AI能力。

▼算法層面：MusaBert使用了潞晨科技的AI大模型開發系統Colossal-AI，在上游訓練方面，充分發揮了該系統的易用性及強大的并行訓練性能，同時MusaBert針對模型數據預處理使用的DataLoader進行了優化，可以在低資源的條件下快速處理大規模數據；在下游任務方面，摩爾線程通過采用合適的優化建模、在領域內進行數據增強以及在模型的訓練優化中采用了先進的Adan優化器等方式，盡可能發掘和展現出預訓練語言模型強大的語義理解能力。摩爾線程自研的語義嵌入模型MusaSim以MusaBert為基座模型，使用對比學習方法進行精調，并利用了摩爾線程收集的百萬對有監督數據。得益于MusaBert和高質量的數據集，MusaSim不僅在語義相似度任務上超越了眾多更大規模的模型，在意圖識別、情緒分析等分類任務上，也能得到較好的效果。

▼數據層面：MusaBert除使用了摩爾線程自身收集的高質量語義相似數據以外，還使用了200GB悟道開源數據和80GB的CLUE社區數據，以及浪潮電子信息產業股份有限公司提供的1T高質量數據集。大規模高質量的數據使得模型在相對小的規模下仍然保持了較高的性能。

目前，MusaBert作為基座模型，已經應用于摩爾線程研發的智能客服與數字人等項目，并相繼在下游語義相似度、情緒識別、閱讀理解、聲韻識別等領域落地。

為了更進一步降低大模型開發和應用的門檻，MusaBert代碼現已開源到Colossal-AI倉庫(https://github.com/hpcaitech/ColossalAI/tree/main/examples/language/roberta)，使用該腳本，可在短時間內訓練出高質量的中文Bert模型。包括MusaBert和MusaSim在內的一系列高質量模型也將在近期開源以貢獻中文NLP社區。此外，經摩爾線程與潞晨科技的嚴格測試，僅通過摩爾線程多功能GPU單卡，即可進行MusaBert甚至是更大規模的GPT2的訓練，大大降低了預訓練成本，這也為雙方實現低資源大模型訓練的共同愿景，邁出了堅實一步。

作為中文語言理解領域最具權威性的測評基準之一，CLUE 涵蓋文本相似度、分類、自然語言推理、閱讀理解等眾多語義分析和理解類子任務，工業界和學術界紛紛用 CLUE 作為預訓練算法能力的驗證和衡量標準。此次進入CLUE榜單TOP 10，代表了摩爾線程與潞晨科技聯合研發團隊在中文預訓練研究領域已達到業內領先水平。

展望未來，摩爾線程還將與潞晨科技緊密合作，著手更適當規模的自然語言大模型研究，充分利用上游數據，產出能力更強的模型并且開源。同時，保持算法和系統兩個層面并行，持續優化大模型在摩爾線程多功能GPU上的訓練能力，尤其在單張消費級顯卡等低資源場景下的訓練能力，可以大大降低使用大模型訓練的門檻和成本，進一步促進AI民主化。

▼ 關于潞晨科技

潞晨科技是一家致力于“解放AI生產力”的全球性公司，核心產品面向大模型時代的通用深度學習系統 Colossal-AI，可實現高效快速部署AI大模型訓練和推理，降低AI大模型應用成本。自開源以來，Colossal-AI已經多次在GitHub熱榜位列世界第一，獲得GitHub Star約七千顆，并成功入選SC、AAAI、PPoPP等國際AI與HPC頂級會議的官方教程。相關解決方案已成功在自動駕駛、云計算、零售、醫藥、芯片等行業知名廠商落地應用、廣受好評。

▼ 關于摩爾線程

摩爾線程是一家以 GPU 芯片設計為主的集成電路高科技公司，專注于研發設計全功能 GPU 芯片及相關產品，能夠為中國科技生態合作伙伴提供強大的計算加速能力。公司成立于 2020年10月，致力于創新面向元計算應用的新一代 GPU，構建融合視覺計算、3D 圖形計算、科學計算及人工智能計算的綜合計算平臺，建立基于云原生 GPU計算的生態系統，助力驅動數字經濟發展。

審核編輯：李倩

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI算法

AI算法

+關注

關注
0

文章
252

瀏覽量
12308
自然語言處理

自然語言處理

+關注

關注
1

文章
619

瀏覽量
13603
摩爾線程

摩爾線程

+關注

關注
2

文章
200

瀏覽量
4620

原文標題：Colossal-AI助力，摩爾線程預訓練語言模型MusaBert榮登CLUE榜單TOP10

文章出處：【微信號：moorethreads，微信公眾號：摩爾線程】歡迎添加關注！文章轉載請注明出處。

云知聲榮登2024大模型企業TOP50榜單

近日，智領未來·向新而行—2024人工智能大模型產業大會在京召開，會上揭曉2024大模型企業TOP50榜單，云知聲榮登

發表于 11-29 17:52 ?546次閱讀

云知學院榮登2024中國企培業模式創新TOP10榜單

近日，第13屆國際培訓產品博覽會（簡稱“培博會”）在江蘇昆山舉行，展會期間公布2024培博會?培英獎評選結果，云知聲旗下人工智能教育培訓品牌——云知學院入選“2024中國企培業模式創新TOP10”榜單，商業價值獲行業認可。

發表于 11-21 14:12 ?284次閱讀

摩爾線程與羽人科技完成大語言模型訓練測試

（YuRen-7b）大語言模型的訓練測試。測試結果顯示，訓練效率達到預期，夸娥千卡智算集群展現出了高度的兼容性和穩定性，為羽人科技未來的零代碼訓練

發表于 08-27 16:19 ?567次閱讀

大語言模型的預訓練

能力，逐漸成為NLP領域的研究熱點。大語言模型的預訓練是這一技術發展的關鍵步驟，它通過在海量無標簽數據上進行訓練，使

發表于 07-11 10:11 ?491次閱讀

預訓練模型的基本原理和應用

預訓練模型（Pre-trained Model）是深度學習和機器學習領域中的一個重要概念，尤其是在自然語言處理（NLP）和計算機視覺（CV）等領域中得到了廣泛應用。

發表于 07-03 18:20 ?3039次閱讀

摩爾線程與智譜AI完成大模型性能測試與適配

近日，摩爾線程與智譜AI在人工智能領域開展了一輪深入的合作，共同對GPU大模型進行了適配及性能測試。此次測試不僅涵蓋了大模型的推理能力，還涉及了基于

發表于 06-14 16:40 ?1117次閱讀

摩爾線程與師者AI攜手完成70億參數教育AI大模型訓練測試

近日，國內知名的GPU制造商摩爾線程與全學科教育AI大模型“師者AI”聯合宣布，雙方已成功完成了一項重要的大模型訓練測試。此次測試依托

發表于 06-14 16:31 ?619次閱讀

摩爾線程和滴普科技完成大模型訓練與推理適配

近日，摩爾線程與滴普科技宣布了一項重要合作成果。摩爾線程的夸娥（KUAE）千卡智算集群與滴普科技的企業大模型Deepexi已完成

發表于 05-30 10:14 ?579次閱讀

摩爾線程千卡智算集群與滴普企業大模型已完成訓練及推理適配

近日，摩爾線程與國內領先的數據智能服務商滴普科技共同宣布，摩爾線程夸娥（KUAE）千卡智算集群與滴普企業大模型Deepexi已完成

發表于 05-29 10:28 ?496次閱讀

摩爾線程攜手憨猴集團，深化AI算力戰略合作，成功實現大模型分布式訓練

摩爾線程與憨猴科技集團日前宣布，采用搭載摩爾線程的夸娥（KUAE）千卡智算集群，已成功完成了多個大模型的分布式

發表于 05-17 17:24 ?712次閱讀

Nullmax榮登「中國人工智能與大數據產業最佳投資案例TOP10」榜單

5月10日，“投中榜·2023年度榜單”重磅揭曉。自動駕駛行業智變引領者Nullmax 憑借領先的技術實力、突出的量產表現及巨大的商業潛力，榮登「中國人工智能與大數據產業最佳投資案例 TOP

發表于 05-11 17:32 ?609次閱讀

【大語言模型：原理與工程實踐】大語言模型的預訓練

大語言模型的核心特點在于其龐大的參數量，這賦予了模型強大的學習容量，使其無需依賴微調即可適應各種下游任務，而更傾向于培養通用的處理能力。然而，隨著學習容量的增加，對預

發表于 05-07 17:10

【大語言模型：原理與工程實踐】大語言模型的基礎技術

全面剖析大語言模型的核心技術與基礎知識。首先，概述自然語言的基本表示，這是理解大語言模型技術的前提。接著，詳細介紹自然

發表于 05-05 12:17

摩爾線程助力AI大模型訓練與計算升級，共建美好數字化未來

此外，在中關村國際技術交易大會高精尖技術產品首發會上，摩爾線程與無問芯穹聯合宣布，雙方正致力于開發基于夸娥千卡智算集群的“MT-infini-3B”合作大模型。摩爾

發表于 04-28 16:42 ?1140次閱讀

中穎電子入選Fabless 100排行榜TOP10微控制器公司榜單

中穎電子入選 AspenCore 2024中國IC設計Fabless 100排行榜TOP10微控制器公司榜單

發表于 04-01 14:12 ?591次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

摩爾線程預訓練語言模型MusaBert榮登CLUE榜單TOP10

評論

云知聲榮登2024大模型企業TOP50榜單

云知學院榮登2024中國企培業模式創新TOP10榜單

摩爾線程與羽人科技完成大語言模型訓練測試

大語言模型的預訓練

預訓練模型的基本原理和應用

摩爾線程與智譜AI完成大模型性能測試與適配

摩爾線程與師者AI攜手完成70億參數教育AI大模型訓練測試

摩爾線程和滴普科技完成大模型訓練與推理適配

摩爾線程千卡智算集群與滴普企業大模型已完成訓練及推理適配

摩爾線程攜手憨猴集團，深化AI算力戰略合作，成功實現大模型分布式訓練

Nullmax榮登「中國人工智能與大數據產業最佳投資案例TOP10」榜單

【大語言模型：原理與工程實踐】大語言模型的預訓練

【大語言模型：原理與工程實踐】大語言模型的基礎技術

摩爾線程助力AI大模型訓練與計算升級，共建美好數字化未來

中穎電子入選Fabless 100排行榜TOP10微控制器公司榜單