AI初創企業推MoE混合專家模型架構新品abab 6.5

4 月 17 日，國內人工智能初創公司 MiniMax 稀宇科技宣布推出采用混合專家模型架構的 losoev 6.5 系列模型，其核心性能已接近 GPT-4、Claude-3 和 Gemini-1.5。

losoev 6.5 系列包含兩款模型：

losoev 6.5：擁有萬億級別的參數，可處理 200k tokens 的上下文長度；

losoev 6.5s：與 losoev 6.5 共享相同的訓練技術和數據，但效率更高，同樣支持 200k tokens 的上下文長度，且能夠在 1 秒鐘內處理近 3 萬字的文本。

自今年 1 月份推出國內首款基于 MoE 架構的 losoev 6 模型以來，MiniMax 通過優化模型架構、重建數據管道、改進訓練算法以及實施并行訓練策略等手段，在加速模型擴展方面取得了顯著進展。

在 200k token 的范圍內，官方對 losoev 6.5 進行了業內常見的“大海撈針”測試，即將一句與原文無關的句子插入長文本中，然后通過自然語言詢問模型，觀察其能否準確識別出這句話。經過 891 次測試，losoev 6.5 均能準確回答問題。

losoev 6.5 和 losoev 6.5s 模型將逐步應用于 MiniMax 旗下的產品，如海螺 AI 和 MiniMax 開放平臺。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

算法

算法

+關注

關注
23

文章
4607

瀏覽量
92840
人工智能

人工智能

+關注

關注
1791

文章
47183

瀏覽量
238266
模型

模型

+關注

關注
1

文章
3226

瀏覽量
48809

獵戶星空發布Orion-MoE 8×7B大模型及AI數據寶AirDS

。 Orion-MoE 8×7B是獵戶星空精心打造的開源混合架構專家大模型，該模型擁有高達8×7

發表于 11-29 13:57 ?210次閱讀

騰訊發布開源MoE大語言模型Hunyuan-Large

近日，騰訊公司宣布成功推出業界領先的開源MoE(Mixture of Experts，專家混合)大語言模型——Hunyuan-Large。這款模型

發表于 11-06 10:57 ?298次閱讀

浪潮信息發布“源2.0-M32”開源大模型

浪潮信息近日推出了革命性的“源2.0-M32”開源大模型。該模型在源2.0系列基礎上，引入了“基于注意力機制的門控網絡”技術，構建了一個包含32個專家的混合

發表于 05-29 09:08 ?639次閱讀

騰訊云大模型價格調整：混元-lite、混元-standard免費，混元-pro降價

據了解，騰訊混元大模型是騰訊全鏈路自研的萬億參數大模型，采用混合專家模型（MoE）結構，

發表于 05-23 17:05 ?860次閱讀

人大系初創公司智子引擎發布全新多模態大模型Awaker 1.0

人大系初創公司智子引擎近日震撼發布了新一代多模態大模型Awaker 1.0，這一里程碑式的成果標志著公司在通用人工智能（AGI）領域取得了重要突破。與前代ChatImg序列模型相比，Awaker 1.0憑借其獨特的

發表于 05-06 09:59 ?597次閱讀

MOE與MOT：提升LLM效能的關鍵策略比較

MoE 與 MoT：在專家混合中（左），每個令牌都被路由到不同的專家前饋層。在令牌混合（右）中，每組內的令牌被

發表于 04-15 09:53 ?872次閱讀

AI初創企業Suno發布首款音樂AI生成模型SunoV3

美國人工智能初創企業Suno近日震撼發布其首款音樂AI生成模型——SunoV3。這款創新產品已正式登陸其官方網站，并向所有用戶免費開放使用，標志著音樂創作領域邁入了全新的智能化時代。

發表于 03-26 09:17 ?1107次閱讀

英特爾與Arm聯手助力初創企業開發Arm架構SoC

據介紹，此次合作旨在聯合推動使用Intel 18A制程工藝研發Arm架構SoC的初創企業發展。英特爾和Arm將攜手提供IP和制造及相關金融支持，助力初創

發表于 03-25 15:34 ?401次閱讀

微軟支付6.5億美元獲得Inflection AI的AI模型授權

微軟近日宣布向人工智能初創公司Inflection AI支付高達6.5億美元的巨額資金，這一舉動在業內引起了廣泛關注。據悉，這筆資金主要用于獲得Inflection AI的

發表于 03-25 10:39 ?502次閱讀

蘋果發布300億參數MM1多模態大模型

近日，科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中，正式公布了其最新的多模態大模型研究成果——MM1。這款具有高達300億參數的多模態模型系列，由密集模型和

發表于 03-19 11:19 ?891次閱讀

微軟攜手法國AI初創企業Mistral推動AI模型商業化

微軟近日與法國人工智能初創企業Mistral達成合作協議，旨在推動AI模型的商業化應用。據悉，微軟將提供全方位支持，幫助這家成立僅10個月的公司將其先進的

發表于 02-28 10:23 ?530次閱讀

昆侖萬維發布新版MoE大語言模型天工2.0

昆侖萬維科技今日震撼發布全新升級的「天工2.0」MoE大語言模型以及配套的新版「天工AI智能助手」APP。此次更新標志著國內首個搭載MoE架構

發表于 02-06 16:19 ?1264次閱讀

幻方量化發布了國內首個開源MoE大模型—DeepSeekMoE

幻方量化旗下組織深度求索發布了國內首個開源 MoE 大模型 —— DeepSeekMoE，全新架構，免費商用。

發表于 01-23 11:28 ?1514次閱讀

對標OpenAI GPT-4，MiniMax國內首個MoE大語言模型全量上線

MoE 架構全稱專家混合（Mixture-of-Experts），是一種集成方法，其中整個問題被分為多個子任務，并將針對每個子任務訓練一組專家

發表于 01-16 15:34 ?893次閱讀

混合專家模型 (MoE)核心組件和訓練方法介紹

隨著 Mixtral 8x7B (announcement, model card) 的推出，一種稱為混合專家模型 (Mixed Expert Models，簡稱 MoEs

發表于 01-13 09:37 ?1238次閱讀

微云疏影
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 對比各家主流MCU指標，國產MCU真的品質不佳？
Hot 模擬信號和數字信號的區別和特點

New 方正電機成為小鵬汽車驅動電機供應商，總需求量預計達35萬臺
New 雷諾-吉利動力總成合資企業HORSE在倫敦成立

精選推薦
更多

文章

資料

帖子

折疊屏2024的新東西、好東西、舊東西

腦極體
1天前

661 閱讀

艾為車規氛圍燈驅動芯片AW23003QNR-Q1解析已過AEC-Q100認證

艾為之家
1天前

623 閱讀

使用Keithley源表進行DC-DC電源管理芯片效率測試

泰克科技
2天前

882 閱讀

Mate70首銷兩周超越前代！字節掀AI價格戰！本周熱點科技新聞點評

章鷹觀察
2天前

839 閱讀

基于英特爾開發板開發ROS應用

英特爾物聯網
2天前

464 閱讀

無線電傳播原理技術資料

感謝相遇
1.04 MB

10積分

163下載

RS糾錯編碼分析與實現

echomybj
196 KB

免費

0下載

MSP430CC1100-2500官方示例源代碼12

0.02 MB

免費

14下載

設計的帶嵌入式收發器的Gen1×1硬核IP的 PCI Express IP編譯器

siyugege
6.32MB

2積分

9下載

Heartleech OpenSSL私鑰提取工具

成爾秩
2.91 MB

免費

0下載

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】+小白折騰瑞薩RA系列全過程02

jf_80431208
1天前

205 閱讀

【敏矽微ME32G070開發板免費體驗】新建工程（MDK）

吉吉祥
2天前

383 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】按鍵點燈：使用輪詢方式和中斷方式實現

jf_64583430
2天前

330 閱讀

淺談加密芯片的一種破解方法和對應加密方案改進設計

jf_38636298
3天前

1159 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】4、Amazon FreeRTOS初探，第一個程序

lustao
3天前

2248 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

AI初創企業推MoE混合專家模型架構新品abab 6.5

評論

獵戶星空發布Orion-MoE 8×7B大模型及AI數據寶AirDS

騰訊發布開源MoE大語言模型Hunyuan-Large

浪潮信息發布“源2.0-M32”開源大模型

騰訊云大模型價格調整：混元-lite、混元-standard免費，混元-pro降價

人大系初創公司智子引擎發布全新多模態大模型Awaker 1.0

MOE與MOT：提升LLM效能的關鍵策略比較

AI初創企業Suno發布首款音樂AI生成模型SunoV3

英特爾與Arm聯手助力初創企業開發Arm架構SoC

微軟支付6.5億美元獲得Inflection AI的AI模型授權

蘋果發布300億參數MM1多模態大模型

微軟攜手法國AI初創企業Mistral推動AI模型商業化

昆侖萬維發布新版MoE大語言模型天工2.0

幻方量化發布了國內首個開源MoE大模型—DeepSeekMoE

對標OpenAI GPT-4，MiniMax國內首個MoE大語言模型全量上線

混合專家模型 (MoE)核心組件和訓練方法介紹