騰訊發布開源MoE大語言模型Hunyuan-Large

近日，騰訊公司宣布成功推出業界領先的開源MoE(Mixture of Experts，專家混合)大語言模型——Hunyuan-Large。這款模型不僅在參數量上刷新了業界紀錄，更在效果上展現出了卓越的性能，標志著騰訊在自然語言處理領域邁出了重要的一步。

據了解，Hunyuan-Large的總參數量高達389B(即3890億)，這一數字遠超當前許多主流的大語言模型。而其激活參數也達到了驚人的52B(即520億)，這意味著模型在處理復雜任務時能夠展現出更強的學習能力和泛化性能。

除了參數量上的優勢，Hunyuan-Large在訓練數據上也下足了功夫。據悉，該模型訓練時所使用的token數量達到了7T(即7萬億)，這確保了模型能夠充分學習到語言的多樣性和復雜性。同時，Hunyuan-Large還支持最大上下文長度為256K的文本輸入，這一特性使得模型在處理長文本或對話場景時能夠更準確地捕捉上下文信息，從而生成更加連貫和自然的回復。

騰訊此次推出的Hunyuan-Large大語言模型，不僅展示了其在人工智能領域的深厚技術積累，也為整個自然語言處理領域的發展注入了新的活力。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

人工智能

人工智能

+關注

關注
1791

文章
47183

瀏覽量
238260
騰訊

騰訊

+關注

關注
7

文章
1652

瀏覽量
49423
語言模型

語言模型

+關注

關注
0

文章
520

瀏覽量
10268
自然語言

自然語言

+關注

關注
1

文章
287

瀏覽量
13346

大語言模型開發語言是什么

在人工智能領域，大語言模型（Large Language Models, LLMs）背后，離不開高效的開發語言和工具的支持。下面，AI部落小編為您介紹大

發表于 12-04 11:44 ?95次閱讀

獵戶星空發布Orion-MoE 8×7B大模型及AI數據寶AirDS

近日，獵戶星空攜手聚云科技在北京共同舉辦了一場發布會。會上，獵戶星空正式揭曉了其自主研發的Orion-MoE 8×7B大模型，并與聚云科技聯合推出了基于該大模型的數據服務——AI數據寶

發表于 11-29 13:57 ?208次閱讀

騰訊混元Large模型及云TI平臺全新上線

近日，騰訊混元團隊最新推出的MoE模型“混元Large”已正式開源上線。這一里程碑式的進展標志著騰訊

發表于 11-08 11:03 ?408次閱讀

昆侖萬維開源2千億稀疏大模型Skywork-MoE

近日，昆侖萬維公司宣布開源一款名為Skywork-MoE的稀疏大模型，該模型擁有高達2千億參數，不僅性能強勁，而且推理成本更低，為人工智能領域帶來了新的突破。

發表于 06-04 14:44 ?576次閱讀

浪潮信息發布“源2.0-M32”開源大模型

浪潮信息近日推出了革命性的“源2.0-M32”開源大模型。該模型在源2.0系列基礎上，引入了“基于注意力機制的門控網絡”技術，構建了一個包含32個專家的混合專家模型（

發表于 05-29 09:08 ?639次閱讀

騰訊云大模型價格調整：混元-lite、混元-standard免費，混元-pro降價

據了解，騰訊混元大模型是騰訊全鏈路自研的萬億參數大模型，采用混合專家模型（MoE）結構，

發表于 05-23 17:05 ?858次閱讀

Mistral Large模型現已在Amazon Bedrock上正式可用

的 Mistral 7B 和 Mixtral 8x7B模型。今天，Mistral AI最新且最前沿的大語言模型（LLM）Mistral Large又在Amazon Bedrock上正式

發表于 04-08 16:26 ?553次閱讀

Mistral發布Mistral Large旗艦模型，但沒有開源

昨夜，被稱為“法國版 OpenAI”的 Mistral AI 再放大招，正式發布 Mistral Large 旗艦模型，并且推出對標 ChatGPT 的對話產品：Le Chat，直接殺到 OpenAI 家門口。

發表于 02-27 13:34 ?761次閱讀

昆侖萬維發布新版MoE大語言模型天工2.0

昆侖萬維科技今日震撼發布全新升級的「天工2.0」MoE大語言模型以及配套的新版「天工AI智能助手」APP。此次更新標志著國內首個搭載MoE架

發表于 02-06 16:19 ?1264次閱讀

大模型開源開放評測體系司南正式發布

近日，大模型開源開放評測體系司南（OpenCompass2.0）正式發布，旨在為大語言模型、多模態模型

發表于 02-05 11:28 ?1048次閱讀

Meta發布CodeLlama70B開源大模型

Meta發布CodeLlama70B開源大模型 Meta發布了開源大模型CodeLlama70B

發表于 01-31 10:30 ?1412次閱讀

幻方量化發布了國內首個開源MoE大模型—DeepSeekMoE

幻方量化旗下組織深度求索發布了國內首個開源 MoE 大模型 —— DeepSeekMoE，全新架構，免費商用。

發表于 01-23 11:28 ?1514次閱讀

機器人基于開源的多模態語言視覺大模型

ByteDance Research 基于開源的多模態語言視覺大模型 OpenFlamingo 開發了開源、易用的 RoboFlamingo 機器人操作

發表于 01-19 11:43 ?408次閱讀

對標OpenAI GPT-4，MiniMax國內首個MoE大語言模型全量上線

MoE 架構全稱專家混合（Mixture-of-Experts），是一種集成方法，其中整個問題被分為多個子任務，并將針對每個子任務訓練一組專家。MoE 模型將覆蓋不同學習者（專家）的不同輸入數據。

發表于 01-16 15:34 ?893次閱讀

大語言模型推斷中的批處理效應

隨著開源預訓練大型語言模型（Large Language Model, LLM ）變得更加強大和開放，越來越多的開發者將大語言

發表于 01-04 12:32 ?628次閱讀

科技綠洲
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot javascript的成熟分類
Hot java和javaweb和javascript的區別

New 使用CAN總線進行數據采集的方法
New CAN總線與其他通信協議對比

精選推薦
更多

文章

資料

帖子

折疊屏2024的新東西、好東西、舊東西

腦極體
1天前

567 閱讀

艾為車規氛圍燈驅動芯片AW23003QNR-Q1解析已過AEC-Q100認證

艾為之家
1天前

575 閱讀

使用Keithley源表進行DC-DC電源管理芯片效率測試

泰克科技
2天前

823 閱讀

Mate70首銷兩周超越前代！字節掀AI價格戰！本周熱點科技新聞點評

章鷹觀察
2天前

789 閱讀

基于英特爾開發板開發ROS應用

英特爾物聯網
2天前

443 閱讀

MSP430F169中對Flash的信息段A整段進行讀寫操作

0.00 MB

免費

19下載

openharmony三方組件適配移植的錄音機功能實現

姚小熊27
1.00 MB

免費

4下載

uiw-iconfont開源圖標字體

goodmbby
2.25 MB

2積分

1下載

DGS framework Netflix開發的GraphQL服務器框架

張旭
1.30 MB

2積分

3下載

Sequel Pro MacOS MySQL/MariaDB數據庫管理工具

石飛鵬
8.86 MB

2積分

1下載

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】+小白折騰瑞薩RA系列全過程02

jf_80431208
1天前

158 閱讀

【敏矽微ME32G070開發板免費體驗】新建工程（MDK）

吉吉祥
2天前

336 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】按鍵點燈：使用輪詢方式和中斷方式實現

jf_64583430
2天前

293 閱讀

淺談加密芯片的一種破解方法和對應加密方案改進設計

jf_38636298
3天前

1068 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】4、Amazon FreeRTOS初探，第一個程序

lustao
3天前

2118 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

騰訊發布開源MoE大語言模型Hunyuan-Large

評論

大語言模型開發語言是什么

獵戶星空發布Orion-MoE 8×7B大模型及AI數據寶AirDS

騰訊混元Large模型及云TI平臺全新上線

昆侖萬維開源2千億稀疏大模型Skywork-MoE

浪潮信息發布“源2.0-M32”開源大模型

騰訊云大模型價格調整：混元-lite、混元-standard免費，混元-pro降價

Mistral Large模型現已在Amazon Bedrock上正式可用

Mistral發布Mistral Large旗艦模型，但沒有開源

昆侖萬維發布新版MoE大語言模型天工2.0

大模型開源開放評測體系司南正式發布

Meta發布CodeLlama70B開源大模型

幻方量化發布了國內首個開源MoE大模型—DeepSeekMoE

機器人基于開源的多模態語言視覺大模型

對標OpenAI GPT-4，MiniMax國內首個MoE大語言模型全量上線

大語言模型推斷中的批處理效應