一区二区三区在线播放,亚洲欧洲国产成人综合一本,四4虎在线

新一輪人工智能熱潮下，國內大模型群雄逐鹿，目前已有超過80個大模型公開測試。而相關數據顯示，ChatGPT自發布以來，全球訪問量環比增幅持續下降，6月首次出現環比下滑9.7%。泡沫退去，如何在大模型時代保持市場競爭力？

針對大模型場景，昆侖芯早已在產品定義上作出布局，相較第一代產品，昆侖芯2代AI 芯片可大幅優化算力、互聯和高性能，而在研的下一代產品則將提供更佳的性能體驗。

在近日落幕的XceedCon2023人工智能芯片生態大會上，昆侖芯大模型端到端解決方案正式發布，該解決方案隨即入選2023世界人工智能大會卓越人工智能引領者獎（Super AI Leader，簡稱SAIL獎）TOP30榜單。

昆侖芯副總裁王勇、昆侖芯互聯網行業總經理王志鵬先后在XceedCon2023人工智能芯片生態大會、2023世界人工智能大會對昆侖芯大模型端到端解決方案進行發布與推介。本篇以下內容整理自現場實錄。

軟硬協同、技術創新

打造高性能產品矩陣

集十余年AI加速領域研發積累，昆侖芯核心團隊于2017年在Hot Chips上發布自研、面向通用人工智能計算的芯片核心架構——昆侖芯XPU。目前，已有兩代昆侖芯AI芯片基于該架構實現量產和規模部署。

昆侖芯XPU專為密集型計算而設計，相比GPU可提供更多AI加速單元，同時支持C/C++、類CUDA語法編程，兼具高性能和可編程性，適配幾乎所有主流AI場景，滿足不同行業的大模型訓推需求。

大模型的演進必將伴隨參數量的增加，更加依賴于分布式訓練與推理能力。昆侖芯2代系列產品搭載新一代核心架構XPU-R，性能相較一代提升2-3倍，在分布式場景中優勢明顯。

01.

大顯存

昆侖芯2代產品擁有32GB顯存容量，在同價位產品中內存優勢突出。

02.

高互聯

昆侖芯通過領先技術，可實現單機八卡高速互聯，帶寬達到200GB/s；支持Direct RDMA，可實現跨機間低延時、高速通訊。

昆侖芯推出針對不同參數級別的大模型產品矩陣，兼具顯存和算力成本優勢。

昆侖芯AI加速卡R200-8F面向百億以內參數量級，相比同類型產品性能提升20%；

昆侖芯AI加速器組R480-X8面向百億至千億參數量級，性能達到同類型產品的1.3倍以上；

昆侖芯AI加速器組R480-X8集群針對千億以上參數量級，可實現多機多卡分布式推理。

昆侖芯大模型解決方案軟件棧

軟件生態層面，昆侖芯提供了針對大模型場景的專用加速庫、豐富的云原生插件，支持文心一言、LLaMA、Bloom、ChatGLM、GPT等行業主流大模型。

昆侖芯XFT（XPU Fast Transformer）推理加速庫，較原生框架小算子版本性能提升5倍以上。目前，XFT加速庫已與百度飛槳、PyTorch等主流深度學習框架完成適配；

昆侖芯云原生插件可幫助用戶快速完成和大模型平臺的適配；同時提供昆侖芯SDK，幫助用戶快速完成適配和實時自定義開發。

昆侖芯xHuggingface開源推理套件

此外，昆侖芯全面擁抱開源社區，積極攜手生態伙伴構建軟硬一體的AI芯片生態。

昆侖芯打造了xHuggingface開源推理套件，僅修改1-2行代碼，即可快速搭建基于XPU的智能客服APP。同時，昆侖芯與飛槳PaddlePaddle的AI Studio社區緊密合作，基于xHuggingface開源推理套件向廣大開發者提供更快、更強、更省的算力產品；

昆侖芯與飛槳深入協同適配行業主流大模型，可支持超大規模分布式訓練與推理。針對稠密大模型，昆侖芯支持飛槳的Sharding并行、數據并行、模型并行、流水線并行四種并行方式；針對稀疏大模型，昆侖芯與飛槳共同打造大規模參數服務器架構，實現了萬億參數的大模型訓練。

深入場景、真實歷練

打磨端到端解決方案

昆侖芯深入了解不同應用場景下客戶的真實需求，憑借軟硬協同技術與高性能產品矩陣，為千行百業提供開箱即用的產品和全棧式AI服務。

大語言模型場景

昆侖芯推理加速方案

目前，昆侖芯已與業界主流開源大模型完成適配，向客戶開放開源軟件庫，供客戶進行二次修改、微調，滿足不同推理場景下的個性化定制需求。

GPT百億參數大模型場景：昆侖芯產品的QPS相比主流165W產品提高30%以上，同時首字時延更低。

文心一格：目前已大規模應用昆侖芯產品，成本降低的同時，可實現2秒快速出圖。

昆侖芯訓練產品總覽

針對大語言模型訓練場景，昆侖芯也可提供一整套精調的訓練策略。目前，昆侖芯已適配pretrain、post-pretrain、SFT、LoRA等模型，可根據客戶的數據量與計算資源情況，靈活推薦不同的訓練模式。

能源行業：昆侖芯解決方案通過SFT訓練模式，客戶僅使用少量數據即可2天打造專屬行業大模型。

智源研究院：昆侖芯和智源研究院在大模型方面已有深入合作。昆侖芯已完成和Aquila大語言模型推理任務的適配、精度調試和性能優化，并實現大規模分布式推理上線，訓練任務適配優化中；同時也適配了智源eva視覺大模型，初步驗證了大規模分布式預訓練能力。

稀疏大模型推薦場景

稀疏大模型存在訓練門檻高、算力消耗大等技術挑戰。對于算法和模型持續高頻迭代的推薦場景，昆侖芯始終將“安全可信”、“從GPU零成本無縫遷移”作為目標，實現訓練與推理系統的緊密耦合，為客戶降本增效。目前，昆侖芯已與互聯網頭部客戶完成了訓練場景的端到端聯合開發，并在TB級以上稀疏大模型上完成了“替換主流GPU的全量上線”。

大模型的持續迭代加速了我國AI技術及AI產業的演進，利好政策的相繼出臺同時開啟了我國大模型商用浪潮。面向未來，昆侖芯將始終堅持軟硬協同創新，夯實AI領域綜合優勢，加速大模型產業落地，勇立大模型時代潮頭。

責任編輯：彭菁

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

gpu

gpu

+關注

關注
28

文章
4729

瀏覽量
128892
開源

開源

+關注

關注
3

文章
3316

瀏覽量
42473
昆侖芯科技

昆侖芯科技

+關注

關注
0

文章
27

瀏覽量
613

原文標題：來了！一文讀懂昆侖芯大模型端到端解決方案

文章出處：【微信號：昆侖芯科技，微信公眾號：昆侖芯科技】歡迎添加關注！文章轉載請注明出處。

阿里云開源推理大模型QwQ

近日，阿里云通義團隊宣布推出全新AI推理模型QwQ-32B-Preview，并同步實現了開源。這一舉措標志著阿里云在AI推理領域邁出了重要一步。據評測數據顯示，QwQ預覽版本已具備研究生水平的科學

發表于 11-29 11:30 ?538次閱讀

昆侖萬維推出“天工大模型4.0”o1版(Skywork o1)邀請測試

近日，昆侖萬維正式向外界推出了其最新研發的“天工大模型4.0”o1版(Skywork o1)。該系列模型以其獨特的復雜思考推理能力，吸引了眾多業內人士的關注。據悉，Skywork o1是昆侖萬維

發表于 11-28 10:33 ?263次閱讀

昆侖萬維天工大模型4.0 O1版即將邀測

昆侖萬維公司近日宣布，其自主研發的天工大模型4.0 O1版（英文名：Skywork O1）將于11月27日正式啟動邀請測試。這款模型是國內首款具備中文邏輯推理能力的o1模型，具有里程碑式的意義。

發表于 11-19 17:24 ?508次閱讀

李開復:中國擅長打造經濟實惠的AI推理引擎

10月22日上午，零一萬物公司的創始人兼首席執行官李開復在與外媒的交流中透露，其公司旗下的Yi-Lightning（閃電模型）在推理成本上已實現了顯著優勢，比OpenAI的GPT-4o模型低了31倍。他強調，中國擅長打造經濟實惠的AI推

發表于 10-22 16:54 ?354次閱讀

國產芯上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于芯馳D9國產商顯板

本篇測評由優秀測評者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板（米爾基于芯馳D9360國產開發板）的TinyMaxi輕量級的神經網絡推理庫方案測試。算力測試TinyMaix

發表于 08-09 18:26

國產芯上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于芯馳D9國產商顯板

本帖最后由 blingbling111 于 2024-8-8 09:23 編輯本篇測評由與非網的優秀測評者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板（米爾基于芯馳

發表于 08-07 18:06

迅為RK3568手冊上新 | RK3568開發板NPU例程測試

是幫助學習和開發用戶快速上手使用RKNPU。本手冊先介紹梳理瑞芯微開源NPU資料，然后著手搭建環境和工具的使用，最后以瑞芯微開源demo為例，體驗和使用RKNPU。更新內容●教程更新

發表于 07-12 14:44

國產芯上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于芯馳D9國產商顯板

本篇測評由與非網的優秀測評者“短笛君”提供。本文將介紹基于米爾電子MYD-YD9360商顯板（米爾基于芯馳D9360國產開發板）的TinyMaxi輕量級的神經網絡推理庫方案測試。算力測試

發表于 07-05 08:02 ?1867次閱讀

JH-7110 RISC-V開發套件正式開源

近日，賽昉科技在RVspace生態社區正式開源昉·驚鴻-7110（JH-7110）DevKit開發套件，同時提供其原理圖和PCB參考設計源文件，旨在為客戶提供全面的RISC-V芯片平臺

發表于 06-15 08:19 ?483次閱讀

昆侖萬維開源2千億稀疏大模型Skywork-MoE

近日，昆侖萬維公司宣布開源一款名為Skywork-MoE的稀疏大模型，該模型擁有高達2千億參數，不僅性能強勁，而且推理成本更低，為人工智能領域帶來了新的突破。

發表于 06-04 14:44 ?576次閱讀

AI推理框架軟件ONNX Runtime正式支持龍架構

近日，知名AI推理框架開源社區ONNX Runtime正式發布支持龍架構的版本1.17.0。

發表于 03-12 12:23 ?570次閱讀

上交所終止昆侖聯通主板上市審核

近日，上海證券交易所公開的信息顯示，北京昆侖聯通科技發展股份有限公司（以下簡稱“昆侖聯通”）及其保薦機構東方證券已經撤回了發行上市申請?；谶@一決定，上海證券交易所終止了對昆侖聯通發行上市的審核。

發表于 03-11 14:59 ?657次閱讀

昆侖聯通終止上交所主板IPO

上海證券交易所（上交所）近日宣布，已終止對北京昆侖聯通科技發展股份有限公司（以下簡稱“昆侖聯通”）首次公開發行股票并在主板上市的審核。這一決定意味著昆侖聯通的上市計劃暫時受挫。

發表于 03-05 13:55 ?647次閱讀

昆侖聯通主板IPO撤單

北京昆侖聯通科技發展股份有限公司（以下簡稱“昆侖聯通”），一家專業的IT基礎架構解決方案提供商，近日因其及保薦人主動撤回發行上市申請，上海證券交易所（上交所）決定終止其發行上市審核。

發表于 03-04 17:05 ?832次閱讀

昆侖聯通IPO申請被終止

北京昆侖聯通科技發展股份有限公司（簡稱“昆侖聯通”）的IPO申請已被終止，這是因為公司及其保薦人撤回了發行上市申請。

發表于 03-04 09:33 ?543次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

昆侖芯重磅打造xHuggingface開源推理套件

評論

阿里云開源推理大模型QwQ

昆侖萬維推出“天工大模型4.0”o1版(Skywork o1)邀請測試

昆侖萬維天工大模型4.0 O1版即將邀測

李開復:中國擅長打造經濟實惠的AI推理引擎

國產芯上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于芯馳D9國產商顯板

國產芯上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于芯馳D9國產商顯板

迅為RK3568手冊上新 | RK3568開發板NPU例程測試

國產芯上運行TinyMaxi輕量級的神經網絡推理庫-米爾基于芯馳D9國產商顯板

JH-7110 RISC-V開發套件正式開源

昆侖萬維開源2千億稀疏大模型Skywork-MoE

AI推理框架軟件ONNX Runtime正式支持龍架構

上交所終止昆侖聯通主板上市審核

昆侖聯通終止上交所主板IPO

昆侖聯通主板IPO撤單

昆侖聯通IPO申請被終止