色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

Neuchips展示大模型推理ASIC芯片

領先的AI專用集成電路（ASIC）解決方案提供商Neuchips在CES 2024上展示了其革命性的Raptor Gen AI加速芯片（以前稱為N3000）和Evo PCIe加速卡LLM解決方案。新的芯片解決方案Raptor使企業能夠以現有解決方案的一小部分成本部署大型語言模型（LLM）推理。

NeuchipsCEO Ken Lau表示：“我們很高興在CES 2024上向業界展示我們的Raptor芯片和Evo卡。Neuchips的解決方案代表了自然語言處理在性價比上的巨大飛躍。有了Neuchips，任何組織都可以在廣泛的AI應用中從LLM中獲得力量。”

LLM民主化

Raptor和Evo共同提供了一個優化的堆棧，使企業可以輕松訪問市場領先的LLM。與現有解決方案相比，Neuchips的AI解決方案顯著降低了硬件成本。高能效也最大限度地減少了用電量，進一步降低了總擁有成本。

在CES 2024上，Neuchips展示了Raptor和Evo，在個人AI助理應用程序上加速Whisper和LlamaAI聊天機器人。該解決方案突出了LLM推理對實際業務需求的強大功能。

其他技術會議將展示Raptor和Evo如何削減語音到文本應用程序的部署成本。

Raptor GenAI加速器為突破LLM性能提供動力

Raptor每個芯片的運算速度高達每秒200TOPS。它在AI推理操作（如矩陣乘法、向量和嵌入表查找）方面的出色性能適用于Gen-AI和基于變壓器的AI模型。這一突破性的吞吐量是通過Neuchips為神經網絡量身定制的專利壓縮和效率優化來實現的。

Evo第5代PCIe卡為加速和低功耗設定新標準

與Raptor互補的是Neuchips的超低功耗Evo加速卡。Evo結合了8通道PCIe Gen 5和32GB LPDDR5，實現64 GB/s主機I/O帶寬和1.6 Tbps每秒的內存帶寬，每卡僅55瓦。

正如DLRM所展示的那樣，Evo還具有100%的可擴展性，允許客戶通過添加更多芯片來線性提高性能。這種模塊化設計確保了對未來AI工作負載的投資保護。

該公司2024年下半年推出了HHHL(half-height half-length)外形產品Viper，提供更大的部署靈活性。新系列在緊湊的設計中帶來了數據中心級的AI加速。

原文鏈接：

https://www.techpowerup.com/317298/neuchips-to-showcase-industry-leading-gen-ai-inferencing-accelerators-at-ces-2024

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

ASIC芯片

ASIC芯片

+關注

關注
2

文章
92

瀏覽量
23801
LLM

LLM

+關注

關注
0

文章
293

瀏覽量
351

原文標題：Neuchips展示大模型推理ASIC芯片！

文章出處：【微信號：SSDFans，微信公眾號：SSDFans】歡迎添加關注！文章轉載請注明出處。

智譜推出深度推理模型GLM-Zero預覽版

近日，智譜公司正式發布了其深度推理模型GLM-Zero的預覽版——GLM-Zero-Preview。這款模型標志著智譜在擴展強化學習技術訓練推理模型方面的重大突破，成為其首個專注于增強AI推理

發表于 01-03 10:42 ?121次閱讀

智譜GLM-Zero深度推理模型預覽版正式上線

近日，智譜公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上線。這款模型是智譜首個基于擴展強化學習技術訓練的推理模型，標志著智譜在AI推理領域

發表于 01-02 10:55 ?110次閱讀

如何開啟Stable Diffusion WebUI模型推理部署

如何開啟Stable Diffusion WebUI模型推理部署

發表于 12-11 20:13 ?121次閱讀

阿里云開源推理大模型QwQ

推理能力，尤其在數學和編程方面表現突出。其整體推理水平已經可以與OpenAI的o1模型相媲美，這充分展示了QwQ的強大實力和潛力。 QwQ(Qwen with Questions)是通

發表于 11-29 11:30 ?581次閱讀

使用vLLM+OpenVINO加速大語言模型推理

隨著大語言模型的廣泛應用，模型的計算需求大幅提升，帶來推理時延高、資源消耗大等挑戰。

發表于 11-15 14:20 ?442次閱讀

高效大模型的推理綜述

大模型由于其在各種任務中的出色表現而引起了廣泛的關注。然而，大模型推理的大量計算和內存需求對其在資源受限場景的部署提出了挑戰。業內一直在努力開發旨在提高大模型

發表于 11-15 11:45 ?437次閱讀

FPGA和ASIC在大模型推理加速中的應用

隨著現在AI的快速發展，使用FPGA和ASIC進行推理加速的研究也越來越多，從目前的市場來說，有些公司已經有了專門做推理的ASIC，像Groq的LPU，專門針對大語言

發表于 10-29 14:12 ?523次閱讀

澎峰科技高性能大模型推理引擎PerfXLM解析

自ChatGPT問世以來，大模型遍地開花，承載大模型應用的高性能推理框架也不斷推出，大有百家爭鳴之勢。在這種情況下，澎峰科技作為全球領先的智能計算服務提供商，在2023年11月25日發布了針對大語言

發表于 09-29 10:14 ?499次閱讀

OpenAI即將發布“草莓”推理大模型

科技界迎來新動態，據可靠消息透露，OpenAI正緊鑼密鼓地籌備著一項重大發布——預計在兩周內，將正式推出名為“草莓”的新型AI推理模型，并將其無縫融入ChatGPT服務中。這款以卓越推理能力為核心的大模型，旨在突破現有GPT-4

發表于 09-11 16:53 ?539次閱讀

LLM大模型推理加速的關鍵技術

LLM（大型語言模型）大模型推理加速是當前人工智能領域的一個研究熱點，旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型

發表于 07-24 11:38 ?915次閱讀

如何加速大語言模型推理

的主要挑戰。本文將從多個維度深入探討如何加速大語言模型的推理過程，以期為相關領域的研究者和開發者提供參考。

發表于 07-04 17:32 ?561次閱讀

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

用于文本生成，根據提示或上下文生成連貫、富有創造性的文本，為故事創作等提供無限可能。大語言模型也面臨挑戰。一方面，其計算資源需求巨大，訓練和推理耗時；另一方面，模型高度依賴數據，需要大規模訓練數據才能

發表于 05-04 23:55

Groq LPU崛起，AI芯片主戰場從訓練轉向推理

人工智能推理的重要性日益凸顯，高效運行端側大模型及AI軟件背后的核心技術正是推理。不久的未來，全球芯片制造商的主要市場將全面轉向人工智能推理

發表于 02-29 16:46 ?1197次閱讀

Groq推出大模型推理芯片超越了傳統GPU和谷歌TPU

Groq推出了大模型推理芯片，以每秒500tokens的速度引起轟動，超越了傳統GPU和谷歌TPU。

發表于 02-26 10:24 ?1065次閱讀

到底什么是ASIC和FPGA？

神經網絡推理，能夠實現高效的卷積、池化等操作。一些手機芯片里，經常集成這玩意。說到手機芯片，值得一提的是，我們手機現在的主芯片，也就是常說的SoC

發表于 01-23 19:08

SSDFans
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 碎屏手機數據導出方案
Hot 什么是UFS？為什么說UFS是手機存儲的未來？

New 佰維存儲加入開放數據中心委員會ODCC:打造高效存力,賦能AI+時代
New Neuchips展示大模型推理ASIC芯片

精選推薦
更多

文章

資料

帖子

采用 LLC 拓撲結構設計隔離式柵極驅動器電源,低成本 LLC 轉換器的設計指南

eeDesigner
35分鐘前

57 閱讀

三菱電機超小型全SiC DIPIPM解析

三菱電機半導體
1小時前

90 閱讀

電源模塊輸入端需要加入 LC 濾波電路嗎

eeDesigner
2小時前

7 閱讀

使用AMD Vitis進行嵌入式設計開發用戶指南

Xilinx賽靈思官微
5小時前

201 閱讀

晶振在工業相機中的應用

揚興科技
19小時前

235 閱讀

電子產品設計經驗總結之PCB設計

h1654155206.9618
662

免費

0下載

實用的儀表用恒流源電路設計方案

lanlanw
191 KB

免費

430下載

CAT-Java加密與解密算法調用工具包

李斌
42.04 MB

2積分

2下載

temp-file-viewer臨時文件分享中轉站

好名字
0.53 MB

2積分

2下載

具有VBUS LDO穩壓器的TPS6612x集成灌電流TPS6612x數據表

糖栗子
1.53MB

免費

0下載

SMT貼片空焊異常

jf_61640453
14小時前

43 閱讀

HarmonyOS NEXT 原生應用開發：社交通訊發現界面實現

李洋水蛟龍
14小時前

40 閱讀

用于課題的無線轉速霍爾傳感器，新人應該從哪里開始學習

jf_48213409
14小時前

52 閱讀

labview怎樣實現成績圖錄入程序圖，還要顯示信息

jf_70720794
14小時前

196 閱讀

嵌入式學習-飛凌嵌入式ElfBoard ELF 1板卡-初識設備樹之設備樹組成和結構

jf_13411809
14小時前

185 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

Neuchips展示大模型推理ASIC芯片

評論

智譜推出深度推理模型GLM-Zero預覽版

智譜GLM-Zero深度推理模型預覽版正式上線

如何開啟Stable Diffusion WebUI模型推理部署

阿里云開源推理大模型QwQ

使用vLLM+OpenVINO加速大語言模型推理

高效大模型的推理綜述

FPGA和ASIC在大模型推理加速中的應用

澎峰科技高性能大模型推理引擎PerfXLM解析

OpenAI即將發布“草莓”推理大模型

LLM大模型推理加速的關鍵技術

如何加速大語言模型推理

【大語言模型：原理與工程實踐】揭開大語言模型的面紗

Groq LPU崛起，AI芯片主戰場從訓練轉向推理

Groq推出大模型推理芯片超越了傳統GPU和谷歌TPU

到底什么是ASIC和FPGA？