色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Neuchips展示大模型推理ASIC芯片

SSDFans ? 來源:SSDFans ? 2025-01-06 17:30 ? 次閱讀

領先的AI專用集成電路ASIC)解決方案提供商Neuchips在CES 2024上展示了其革命性的Raptor Gen AI加速芯片(以前稱為N3000)和Evo PCIe加速卡LLM解決方案。新的芯片解決方案Raptor使企業能夠以現有解決方案的一小部分成本部署大型語言模型(LLM)推理。

NeuchipsCEO Ken Lau表示:“我們很高興在CES 2024上向業界展示我們的Raptor芯片和Evo卡。Neuchips的解決方案代表了自然語言處理在性價比上的巨大飛躍。有了Neuchips,任何組織都可以在廣泛的AI應用中從LLM中獲得力量。”

LLM民主化

Raptor和Evo共同提供了一個優化的堆棧,使企業可以輕松訪問市場領先的LLM。與現有解決方案相比,Neuchips的AI解決方案顯著降低了硬件成本。高能效也最大限度地減少了用電量,進一步降低了總擁有成本。

在CES 2024上,Neuchips展示了Raptor和Evo,在個人AI助理應用程序上加速Whisper和LlamaAI聊天機器人。該解決方案突出了LLM推理對實際業務需求的強大功能。

其他技術會議將展示Raptor和Evo如何削減語音到文本應用程序的部署成本。

Raptor GenAI加速器為突破LLM性能提供動力

Raptor每個芯片的運算速度高達每秒200TOPS。它在AI推理操作(如矩陣乘法、向量和嵌入表查找)方面的出色性能適用于Gen-AI和基于變壓器的AI模型。這一突破性的吞吐量是通過Neuchips為神經網絡量身定制的專利壓縮和效率優化來實現的。

Evo第5代PCIe卡為加速和低功耗設定新標準

與Raptor互補的是Neuchips的超低功耗Evo加速卡。Evo結合了8通道PCIe Gen 5和32GB LPDDR5,實現64 GB/s主機I/O帶寬和1.6 Tbps每秒的內存帶寬,每卡僅55瓦。

正如DLRM所展示的那樣,Evo還具有100%的可擴展性,允許客戶通過添加更多芯片來線性提高性能。這種模塊化設計確保了對未來AI工作負載的投資保護。

公司2024年下半年推出了HHHL(half-height half-length)外形產品Viper,提供更大的部署靈活性。新系列在緊湊的設計中帶來了數據中心級的AI加速。

原文鏈接:

https://www.techpowerup.com/317298/neuchips-to-showcase-industry-leading-gen-ai-inferencing-accelerators-at-ces-2024


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • ASIC芯片
    +關注

    關注

    2

    文章

    92

    瀏覽量

    23801
  • LLM
    LLM
    +關注

    關注

    0

    文章

    293

    瀏覽量

    351

原文標題:Neuchips展示大模型推理ASIC芯片!

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    智譜推出深度推理模型GLM-Zero預覽版

    近日,智譜公司正式發布了其深度推理模型GLM-Zero的預覽版——GLM-Zero-Preview。這款模型標志著智譜在擴展強化學習技術訓練推理模型方面的重大突破,成為其首個專注于增強AI推理
    的頭像 發表于 01-03 10:42 ?121次閱讀

    智譜GLM-Zero深度推理模型預覽版正式上線

    近日,智譜公司宣布其深度推理模型GLM-Zero的初代版本——GLM-Zero-Preview已正式上線。這款模型是智譜首個基于擴展強化學習技術訓練的推理模型,標志著智譜在AI推理領域
    的頭像 發表于 01-02 10:55 ?110次閱讀

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發表于 12-11 20:13 ?121次閱讀
    如何開啟Stable Diffusion WebUI<b class='flag-5'>模型</b><b class='flag-5'>推理</b>部署

    阿里云開源推理模型QwQ

    推理能力,尤其在數學和編程方面表現突出。其整體推理水平已經可以與OpenAI的o1模型相媲美,這充分展示了QwQ的強大實力和潛力。 QwQ(Qwen with Questions)是通
    的頭像 發表于 11-29 11:30 ?581次閱讀

    使用vLLM+OpenVINO加速大語言模型推理

    隨著大語言模型的廣泛應用,模型的計算需求大幅提升,帶來推理時延高、資源消耗大等挑戰。
    的頭像 發表于 11-15 14:20 ?442次閱讀
    使用vLLM+OpenVINO加速大語言<b class='flag-5'>模型</b><b class='flag-5'>推理</b>

    高效大模型推理綜述

    模型由于其在各種任務中的出色表現而引起了廣泛的關注。然而,大模型推理的大量計算和內存需求對其在資源受限場景的部署提出了挑戰。業內一直在努力開發旨在提高大模型
    的頭像 發表于 11-15 11:45 ?437次閱讀
    高效大<b class='flag-5'>模型</b>的<b class='flag-5'>推理</b>綜述

    FPGA和ASIC在大模型推理加速中的應用

    隨著現在AI的快速發展,使用FPGA和ASIC進行推理加速的研究也越來越多,從目前的市場來說,有些公司已經有了專門做推理ASIC,像Groq的LPU,專門針對大語言
    的頭像 發表于 10-29 14:12 ?523次閱讀
    FPGA和<b class='flag-5'>ASIC</b>在大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>加速中的應用

    澎峰科技高性能大模型推理引擎PerfXLM解析

    自ChatGPT問世以來,大模型遍地開花,承載大模型應用的高性能推理框架也不斷推出,大有百家爭鳴之勢。在這種情況下,澎峰科技作為全球領先的智能計算服務提供商,在2023年11月25日發布了針對大語言
    的頭像 發表于 09-29 10:14 ?499次閱讀
    澎峰科技高性能大<b class='flag-5'>模型</b><b class='flag-5'>推理</b>引擎PerfXLM解析

    OpenAI即將發布“草莓”推理模型

    科技界迎來新動態,據可靠消息透露,OpenAI正緊鑼密鼓地籌備著一項重大發布——預計在兩周內,將正式推出名為“草莓”的新型AI推理模型,并將其無縫融入ChatGPT服務中。這款以卓越推理能力為核心的大模型,旨在突破現有GPT-4
    的頭像 發表于 09-11 16:53 ?539次閱讀

    LLM大模型推理加速的關鍵技術

    LLM(大型語言模型)大模型推理加速是當前人工智能領域的一個研究熱點,旨在提高模型在處理復雜任務時的效率和響應速度。以下是對LLM大模型
    的頭像 發表于 07-24 11:38 ?915次閱讀

    如何加速大語言模型推理

    的主要挑戰。本文將從多個維度深入探討如何加速大語言模型推理過程,以期為相關領域的研究者和開發者提供參考。
    的頭像 發表于 07-04 17:32 ?561次閱讀

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    用于文本生成,根據提示或上下文生成連貫、富有創造性的文本,為故事創作等提供無限可能。大語言模型也面臨挑戰。一方面,其計算資源需求巨大,訓練和推理耗時;另一方面,模型高度依賴數據,需要大規模訓練數據才能
    發表于 05-04 23:55

    Groq LPU崛起,AI芯片主戰場從訓練轉向推理

    人工智能推理的重要性日益凸顯,高效運行端側大模型及AI軟件背后的核心技術正是推理。不久的未來,全球芯片制造商的主要市場將全面轉向人工智能推理
    的頭像 發表于 02-29 16:46 ?1197次閱讀

    Groq推出大模型推理芯片 超越了傳統GPU和谷歌TPU

    Groq推出了大模型推理芯片,以每秒500tokens的速度引起轟動,超越了傳統GPU和谷歌TPU。
    的頭像 發表于 02-26 10:24 ?1065次閱讀
    Groq推出大<b class='flag-5'>模型</b><b class='flag-5'>推理</b><b class='flag-5'>芯片</b> 超越了傳統GPU和谷歌TPU

    到底什么是ASIC和FPGA?

    神經網絡推理,能夠實現高效的卷積、池化等操作。一些手機芯片里,經常集成這玩意。 說到手機芯片,值得一提的是,我們手機現在的主芯片,也就是常說的SoC
    發表于 01-23 19:08
    主站蜘蛛池模板: 广播电台在线收听| 乌克兰黄色录像| CHINA末成年VIDEO学生| 手机毛片在线观看| 好紧好湿太硬了我太爽了小说 | 91亚洲精品| 亚洲黄色片免费看| 日韩a视频在线观看| 毛片免费观看的视频| 花蝴蝶免费观看影视| 风情韵味人妻HD| 99久久久无码国产AAA精品| 亚洲色爽视频在线观看| 双手绑在床头调教乳尖| 漂亮的保姆6在线观看中文| 浪潮色诱AV久久久久久久| 护士12p| 国产女人91精品嗷嗷嗷嗷| 成人天堂婷婷青青视频在线观看| 456亚洲人成在线播放网站| 夜夜国产亚洲视频香蕉| 亚洲国产在线99视频| 无人在线观看免费高清视频播放| 日本人添下面的全过程| 欧美囗交xx bbb视频| 免费国产久久拍久久爱| 老人FREE VIODES老少配| 久草在线一免费新视频| 国语精彩对白2021| 国精产品砖一区二区三区糖心| 国产欧美日韩综合精品一区二区| 国产成人一区免费观看| 日本毛片久久国产精品| 永久免费毛片| 精品一二三区久久AAA片| 无码日本亚洲一区久久精品 | 美妇教师双飞后菊| 香蕉久久日日躁夜夜嗓| 国产成人亚洲综合无| 乌克兰内射私拍| 国产永久免费视频|