色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-04-28 10:36 ? 次閱讀

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫,用于優化從 PC 到云端的 NVIDIA GPU 上運行的大語言模型推理。

Phi-3 Mini 與 10 倍之于其大小的模型能力不相上下。不同于僅用于研究的 Phi-2,Phi-3 Mini 不僅可以用于研究,同時還可以用于多種商業用途。搭載 NVIDIA RTX GPU 的工作站或搭載 GeForce RTX GPU 的 PC 可以使用 Windows DirectML 或 TensorRT-LLM 在本地運行該模型。

該模型有 38 億個參數,在 512 個 NVIDIA Tensor Core GPU 上使用 3.3 萬億個 token 訓練而成,僅耗時七天時間。

Phi-3 Mini 有兩個版本,一個版本支持 4K token,另一個版本支持 128K token,是同類模型中第一個支持超長上下文的模型。因此,開發者在向該模型提問時,可以使用 128,000 個 token(模型能夠處理的最小語言單位),使模型能夠做出更加符合現實的回答。

開發者可以在 ai.nvidia.com上試用帶有 128K 上下文窗口的 Phi-3 Mini。該模型被打包成 NVIDIA NIM,這是一項帶有標準應用編程接口的微服務,可以部署在任何位置。

在邊緣高效運行

自主機器人和嵌入式設備開發者可以通過社區教程(如 Jetson AI Lab)學習創建和部署生成式 AI,并在 NVIDIA Jetson 上部署 Phi-3。

Phi-3 Mini 模型只有 38 億個參數,非常小巧緊湊,可以在邊緣設備上高效運行。參數就像內存中的旋鈕,可在模型訓練過程中進行精確的調整,使模型能夠對輸入的提示做出高度準確的響應。

Phi-3 可以在成本和資源受限的用例中提供幫助,尤其是較簡單的任務。該模型在關鍵語言基準測試中的表現優于一些較大的模型,同時在滿足延遲要求的情況下給出結果。

TensorRT-LLM 將支持 Phi-3 Mini 的長上下文窗口,并使用 LongRoPE、FP8/飛行批處理等眾多優化措施和內核來提高推理吞吐量,減少延遲。TensorRT-LLM 的應用很快將在 GitHub 上的示例文件夾中提供。

開發者可以轉換為 TensorRT-LLM 檢查點格式,該格式針對推理進行了優化,可以輕松地與 NVIDIA Triton 推理服務器一起部署。

開發開放式系統

NVIDIA 是開源生態系統的積極貢獻者,已經發布了 500 多個帶有開源許可證的項目。

NVIDIA 為 JAX、Kubernetes、OpenUSD、PyTorch 和 Linux 內核等眾多外部項目做出了貢獻,還為各種開源基金會和標準機構提供支持。

此次發布建立在 NVIDIA 與微軟深厚的合作基礎上,雙方的合作為加速 DirectML、Azure 云、生成式 AI 研究以及醫療和生命科學等領域的創新鋪平了道路。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    212

    文章

    29029

    瀏覽量

    210108
  • NVIDIA
    +關注

    關注

    14

    文章

    5160

    瀏覽量

    104871
  • 嵌入式設備
    +關注

    關注

    0

    文章

    114

    瀏覽量

    17234
  • GPU芯片
    +關注

    關注

    1

    文章

    304

    瀏覽量

    6018
  • 大模型
    +關注

    關注

    2

    文章

    2845

    瀏覽量

    3497

原文標題:小巧而強大:NVIDIA 加速微軟 Phi-3 開源“小語言模型”

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發

    NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發
    的頭像 發表于 03-20 16:56 ?319次閱讀

    英偉達GTC25亮點:NVIDIA Dynamo開源加速并擴展AI推理模型

    DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發布了開源推理軟件 NVIDIA Dynamo,旨在以高效率、低成本加速并擴展 AI 工廠中的 AI 推理
    的頭像 發表于 03-20 15:03 ?405次閱讀

    NVIDIA推出開放式Llama Nemotron系列模型

    作為 NVIDIA NIM 微服務,開放式 Llama Nemotron 大語言模型和 Cosmos Nemotron 視覺語言模型可在任何
    的頭像 發表于 01-09 11:11 ?425次閱讀

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集擴展了 Meta Llama 開源模型集的模型陣容,包含視覺語言模型
    的頭像 發表于 11-20 09:59 ?484次閱讀

    NVIDIA NIM助力企業高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM,將允許用戶通過 API 調用來大規模地部署大語言模型
    的頭像 發表于 10-10 09:49 ?544次閱讀

    在英特爾酷睿Ultra7處理器上優化和部署Phi-3-min模型

    2024年4月23日,微軟研究院公布Phi-3系列AI大模型,包含三個版本:mini(3.8B參數)、small(7B參數)以及medium(14B參數)。
    的頭像 發表于 08-30 16:58 ?952次閱讀
    在英特爾酷睿Ultra7處理器上優化和部署<b class='flag-5'>Phi-3</b>-min<b class='flag-5'>模型</b>

    如何加速語言模型推理

    的主要挑戰。本文將從多個維度深入探討如何加速語言模型的推理過程,以期為相關領域的研究者和開發者提供參考。
    的頭像 發表于 07-04 17:32 ?796次閱讀

    微軟發布PhI-3-Vision模型,提升視覺AI效率

    Phi-3-vision 是一種小型多模式語言模型(SLM),主要適用于本地人工智能場景。其模型參數高達 42 億,上下文序列包含 128k 個符號,可滿足各種視覺推理和其他任務需求。
    的頭像 發表于 05-28 11:35 ?610次閱讀

    英特爾聯手微軟,推動移動設備低功耗計算及AI解決方案

    據報道,微軟于4月至5月間相繼推出了多款Phi-3小型語言模型(SLM),這些模型以其“輕便易攜且能在移動設備中運行”以及強大的視覺處理能力
    的頭像 發表于 05-27 15:59 ?435次閱讀

    微軟發布視覺型AI新模型Phi-3-vision

     據悉,Phi-3-vision 作為微軟 Phi-3 家族的首款多模態模型,繼承自 Phi-3-mini 的文本理解能力,兼具輕巧便攜特性
    的頭像 發表于 05-27 15:56 ?636次閱讀

    英特爾優化AI產品組合,助力微軟Phi-3家族模型

    近日,英特爾宣布針對微軟Phi-3家族開放模型,成功驗證并優化了其跨客戶端、邊緣及數據中心的AI產品組合。這一重要舉措旨在提供更為靈活和高效的AI解決方案。
    的頭像 發表于 05-27 11:47 ?791次閱讀

    英特爾與微軟合作在其AI PC及邊緣解決方案中支持多種Phi-3模型

    近日,英特爾針對微軟的多個Phi-3家族的開放模型,驗證并優化了其跨客戶端、邊緣和數據中心的AI產品組合。
    的頭像 發表于 05-27 11:15 ?706次閱讀

    NVIDIA與Google DeepMind合作推動大語言模型創新

    支持 NVIDIA NIM 推理微服務的谷歌最新開源模型 PaliGemma 首次亮相。
    的頭像 發表于 05-16 09:44 ?574次閱讀

    微軟發布phi-3AI模型,性能超越GPT-3.5

    微軟稱,帶有38億參數的phi-3-mini經過3.3萬億token的強化學習,其基礎表現已經超過Mixtral 8x7B及GPT-3.5;此外,該模型可在手機等移動設備上運行,并在phi
    的頭像 發表于 04-23 14:32 ?654次閱讀

    NVIDIA全面加快Meta Llama 3的推理速度

    Meta 最新開源語言模型采用 NVIDIA 技術構建,其經過優化后可在云、數據中心、邊緣和 PC 的 NVIDIA GPU 上運行。
    的頭像 發表于 04-23 09:52 ?606次閱讀
    主站蜘蛛池模板: 邪恶肉肉全彩色无遮琉璃神社 | 嫩草影院精品视频在线观看 | 成人在无码AV在线观看一 | 免费国产黄线在线播放 | 精品夜夜澡人妻无码AV | 麻豆无人区乱码 | 永久免费在线看mv | 青娱国产区在线 | 乌克兰粉嫩摘花第一次 | 国产欧美日韩中文视频在线 | a亚洲在线观看不卡高清 | 一区三区在线专区在线 | 国产三级在线观看免费 | 国产精品久久久久a影院 | YELLOW高清在线观看2019 | 秋霞伦理机在线看片 | 日韩一区二区三区射精 | 欧美成人免费一区二区三区不卡 | 一道精品视频一区二区 | 亚洲第一成年网站视频 | 国产中文在线观看 | 国产精品一区二区三区免费 | 国产精品免费观看视频 | 让男人玩尿道的女人 | 亚洲 欧美 国产 综合不卡 | 午夜射精日本三级 | 一个人免费完整观看日本 | 欲香欲色天天影视大全 | 日韩毛片在线视频 | 久久这里只有精品视频9 | 入禽太深免费视频10 | 国产精品第一综合首页 | 健身房被教练啪到腿软H | 国产精品亚洲精品久久国语 | 精品一区二区三区色花堂 | 久青草国产观看在线视频 | 国产午夜一区二区三区免费视频 | 熟女少妇内射日韩亚洲 | 精品无人区麻豆乱码1区2 | 久见久热 这里只有精品 | 亚洲日本激情 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品