色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內不再提示

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫，用于優化從 PC 到云端的 NVIDIA GPU 上運行的大語言模型推理。

Phi-3 Mini 與 10 倍之于其大小的模型能力不相上下。不同于僅用于研究的 Phi-2，Phi-3 Mini 不僅可以用于研究，同時還可以用于多種商業用途。搭載 NVIDIA RTX GPU 的工作站或搭載 GeForce RTX GPU 的 PC 可以使用 Windows DirectML 或 TensorRT-LLM 在本地運行該模型。

該模型有 38 億個參數，在 512 個 NVIDIA Tensor Core GPU 上使用 3.3 萬億個 token 訓練而成，僅耗時七天時間。

Phi-3 Mini 有兩個版本，一個版本支持 4K token，另一個版本支持 128K token，是同類模型中第一個支持超長上下文的模型。因此，開發者在向該模型提問時，可以使用 128,000 個 token（模型能夠處理的最小語言單位），使模型能夠做出更加符合現實的回答。

開發者可以在 ai.nvidia.com上試用帶有 128K 上下文窗口的 Phi-3 Mini。該模型被打包成 NVIDIA NIM，這是一項帶有標準應用編程接口的微服務，可以部署在任何位置。

在邊緣高效運行

自主機器人和嵌入式設備開發者可以通過社區教程（如 Jetson AI Lab）學習創建和部署生成式 AI，并在 NVIDIA Jetson 上部署 Phi-3。

Phi-3 Mini 模型只有 38 億個參數，非常小巧緊湊，可以在邊緣設備上高效運行。參數就像內存中的旋鈕，可在模型訓練過程中進行精確的調整，使模型能夠對輸入的提示做出高度準確的響應。

Phi-3 可以在成本和資源受限的用例中提供幫助，尤其是較簡單的任務。該模型在關鍵語言基準測試中的表現優于一些較大的模型，同時在滿足延遲要求的情況下給出結果。

TensorRT-LLM 將支持 Phi-3 Mini 的長上下文窗口，并使用 LongRoPE、FP8/飛行批處理等眾多優化措施和內核來提高推理吞吐量，減少延遲。TensorRT-LLM 的應用很快將在 GitHub 上的示例文件夾中提供。

開發者可以轉換為 TensorRT-LLM 檢查點格式，該格式針對推理進行了優化，可以輕松地與 NVIDIA Triton 推理服務器一起部署。

開發開放式系統

NVIDIA 是開源生態系統的積極貢獻者，已經發布了 500 多個帶有開源許可證的項目。

NVIDIA 為 JAX、Kubernetes、OpenUSD、PyTorch 和 Linux 內核等眾多外部項目做出了貢獻，還為各種開源基金會和標準機構提供支持。

此次發布建立在 NVIDIA 與微軟深厚的合作基礎上，雙方的合作為加速 DirectML、Azure 云、生成式 AI 研究以及醫療和生命科學等領域的創新鋪平了道路。

審核編輯：劉清

阅读全文

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

機器人

機器人

+關注

關注
212

文章
29029

瀏覽量
210108
NVIDIA

NVIDIA

+關注

關注
14

文章
5160

瀏覽量
104871
嵌入式設備

嵌入式設備

+關注

關注
0

文章
114

瀏覽量
17234
GPU芯片

GPU芯片

+關注

關注
1

文章
304

瀏覽量
6018
大模型

大模型

+關注

關注
2

文章
2845

瀏覽量
3497

原文標題：小巧而強大：NVIDIA 加速微軟 Phi-3 開源“小語言模型”

文章出處：【微信號：NVIDIA-Enterprise，微信公眾號：NVIDIA英偉達企業解決方案】歡迎添加關注！文章轉載請注明出處。

NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發

NVIDIA Isaac GR00T N1開源人形機器人基礎模型+開源物理引擎Newton加速機器人開發

發表于 03-20 16:56 ?319次閱讀

英偉達GTC25亮點：NVIDIA Dynamo開源庫加速并擴展AI推理模型

DeepSeek-R1 上的吞吐量提高了 30 倍 NVIDIA 發布了開源推理軟件 NVIDIA Dynamo，旨在以高效率、低成本加速并擴展 AI 工廠中的 AI 推理

發表于 03-20 15:03 ?405次閱讀

NVIDIA推出開放式Llama Nemotron系列模型

作為 NVIDIA NIM 微服務，開放式 Llama Nemotron 大語言模型和 Cosmos Nemotron 視覺語言模型可在任何

發表于 01-09 11:11 ?425次閱讀

使用NVIDIA TensorRT提升Llama 3.2性能

Llama 3.2 模型集擴展了 Meta Llama 開源模型集的模型陣容，包含視覺語言模型（

發表于 11-20 09:59 ?484次閱讀

NVIDIA NIM助力企業高效部署生成式AI模型

Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM，將允許用戶通過 API 調用來大規模地部署大語言模型。

發表于 10-10 09:49 ?544次閱讀

在英特爾酷睿Ultra7處理器上優化和部署Phi-3-min模型

2024年4月23日，微軟研究院公布Phi-3系列AI大模型，包含三個版本：mini(3.8B參數)、small(7B參數)以及medium(14B參數)。

發表于 08-30 16:58 ?952次閱讀

在英特爾酷睿Ultra7處理器上優化和部署<b class='flag-5'>Phi-3</b>-min<b class='flag-5'>模型</b>

如何加速大語言模型推理

的主要挑戰。本文將從多個維度深入探討如何加速大語言模型的推理過程，以期為相關領域的研究者和開發者提供參考。

發表于 07-04 17:32 ?796次閱讀

微軟發布PhI-3-Vision模型，提升視覺AI效率

Phi-3-vision 是一種小型多模式語言模型（SLM），主要適用于本地人工智能場景。其模型參數高達 42 億，上下文序列包含 128k 個符號，可滿足各種視覺推理和其他任務需求。

發表于 05-28 11:35 ?610次閱讀

英特爾聯手微軟，推動移動設備低功耗計算及AI解決方案

據報道，微軟于4月至5月間相繼推出了多款Phi-3小型語言模型（SLM），這些模型以其“輕便易攜且能在移動設備中運行”以及強大的視覺處理能力

發表于 05-27 15:59 ?435次閱讀

微軟發布視覺型AI新模型：Phi-3-vision

　據悉，Phi-3-vision 作為微軟 Phi-3 家族的首款多模態模型，繼承自 Phi-3-mini 的文本理解能力，兼具輕巧便攜特性

發表于 05-27 15:56 ?636次閱讀

英特爾優化AI產品組合，助力微軟Phi-3家族模型

近日，英特爾宣布針對微軟的Phi-3家族開放模型，成功驗證并優化了其跨客戶端、邊緣及數據中心的AI產品組合。這一重要舉措旨在提供更為靈活和高效的AI解決方案。

發表于 05-27 11:47 ?791次閱讀

英特爾與微軟合作在其AI PC及邊緣解決方案中支持多種Phi-3模型

近日，英特爾針對微軟的多個Phi-3家族的開放模型，驗證并優化了其跨客戶端、邊緣和數據中心的AI產品組合。

發表于 05-27 11:15 ?706次閱讀

NVIDIA與Google DeepMind合作推動大語言模型創新

支持 NVIDIA NIM 推理微服務的谷歌最新開源模型 PaliGemma 首次亮相。

發表于 05-16 09:44 ?574次閱讀

微軟發布phi-3AI模型，性能超越GPT-3.5

微軟稱，帶有38億參數的phi-3-mini經過3.3萬億token的強化學習，其基礎表現已經超過Mixtral 8x7B及GPT-3.5；此外，該模型可在手機等移動設備上運行，并在phi

發表于 04-23 14:32 ?654次閱讀

NVIDIA全面加快Meta Llama 3的推理速度

Meta 最新開源大語言模型采用 NVIDIA 技術構建，其經過優化后可在云、數據中心、邊緣和 PC 的 NVIDIA GPU 上運行。

發表于 04-23 09:52 ?606次閱讀

NVIDIA英偉達企業解決方案
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot NVIDIA將深度學習引入計算機圖形領域以推動行業發展
Hot 一文講述Quadro RTX 5000帶來的性能提升

New NVIDIA攜手合作伙伴成立開放電力AI聯盟
New NVIDIA Blackwell推動流式傳輸和數據分析的未來發展

发布文章

精選推薦
更多

文章

資料

帖子

部署成本顯著降低！英特爾助陣高效AI算力一體機方案

章鷹觀察
14小時前

246 閱讀

零知開源——ESP32語音交互系統（AI小智）開發教程

PCB56242069
15小時前

290 閱讀

2EP1XXR系列全橋變壓器驅動器工作原理（一）——如何通過占空比調節峰值整流應用下的輸出電壓

英飛凌工業半導體
1天前

376 閱讀

從DeepSeek到Qwen，AI大模型的移植與交互實戰指南-飛凌嵌入式

飛凌嵌入式
1天前

447 閱讀

芯擎科技發布史上最全座艙和智駕解決方案，開啟“大生態”模式

章鷹觀察
1天前

301 閱讀

多層板工程設計及RFQ培訓講義

tobehonest
2.43 MB

免費

0下載

談談伺服電機三環控制系統調節方法

Hx
580KB

免費

112下載

ATV61變頻器編程手冊完整版pdf下載

ah此生不換
3.66 MB

1積分

0下載

Project Reunion統一和發展Windows開發者平臺

張超
30.25 MB

2積分

1下載

JNIKeyProtection私密數據存儲

bigbangboom
0.14 MB

免費

0下載

《電子發燒友電子設計周報》聚焦硬科技領域核心價值第5期：2025.03.24--2025.03.28

電子人steve
2天前

684 閱讀

飛凌嵌入式ElfBoard ELF 1板卡-Linux系統中的中斷之按鍵中斷驅動

jf_13411809
2天前

845 閱讀

AG32軟件包SDK更新：加入新例程（可實現至少15個UART串口）

AGMsemi
2天前

729 閱讀

一文看懂RF領域中的駐波比和回波損耗

jf_74262234
2天前

721 閱讀

【米爾-全志T536開發板試用體驗】總結與建議

jinyi7016
3天前

1385 閱讀

推薦專欄
更多