Google Gemma優化后可在NVIDIA GPU上運行

借助 TensorRT-LLM，Google 全新開放語言模型可在 NVIDIA AI 平臺（包括本地 RTX AI PC）上加速運行。

2024 年 2 月 21 日，NVIDIA 攜手 Google 在所有 NVIDIA AI 平臺上發布面向 Gemma 的優化功能，Gemma 是 Google 最先進的新型輕量級 2B 和 7B 開放語言模型，可在任何地方運行，從而降低成本并加快特定領域用戶案例的創新工作。

NVIDIA 和 Google 的團隊緊密合作，利用 NVIDIA TensorRT-LLM（用于優化大語言模型推理性能的開源庫），在數據中心的 NVIDIA GPU、云計算和搭載 NVIDIA RTX GPU 的 PC 上運行時，加速 Gemma 性能（Gemma 由創建 Gemini 模型的相同研究和技術構建）。

這使開發者能將全球高性能 AI PC 中超過 1 億臺搭載 NVIDIA RTX GPU 的用戶作為潛在用戶進行開發。

開發者還可在搭載 NVIDIA GPU 的云端運行 Gemma，該實例擁有 141GB HBM3e 顯存，速度為 4.8TB/秒，Google 將于今年部署該實例。

此外，企業級開發者還可利用 NVIDIA 豐富的工具生態系統（包括依托 NeMo 框架的 NVIDIA AI Enterprise 和 TensorRT-LLM），對 Gemma 進行微調，并將優化后的模型部署到生產應用中。

審核編輯：劉清

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

NVIDIA

NVIDIA

+關注

關注
14

文章
4978

瀏覽量
102987
云計算

云計算

+關注

關注
39

文章
7774

瀏覽量
137351
gpu

gpu

+關注

關注
28

文章
4729

瀏覽量
128890

原文標題：共耀光芒：Google Gemma 優化后可在 NVIDIA GPU 上運行

文章出處：【微信號：NVIDIA_China，微信公眾號：NVIDIA英偉達】歡迎添加關注！文章轉載請注明出處。

《CST Studio Suite 2024 GPU加速計算指南》

。 2. 操作系統支持：CST Studio Suite在不同操作系統上持續測試，可在支持的操作系統上使用GPU計算，具體參考相關文檔。 3. 許可證：

發表于 12-16 14:25

NVIDIA NIM微服務登陸亞馬遜云科技

經過優化的 NIM 微服務現可在 Amazon Bedrock Marketplace、SageMaker JumpStart 和 AWS Marketplace 上獲取，用于各種 NVIDI

發表于 12-06 13:33 ?183次閱讀

如何構建及優化GPU云網絡

并從計算節點成本優化、集群網絡與拓撲的選擇等方面論述如何構建及優化GPU云網絡。

發表于 11-06 16:03 ?347次閱讀

AMD與NVIDIA GPU優缺點

，NVIDIA的RTX系列顯卡以其強大的光線追蹤和DLSS技術領先于市場。例如，NVIDIA的RTX 3080在4K分辨率下提供了卓越的游戲體驗，而AMD的Radeon RX 6800 XT雖然在某些游戲中表現接近，但在光線追蹤技術上

發表于 10-27 11:15 ?639次閱讀

TI TDA2x SoC上基于GPU的環視優化

電子發燒友網站提供《TI TDA2x SoC上基于GPU的環視優化.pdf》資料免費下載

發表于 10-10 09:14 ?0次下載

Google Gemma 2模型的部署和Fine-Tune演示

Google 近期發布了最新開放模型 Gemma 2，目前與同等規模的開放模型相比，取得了明顯的優勢，同時在安全可控性上得到了顯著的增強。

發表于 08-09 17:04 ?525次閱讀

暴漲預警！NVIDIA GPU供應大跳水

gpu

jf_02331860
發布于 :2024年07月26日 09:41:42

英國公司實現英偉達CUDA軟件在AMD GPU上的無縫運行

7月18日最新資訊，英國創新科技企業Spectral Compute震撼發布了其革命性GPGPU編程工具包——“SCALE”，該工具包實現了英偉達CUDA軟件在AMD GPU上的無縫遷移與運行，標志著在

發表于 07-18 14:40 ?634次閱讀

使用google-translate和wwe合并后無法使用google-tts怎么解決？

，在使用喚醒詞喚醒后，我想讓他使用google-tts說一句話，但是出現以下錯誤Code: Select all I (16188) wwe_example: rec_engine_cb

發表于 06-28 06:05

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微軟最新的 Phi-3 Mini 開源語言模型。TensorRT-LLM 是一個開源庫，用于優化從 PC 到云端的 NVID

發表于 04-28 10:36 ?547次閱讀

NVIDIA全面加快Meta Llama 3的推理速度

Meta 最新開源大語言模型采用 NVIDIA 技術構建，其經過優化后可在云、數據中心、邊緣和 PC 的 NVIDIA

發表于 04-23 09:52 ?453次閱讀

利用NVIDIA組件提升GPU推理的吞吐

本實踐中，唯品會 AI 平臺與 NVIDIA 團隊合作，結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV（HKV）將推理的稠密網絡和熱 Embedding 全置于

發表于 04-20 09:39 ?714次閱讀

NVIDIA 發布全新交換機，全面優化萬億參數級 GPU 計算和 AI 基礎設施

NVIDIA Quantum-X800 InfiniBand 網絡，打造性能最強大的 AI 專用基礎設施 NVIDIA Spectrum-X800 以太網絡，數據中心必備的優化 AI 網絡

發表于 03-19 10:05 ?332次閱讀

TensorRT LLM加速Gemma！NVIDIA與谷歌牽手，RTX助推AI聊天

NVIDIA今天在其官方博客中表示，今天與谷歌合作，在所有NVIDIA AI平臺上為Gemma推出了優化。

發表于 02-23 09:42 ?601次閱讀

谷歌發布全球最強開源大模型Gemma

谷歌近日宣布，其全新開源大模型Gemma正式亮相。Gemma被譽為全球性能最強大、同時也是最輕量級的模型系列，分為2B（20億參數）和7B（70億）兩種尺寸版本。令人矚目的是，即便是2B版本，也能夠在筆記本電腦上流暢運行。

發表于 02-22 14:51 ?792次閱讀

NVIDIA英偉達
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot VR、AR與MR的發展歷史以及商業應用實例
Hot NVIDIA RTX與GTX的區別是什么？

New AI先驅榮獲諾貝爾物理學獎和化學獎
New NVIDIA預測2025年AI行業發展

精選推薦
更多

文章

資料

帖子

折疊屏2024的新東西、好東西、舊東西

腦極體
1天前

454 閱讀

艾為車規氛圍燈驅動芯片AW23003QNR-Q1解析已過AEC-Q100認證

艾為之家
1天前

444 閱讀

使用Keithley源表進行DC-DC電源管理芯片效率測試

泰克科技
2天前

704 閱讀

Mate70首銷兩周超越前代！字節掀AI價格戰！本周熱點科技新聞點評

章鷹觀察
2天前

703 閱讀

基于英特爾開發板開發ROS應用

英特爾物聯網
2天前

410 閱讀

S7-200 Modbus通信協議手冊

liuxin
667 KB

免費

336下載

基于LTC3416-0504-mag直流到直流單輸出電源的參考設計

人走了
113.04KB

2積分

7下載

Deigo CF的彈性運行時

王靜
17.03 MB

免費

0下載

fast-poster海報生成器

石飛鵬
3.56 MB

2積分

1下載

srpc高性能通用RPC框架

李芳
0.43 MB

2積分

1下載

【敏矽微ME32G070開發板免費體驗】新建工程（MDK）

吉吉祥
1天前

242 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】按鍵點燈：使用輪詢方式和中斷方式實現

jf_64583430
1天前

216 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】07、ADC采集PWM輸出的電壓值

jf_83922529
2天前

317 閱讀

淺談加密芯片的一種破解方法和對應加密方案改進設計

jf_38636298
2天前

900 閱讀

【RA-Eco-RA4E2-64PIN-V1.0開發板試用】4、Amazon FreeRTOS初探，第一個程序

lustao
2天前

1861 閱讀

推薦專欄
更多

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

Google Gemma優化后可在NVIDIA GPU上運行

評論

《CST Studio Suite 2024 GPU加速計算指南》

NVIDIA NIM微服務登陸亞馬遜云科技

如何構建及優化GPU云網絡

AMD與NVIDIA GPU優缺點

TI TDA2x SoC上基于GPU的環視優化

Google Gemma 2模型的部署和Fine-Tune演示

暴漲預警！NVIDIA GPU供應大跳水

英國公司實現英偉達CUDA軟件在AMD GPU上的無縫運行

使用google-translate和wwe合并后無法使用google-tts怎么解決？

NVIDIA加速微軟最新的Phi-3 Mini開源語言模型

NVIDIA全面加快Meta Llama 3的推理速度

利用NVIDIA組件提升GPU推理的吞吐

NVIDIA 發布全新交換機，全面優化萬億參數級 GPU 計算和 AI 基礎設施

TensorRT LLM加速Gemma！NVIDIA與谷歌牽手，RTX助推AI聊天

谷歌發布全球最強開源大模型Gemma