色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

RTX AI PC和工作站提供強大AI性能

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 2024-08-23 16:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

由 NVIDIA RTX 和 GeForce RTX 技術驅動的 AI PC 時代已經到來。在這一背景下,一種評估 AI 加速性能的新方法應運而生,同時還帶來了一套新術語,這套術語成了用戶選擇臺式電腦和筆記本電腦的參考標準。

雖然 PC 游戲玩家了解每秒幀數(FPS)及類似的統計數據,但衡量 AI 性能需要新的指標。

TOPS 脫穎而出

TOPS,即每秒萬億次運算是首要的基準指標。“萬億”是這里的關鍵詞:生成式 AI 任務背后的處理運算量是巨大的。您可以將 TOPS 視為原始性能指標,類似于發動機的額定功率。這個數值自然是越大越好。

例如,比較一下微軟最近發布的 Windows 11 AI PC,其中就包含每秒至少可執行 40 萬億次運算的神經處理單元(NPU)。40 TOPS 的算力足以勝任一些輕量級 AI 輔助任務,例如詢問本地聊天機器人昨天的筆記在哪里。

但許多生成式 AI 的算力需求遠不止于此。NVIDIA RTX 和 GeForce RTX GPU 可在所有生成式任務中提供卓越的性能,其中 GeForce RTX 4090 GPU 的算力可達 1177 TOPS。這就是處理 AI 輔助數字內容創作(DCC)、PC 游戲 AI 超分辨率、根據文本或視頻生成圖像、與本地大語言模型(LLM)交互等任務所需的算力。

以 Token 衡量性能

TOPS 只是一項基礎衡量指標。LLM 的性能以模型生成的 Token 數量來衡量。

Token 是 LLM 的輸出,它可以是句子中的一個詞,甚至可以是標點符號或空格這類更小的片段。AI 加速任務的性能可以用“每秒 Token 數”來衡量。

另一個重要因素則是 batch size,也就是在一次推理過程中可同時處理的輸入數量。由于大語言模型(LLM)是許多現代 AI 系統的核心,處理多個輸入(例如來自單個應用或跨多個應用)的能力將成為關鍵的差異化因素。雖然較大的 batch size 可以提升并發輸入的性能,但也需要占用更多的內存,尤其是運行較大的模型時。

RTX GPU 非常適合 LLM,因為它們擁有大量專用的顯存(VRAM)、Tensor Core 和 TensorRT-LLM 軟件。

GeForce RTX GPU 最多可提供 24GB 的高速 VRAM,而 NVIDIA RTX GPU 最多可提供 48GB 的高速 VRAM,可支持更大的模型和更大的 batch size。RTX GPU 還可利用 Tensor Core,這是一種專用的 AI 加速器,可顯著加速深度學習和生成式 AI 模型中的計算密集型運算。應用在使用 NVIDIA TensorRT 軟件開發套件(SDK)的情況下可輕松實現超高性能。該套件可在超過 1 億臺由 RTX GPU 驅動的 Windows PC 和工作站上解鎖超高性能生成式 AI。

結合了大顯存、專用 AI 加速器和優化的軟件,RTX GPU 的吞吐量得到了巨大提升,尤其是在 batch size 增加的情況下。

文本生圖像,速度超以往

測量圖像生成速度是評估性能的另一種方法。最直接的一個方法是使用 Stable Diffusion,這是一種基于圖像的熱門 AI 模型,可讓用戶輕松地將文本描述轉換為復雜的視覺畫面。

借由 Stable Diffusion,用戶可以通過輸入關鍵詞快速獲得想要的圖像相比于 CPU 或 NPU,使用 RTX GPU 運行 AI 模型時可以更快生成所需結果。

在熱門的 Automatic1111 界面使用 TensorRT 擴展程序時,相應性能表現甚至會更好。借助 SDXL 模型,RTX 用戶通過提示生成圖像的速度至多可提升至原來的 2 倍,這可大幅簡化 Stable Diffusion 工作流。

另一個熱門的 Stable Diffusion 用戶界面 ComfyUI 在上周也支持了 TensorRT 加速。現在,RTX 用戶文生圖的速度可提升多達 60%。RTX 用戶還可使用 Stable Video Diffusion 將這些圖像轉換為視頻,在 TensorRT 的助力下,轉換速度甚至可提升多達 70%。

全新的 UL Procyon AI 圖像生成基準測試現已支持 TensorRT 加速。與最快的非 TensorRT 加速狀態相比,TensorRT 加速可在 GeForce RTX 4080 SUPER GPU 上帶來 50% 的速度提升。

適用于 Stable Diffusion 3 的 TensorRT 加速近期發布,前者是 Stability AI 備受期待的全新文本轉圖像模型。此外,全新的 TensorRT-Model Optimizer 可進一步提升性能。與非 TensorRT 加速狀態相比,它可帶來顯著的速度提升,同時減少顯存消耗。

當然,眼見方能為實。真正的考驗來自于不斷迭代提示詞這種真實場景。在 RTX GPU 上,用戶通過改進提示詞來優化圖像的速度可得到顯著提升,每次迭代只需數秒即可完成。而在 Macbook Pro M3 Max 上,完成相同的迭代需要耗費數分鐘。此外,如果在由 RTX 驅動的 PC 或工作站上本地運行,用戶可以同時享受到速度和安全性方面的優勢,并讓所有內容保持私密。

測試結果出爐,相關技術開源

不過,且不要僅聽我們的一面之詞。開源的 Jan.ai 背后的 AI 研究人員和工程師團隊最近將 TensorRT-LLM 集成到了其本地聊天機器人應用中,然后親自測試了這些優化效果。

研究人員在社區使用的各種 GPU 和 CPU 上,以開源的 llama.cpp 推理引擎為對照,測試了 TensorRT-LLM 的實際表現。他們發現 TensorRT“在相同硬件上比 llama.cpp 快 30-70%”,并且在進行連續處理時效率更高。該團隊還提供了測試方法,邀請其他人親自測試生成式 AI 的性能。

無論是游戲還是生成式 AI,速度才是其致勝法寶。在確定性能冠軍時,TOPS、每秒 Token 數和 batch size 均需納入考量。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5299

    瀏覽量

    106279
  • PC
    PC
    +關注

    關注

    9

    文章

    2149

    瀏覽量

    156439
  • 內存
    +關注

    關注

    8

    文章

    3119

    瀏覽量

    75217
  • AI
    AI
    +關注

    關注

    88

    文章

    35039

    瀏覽量

    278941

原文標題:解碼 RTX AI PC 和工作站上的 AI 性能

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    制作團隊如何借助NVIDIA RTX AI讓創意成真

    藝術家和開發者已經在利用生成式 AI 簡化工作、突破創意邊界,無論是探索概念、設計虛擬世界還是構建智能應用。借助 RTX AI PC,用戶能
    的頭像 發表于 07-09 16:28 ?162次閱讀

    潤開鴻推出基于OpenHarmony的桌面操作系統及AI PC工作站

    股份有限公司旗下子公司江蘇潤開鴻數字科技有限公司(以下簡稱“潤開鴻”)受邀出席,并重磅發布基于OpenHarmony的HiHopeOS桌面操作系統及AI PC工作站軟、硬件新品,以創新技術共筑中國電腦產業未來。
    的頭像 發表于 06-03 16:25 ?379次閱讀

    英特爾發布全新GPU,AI工作站迎來新選擇

    Pro B50 GPU,搭載了為AI推理和專業工作站量身定制的配置,擴展了英特爾銳炫Pro產品系列。 英特爾 ? Gaudi 3 AI 加速器: 英特爾Gaud
    發表于 05-20 11:03 ?1506次閱讀

    首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手

    Studio提供了最優解。Neuron Studio可針對模型到應用,提供式、全鏈路、自動化的開發協助,不僅讓AI應用開發的全流程可視化,更帶來整個多種工具的一
    發表于 04-13 19:52

    Banana Pi 發布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    RZ/V2N——近期在嵌入式世界2025上新發布,為 AI 計算、嵌入式系統及工自動化提供強大支持。這款全新的計算平臺旨在滿足開發者和企業用戶對高性能、低功耗和靈活擴展的需求。 [](
    發表于 03-19 17:54

    NVIDIA Blackwell RTX PRO 提供工作站和服務器兩種規格,助力設計師、開發者、數據科學家和創作人員構建代理式

    月 18 日 —— NVIDIA 今日發布了 NVIDIA RTX PRO? Blackwell 系列工作站和服務器 GPU,通過突破性的加速計算、AI 推理、光線追蹤和神經渲染技術,重新定義
    發表于 03-19 09:50 ?309次閱讀
    NVIDIA Blackwell <b class='flag-5'>RTX</b> PRO <b class='flag-5'>提供</b><b class='flag-5'>工作站</b>和服務器兩種規格,助力設計師、開發者、數據科學家和創作人員構建代理式

    工業機器人工作站的建設意義

    其他輔助設備的配合,形成了一套完整的自動化生產流程。桐爾作為專業的自動化解決方案提供商,致力于通過工業機器人工作站的建設,為企業帶來顯著的經濟效益和生產效率提升。 工業機器人工作站的建立首先能夠顯著
    發表于 03-17 14:49

    快速升級DELL與HP工作站儲存效能,實現高效工作流!

    。對于已配備超薄型光驅插槽位及PCIe插槽的HP工作站、Dell工作站,ICYDOCK可以提供創新的解決方案,幫助用戶有效率地提升存儲容量。可兼容的工作站型號HP
    的頭像 發表于 02-14 15:38 ?520次閱讀
    快速升級DELL與HP<b class='flag-5'>工作站</b>儲存效能,實現高效<b class='flag-5'>工作</b>流!

    NVIDIA RTX賦能AI工作站加速數據科學工作流程

    各行各業都在借助 AI 實現轉型,以提高競爭力和運營效率。在零售業中,聊天機器人正在簡化用戶的產品庫存搜索。在金融服務業,基于 AI 的工具正應用于欺詐檢測。而在醫療健康領域,AI 正在幫助從基因組學中發現新的見解,從而改善患者
    的頭像 發表于 02-08 10:01 ?574次閱讀
    NVIDIA <b class='flag-5'>RTX</b>賦能<b class='flag-5'>AI</b><b class='flag-5'>工作站</b>加速數據科學<b class='flag-5'>工作</b>流程

    NVIDIA推出面向RTX AI PCAI基礎模型

    NVIDIA 今日發布能在 NVIDIA RTX AI PC 本地運行的基礎模型,為數字人、內容創作、生產力和開發提供強大助力。
    的頭像 發表于 01-08 11:01 ?531次閱讀

    提升企業效能:迷你工作站的潛力

    杰和科技迷你工作站WA814正式上線以來,客戶們和合作伙伴就對這款產品表現出了濃厚的興趣,迫不及待地想要深入了解并親身體驗它所帶來的價值。對比傳統的工作站,杰和迷你工作站WA814只有3.4L的小巧體積,外出
    的頭像 發表于 01-06 11:02 ?378次閱讀
    提升企業效能:迷你<b class='flag-5'>工作站</b>的潛力

    杰和課堂|一文講清工作站到底有多香

    當一名建筑設計師用CAD繪制復雜的建筑藍圖時,一臺性能強勁的工作站就是他們的“得力助手”。工作站的專業顯卡(如NVIDIARTXA系列)能夠提供更高的計算能力,確保渲染效果真實細膩,同
    的頭像 發表于 12-30 19:07 ?467次閱讀
    杰和課堂|一文講清<b class='flag-5'>工作站</b>到底有多香

    NVIDIA RTX AI Toolkit擁抱LoRA技術

    RTX AI PC工作站上使用最新版 RTX AI Toolkit 微調 LLM,最高可
    的頭像 發表于 11-20 09:14 ?706次閱讀
    NVIDIA <b class='flag-5'>RTX</b> <b class='flag-5'>AI</b> Toolkit擁抱LoRA技術

    NVIDIA NIM在搭載RTX技術的AI工作站上的應用

    AI 計算資源的需求正不斷增長。從概念驗證到企業部署需要針對生成性 AI 工作負載進行優化的強大計算基礎設施。同時,AI 開發項目需要更多的
    的頭像 發表于 11-09 11:47 ?773次閱讀

    NVIDIA RTX AI套件簡化AI驅動的應用開發

    NVIDIA 于近日發布 NVIDIA RTX AI套件,這一工具和 SDK 集合能夠幫助 Windows 應用開發者定制、優化和部署適用于 Windows 應用的 AI 模型。該套件免費提供
    的頭像 發表于 09-06 14:45 ?867次閱讀
    主站蜘蛛池模板: 中文字幕亚洲无限码 | 阿娇和冠希13分钟在线观看 | 吃奶摸下的激烈免费视频 | 日韩 亚洲 欧美 中文 高清 | 恋孩癖网站大全在线观看 | 亚洲成AV人电影在线观看 | 国产欧美日韩精品a在线观看高清 | AV一区AV久久AV无码 | 彭丹吃奶门 | 在线观看亚洲AV无码每日更新 | 偷柏自拍亚洲综合在线 | 欧美特级特黄AAAAA片 | 青草国产超碰人人添人人碱 | 插曲的痛30分钟视频最新章节 | 欧美色妞AV重囗味视频 | 视频一区国产第一页 | 超碰caoporn| 老师那里好大又粗h男男 | 久久黄色录像 | 欧美日韩一区在线观看 | 精品AV综合导航 | 色偷偷91综合久久噜噜 | 精品久久久噜噜噜久久7 | 掀开奶罩边躁狠狠躁软学生 | 国产亚洲精品网站在线视频 | 亚洲国产在线综合018 | 丰满少妇被猛烈进出69影院 | 高h原耽肉汁动漫视频 | 亚洲男人97色综合久久久 | 久久无码AV亚洲精品色午夜麻豆 | 国产精品亚欧美一区二区三区 | gv肉片视频免费观看 | 国产成人精品视频免费大全 | 久久电影精品 | 日本亚洲精品色婷婷在线影院 | 成人精品综合免费视频 | 亚洲精品青青草原avav久久qv | 久久黄色网 | 亚洲欧美日韩国产另类电影 | 人曽交Z00Z0OA片 | poronovideos动物狗猪 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品