色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

騰訊云與NVIDIA仍持續為AI推理加速進行合作

NVIDIA英偉達 ? 來源:NVIDIA英偉達 ? 作者:NVIDIA英偉達 ? 2022-08-31 09:24 ? 次閱讀

騰訊云計算加速套件 TACO Kit 包含 TACO Train 和 TACO Infer 兩個 AI 組件。基于 GPU 異構計算平臺針對業界 AI 訓練和推理任務進行了全方位的加速優化。TACO Kit 不僅大大提升了 GPU 集群上多機多卡分布式訓練的效率,對于 GPU 上的模型推理也通過集成 NVIDIA TensorRT 帶來了顯著加速。雙方團隊就 GPU 推理加速這一話題將進行持續深入的合作,推出定制化的優化方案,為業界客戶帶來顯著的性能收益。

騰訊云計算加速套件TACO Kit(Tencent Cloud Accelerated Computing Optimization Kit)是一種異構計算加速軟件服務,具備領先的 GPU 共享技術和業界唯一的 GPU 在離線混部能力,搭配騰訊自研的軟硬件協同優化組件和硬件廠商特有優化方案,支持物理機、云服務器、容器等產品的計算加速、圖形渲染、視頻轉碼各個應用場景,幫助用戶實現全方位全場景的降本增效。

其中,AI 加速引擎 TACO Train 和 TACO Infer 是騰訊云虛擬化團隊依托云帆團隊,立足于騰訊內部豐富的 AI 業務場景,深耕訓練框架優化、分布式框架優化、網絡通信優化、推理性能優化等關鍵技術,攜手打造的一整套 AI 加速方案。為了更好的服務用戶,騰訊云決定將內部深度優化的加速方案免費提供給公有云用戶,助力廣大用戶提高 AI 產品迭代效率。

無論對于 AI 訓練或 AI 推理,如何有效提升 AI 任務的性能,節省硬件資源成本,是業界持續追求的目標。在訓練方面,隨著 AI 模型規模的擴大及訓練數據的增多,用戶對模型的迭代效率要求也隨之增長,單個 GPU 的算力已無法滿足大部分業務場景,使用單機多卡或多機多卡訓練已成為趨勢。但用戶在部署分布式訓練系統時,時常面臨著難以充分利用 GPU 資源、訓練效率低下的問題,而分布式訓練性能調優卻是需要同時進行通信優化、計算優化的極其復雜的問題。

在推理方面,對多種多樣的工作負載進行推理加速也是業界共同的需求。這需要考慮如何對不同框架訓練的模型進行統一的高效部署;如何整合各類加速軟件和技術,對接不同模型和業務場景。

在訓練方面,TACO Train 推出 Tencent TensorFlow(以下簡稱 TTF), 針對特定業務場景的 XLA,Grappler 圖優化,以及自適應編譯框架解決冗余編譯的問題,并對 TensorFlow 1.15 添加了對CUDA 11的支持,讓用戶可以使用NVIDIA A100 Tensor Core GPU來進行模型訓練。另外,TACO Train 推出 LightCC 這一基于 Horovod 深度優化的分布式訓練框架,在保留了原生 Horovod 的易用性上,增加了性能更好的通信方式。相比 Horovod,LightCC 能夠對 2D AllReduce 充分利用通信帶寬;在 GPU 上訓練時提供高效的梯度融合方式;并使用 TOPK 壓縮通信,降低通信量,提高傳輸效率。最后,騰訊云自研了用戶態網絡協議棧 HARP,可以通過 Plug-in 的方式集成到NVIDIA NCCL中,無需任何業務改動,加速云上分布式訓練性能,從而解決了目前普遍使用的內核網絡協議棧存在著一些必要的開銷導致其不能很好地利用高速網絡設備的問題。

在推理方面,TACO Infer 通過跨平臺統一的優化接口賦能用戶,讓渴望加速計算的用戶輕松駕馭騰訊云上豐富的異構算力。TACO Infer 針對 GPU 推理任務,集成了NVIDIA TensorRT,利用其極致的模型優化能力,使推理過程能夠達到令人滿意的性能。此外,TACO 也將自定義的高性能 kernel 實現與TensorRT相結合,極大地提升用戶的推理效率。

TACO Kit 針對 GPU 的訓練優化,為諸多業務帶來了顯著的性能提升。在某電商平臺推薦業務Wide & Deep 模型訓練任務中,TACO Train 提供的方案通過定制化高性能 GPU 算子,使延遲從 14.3ms 下降至 2.8ms;整體訓練性能提升 43%,成本下降 11%;在另一電商推薦場景 MMoE 模型的訓練任務中,TACO Train 提供的訓練方案,在NVIDIA V100 Tensor Core GPU集群上,使計算速度性價比相比于 CPU 集群提升了 3.2 倍,收斂速度性價比相比于 CPU 集群提升了 24.3 倍。

目前,騰訊云 TACO Kit 與 NVIDIA 雙方團隊仍持續為 AI 推理加速進行合作。未來也將針對一些常見的業務模型,圍繞TensorRT進行聯合優化,將模型推理的性能推向更高的水準,為業界有推理加速需求的客戶提供一站式的優化方案。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5107

    瀏覽量

    104468
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4830

    瀏覽量

    129778
  • AI
    AI
    +關注

    關注

    87

    文章

    32439

    瀏覽量

    271624
  • 騰訊云
    +關注

    關注

    0

    文章

    219

    瀏覽量

    16880

原文標題:騰訊云與 NVIDIA 深度合作,打造計算加速套件 TACO Kit 加速 GPU AI 計算全鏈路

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    使用NVIDIA推理平臺提高AI推理性能

    NVIDIA推理平臺提高了 AI 推理性能,零售、電信等行業節省了數百萬美元。
    的頭像 發表于 02-08 09:59 ?323次閱讀
    使用<b class='flag-5'>NVIDIA</b><b class='flag-5'>推理</b>平臺提高<b class='flag-5'>AI</b><b class='flag-5'>推理</b>性能

    騰訊申請注冊“騰訊AI代碼助手”商標

    致力于提升編程效率的智能工具。其主要功能包括代碼的智能補全和自動生成,旨在幫助開發者更加高效地進行編程工作。這款工具的出現,標志著騰訊在人工智能和計算領域的技術實力得到了進一步的提升。 值得注意的是,
    的頭像 發表于 12-13 10:28 ?417次閱讀

    NVIDIA與軟銀集團合作加速日本主權AI計劃

    NVIDIA 宣布與軟銀集團開展一系列合作,旨在加速日本主權 AI 計劃,并進一步提升日本在全球的技術領先優勢,同時全球電信運營商開辟數十
    的頭像 發表于 11-19 15:49 ?464次閱讀

    印尼GOTO、騰訊與阿里簽署合作協議

    近日,印尼知名科技公司GOTO與中國的騰訊、阿里正式簽署了合作協議。此次攜手合作,旨在共同推動印尼數字經濟的發展,
    的頭像 發表于 11-11 14:32 ?502次閱讀

    NVIDIA助力麗蟾科技打造AI訓練與推理加速解決方案

    麗蟾科技通過 Leaper 資源管理平臺集成 NVIDIA AI Enterprise,企業和科研機構提供了一套高效、靈活的 AI 訓練與推理
    的頭像 發表于 10-27 10:03 ?404次閱讀
    <b class='flag-5'>NVIDIA</b>助力麗蟾科技打造<b class='flag-5'>AI</b>訓練與<b class='flag-5'>推理</b><b class='flag-5'>加速</b>解決方案

    NVIDIA與思科合作打造企業級生成式AI基礎設施

    NVIDIA 加速計算平臺、NVIDIA AI Enterprise 軟件和 NVIDIA NIM
    的頭像 發表于 10-10 09:35 ?500次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1
    的頭像 發表于 07-25 09:48 ?841次閱讀

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革

    by HPE 包含了可持續加速計算產品組合以及全生命周期服務,將簡化 AI 創造價值的過程,加速生成式 AI 的發展步伐。
    的頭像 發表于 06-21 14:39 ?469次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

    作為極具開創性的一站式“交鑰匙”私有人工智能(private-cloud AI)解決方案,NVIDIA AI Computing by HPE 包含了可
    的頭像 發表于 06-20 17:36 ?839次閱讀

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI模型部署過程,全球的2800萬英偉達開發者
    的頭像 發表于 06-04 09:15 ?796次閱讀

    英特爾助力京東用CPU加速AI推理,以大模型構建數智化供應鏈

    英特爾助力京東用CPU加速AI推理,以大模型構建數智化供應鏈
    的頭像 發表于 05-27 11:50 ?649次閱讀
    英特爾助力京東<b class='flag-5'>云</b>用CPU<b class='flag-5'>加速</b><b class='flag-5'>AI</b><b class='flag-5'>推理</b>,以大模型構建數智化供應鏈

    研華與英偉達深化合作, 成為NVIDIA AI Enterprise軟件全球分銷商

    )的軟件平臺。近日發布的NVIDIA AI Enterprise 5.0將為用戶提供一系列微服務,其中包括NVIDIA NIM。這是一套用于對二十多種流行的AI模型
    發表于 05-07 11:21 ?475次閱讀
    研華與英偉達深化<b class='flag-5'>合作</b>, 成為<b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Enterprise軟件全球分銷商

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin Hierarc
    的頭像 發表于 04-20 09:39 ?883次閱讀

    NVIDIA和谷歌宣布開展一項新的合作加速AI開發

    NVIDIA 和谷歌宣布開展一項新的合作,以幫助全球初創企業加速創建生成式 AI 應用和服務。
    的頭像 發表于 04-11 14:03 ?615次閱讀

    SAP與NVIDIA攜手加速生成式AI在企業應用中的普及

    SAP SE 和 NVIDIA 宣布深化合作,致力于加速企業客戶在 SAP 解決方案和應用組合中利用數據和生成式 AI 的變革力量。
    的頭像 發表于 03-22 10:02 ?725次閱讀
    主站蜘蛛池模板: 久久久久夜 | 最新国产成人综合在线观看 | 中文字幕无码一区二区免费 | 国产亚洲美女精品久久久2020 | 曰本熟妇乱妇色A片在线 | 日本熟妇乱妇熟色在线电影 | 国产精品一区二区三区四区五区 | 又紧又大又爽精品一区二区 | 久久精品在现线观看免费15 | 国产精一品亚洲二区在线播放 | 簧片在线观看 | 抽插的日日液液H | 伊人久久综合热青草 | 一个人HD在线观看免费高清视频 | 精品久久久久久久久免费影院 | 9277在线观看免费高清完整版 | 国产区精品综合在线 | 国产AV精品无码免费看 | 亚洲精品久久久WWW游戏好玩 | 91极品蜜桃臀在线播放 | 欧美最猛性XXXXX肛交 | 搡女人免费免费视频观看 | 久久se精品一区二区国产 | 超碰免费视频部落格 | 免费果冻传媒在线完整观看 | 天天躁日日躁狠狠躁中文字幕老牛 | 午夜福利免费院 | 国产91网站在线观看免费 | 九九99热久久精品在线6 | 日本十八禁无遮无挡漫画 | 亚洲中文字幕日产乱码2020 | 一本大道无码AV天堂欧美 | 给我免费播放片bd国语 | 国产亚洲tv在线观看 | 国产AV精品无码免费看 | 我解开了岳的乳第一个女人 | 好想被狂躁A片免费久99 | 18黄女脱内衣 | 久久久这里有精品999 | 国产成人无码AV麻豆 | 亚洲色欲国产免费视频 |