色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

使用NVIDIA Triton推理服務器來加速AI預測

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 2024-02-29 14:04 ? 次閱讀

這家云計算巨頭的計算機視覺和數據科學服務使用 NVIDIA Triton 推理服務器來加速 AI 預測。

作為一名狂熱的自行車愛好者,Thomas Park 深知擁有多個變速檔位對于平穩、快速騎行的重要性。

因此,當這位軟件架構師為 Oracle Cloud Infrastructure(OCI)的視覺 AI 服務設計 AI 推理平臺時,他選擇了 NVIDIA Triton 推理服務器,因為它可以通過變換“檔位”,來快速高效地處理幾乎任何 AI 模型、框架、硬件和運行模式。

Park 表示:“NVIDIA AI推理平臺為我們的全球云服務客戶帶來了巨大的靈活性,讓他們可以構建和運行 AI 應用。”Park 是一位在蘇黎世工作的計算機工程師,同時也是一名富有競爭力的自行車手,他曾先后就職于四家全球超大型云服務提供商。

具體而言,Triton 將 OCI 的總擁有成本降低了 10%、將遷移到 Triton 的 OCI 視覺和文檔理解服務模型的預測吞吐量提高了 76%,并將推理延遲降低了 51%。Park 和一位同事在今年早些時候發布的一篇 Oracle 博客中指出,全球有超過 45 個區域數據中心在運行這些服務。

計算機視覺加速深入洞察

依靠 OCI 視覺 AI,客戶可以進行各種物體檢測和圖像分類工作。例如,美國的一家運輸公司利用它來自動檢測經過的車軸數,以計算和結算過橋費,從而節省了忙碌的卡車司機在收費站的等待時間。

OCI AI 還通過 Oracle NetSuite 提供,Oracle NetSuite 是全球 37,000 多個企業組織使用的一套商業應用程序,它可以用于自動識別發票等工作。

在 Park 的努力下,Triton 如今也被其他 OCI 服務所采用。

能夠識別 Triton 的數據服務

負責處理 Oracle 內外部用戶機器學習事務的 OCI 數據科學服務產品管理總監 Tzvi Keisar 表示:“我們的 AI 平臺能夠識別 Triton,以造福于我們的客戶。”

Keisar 提到:“想要使用 Triton 的客戶不必擔心配置問題,因為平臺會自動完成配置,為他們啟動一個 Triton 驅動的推理終端節點。”

Triton 包含在 NVIDIA AI Enterprise 中,該平臺可提供企業所需的全方位的安全和支持,并且可以在 OCI Marketplace 上獲得

一個龐大的 SaaS 平臺

OCI 的數據科學服務是一個適用于 Oracle NetSuite 和 Oracle Fusion 應用程序的機器學習平臺。

“這些商業應用套件規模龐大,有數以萬計的客戶也在我們的服務上構建他們的框架。”Keisar 說。

這些客戶主要是來自于制造業、零售業、交通運輸業等行業的企業用戶。他們正在構建和使用幾乎所有形態與規模的 AI 模型。

推理是該團隊推出的首批服務之一,而 Triton 在推出后不久就進入了該團隊的視線。

最佳的推理框架

“我們看到 Triton 作為一流的服務框架越來越受歡迎,于是開始試用。”Keisar 說,“我們發現它的性能非常出色,彌補了現有產品的不足,尤其是在多模型推理方面。它是目前功能最全面、最先進的推理框架。”

Triton 于 3 月在 OCI 上發布,已經吸引了 Oracle 許多內部團隊的關注。他們希望將其用于需要同時運行多個 AI 模型以作出預測的推理工作。

他表示:“當用于部署在單個端點上的多個模型時,Triton 的表現和性能都非常好。”

加快未來發展

展望未來,復雜的大語言模型(LLM)激發了眾多用戶的想象力。為了能夠在未來為這些模型上的推理提供更強大的助力,Keisar 的團隊正在對 NVIDIA TensorRT-LLM 軟件進行評估。

身為一名活躍的博主,Keisar 在其最新文章中詳細介紹了在 NVIDIA A10 Tensor Core GPU 上運行具有高達 700 億參數的 Llama 2 LLM 的量化技術。

他表示:“即使減低到四位參數,模型輸出的質量仍然相當不錯。在 NVIDIA GPU 上的部署使我們能夠靈活地在延遲、吞吐量和成本之間找到良好的平衡點。”




審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4978

    瀏覽量

    102987
  • 計算機視覺
    +關注

    關注

    8

    文章

    1698

    瀏覽量

    45974
  • LLM
    LLM
    +關注

    關注

    0

    文章

    286

    瀏覽量

    327

原文標題:名不虛傳:NVIDIA Triton 加速 Oracle Cloud 上的推理

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    日本企業借助NVIDIA產品加速AI創新

    日本領先企業和大學正在使用 NVIDIA NeMo、NIM 微服務NVIDIA Isaac 加速 AI 創新。
    的頭像 發表于 11-19 14:34 ?281次閱讀

    NVIDIA助力麗蟾科技打造AI訓練與推理加速解決方案

    麗蟾科技通過 Leaper 資源管理平臺集成 NVIDIA AI Enterprise,為企業和科研機構提供了一套高效、靈活的 AI 訓練與推理加速
    的頭像 發表于 10-27 10:03 ?208次閱讀
    <b class='flag-5'>NVIDIA</b>助力麗蟾科技打造<b class='flag-5'>AI</b>訓練與<b class='flag-5'>推理</b><b class='flag-5'>加速</b>解決方案

    NVIDIA與思科合作打造企業級生成式AI基礎設施

    NVIDIA 加速計算平臺、NVIDIA AI Enterprise 軟件和 NVIDIA NIM
    的頭像 發表于 10-10 09:35 ?340次閱讀

    NVIDIA AI服務器領域重大革新:預計明年首推插槽式設計

    在科技界引起廣泛關注的最新動態中,里昂證券于9月26日發布了一份引人注目的報告,揭示了NVIDIAAI服務器領域的一項重大變革。據該報告透露,NVIDIA即將在
    的頭像 發表于 09-26 14:25 ?808次閱讀

    什么是AI服務器AI服務器的優勢是什么?

    AI服務器是一種專門為人工智能應用設計的服務器,它采用異構形式的硬件架構,通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速芯片
    的頭像 發表于 09-21 11:43 ?820次閱讀

    AMD助力HyperAccel開發全新AI推理服務器

    HyperAccel 是一家成立于 2023 年 1 月的韓國初創企業,致力于開發 AI 推理專用型半導體器件和硬件,最大限度提升推理工作負載的存儲帶寬使用,并通過將此解決方案應用于
    的頭像 發表于 09-18 09:37 ?356次閱讀
    AMD助力HyperAccel開發全新<b class='flag-5'>AI</b><b class='flag-5'>推理</b><b class='flag-5'>服務器</b>

    NVIDIA助力提供多樣、靈活的模型選擇

    在本案例中,Dify 以模型中立以及開源生態的優勢,為廣大 AI 創新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理
    的頭像 發表于 09-09 09:19 ?460次閱讀

    NVIDIA攜手Meta推出AI服務,為企業提供生成式AI服務

    NVIDIA近日宣布了一項重大舉措,正式推出NVIDIA AI Foundry服務NVIDIA NIM(
    的頭像 發表于 07-25 16:57 ?532次閱讀

    英偉達推出全新NVIDIA AI Foundry服務NVIDIA NIM推理服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務NVIDIA NIM 推理
    的頭像 發表于 07-25 09:48 ?698次閱讀

    AI服務器的特點和關鍵技術

    AI服務器,即人工智能服務器,是一種專門設計用于運行和加速人工智能(AI)算法與模型的硬件設備。隨著人工智能技術的快速發展和普及,
    的頭像 發表于 07-17 16:34 ?1519次閱讀

    ai服務器是什么架構類型

    AI服務器,即人工智能服務器,是專門為人工智能應用設計的高性能計算服務器AI服務器的架構類型有
    的頭像 發表于 07-02 09:51 ?1050次閱讀

    英偉達推出AI模型推理服務NVIDIA NIM

    英偉達近日宣布推出一項革命性的AI模型推理服務——NVIDIA NIM。這項服務將極大地簡化AI
    的頭像 發表于 06-04 09:15 ?674次閱讀

    利用NVIDIA組件提升GPU推理的吞吐

    本實踐中,唯品會 AI 平臺與 NVIDIA 團隊合作,結合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將
    的頭像 發表于 04-20 09:39 ?714次閱讀

    臺積電:AI服務器處理預計翻番,拉動收入增長?

    臺積電將 AI 服務器處理嚴格限定為用于 AI 訓練與推理的 GPU、CPU 及 AI
    的頭像 發表于 04-19 15:04 ?356次閱讀

    利用NVIDIA產品技術組合提升用戶體驗

    本案例通過利用NVIDIA TensorRT-LLM加速指令識別深度學習模型,并借助NVIDIA Triton推理
    的頭像 發表于 01-17 09:30 ?684次閱讀
    主站蜘蛛池模板: 日日操日日射| 91欧美秘密入口| 嫩草视频在线观看免费| 国产成人高清视频| 中文字幕亚洲第一页| 色妹子综合| 免费国产成人高清在线观看视频| 国产精品99久久久久久AV下载| 131美女爱做视频午夜剧场| 视频在线观看高清免费看| 美女被艹网站| 娇小亚裔被两个黑人| 国产成人精品电影在线观看| 91精品婷婷国产综合久久8| 亚洲AV成人无码999WWW| 日本ccc三级| 内射爽无广熟女亚洲| 久久精品亚洲热综合一本奇米 | 精品熟女少妇AV久久免费A片| 边做边爱免费视频播放| 最近中文字幕MV高清在线视频 | 俄罗斯9一14 young处| 中文字幕亚洲欧美在线视频| 亚洲国产精品一区二区久久第 | 亚洲男人97色综合久久久| 日韩高清特级特黄毛片| 免费观看的毛片| 久久亚洲伊人中字综合精品| 国产午夜精品久久理论片小说| 成人性视频全过程| jizzzz亚洲丰满xxxx| 57PAO强力打造高清免费| 伊人免费在线| 亚洲欧美一区二区三区久久 | jjzzz日本| ppypp日本欧美一区二区| 91香蕉福利一区二区三区| 自拍区偷拍亚洲视频| 在线观看免费亚洲| 中文字幕在线不卡日本v二区| 亚洲日韩在线观看|