色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何解決GPU短缺和成本飆升問題?

sakobpqhz ? 來源:算力基建 ? 2023-09-14 11:32 ? 次閱讀

9月14-15日,2023全球AI芯片峰會將在深圳灣萬麗酒店舉行。清華大學教授、中國半導體行業協會副理事長魏少軍領銜50+位演講嘉賓,NVIDIA高通英特爾AMD齊聚,近30家中國AI芯片與算力企業登臺交鋒,4家Chiplet創業創新團隊亮相,6位分析師和投資人帶來報告分享。峰會最終議程已公布,歡迎大家報名,線下參會交流。

由 GPT-4 等大型語言模型 (LLM) 支持的生成式人工智能科技界引起了巨大震動。ChatGPT 的迅速崛起引發了全球科技行業對人工智能的重新評估和優先考慮,實時重塑了產品戰略。

LLM 的整合為產品開發人員提供了一種簡便的方法,將人工智能驅動的功能融入到他們的產品中。但并非一帆風順。產品領導者面臨著一個巨大的挑戰:GPU 短缺和成本飆升。

01.LLMs的興起和GPU短缺

越來越多的人工智能初創公司和服務導致對 A100 和 H100 等高端 GPU 的高需求,從而壓垮了 Nvidia 及其制造合作伙伴臺積電,兩者都在努力滿足供應。Reddit 等在線論壇上充斥著對 GPU 可用性的不滿,這呼應了整個技術社區的情緒。情況變得如此可怕,AWS 和 Azure 都別無選擇,只能實施配額系統。

這個瓶頸不僅擠壓了初創企業,也擠壓了初創企業的發展。對于 OpenAI 這樣的科技巨頭來說,這是一個絆腳石。最近在倫敦舉行的一次非正式會議上,OpenAI 首席執行官 Sam Altman坦誠承認,計算機芯片短缺正在阻礙 ChatGPT 的進步。據報道,Altman 感嘆計算能力的缺乏導致 API 可用性低于標準,并阻礙 OpenAI 為 ChatGPT 推出更大的“上下文窗口”。

推薦一場會議。2023全球AI芯片峰會將于9月14-15日在深圳灣萬麗酒店舉行,NVIDIA 解決方案與架構技術總監張瑞華首次參會,將圍繞《生成式 AI 與大語言模型時代的 NVIDIA GPU 生態》這一主題帶來演講。歡迎大家報名參會~

02.優先考慮AI功能

一方面,產品領導者發現自己陷入了不懈的創新之中,面臨著利用新一代人工智能的力量提供尖端功能的期望。另一方面,他們還要應對 GPU 容量限制的嚴峻現實。這是一個復雜的雜耍行為,無情的優先順序不僅成為戰略決策,而且成為必要。 鑒于 GPU 可用性在可預見的未來仍將是一個挑戰,產品領導者必須戰略性地考慮 GPU 分配。傳統上,產品領導者依賴于優先級劃分技術,例如客戶價值/需求與努力矩陣。無論這種方法在計算資源豐富的世界中多么合乎邏輯,現在都需要進行一些重新評估。 在我們當前的范式中,計算是限制因素,而不是軟件人才,產品領導者必須重新定義如何確定各種產品或功能的優先級,將 GPU 的限制帶到戰略決策的最前沿。 對于科技行業來說,圍繞容量限制進行規劃似乎不尋常,但在其他行業卻是一種常見策略。基本概念很簡單:最有價值的因素是在受限資源上花費的時間,目標是優化在該約束上花費的每單位時間的價值。

03.技術成功指標

作為一名前顧問,我已成功地將這個框架應用于各個行業。我相信,在 GPU 限制存在的情況下,科技產品領導者也可以使用類似的方法來確定產品或功能的優先級。應用此框架時,最直接的價值衡量標準是盈利能力。 然而,在科技領域,盈利能力可能并不總是合適的衡量標準,特別是在涉足新市場或新產品時。因此,我調整了該框架,以與技術中普遍使用的成功指標保持一致,概述了一個簡單的四個步驟過程:

1.貢獻 首先也是最重要的,確定你的北極星指標。這是每個產品或功能的貢獻,概括了其價值的本質。一些具體的例子可能包括:

收入和利潤增加

市場份額的增長

日/月活躍用戶數增長

2. 所需GPU數量 衡量每個產品或功能所需的 GPU 數量。重點關注關鍵因素,包括:

每個用戶每天的查詢數

日活躍用戶數

查詢的復雜性(每個查詢消耗多少令牌)

3.計算每個GPU的貢獻

把它分解到具體細節。每個 GPU 對總體目標有何貢獻?了解這一點將使您清楚地了解 GPU 的最佳分配位置。 根據每個 GPU 的貢獻確定產品的優先級 現在,是時候做出艱難的決定了。根據每個 GPU 的貢獻對您的產品進行排名,然后進行相應的排列。首先關注每 GPU 貢獻最高的產品,確保將有限的資源投入到能夠產生最大影響的領域。 由于GPU 限制不再是盲點,而是決策過程中的可量化因素,您的公司可以更有策略地應對 GPU 短缺問題。為了使這個框架變得生動起來,讓我們想象一個場景,在這個場景中,作為產品領導者,您正在努力應對在四種不同產品之間確定優先級的挑戰:

b244f470-4f8c-11ee-a25d-92fbcf53809c.png

盡管產品 A 具有最高的收入潛力,但它并沒有為每個 GPU 帶來最高的貢獻。令人驚訝的是,產品 D 的收入潛力最小,但每個 GPU 的回報卻最高。通過根據此指標確定優先級,您可以最大化總潛在收入。 假設您總共有 1,000 個 GPU 可供使用。一個簡單的選擇可能會讓您選擇產品 A,從而產生 1 億美元的潛在收入。但是,通過應用上述優先級策略,您可以獲得 1.55 億美元的收入:

b2775e92-4f8c-11ee-a25d-92fbcf53809c.png

同樣的方法可以應用于其他貢獻指標,例如市場份額增益:

b2a03420-4f8c-11ee-a25d-92fbcf53809c.png

同樣,選擇產品 A 會導致市場份額增加 5%。然而,應用上述優先級策略,您可以獲得 7.75% 的市場份額增益:

b2bff120-4f8c-11ee-a25d-92fbcf53809c.png

04.優點和限制

這種替代的優先級框架引入了一種更加細致和更具戰略性的方法。通過專注于每個 GPU 的貢獻,您可以戰略性地調整資源,使其能夠發揮最大的作用,無論是在收入、市場份額還是任何其他定義指標方面。 但優點還不止于此。這種方法還可以增強產品團隊的清晰度和客觀性。根據我的經驗,包括我早期在一家醫療保健公司領導數字化轉型以及后來與麥肯錫的各種客戶合作時,這種方法在容量限制是關鍵因素的情況下改變了游戲規則。它使我們能夠以更加數據驅動和理性的方式確定計劃的優先順序,從而將傳統政治邊緣化,否則決策可能會落在房間里最響亮的聲音的手中。 然而,不存在一刀切的解決方案,并且值得承認這種方法的潛在局限性。例如,這種方法可能并不總是體現某些投資的戰略重要性。因此,雖然可以而且應該對框架做出例外,但應該仔細考慮例外情況,而不是規范。這樣可以保持流程的完整性,并確保任何偏差都是在考慮到更廣泛的戰略背景的情況下做出的。

05.結論

產品領導者面臨著前所未有的GPU 短缺局面,因此需要尋找新的資源管理方法。用偉大的軍事家孫子的話來說,“混亂之中也蘊藏著機遇”。 GPU 短缺確實是一個挑戰,但如果采取正確的方法,它也可能成為差異化和成功的催化劑。所提出的優先級框架側重于每個 GPU 的貢獻,提供了一種確定優先級的戰略方法。通過專注于每個 GPU 的貢獻,公司可以最大限度地提高投資回報,將資源調整到能夠產生最大影響的地方,并專注于對公司長期成功最重要的事情。

編輯:黃飛

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    4979

    瀏覽量

    102994
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4729

    瀏覽量

    128892
  • 人工智能
    +關注

    關注

    1791

    文章

    47191

    瀏覽量

    238268
  • AI芯片
    +關注

    關注

    17

    文章

    1880

    瀏覽量

    34994
  • ChatGPT
    +關注

    關注

    29

    文章

    1560

    瀏覽量

    7597

原文標題:GPU短缺和成本問題,如何破?

文章出處:【微信號:算力基建,微信公眾號:算力基建】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    《CST Studio Suite 2024 GPU加速計算指南》

    GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH發布的有關CST Studio Suite 2024的GPU計算指南。涵蓋GPU計算
    發表于 12-16 14:25

    如何構建及優化GPU云網絡

    并從計算節點成本優化、集群網絡與拓撲的選擇等方面論述如何構建及優化GPU云網絡。
    的頭像 發表于 11-06 16:03 ?348次閱讀
    如何構建及優化<b class='flag-5'>GPU</b>云網絡

    【一文看懂】大白話解釋“GPUGPU算力”

    隨著大模型的興起,“GPU算力”這個詞正頻繁出現在人工智能、游戲、圖形設計等工作場景中,什么是GPU,它與CPU的區別是什么?以及到底什么是GPU算力?本篇文章主要從以下5個角度,讓您全方位了解
    的頭像 發表于 10-29 08:05 ?568次閱讀
    【一文看懂】大白話解釋“<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>算力”

    常見GPU問題及解決方法

    GPU(圖形處理單元)是計算機硬件的重要組成部分,負責處理圖形和視頻渲染任務。隨著技術的發展,GPU在深度學習、游戲、視頻編輯等領域扮演著越來越重要的角色。然而,在使用GPU的過程中,我們可能會遇到
    的頭像 發表于 10-27 14:12 ?1236次閱讀

    何解決工字電感噪音大的問題

    電子發燒友網站提供《如何解決工字電感噪音大的問題.docx》資料免費下載
    發表于 09-04 11:46 ?0次下載

    何解決電感的漏感問題

    電子發燒友網站提供《如何解決電感的漏感問題.docx》資料免費下載
    發表于 09-02 14:48 ?0次下載

    暴漲預警!NVIDIA GPU供應大跳水

    gpu
    jf_02331860
    發布于 :2024年07月26日 09:41:42

    Anthropic AI模型訓練成本飆升,預計未來將達百億級

    在人工智能領域的激烈競爭中,Anthropic公司以其高昂的研發投入引發了廣泛關注。據公司CEO達里奧·阿莫代透露,當前正在開發的AI模型訓練成本飆升至驚人的10億美元,這一數字不僅彰顯了Anthropic在技術創新上的不遺余力,也預示著AI研發
    的頭像 發表于 07-09 15:38 ?440次閱讀

    英偉達數據中心GPU出貨量飆升,市場份額持續領跑

    在全球半導體和計算技術不斷革新的浪潮中,英偉達(NVIDIA)再次憑借其卓越的技術實力和市場洞察力,在數據中心GPU領域取得了令人矚目的成績。根據半導體分析公司TechInsights的最新報告
    的頭像 發表于 06-13 17:08 ?1040次閱讀

    NVLink技術之GPUGPU的通信

    在多 GPU 系統內部,GPU 間通信的帶寬通常在數百GB/s以上,PCIe總線的數據傳輸速率容易成為瓶頸,且PCIe鏈路接口的串并轉換會產生較大延時,影響GPU并行計算的效率和性能。
    發表于 03-27 09:40 ?3867次閱讀
    NVLink技術之<b class='flag-5'>GPU</b>與<b class='flag-5'>GPU</b>的通信

    FPGA在深度學習應用中或將取代GPU

    它們在高溫下運行時需要及時冷卻,而這并不總是可以實現的。要做到這點需要更多的電力、維護成本等。” 使用壽命也是一個問題。一般來說,GPU 的使用 壽命約為 2-5 年,這對那些每隔幾年就換一次電腦
    發表于 03-21 15:19

    GPU理想成本揭秘,性價比之選

    如果新的 GPU 能夠為頻繁和不頻繁升級的玩家提供最佳性能提升,從而滿足最廣泛的 PC 游戲玩家的需求,那么這一代將被認為更加成功。
    發表于 03-15 11:15 ?657次閱讀
    <b class='flag-5'>GPU</b>理想<b class='flag-5'>成本</b>揭秘,性價比之選

    煤氣柜泄漏問題如何解

    電子發燒友網站提供《煤氣柜泄漏問題如何解決.docx》資料免費下載
    發表于 03-05 17:49 ?0次下載

    何解決鍵槽滾鍵磨損問題

    電子發燒友網站提供《如何解決鍵槽滾鍵磨損問題.docx》資料免費下載
    發表于 02-04 14:24 ?0次下載

    2024年,GPU還會維持天價嗎?

    云廠商作為AI算力需求的主要承載方,一場由GPU主導的變革正在悄然興起,這場變革的突出表現在云廠商紛紛下場造芯,結合GPU短缺、高昂成本、應對云服務更加智能化、自主化、靈活化和可擴展
    的頭像 發表于 01-14 11:28 ?1387次閱讀
    2024年,<b class='flag-5'>GPU</b>還會維持天價嗎?
    主站蜘蛛池模板: 99精品在线看| 精品国产中文字幕在线视频| 秘密教学93话恩爱久等了免费| 射死你天天日| 99午夜视频| 久久AV喷吹AV高潮欧美| 天天爽夜夜爽夜夜爽| 99久免费精品视频在线观看2| 精品高清国产a毛片| 色狠狠一区| a在线观看视频| 久久精品手机观看| 亚洲 欧美 中文 日韩 另类 | 18禁止看的免费污网站| 国产亚洲精品免费视频| 日本精品久久久久中文字幕 1| 2019一級特黃色毛片免費看| 韩日午夜在线资源一区二区| 四房色播手机版| 变态露出野外调教| 空姐厕所啪啪啪| 一个人在线观看免费中文www | 亚洲乱码中文字幕久久| a免费视频| 黑人巨茎大战白人女40CMO| 两性色午夜视频免费国产| 人妻中文字幕无码系列| 亚洲精品国产在线网站| 95国产欧洲精华液| 国产精品国产三级国产an| 久久资源365| 无遮掩H黄纯肉动漫在线观看星| 曰本真人00XX动太图| 国产AV国片精品无套内谢无码 | GAY空少被体育生开菊| 久久亚洲精品成人| 亚洲女人网| 红色机尾快播| 亚洲免费网站在线观看| 国产在线观看的| 亚洲精品不卡视频|