色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

攀登深度學習之巔 對AI領域會產生什么深遠影響

Tensorflowers ? 來源:未知 ? 2019-02-23 10:54 ? 次閱讀

2018 年,由美國國家能源研究科學計算中心 (NERSC) 與 NVIDIA組成的聯合團隊取得了一項突破性成就。他們成功將一種科學嚴謹的深度學習應用擴展至 27000 多個NVIDIA V100Tensor 核心 GPU,攻克了此過程中百億億次運算的難關。憑借該項成就,研究團隊由此斬獲高性能計算領域的最高獎項ACM 戈登貝爾獎。除 2018 年的技術論文與新聞稿之外,我們還將在本文中探討這項成就對 AI 領域產生的深遠影響,以及未來面臨的開放性挑戰。

由伯克利實驗室與橡樹嶺國家實驗室各自領導的兩個研究團隊共享 2018 年 ACM 戈登貝爾獎

深度學習軟件:性能與生產力

低級工具能為開發者帶來精確度,高級工具則可提高工作效率,這二者之間總存在一個折衷點。我們已為此找到解決方案。在本次項目中,我們用高效的 PythonTensorFlow 表示網絡架構與整體的應用工作流。TensorFlow 反過來會利用在 C 和 C++ 環境中實施的例程來實現高性能,提供精確度,并解放開發者以提高其工作效率。因此,在 8 個月的時間里,我們的團隊從頭開始構建網絡原型,并在全球最大的高性能計算 (HPC) 系統 Summit 上對其性能與擴展作出了優化。

我們相信,此項目能夠展示出研究人員長期推測的 HPC 與 AI 軟件堆棧的實際融合效果,即以 C/C++ 編寫的高性能庫 (CuDNN) 和框架 (TensorFlow),以及通過 Python 公開的高效接口。同理,我們還在 NCCL 和 MPI 中實施經高度優化且基于拓撲感知的通信集合,但通過簡單高效的 Horovod 接口實現公開。展望未來,我們相信,在助力科學家及更廣泛的研究社區探索更復雜架構的過程中,為混合并行模式(數據、模型、流水線)提供透明支持將至關重要。

深度學習硬件:GPU 和混合精度

本次項目利用 NVIDIA Volta GPU 來訓練 DeepLabv3+ 分割網絡。在混合精度模式下,Volta 上可達到的峰值性能為 125 萬億次浮點運算。該模式由 NVIDIA 通過 Tensor 核心 GPU 架構推出,可執行 FP16 精度計算并能以 FP32 精度模式累積結果。在本項目開展之前,該領域存在一個仍待解決的問題,即現實的科學應用能否利用 FP16(不損失精確度)并獲得較高的峰值性能。我們的研究最終證明,對于科學領域的模式識別問題,16 位精度可能足以滿足相關需求。此外,對于擁有 4000 多個計算核心的復雜應用而言,極高的峰值亦有可能實現:在規模龐大的 GPU 集群上,我們的應用實現了每塊 GPU 大約 40 萬億次浮點運算的峰值性能。

我們相信,這些結果為科學應用打開了通往低精度加速器的一扇大門。雖然原始數據集可能具有高精度(64 位或 32 位),但我們或許仍可以在不損失收斂或穩定性的前提下,以低精度模式執行模式識別任務。

開放性挑戰

如要在當代的 HPC 系統上實現百億億級的性能,我們需對所有組件仔細調優,包括硬件(CPU、GPU、NVLink、文件系統、網絡互連)和軟件。雖然我們的項目成功實現了大幅調優、優化和擴展,但我們想指出兩項挑戰,以便向行業及研究社區征求更多意見。

大規模數據管理

得益于 GPU 架構在加快計算方面取得的進展,我們現已能在單個硅處理器上暢享高于 100 萬億次浮點運算級的性能。隨著 GPU 速度越來越快,向其輸送數據的能力會逐漸限制性能。本次項目中,我們對 20 太字節的數據集展開分析,這實際上需要整個 Summit 系統保持每秒大約 4 太字節的 I/O 速率。Summit 上的 GPFS 文件系統根本無法勝任該項任務,在 NERSC Cori 系統的 Lustre 文件系統上執行的類似實驗也以徹底失敗而告終。對于這兩種情況,在節點本地 NVMe上暫存數據和突發緩沖區技術便顯得至關重要。

傳統的 HPC 文件系統主要用于支持以寫入為主的工作負載;而深度學習工作負載則屬于讀取密集型負載,對數據帶寬和元數據操作速率要求頗高。如要支持大規模深度學習工作負載,我們可能必須先對緩存分層、分片和混編操作提供透明支持。

大規模收斂

提供深度學習解決方案的時間由兩部分構成:計算擴展效率和統計擴展效率。我們的研究已經展示出卓越的計算擴展性能,并且提供了許多有關系統級注意事項的建議。一個未解決的問題是,如何使用 SGD(隨機梯度下降)的其中一個收斂屬性取代大批量(在本項目中,批量大小高于 27000)。

在 HPC 資源上提供高度并行性具有正反兩方面作用。如要以超高并發級別在大規模資源上運行,我們需在短時間內對超參數進行調優。有關收斂算法行為的啟發式方法可能會或不會繼承自較小規模的運行。盡管目前對于選擇各類超參數所產生效果的實證評估都很合理,但我們預計,科學界將需要更好的指導原則,以及用于解決新問題的收斂保證。

我們相信,在解決收斂問題的過程中,進一步開發 LARS 與 LARC 等新算法和潛在的高階優化方法將是至關重要的一環。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4743

    瀏覽量

    129009
  • 人工智能
    +關注

    關注

    1792

    文章

    47354

    瀏覽量

    238832
  • 深度學習
    +關注

    關注

    73

    文章

    5504

    瀏覽量

    121246

原文標題:攀登百億億級深度學習之巔

文章出處:【微信號:tensorflowers,微信公眾號:Tensorflowers】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    AI人工智能技術主要應用于什么方面,給未來帶來什么影響?

    解決復雜的決策問題到優化日常生活中的各類服務,AI的應用領域廣泛而深入,以下將詳述其主要應用場景及所帶來的深遠影響。 在工業生產中,人工智能通過機器人技術、自主控制和預測性維護等手段重塑了制造業格局。基于機器
    的頭像 發表于 11-05 18:11 ?497次閱讀

    AI干貨補給站 | 深度學習與機器視覺的融合探索

    在智能制造的浪潮中,阿丘科技作為業界領先的工業AI視覺平臺及解決方案提供商,始終致力于推動AI+機器視覺技術的革新與應用。為此,我們特別開設了「AI干貨補給站」專欄,分享此領域的基礎知
    的頭像 發表于 10-29 08:04 ?231次閱讀
    <b class='flag-5'>AI</b>干貨補給站 | <b class='flag-5'>深度</b><b class='flag-5'>學習</b>與機器視覺的融合探索

    GPU深度學習應用案例

    GPU在深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度學習
    的頭像 發表于 10-27 11:13 ?407次閱讀

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習
    的頭像 發表于 10-23 15:25 ?869次閱讀

    AI for Science:人工智能驅動科學創新》第4章-AI與生命科學讀后感

    很幸運社區給我一個閱讀此書的機會,感謝平臺。 《AI for Science:人工智能驅動科學創新》第4章關于AI與生命科學的部分,為我們揭示了人工智能技術在生命科學領域中的廣泛應用和深遠影響
    發表于 10-14 09:21

    FPGA做深度學習能走多遠?

    。FPGA的優勢就是可編程可配置,邏輯資源多,功耗低,而且賽靈思等都在極力推廣。不知道用FPGA做深度學習未來怎樣發展,能走多遠,你怎么看。 A:FPGA 在深度
    發表于 09-27 20:53

    深度學習中的時間序列分類方法

    時間序列分類(Time Series Classification, TSC)是機器學習深度學習領域的重要任務之一,廣泛應用于人體活動識別、系統監測、金融預測、醫療診斷等多個
    的頭像 發表于 07-09 15:54 ?1001次閱讀

    基于AI深度學習的缺陷檢測系統

    在工業生產中,缺陷檢測是確保產品質量的關鍵環節。傳統的人工檢測方法不僅效率低下,且易受人為因素影響,導致誤檢和漏檢問題頻發。隨著人工智能技術的飛速發展,特別是深度學習技術的崛起,基于AI深度
    的頭像 發表于 07-08 10:30 ?1487次閱讀

    人工智能、機器學習深度學習是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機器學習(Machine Learning, ML)和深度學習(Deep Learning,
    的頭像 發表于 07-03 18:22 ?1323次閱讀

    人工智能深度學習的五大模型及其應用領域

    隨著科技的飛速發展,人工智能(AI)技術特別是深度學習在各個領域展現出了強大的潛力和廣泛的應用價值。深度
    的頭像 發表于 07-03 18:20 ?4647次閱讀

    谷歌CEO皮查伊探討AI革命:影響深遠AI將融入日常工作

    在訪談中,主持人首先詢問皮查伊為何選擇使用谷歌的AI,他回應稱,AI將對我們的生活產生深遠影響。“AI的應用多種多樣,能提升用戶體驗,簡化工
    的頭像 發表于 05-28 15:00 ?585次閱讀

    深度解析深度學習下的語義SLAM

    隨著深度學習技術的興起,計算機視覺的許多傳統領域都取得了突破性進展,例如目標的檢測、識別和分類等領域。近年來,研究人員開始在視覺SLAM算法中引入
    發表于 04-23 17:18 ?1306次閱讀
    <b class='flag-5'>深度</b>解析<b class='flag-5'>深度</b><b class='flag-5'>學習</b>下的語義SLAM

    FPGA在深度學習應用中或將取代GPU

    基礎設施,人們仍然沒有定論。如果 Mipsology 成功完成了研究實驗,許多正受 GPU 折磨的 AI 開發者將從中受益。 GPU 深度學習面臨的挑戰 三維圖形是 GPU 擁有如此大的內存和計算能力
    發表于 03-21 15:19

    FPGA的力量:2024年AI計算領域的黑馬?

    、效率和可擴展性等方面的挑戰。在這一背景下,現場可編程門陣列(FPGA)以其獨特的優勢逐漸嶄露頭角,并有望在2024年對AI領域產生深遠影響
    的頭像 發表于 03-07 09:37 ?933次閱讀
    FPGA的力量:2024年<b class='flag-5'>AI</b>計算<b class='flag-5'>領域</b>的黑馬?

    揭秘AI與半導體深度融合背后的創新力量

    隨著科技的飛速發展,人工智能(AI)與半導體產業正以前所未有的速度深度融合。這一融合不僅推動了半導體技術的進步,更為AI的廣泛應用和商業化提供了堅實的基礎。本文旨在探討這種深度融合將如
    的頭像 發表于 02-22 10:09 ?1131次閱讀
    揭秘<b class='flag-5'>AI</b>與半導體<b class='flag-5'>深度</b>融合背后的創新力量
    主站蜘蛛池模板: xxxx69日本| 久久热最新网站获取3| 美女扒开尿孔| 99久久网站| 人和拘一级毛片| 国产精品自拍| 亚洲欧美中文日韩v在线| 理论片午午伦夜理片久久| hdsex老太婆70| 神马电影院午夜神福利在线观看| 国产精品人妻系列21P| 在线免费观看国产| 日本强好片久久久久久AAA| 国内自拍 在线 亚洲 欧美| 97人妻精品全国免费视频| 日日操天天操夜夜操| 玩50岁四川熟女大白屁股直播| 在线播放成人无码日| 老司机福利在 线影院| 在线伦理电影网| 免费看a视频| 边摸边吃奶边做下面视频| 日本xxx护士与黑人| 人妻互换免费中文字幕| 扒开屁股眼往里面夹东西| 亚洲精品免费网站| 青草国产在线视频免费| 红桃视频国产AV| 岛国大片在线观看完整版| 在教室伦流澡到高潮HNP视频| 色欲AV精品人妻一区二区三区| 久久视频这里只精品99re8久| 国产 亚洲 日韩 欧美 在线观看 | 日本阿v直播在线| 九九九精品国产在线| 第七色 夜夜撸| 18禁黄无遮挡禁游戏在线下载| 性虎成人网| 囚禁固定在调教椅上扩张H| 久久热在线视频精品1| 国产香蕉视频在线播放|