色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Exaflop簡史

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-08-03 09:54 ? 次閱讀

Exaflop 是衡量超級計算機性能的單位,表示該計算機每秒可至少進行百億億次浮點運算。

為了解決這個時代最復雜的問題,比如如何治療像新冠肺炎和癌癥這樣的疾病、以及如何緩解氣候變化等。計算機的計算量正在不斷增加。

所有這些重大挑戰將計算帶入了現今的百億億次級時代,頂級性能通常以 exaflops 來衡量。

什么是 Exaflop?

Exaflop 是衡量超級計算機性能的單位,表示該計算機每秒可以至少進行 10^18 或百億億次浮點運算。

Exaflop 中的 exa-前綴表示“百億億”,即 10 億乘以 10 億或1的后面有 18 個零。同樣,單個 exabyte 的內存子系統可以儲存百億億字節的數據。

exaflop 中的“flop”是浮點運算的縮寫。exaflop/s 是表示系統每秒浮點運算次數的單位。

浮點是指所有數字都用小數點表示的計算方法。

1000 Petaflop = 1 Exaflop

前綴 peta- 表示 10^15,即 1 的后面有 15 個零。因此 1 exaflop 等于 1000 petaflop。

c4a277d0-1263-11ed-ba43-dac502259ad0.png

1 exaflop 的計算量到底有多大?相當于十億人中的每個人都拿著十億個計算器。

如果他們同時按下等號,就是進行了 1 個 exaflop。

擁有 Big Red 200 和其他幾臺超級計算機的印第安納大學表示,exaflop 計算機的速度相當于一個人每秒鐘進行一次計算,并一直計算 31,688,765,000 年。

Exaflop 簡史

在超級計算發展史的大部分時間里,一次浮點運算就是一次,但隨著工作負載引入 AI ,這種情況也發生了變化。

人們開始使用最高的精度格式來表示數字,這種格式被稱為雙精度,由 IEEE 浮點運算標準定義。它之所以被稱為雙精度或 FP64,是因為計算中的每個數字都需要以 64 位用 0 或 1 表示的數據塊表示,而單精度為 32 位。

雙精度使用 64 位確保每個數字都精確到很細微的部分,比如 1.0001 + 1.0001 = 2.0002,而不是 1 + 1 = 2。

這種格式非常適合當時的大部分工作負載,比如從原子到飛機等全部需要確保模擬結果接近于真實的模擬。

因此,當 1993 年全球最強大的超級計算機榜單 TOP500 首次發布時,衡量 FP64 數學性能的 LINPACK 基準(又稱HPL)自然成為了默認的衡量標準。

AI 大爆炸

十年前,計算行業發生了 NVIDIA 首席執行官黃仁勛所說的 AI 大爆炸。

這種強大的新計算形式開始在科學和商業應用上展現出重大成果,而且它運用了一些非常不同的數學方法。

深度學習并不是模擬真實世界中的物體,而是在堆積如山的數據中篩選,以找到能夠帶來新洞察的模式。

這種數學方法需要很高的吞吐量,所以用經過簡化的數字(比如使用 1.01 而不是 1.0001)進行大量計算要比用更復雜的數字進行少量計算好得多。

因此 AI 使用 FP32、FP16 和 FP8 等低精度格式,通過 32 位、16 位和 8 位數讓用戶更快地進行更多計算。

混合精度不斷發展

AI 使用 64 位數就如同在周末外出時帶著整個衣柜。

研究人員一直在積極地為 AI 尋找理想的低精度技術。

例如首個 NVIDIA Tensor Core GPU——Volta,它使用了混合精度,并以 FP16 格式執行矩陣乘法,然后用 FP32 累積結果以獲得更高的精度。

Hopper 通過 FP8 加速

最近,NVIDIA Hopper 架構首次發布了速度更快的低精度 AI 訓練方法。Hopper Transformer Engine 能夠自動分析工作負載,盡可能采用 FP8 并以 FP32 累積結果。

在進行計算密集度較低的推理工作,比如在生產中運行 AI 模型時,TensorFlow 和 PyTorch 等主要框架通過支持 8 位整數實現快速性能,因為這樣就不需要使用小數點來完成工作。

好消息是,NVIDIA GPU 支持上述所有精度格式,因此用戶可以實現每個工作負載的最優加速。

去年,IEEE P3109 委員會開始為機器學習中使用的精度格式制定行業標準。這項工作可能還需要一到兩年的時間才能完成。

一些模擬軟件在低精度工作中大放異彩

雖然 FP64 在模擬工作中仍然很受歡迎,但當低精度數學能夠更快提供可用結果時,許多人會使用后者。

c4d88d16-1263-11ed-ba43-dac502259ad0.png

影響 HPC 應用程序性能的因素各不相同

例如,研究人員用 FP32 運行廣受歡迎的汽車碰撞模擬器——Ansys LS-Dyna。基因組學也傾向于使用低精度數學。

此外,許多傳統的模擬開始在部分工作流程中采用 AI。隨著越來越多的工作負載使用 AI,超級計算機需要支持較低的精度才能有效運行這些新興應用。

基準與工作負載同步發展

在認識到這些變化后,包括 Jack Dongarra(2021 年圖靈獎得主和 HPL 的貢獻者)在內的研究人員在 2019 年首次發布了 HPL-AI,這項新基準更適合測量新的工作負載。

Dongarra 在 2019 年的博客中表示:“無論是技術不斷優化的傳統模擬,還是 AI 應用,混合精度技術對于提高超級計算機的計算效率越來越重要。正如 HPL 實現了對雙精度能力的基準測試一樣,這種基于 HPL 的新方法可以對超級計算機的混合精度能力進行大規模基準測試。”

尤利希超級計算中心主任 Thomas Lippert 同意了這一觀點。

他在去年發表的一篇博客中表示:“我們使用 HPL-AI 基準是因為它既能夠準確地衡量日益增加的 AI 和科學工作負載中的混合精度工作,也能反映準確的 64 位浮點計算結果。”

現今的 Exaflop 系統

在 6 月的一份報告中,全球 20 個超級計算機中心提交了 HPL-AI 結果,其中有三個中心提供了超過 1 exaflop 的性能。

在這些系統中,橡樹嶺國家實驗室的超級計算機在 HPL 上的 FP64 性能也超過了 1 exaflop。

c517a064-1263-11ed-ba43-dac502259ad0.png

2022 年 6 月 HPL-AI 結果的采樣器

兩年前,一非傳統系統首次達到 1 exaflop。這臺由 Folding@home 聯盟組裝的眾源超級計算機在呼吁幫助抵御新冠疫情后,達到了這一里程碑,到現在已有超過 100 萬臺計算機加入其中。

理論和實踐中的Exaflop

許多組織從那時起就已開始安裝理論峰值性能超過 1 exaflop 的超級計算機。需要注意的是,TOP500 榜單同時發布 Rmax(實際)和 Rpeak(理論)分數。

Rmax 指計算機實際表現出的最佳性能。

Rpeak 是一切系統都處于高水平運行時的最高理論性能,而這幾乎從未發生過。該數值的計算方法通常是將系統中的處理器數量乘以其時鐘速度,然后再將結果乘以處理器在一秒鐘內可執行的浮點運算數。

因此,如果有人說他們的系統達到 1 exaflop,請詢問他說的是 Rmax(實際)還是Rpeak(理論)。

Exaflop 時代的眾多指標

這也是新百億億次時代的眾多細微變化之一。

值得注意的是,HPL 和 HPL-AI 屬于合成基準,即它們衡量的是數學程序的性能,而不是真實世界的應用。MLPerf 等其他基準則基于真實世界中的工作負載。

最后,衡量系統性能的最佳標準當然是它運行用戶應用程序的情況。該衡量標準不是基于 exaflop,而是基于投資回報率。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5013

    瀏覽量

    103247
  • 計算機
    +關注

    關注

    19

    文章

    7518

    瀏覽量

    88193
  • AI
    AI
    +關注

    關注

    87

    文章

    31099

    瀏覽量

    269435

原文標題:什么是 Exaflop?

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    TOP500第二臺E級超算出現,AMD要在HPC上逆襲英特爾?

    Exaflop/s的HPL算力成績,在開發人員的優化下,相較上次提交的1.194 Exflop/s成績還有所提升。Frontier集成
    的頭像 發表于 05-15 09:11 ?2437次閱讀
    TOP500第二臺E級超算出現,AMD要在HPC上逆襲英特爾?

    翠展微電子完成數億元B+輪融資

    本輪融資由國科長三角資本領投,同鑫資本和銀茂控股等跟投,本輪融資資金將主要用于新產線建設、新設備購置以及新產品研發,以全面提升翠展微在IGBT模塊領域的生產能力和技術創新水平。翠展微目標在2025年具備交付超過300萬套IGBT模塊的能力,這將使其在新能源汽車供應鏈中占據更加重要的位置。
    的頭像 發表于 01-09 09:26 ?5次閱讀

    芯科科技預測2025年無線物聯網的發展趨勢

    隨著CES展會敲開2025年科技行業最新發展的序幕,人工智能(AI)依然占據了重要的版面,并且正逐步與物聯網結合迸發更多創新應用。對此,Silicon Labs(芯科科技)首席技術官兼技術和產品開發高級副總裁Daniel Cooley先生也針對2025年AI和物聯網的趨勢提出了看法,并通過本文整理出四大發展方向:云功能下沉到嵌入式應用、核心技術的演進與集成、重新思考無線標準、物聯網作為人工智能經濟的神經系統,以與行業人士一同分享未來世界可能的樣貌。
    的頭像 發表于 01-09 09:22 ?9次閱讀

    高精度焊接數據記錄儀在工業應用中的重要性分析

    高精度焊接數據記錄儀在現代工業生產中扮演著至關重要的角色。隨著制造業向智能化、自動化方向的不斷推進,對焊接質量的要求也越來越高。焊接作為制造過程中不可或缺的一環,其質量直接影響到產品的整體性能和安全性。因此,如何確保焊接過程的穩定性和可靠性成為企業關注的重點。高精度焊接數據記錄儀通過實時監測并記錄焊接過程中的各項參數,為焊接質量控制提供了科學依據,對于提升產
    的頭像 發表于 01-09 09:22 ?11次閱讀

    安森美(onsemi)的超聲波傳感器解決方案的未來趨勢和創新

    簡要介紹超聲波傳感器的發展歷程,并結合當前和未來的應用,預測未來幾年超聲波傳感器的應用領域。? ? ? 汽車超聲波傳感器簡史 超聲波技術常用于檢測物體和發現固體材料中的缺陷,其首項專利可以追溯到上世紀30年代。一直
    的頭像 發表于 11-23 14:53 ?1047次閱讀

    名單公布!【書籍評測活動NO.50】親歷芯片產線,輕松圖解芯片制造,揭秘芯片工廠的秘密

    的知識門檻低,又獨家揭秘了芯片制造工廠的運營到管理,適用于更大讀者群。本書非常適合對芯片這個話題(不管是技術還是產業運營等)感興趣的IC從業者和大眾讀者。 相信閱讀過《芯路》《半導體簡史》《圖解
    發表于 11-04 15:38

    【「ARM MCU嵌入式開發 | 基于國產GD32F10x芯片」閱讀體驗】+書籍整體概況

    系統的概念,ARM簡史,以及前期的準備工作,視頻時長112min。 第二章介紹GD32F10x的架構,包含計算機架構,Cortex-M3架構;第三章通用輸入/輸出端口GPIO介紹,內容非常豐富,介紹
    發表于 08-25 22:48

    Perforce靜態代碼分析專家解讀MISRA C++:2023?新標準:如何安全、高效地使用基于范圍的for循環,防范未定義行

    Frank van den Beuken博士的博客系列,本期為第三篇。 在前兩篇系列文章中,我們向您介紹了 新的MISRA C++ 標準 和 C++簡史 。本文,我們將仔細研究C++中以for循環為中心
    的頭像 發表于 06-18 12:57 ?451次閱讀

    進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片

    72個 NVLink 連接的Blackwell GPU 和 30TB 的統一內存,在130TB/s 的計算結構上運行,GB200 NVL72 在單個機架中創造了一個exaFLOP 級別的 AI 超級
    發表于 05-13 17:16

    寬帶上網技術簡史(2024版)

    在如今這個數字時代,寬帶已經成為我們每個人、每個家庭的生活必需品。如果沒有它,我們會坐立難安、心緒不寧。那么,你知道寬帶背后的技術原理嗎?從最早期的56k“貓”撥號,到現在的千兆城市、千兆家庭,我們的寬帶技術到底經歷了怎樣的變革?今天這篇文章,我們就來詳細了解一下——“寬帶的故事”。█xDSL和ISDN下面這個界面,你見過嗎?我相信很多70后80后的小伙伴,
    的頭像 發表于 04-20 08:05 ?1059次閱讀
    寬帶上網技術<b class='flag-5'>簡史</b>(2024版)

    算力簡史,是一段波瀾壯闊的歷史

    今天這篇文章,我將給大家詳細介紹一下人類算力的演進過程。這是一段波瀾壯闊的歷史,值得我們駐足與回憶。Chrent人工算力時代人類對算力的利用,從遠古時期就已經開始了。大腦,是我們最原生的算力工具。依靠大腦所提供的算力,我們才得以生存。動物也有大腦,也有算力,但是遠遠不如人類強勁。在漫長的進化過程中,人類的大腦越來越發達,最終幫助自己從萬物生靈中脫穎而出,成為
    的頭像 發表于 04-04 08:26 ?678次閱讀
    算力<b class='flag-5'>簡史</b>,是一段波瀾壯闊的歷史

    什么是SaaS?中國SaaS發展簡史

    SaaS融合了軟件與云計算的優勢,在這種服務模式下,用戶不僅獲得了軟件的功能,更重要的是,用戶擁有數據與隱私權。
    發表于 03-14 11:30 ?754次閱讀
    什么是SaaS?中國SaaS發展<b class='flag-5'>簡史</b>

    單片機發展簡史

    單片機出現的歷史并不長,但發展十分迅猛。它的產生與發展和微處理器(CPU)的產生與發展大體同步,自1971年美國英特爾公司首先推出4位微處理器以來,它的發展到目前為止大致可分為5個階段。
    發表于 03-14 11:22 ?1375次閱讀

    全球AGV發展簡史

    AGV(自動引導車)是一種自動化材料搬運機器人,自上世紀50年代發展至今,應用范圍不斷擴大,已廣泛應用于制造、倉庫、醫院和機場等領域。現代AGV具備更高安全性和承載能力,可運輸更多種物品,并可通過與云計算和大數據分析結合實現更智能的自動化控制。未來,AGV技術將持續改進和完善,成為制造業和物流業智能化發展的重要力量。
    的頭像 發表于 02-27 18:20 ?1289次閱讀

    C++簡史:C++是如何開始的

    MISRA C++:2023,MISRA? C++ 標準的下一個版本,來了!為了幫助您做好準備,我們介紹了 Perforce 首席技術支持工程師 Frank van den Beuken 博士撰寫的 MISRA C++:2023 博客系列的第二部分。 在這篇博客中,我們將深入探討 C++ 的歷史、編程語言多年來的發展歷程以及它的下一步發展方向。
    的頭像 發表于 01-11 09:00 ?622次閱讀
    C++<b class='flag-5'>簡史</b>:C++是如何開始的
    主站蜘蛛池模板: 精品午夜中文字幕熟女人妻在线| 亚洲综合日韩中文字幕v在线| 国产爱豆果冻传媒在线观看视频| 亚洲色欲H网在线观看| 欧洲电影巜肉欲丛林| 久久亚洲国产成人影院| 国产亚洲精品久久久999蜜臀| java农村野外妇女hd| 在线免费观看国产精品| 午夜一区二区三区| 妻子的秘密HD观看| 美女屁股软件| 久久久久琪琪精品色| 国产在线精品亚洲第一区| 国产成人高清精品免费观看| free性中国hd护士高清| 4k岛国精品午夜高清在线观看| 亚洲欧美日韩国产手机在线| 乌克兰内射私拍| 日欧一片内射VA在线影院| 欧美日韩一区不卡在线观看| 久久视频精品3线视频在线观看| 湖南电台在线收听| 国产亚洲精品欧洲在线视频| 国产69精品久久久久麻豆 | 一本道中文无码亚洲| 午夜福利合集1000在线| 肉耽高h一受n攻| 日本免费无码A专区在线观看| 欧美黑白配性xxxxx| 男人和女人一起愁愁愁很痛| 久久伊人男人的天堂网站| 国内精品久久久久影院亚洲| 国产人妻精品午夜福利免费不卡 | 狠狠射首页| 海角国精产品一区一区三区糖心| 国产乱码精品AAAAAAAA| 国产99视频精品一区| 国产99视频在线观看| 搞基福利社| 国产精品嫩草影视在线观看|