色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

超級計算機和FPGA

e9Zb_gh_8734352 ? 來源:FPGA技術聯(lián)盟 ? 作者:FPGA技術聯(lián)盟 ? 2020-11-02 18:17 ? 次閱讀

01

超級計算機和FPGA

1、超算?

大數(shù)據、基因科學、金融工程、人工智能、新材料設計、制藥和醫(yī)療工程、氣象災害預測等領域所涉及的計算處理,家用個人計算機級別的性能是遠遠不夠的。超級計算機(以下簡稱超算)就是為了解決這種超大規(guī)模的問題而開發(fā)的。超算并沒有一個明確的定義, 通常所說的超算大致是性能在家用計算機的1000倍以上,或者理論性能在50 TFLOPST以上的系統(tǒng)。

FPGA作為可以提高超算能效比的通用器件受到了廣泛關注。從性能、靈活性和功耗效率方面,CPU、FPGA和ASIC里面FPGA走的是中間路線。FPGA的功耗效率是高于CPU的,靈活性高于ASIC;從功耗效率、性能保障性和算法適用性來看,F(xiàn)PGA應該是碾壓GPU的。GPU適用的算法非常有限,拿到一個算法,能否達到最終的性能是有風險的;早期GPU的實現(xiàn)算法非常容易,但是自從Xilinx在高層次綜合HLS方面深度耕耘后,F(xiàn)PGA的編程容易度也降低了很多。其優(yōu)勢是不但可以作為運算加速器,還可以作為連接器件讓超算中眾多的運算處理器和運算加速器更緊密地結合。此外,IoT技術正在推動硬件基礎設施的升級,今后運算和數(shù)據的集中化和分散化進程都會加速發(fā)展。在這個進程當中,為了運用超算技術,也要求數(shù)據中心具備更加嶄新和有效的方法和技術口。除了大規(guī)模計算以外,從強化升級社會IT基礎建設的角度上看,超算技術也越來越必要。因此,PLD/FPGA必將會在超算中得到更廣泛的運用。

02

超算中的FPGA應用案例

1、首先是筑波大學20世紀70年代開始研發(fā)用于科學計算的并行計算機PACS/PAX,而HA-PACS是該系列的第8代。PACS/PAX系列自開發(fā)之初就以實現(xiàn)了CPU和內存間的高速互聯(lián)架構而聞名。HA-PACS是PACS/PAX系列中首次采用GPU作為運算加速器的超算。用GPU提高超算性能,還必須要實現(xiàn)能夠充分發(fā)揮GPU高運算性能的并行系統(tǒng)架構。然而,HA-PACS開發(fā)時的GPU存在些問題,導致難以實現(xiàn)高效的并行系統(tǒng)架構。例如在多個GPU間共享數(shù)據時,傳輸前后需要在宿主CPU的主存中進行數(shù)據復制。還有將數(shù)據傳輸從PCle轉為其他通信方式時,很難削減通信延遲。為了改善這些問題,HA-PACS系統(tǒng)基于PEARL ( PCI Express Adaptive and Reliable Link)概念提出了TCA ( Tightly Coupled Accelerato-rs) 技術,并開始開發(fā)實現(xiàn)TCA的PEACH2板卡。

那么由CPU+GPU+FPGA組成的異構系統(tǒng)的性能又如何呢? HA-PACS/TCA是一個只有64個節(jié)點的小規(guī)模系統(tǒng),理論性能為364.3TFLOPS,實測性能為277.1 TFLOPS, 2013年11月位列TOP500的第134名。另外,由于該系統(tǒng)達到了3.52 GFLOPS/W的高能效比,在2013年11月和2014年6月的Green500榜中位列第3名。HA-PACS/TCA的基礎部分采用GPU和CPU組合來實現(xiàn)高性能、低功耗的運算,再加上基于FPGA的PEACH2的使用,進一步提高了跨學科合作應用中的運算性能。

PEACH2提供了可以讓多個GPU直接互聯(lián)通信的框架。具體來說,PEACH2擴展了PCle通信連接,并實現(xiàn)了GPU間的直接通信,從而達到了提高數(shù)據傳輸效率的目的”。技術上,PEACH2實現(xiàn)了一種路由,可以將PCIe協(xié)議中Root Complex和多個End Point間的數(shù)據包在多個節(jié)點間傳輸。

原本的數(shù)據傳輸路徑GPUmem→CPUmem→(InfiniBand/MPI)→CPUmem→GPU mem, 縮短為了GPU mem→(PCIe/PEACH2)→GPU mem,即GPU間的直連傳輸。此外,通信協(xié)議的統(tǒng)一也實現(xiàn)了比InfiniBand更低的延遲。

下面一起看一下PEACH2的通信性能。PEACH2具備4個PCleGen2 x8 (8通路)端口。這里的端口數(shù)量上的限制并非源于PEACH2本身,而是因為所采用的FPGA器件的物理限制,這點可以通過FPGA制造技術的提升而改善。PEACH2中GPU對GPU的DMAPing-pong延遲為2.0us ( 100萬分之2秒),CPU對CPU的延遲為1.8 us,可以說通信延遲十分小了。PEACH2能達到這種性能要歸功于使用了PLD/FPGA,正因如此它才能將傳輸開銷降低到2.0 us的程度。這個性能和MVAPICH2 v2.0-GDR ( 帶GDR : 4.5us ;不帶GDR : 19 us) 相比已經足夠了。FPGA的采用實現(xiàn)了輕量化協(xié)議、多RootComplex互聯(lián)、Block-Stride通信硬件,從而獲得了高應用性能。此外,在Ping-pong帶寬方面,PEACH2 的CPU對CPU的DMA傳輸性能約為3.5 GB/s,達到了理論性能的95%;GPU對GPU的DMA性能約為2.8GB/s。然而,當負載大小超過512 KB時MVAPICH2 v2.0-GDR的性能更高,可以在實際應用時根據需求進行選擇。綜上,無論研究領域或商業(yè)系統(tǒng),今后都會繼續(xù)探索能夠發(fā)揮PLD/FPGA優(yōu)勢的高效方法,從而提高系統(tǒng)的整體性能。

2、其次是Cray Research,該公司的超級計算機:XD1就有用上FPGA,XD1用的是Xilinx(賽靈思)公司的VIRTEX系列FPGA。XD1機內有所謂的FPGA應用程序加速模塊(FPGA ApplicaTIon AcceleraTIon Module),模塊等于是機內的一個小型輔助運算系統(tǒng),VIRTEX是模塊內的主控芯片,等于是一個協(xié)同處理器(Co-Processor),只不過這個協(xié)同處理器與ASIC型式的協(xié)同處理器不同,F(xiàn)PGA具有可程序化的功效,因此VIRTEX是一顆可程序化的協(xié)同處理器。運算模塊內除了有FPGA的協(xié)同處理器外,處理器也必須搭配內存才能行使運算,所以FPGA會再連接4顆QDR II SRAM(極高速性的內存),然后模塊一方面用HyperTransport與XD1的主處理器相連,另一方面也連往XD1的特有高速I/O界面:RapidArray。

接著,由于高效運算多是執(zhí)行大量重復性的運算,例如氣象預測、風洞測試等,所以可以將執(zhí)行的應用程序轉化成FPGA內的組態(tài)(ConfiguraTIon)程序,以硬件線路方式來執(zhí)行運算,如此將比過往用純軟件方式執(zhí)行快上數(shù)倍至數(shù)十倍的效能,甚至在特定的應用運算上能達一百倍以上的效能。

更仔細而言,其實是將整個應用程序中重復性最高、且最經常用的函數(shù)庫進行轉化,并以FPGA的硬件線路執(zhí)行,如此就能獲得最大的加速效果。

Cray如此,與Cray同為高效運算市場的另一家業(yè)者:SGI(視算科技)也實行相同的作法,SGI提出所謂的RASC(Reconfigurable ApplicaTIon Specific Computing,可組態(tài)化應用程序性運算,)RASC也是以模塊方式讓原有的超級計算機能獲得加速效果。

SGI的作法與Cray有部分相同也有部分不同,Cray是將模塊設置在原有超級計算機的機內,而SGI則是運用既有超級計算機機箱的上部來加搭加速模塊,不過就功效機制而言兩者異曲同工,此外兩者都使用Xilinx的VIRTEX系列FPGA,但是內存與I/O部分兩家也實行不同的設計,Cray是使用QDR II SRAM,SGI則是可實行QDR SRAM,或者也可用DDR2 SDRAM,前者容量少(80MB)但速度快,后者容量大(20GB)而速度慢,提供兩種選擇的原因是可依據不同的應用程序特性來選用。

另外,高效運算業(yè)者通常有獨門的機內通訊傳輸技術,RapidArray即是Cray的獨家技術,而SGI自身也有獨家的傳輸技術,即NUMAlink 4(已是第四代技術),所以SGI的RASC不是使用RapidArray,而是使用NUMAlink 4。

其實Cray系統(tǒng)內所用的FPGA模塊是與DRC Computer公司技術合作而成,因此DRC Computer自身也有提供相近方案,DRC的RPU(Reconfigurable Processor Units)同樣也是用FPGA來加速,一樣是用Xilinx VIRTEX FPGA,但與主系統(tǒng)間的連接接口改成AMD Opteron處理器的接座接口,如此一般使用AMD Opteron處理器的x86服務器也可以加裝RPU來提升高效運算的效能。

原文標題:FPGA應用案例——超級計算機

文章出處:【微信公眾號:FPGA技術聯(lián)盟】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關注

    關注

    1638

    文章

    21861

    瀏覽量

    610210
  • 計算機
    +關注

    關注

    19

    文章

    7589

    瀏覽量

    89482
  • 人工智能
    +關注

    關注

    1801

    文章

    48259

    瀏覽量

    243573

原文標題:FPGA應用案例——超級計算機

文章出處:【微信號:gh_873435264fd4,微信公眾號:FPGA技術聯(lián)盟】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    NVIDIA推出個人AI超級計算機Project DIGITS

    NVIDIA 推出個人 AI 超級計算機 NVIDIA Project DIGITS,全球的 AI 研究員、數(shù)據科學家和學生都可獲取 NVIDIA Grace Blackwell 平臺的強大功能。
    的頭像 發(fā)表于 01-08 11:03 ?571次閱讀

    云端超級計算機使用教程

    云端超級計算機是一種基于云計算的高性能計算服務,它將大量計算資源和存儲資源集中在一起,通過網絡向用戶提供按需的
    的頭像 發(fā)表于 12-17 10:19 ?361次閱讀

    量子計算機與普通計算機工作原理的區(qū)別

    超越世界上最強大的超級計算機,完成以前不可想象的任務!這意味著量子計算機可能會徹底改變我們的生活。 在本文中,我們將先了解普通計算機的工作原理,再深入探討量子
    的頭像 發(fā)表于 11-24 11:00 ?947次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區(qū)別

    NVIDIA 以太網加速 xAI 構建的全球最大 AI 超級計算機

    市的 Colossus 超級計算機集群達到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網網絡平臺,該平臺是專為多租戶
    發(fā)表于 10-30 09:33 ?234次閱讀
    NVIDIA 以太網加速 xAI 構建的全球最大 AI <b class='flag-5'>超級</b><b class='flag-5'>計算機</b>

    丹麥推出首臺AI超級計算機Gefion

    近日,丹麥正式推出了該國首臺人工智能超級計算機,命名為Gefion,以紀念丹麥神話中的女神。此次揭幕儀式由英偉達首席執(zhí)行官黃仁勛與丹麥國王共同出席,彰顯了該項目的重要性和影響力。 Gefion AI
    的頭像 發(fā)表于 10-29 15:13 ?610次閱讀

    NVIDIA助力丹麥發(fā)布首臺AI超級計算機

    這臺丹麥最大的超級計算機由該國政府與丹麥 AI 創(chuàng)新中心共同建設,是一臺 NVIDIA DGX SuperPOD 超級計算機
    的頭像 發(fā)表于 10-27 09:42 ?681次閱讀

    云端超級計算機怎么用

    云端超級計算機是一種基于云計算的高性能計算服務,它將大量計算資源和存儲資源集中在一起,通過網絡向用戶提供按需的
    的頭像 發(fā)表于 10-18 10:14 ?319次閱讀

    晶體管計算機和電子管計算機有什么區(qū)別

    晶體管計算機和電子管計算機作為計算機發(fā)展史上的兩個重要階段,它們在多個方面存在顯著的區(qū)別。以下是對這兩類計算機在硬件、性能、應用以及技術發(fā)展等方面區(qū)別的詳細闡述。
    的頭像 發(fā)表于 08-23 15:28 ?2941次閱讀

    借助NVIDIA超級計算機加速量子計算發(fā)展

    科學期刊《自然》(Nature)本月早些時候發(fā)表了一項研究,通過使用 NVIDIA 驅動的超級計算機,驗證了量子計算的商業(yè)化途徑。
    的頭像 發(fā)表于 07-25 09:55 ?691次閱讀

    工業(yè)計算機與普通計算機的區(qū)別

    在信息化和自動化日益發(fā)展的今天,計算機已經成為了我們日常生活和工作中不可或缺的工具。然而,在計算機領域中,工業(yè)計算機和普通計算機雖然都具備基本的計算
    的頭像 發(fā)表于 06-06 16:45 ?2006次閱讀

    馬斯克計劃打造超級計算機推動AI發(fā)展

    科技巨頭埃隆·馬斯克近日在投資者會議上透露,其人工智能初創(chuàng)公司xAI正全力籌備打造一臺超級計算機。這臺計算機將作為下一版人工智能聊天機器人Grok的強大后盾,為其提供強大的算力支持。
    的頭像 發(fā)表于 05-28 09:18 ?678次閱讀

    NVIDIA和Recursion利用AI超級計算機加快新藥研發(fā)

    BioHive 由 NVIDIA AI 驅動,用于加速醫(yī)療領域科學家的工作。在全球超級計算機 TOP500 榜單中,它的排名上升了 100 多位。
    的頭像 發(fā)表于 05-16 09:46 ?1452次閱讀
    NVIDIA和Recursion利用AI<b class='flag-5'>超級</b><b class='flag-5'>計算機</b>加快新藥研發(fā)

    富士通使用富岳超級計算機訓練LLM

    盡管富士通的富岳超級計算機不再是超級計算機500強名單中最快的機器,但它仍然是一個非常強大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種工作負載,例如AI。
    的頭像 發(fā)表于 05-13 14:18 ?696次閱讀

    英偉達幫助日本建造混合量子超級計算機

    英偉達正在幫助日本建造混合量子超級計算機,這是日本國家量子計算計劃的一部分。
    的頭像 發(fā)表于 04-23 14:54 ?703次閱讀

    微軟和OpenAI計劃投資1000億美元建造“星際之門”AI超級計算機

    微軟和OpenAI計劃投資1000億美元建造“星際之門”AI超級計算機這一消息屬實。
    的頭像 發(fā)表于 04-11 10:14 ?782次閱讀
    主站蜘蛛池模板: 亚洲熟妇色自偷自拍另类 | 国产亚洲视频在线观看 | 亚洲伊人久久精品 | 被肉日常np快穿高h 被肉日常np高h | 精品国产原创在线观看视频 | a级男女性高爱潮高清试看 A级毛片无码久久精品免费 | 4hu四虎免费影院www | 最新国自产拍天天更新 | 青青青青青青青草 | 午夜福利理论片高清在线 | 成人在线视频免费看 | qovd电影 | 日本高清不卡一区久久精品 | 国产三级在线观看视频 | 亚洲色图影院 | 亚洲福利天堂网福利在线观看 | 快播看av| 秋霞av伦理片在线观看 | 亚洲免费无l码中文在线视频 | 日本精品久久久久中文字幕 | 久久婷婷色一区二区三区 | 人妻免费视频公开上传 | 亚洲一卡二卡三卡四卡2021麻豆 | 又大又硬又爽免费视频 | 亚洲中文有码字幕日本 | 黄 色 网 站 免 费 涩涩屋 | 囯产精品久久久久久久久免费蜜桃 | 亚洲欧美日本中文子不卡 | 自拍视频亚洲综合在线精品 | 国产高清在线a视频大全 | 中文字幕成人在线观看 | 九九热这里只有精品视频免费 | WWWXXXX兽交| 回复术士人生重启在线观看 | 日本内射精品一区二区视频 | 精品AV综合导航 | 麻豆官网md.pub | 女侠含泪巨臀迎合79 | 天天澡夜夜澡人人澡 | 日日啪在线影院百度 | 国产性夜夜性夜夜爽91 |

    電子發(fā)燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品