色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

做通用GPU究竟有多難?

硬件設計 ? 2019-12-31 23:15 ? 次閱讀

根據“牧村波動”(Makimoto’s Wave)顯示,半導體產品未來可能將沿著“標準化”與“定制化”交替發展的路線前進,每十年波動一次。2020 年將至,過去數年我們一直在呼喚AI 芯片和高性能計算芯片,如果 “牧村波動”仍然奏效,那么下一個波峰將是超高靈活度集成的芯片。而這也解釋了為什么英偉達所開創的GPGPU在過去幾年里賺的缽滿盆滿。

其實仔細想想,除了“牧村波動”所昭示的進化規則,通用GPU之所以能夠成為當前的主流趨勢,并引來眾多企業趨之若鶩,至少有一明一潛兩大驅動因素。明面上,現在是異構計算的天下,近年來傳統以CPU為核心的服務器市場增長比較平緩,而GPU服務器的增速迅猛,年增長率據稱超60%。

潛在因素,5G時代的到來推動了物聯網的迅猛發展,應用場景更加豐富多元,這要求云端的計算資源能應對各種復雜場景的需求提供豐富靈活的計算支撐,工程師們肯定更愿意將能“通吃”的芯片焊在服務器上。

打鐵還需自身硬

想要吃到通用GPU這份蛋糕還是需要企業有足夠深厚的功底。相較于開發定制化的AI芯片等,通用GPU在技術上有更高的難度。從硬件角度看,最核心的是指令集。指令集的覆蓋面、顆粒度、效率等決定一款芯片能否覆蓋到足夠寬的應用市場領域,并對軟件開發和產品迭代足夠友好。無論是英偉達還是AMD的GPGPU,指令集都在千條量級,而目前國內的AI芯片指令集大多數都在百條以內。類型與數量的差別映射到硬件高效實現的復雜程度,差距是巨大的,在這方面國內的團隊還存在著一定的差距。另一個重要方面就是基于硬件層的任務管理和智能調度,這可以讓芯片從硬件層即提高算力的利用率,也就是大家常說的實際算力。大多數AI芯片的做法是完全依賴于軟件層的調度實現,但這種方式第一增加了軟件開發的復雜度,第二降低了硬件算力的利用率,第三減緩了軟件棧迭代更新的速度,這在AI領域,面向算法模型、開發環境、應用場景加速更新的大背景下無疑大大增加了產品落地與工程化的難度。

在軟件方面,毫無疑問,最重要的必然是開發生態,GPGPU通過英偉達十多年的耕耘,已經建立起了一個超過160萬開發用戶的龐大而成熟的生態-CUDA。AI芯片則需要搭建全新的生態,它會帶來兩個維度顯著的問題,第一個維度是客戶端,客戶需要冗長的適配期,從原有的開發環境切換到新的軟件生態,這不僅帶來了資源投入,推遲了業務部署時間窗口,增加了業務的不確定性,更嚴重的是不利于保護已有的軟件投資,軟件的很多部分都要重新來寫并適配,這對企業級用戶來講恰恰是非常敏感與慎重的事情。另一個維度是產品開發端,從底層芯片與系統軟件,跳過CUDA層去直接支持開發框架,必然帶來巨大的軟件投入,不停得追趕現有框架的新版本,以及生態巨頭的新框架,這在底層軟件人員缺乏的背景下矛盾顯得尤其突出。

而以上兩點說到底都是需要人來解決的,恰恰在這方面的人才是目前中國企業最缺少的。目前只有英偉達和AMD擁有豐富的團隊,這也側面證明了為什么Intel自己折騰幾年,最后還是請了原AMD RTG顯卡部門負責人Raja、Zen架構的功勛領袖Jim Keller、顯卡技術市場總監Damien Triolet這幾位大神。

曲線救國還是正面突破?

圍繞GPGPU,國外已是龍爭虎斗,反觀國內,能夠洞悉GPGPU發展機遇并付諸行動的芯片廠商少之又少。

華為是為數不多看到通用GPU趨勢的芯片廠商之一,而且看起來正在嘗試兩條腿走路通往GPGPU的路上。一條路是,華為通過其在手機芯片方面的積累,希望從移動端GPU出發,逐步延展至平板電腦端、桌面端、服務器端,走這種從簡單到復雜、從小芯片到大芯片的路徑。

另一條路有點“天龍寺眾高僧合練六脈神劍”的意思。通用GPU復雜、難做,華為就“化繁為簡”,今天先做AI-GPU,明天再做“區塊鏈GPU”,后天再做“超算GPU”……到最后再來個“集大成”,“六脈神劍”通用GPU就成了。看起來很棒對吧?但是這種想法可能過于理想化了。通用GPU不是簡單的“1+1”,十個人會一陽指,也及不上一個人會六脈神劍,一個道理。

筆者還聽說,阿里旗下的芯片部門也想做GPGPU,只不過阿里巴巴的野心大則大矣,只是眼下還沒有足夠大的技術團隊能支持這件事。

其他廠商中,包括寒武紀、依圖、比特大陸、燧原科技等企業,目前也都重點布局于AI芯片,并分別利用自身的優勢走出了自己的風格和水平。

而在GPGPU賽道上,一家名為“天數智芯”的公司選擇了正面“剛”。這家公司目前圍繞GPGPU的系統研發已聚集了一支百余人的技術團隊,其中不乏AMD在美國和上海做 GPU的核心團隊成員、行業經驗超20年的世界級技術專家。今年剛剛試水發布了一款邊緣端芯片,并計劃明年正式發布GPGPU大芯片產品。

國內企業的機遇與挑戰

有一點毋庸置疑,算力經濟時代,整個世界正面臨半導體市場的增長大潮,市場上也涌現出越來越多的半導體企業百舸爭流。而英偉達早早憑借強大的GPU+CUDA方案切入各個領域,用大筆研發投入和時間堆積起堅不可摧的生態城墻,而這恰恰是國內外其他玩家的薄弱環節。

國產芯片企業,特別是處在創業初期的那些,“正確選擇勝過百倍努力”。筆者認為可通用的GPU確然是個非常值得投入的方向。GPGPU誕生也只有十數年時間,“護城河”并非堅不可摧。

只不過在現階段,國產替代方案還要在CUDA生態的基礎上推廣自己的芯片產品,在兼容CUDA的同時,建設新生態。在這個過程中,每一步都關鍵且充滿挑戰。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
收藏 人收藏

    評論

    相關推薦

    《CST Studio Suite 2024 GPU加速計算指南》

    GPU Computing Guide》是由Dassault Systèmes Deutschland GmbH發布的有關CST Studio Suite 2024的GPU計算指南。涵蓋GPU計算
    發表于 12-16 14:25

    請問通用有源低通濾波器應該用什么芯片比較好呢?

    通用有源低通濾波器應該用什么芯片比較好呢?我用的OPA820的效果不太理想啊
    發表于 09-12 07:06

    2024年芯片行業有多難?用數據說話

    2024年芯片行業有多難?用數據說話
    的頭像 發表于 08-10 18:20 ?4442次閱讀

    暴漲預警!NVIDIA GPU供應大跳水

    gpu
    jf_02331860
    發布于 :2024年07月26日 09:41:42

    請問STM32F407 USB的FIFO究竟有多少空間?

    FIFO 連接。但是另一方面,在CSR存儲器映射圖中,一個主機通道的 FIFO地址范圍為 0x1000 (4KB),并且主機模式下有8個這樣的通道。所以真搞不明白究竟 FIFO真正有多少空間?
    發表于 07-04 07:46

    請問ESP32-U4WDH的ESP32-MINI-1模組85℃版和105℃的區別是什么?

    如題:ESP32-U4WDH的ESP32-MINI-1模組85℃版和105℃的區別 這兩個模組,85℃和105℃究竟有哪些區別?包括工藝、功能、價格的區別?
    發表于 07-02 06:37

    軟件生態上超越CUDA,究竟有多難

    電子發燒友網報道(文/周凱揚)近日,英偉達憑借持續上漲的股價,正式超過了微軟成為全球市值最高的公司,這固然離不開GPU這一AI硬件的火熱,但之所以能一舉做到世界第一,也離不開軟件的加持,真正將其推向
    的頭像 發表于 06-20 00:09 ?3689次閱讀

    新手小白怎么學GPU云服務器跑深度學習?

    新手小白想用GPU云服務器跑深度學習應該怎么? 用個人主機通常pytorch可以跑但是LexNet,AlexNet可能就直接就跑不動,如何實現更經濟便捷的實現GPU云服務器深度學習?
    發表于 06-11 17:09

    STM32的DAC輸出有個BUFFER功能,BUFFer的驅動能力究竟有多大,普通的運放輸出可以嗎?驅動LED可以嗎?

    DAC是輸出模擬電壓給外界參考,STM32的DAC輸出有個BUFFER功能,但不知這個BUFFer的驅動能力究竟有多大,普通的運放輸出可以嗎?驅動LED可以嗎?有沒有人做過這塊,給個建議,因為最近要設計個DAC輸出調節運放輸出,希望能有個參考。 如果外接跟隨的話,用LM358可以嗎?請一起討論下!!!
    發表于 05-15 07:42

    共模電感選型依據究竟有哪些

    電子發燒友網站提供《共模電感選型依據究竟有哪些.docx》資料免費下載
    發表于 05-06 10:26 ?1次下載

    SMT貼片加工中元器件移位的原因究竟有哪些?

    ,元器件移位的問題仍然時有發生。那么,造成SMT貼片加工中元器件移位的原因究竟有哪些呢?接下來深圳佳金源錫膏廠家來講一下:首先,貼片機吸嘴的氣壓是影響元器件位置的重要
    的頭像 發表于 04-26 16:00 ?587次閱讀
    SMT貼片加工中元器件移位的原因<b class='flag-5'>究竟有</b>哪些?

    貼片功率電感究竟有沒有正負極之分

    電子發燒友網站提供《貼片功率電感究竟有沒有正負極之分.docx》資料免費下載
    發表于 02-28 10:15 ?0次下載

    什么是DMA?DMA究竟有多快!

    助于提高數據傳輸速度和系統效率。 那么,DMA究竟有多快呢? 實踐出真知 恰好,最近有個多通道數據采集的項目,受限于通道數多、分辨率高,而系統帶寬有限,為了盡可能充分利用有限帶寬,就得想辦法優化時序,把時間都留給數據采集和傳輸。 優化方向就是DMA。 硬件鏈路是A
    的頭像 發表于 02-22 10:43 ?2076次閱讀
    什么是DMA?DMA<b class='flag-5'>究竟有</b>多快!

    gpu服務器是干什么的 gpu服務器與cpu服務器的區別有哪些

    gpu服務器是干什么的 gpu服務器與cpu服務器的區別 GPU服務器是一種專門用于處理圖形運算的服務器,而CPU服務器則是一種處理通用計算任務的服務器。它們之間的主要區別在于服務器所
    的頭像 發表于 01-30 15:31 ?895次閱讀

    英銳恩科技MCU科普:點沙成金的芯片技術究竟有多難?# MCU# 芯片

    芯片mcu
    英銳恩科技
    發布于 :2024年01月11日 17:25:55
    主站蜘蛛池模板: 国产69精品9999XXXX| 最近免费中文字幕大全免费| 久久91精品国产91久久户| 高h 纯肉文| 成都电影免费中文高清| 99国产福利| 2021久久99国产熟女人妻| 中文无码第3页不卡av| 一本色道久久综合亚洲AV蜜桃| 午夜宅宅伦电影网| 无码国产色欲XXXX视频| 婷婷久久无码欧美人妻| 翁用力的抽插| 小xav导航| 亚洲地址一地址二地址三| 亚洲AV國產国产久青草| 亚洲、国产综合视频| 亚洲AV综合99一二三四区| 亚洲精品成A人在线观看| 亚洲欧美自拍明星换脸| 亚洲伊人色| 在线欧美免费人成视频| 18禁三级黄| 99久女女精品视频在线观看| caoporn免费视频在线| 超碰97免费人妻| 高傲教师麻麻被同学调教123| 父皇轻点插好疼H限| 国产精品VIDEOSSEX久久发布| 国产精品久久久久成人免费| 国产精品青草久久福利不卡 | 纯肉腐文高H总受男男| 成人无码在线超碰视频| 国产成人精品电影在线观看| 国产午夜在线观看视频播放| 果冻传媒AV精品一区| 久久精品亚洲热综合一本| 美女屁股软件| 欧美亚洲日韩自拍高清中文| 色姊姊真舒服| 亚洲精品成人a|