色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

AI處理器熱潮正在退去

我快閉嘴 ? 來源:EETOP ? 作者:EETOP ? 2020-09-02 14:03 ? 次閱讀

俗語說得好:海水退潮之后,才知道誰沒穿褲子。但歷史的教訓往往證明殘酷的事實:結果站在浪里的所有人,全部都沒有穿褲子。

處理器業界的年度盛事第32屆IEEE HotChips,剛剛在今年8月以全部線上活動型式結束了,連擠4年牙膏的IBM與英特爾總算換了一管全新牙膏,真是可喜可賀。

但另一方面,分別在云端服務和終端硬件人工智能牛耳的Google與nVidia,卻也學到了“擠牙膏”的精髓,前者讓2018年就問世的第三代TPU,從2018年Google I/O講到2020 HotChips,后者在HotChips發表的內容,完全承襲GTC 2000的簡報,唯一差別只有把華為Ascend 910人工智能處理器和英特爾支援BF16格式的“新型Xeon”Cooper Lake-P拖出來狠狠打一頓。

總之,我們來瞧瞧HotChips 32 的Google 第三代TPU 與nVidiaA100。

講了三年總算勉強講完的Google TPU v3

Google 這家公司最令人稱許之處,在于恐怖的“前瞻執行力”,每當眾人還在清談“技術趨勢”之際,就突然石破天驚的昭示天下:你們還在嘴炮的東西,我們早就應用到實際產品。諸多豐功偉業的最知名案例,莫過于2013 年底,Google 爆炸性公開“規劃部署已達3 年”的B4 數據中心廣域網絡,開大規模商業化軟件定義網絡(SDN)之先河。

早在2015年就投入內部應用的Google TPU,更是近年來的經典案例,接著Google也很迅速推陳出新,2017年推出深度學習第二代TPU,第三代TPU更早在2018 Google I/O就亮相了。

但Google 也隨即“擠牙膏之神”上身,2019 年HotChips 31 教程僅提到部分資訊,到2020 年才公開細節全貌。

我們都有充分的理由相信,第四甚至第五代TPU,不是早就上線服役也該早在路上了。

2019 年比較對手是nVidia V100,結果2020 年看不到第四代TPU 較量V100,讓人感覺有點奇怪。

TPU v3 概觀可視為TPU v2 的雙倍放大版,散熱系統從氣冷改為液冷,也是主機板最顯眼的特色。

TPU v3 仍舊著重持續提升存儲器帶寬(+30%)與容量(加倍),拜液冷之賜,時鐘頻率也有成長(+30%)。

TPU v3 的指令集架構是332 位元長的超長指令集(VLIW),VLIW 指令包內總計有2 個純量指令、4 個向量指令(其中2 個是存儲器載入/回存)、 2 個矩陣(Matrix)指令、6 個立即值(Immediate)與一個雜項(Misc)應用。

強化多芯片互連總線,打造更大規模的“人工智能超級電腦”,更是TPU v3 的重頭戲,也就是上圖那個“4x Nodes”。

同樣一片系統主機板裝4 顆TPU,TPU v3 組成的“人工智能超級電腦”,擁有前代8 倍以上效能、8 倍存儲器容量、4 倍芯片數量與4 倍的最大裝置設定數,可切割成256 個獨立運算平臺分租給客戶。

順便一提,現今已知關于Google TPU 的專利多達50 份,亦不乏詳細描述第三代TPU 的內部架構細節,也是眾多有志進軍人工智能芯片的冒險者,抽絲剝繭的研究對象。

但這對使用Google Cloud AI 的用戶,甚至大多數Google 部門來說,其實并不重要,他們只要用得爽快、不需要“為了喝牛奶自己蓋一座牧場”就夠了。

GPU 基本盤穩扎穩打的nVidia A100

nVidia以通用GPU為基礎,站穩高效能運算市場,并將觸角逐漸延伸到人工智能和自駕車輛等新興應用領域,使2020年夏天市值連續超越英特爾和三星,證實外界多么看好“皮衣教主”昭示天下的“美好未來”。無論個人電腦與高效能運算領域,從“電競筆電非有Max-Q不可”現象到超級電腦Top500清單滿滿的nVidia GPU,優勢地位看似牢不可破。

nVidia 旗艦GPU 也隨著制程演進而持續“恐龍化”,Ampere 世代之首A100 是一顆臺積電7 納米制程、540 億晶體管的巨獸,像更多執行單元、更大存儲器子系統帶寬、一直更新的DGX 超級電腦等,是各位也都耳熟能詳,甚至早就令人哈欠連連的“標準劇情”了。

關于人工智能應用,nVidia A100 最重要的特色,莫過于自行定義的TF32(Tensor Float 32)浮點數格式。講白了就是“取長補短”,既然Google BF16 犧牲掉FP32 的精度,維持動態范圍不變,那就讓精度和FP16 一樣吧,神奇的19 位元長度TF32就這樣誕生了,兼具FP32的動態范圍和FP16 的精度。nVidia 之所以這樣大費周章創造新格式,根本目的不外乎要降低存儲器帶寬和容量需求,和Google發明BF16 如出一轍。

理所當然的,TF32 在A100 一定跑得很快,因所需帶寬僅為前代V100 一半或三分之一,更能喂飽嗷嗷待哺的龐大Tensor Core。

但這件事的背后,隱隱約約透露nVidia長期領先AMD(ATI)的根本原因與基本思維:存儲器帶寬,這件事早從2004年NV40(GeForce 6系列)存儲器控制器內建壓縮傳輸機能,相關技術持續演進并陸續申請專利,就已埋下了種子。過去十幾年來,AMD或ATI的GPU,需要更多存儲器帶寬,才能實現同等級的效能水準,絕對不是偶然。

大概整批帶槍投靠英特爾的前AMD 團隊過去吃了不少悶虧,這次替英特爾重新打造Xe 繪圖架構時,也很刻意提到“End-To-End Compression”,只是不知道會不會不小心踩到nVidia 的專利地雷。

當GPU 踏入高效能運算和人工智能,“每筆運算可平均分配到的存儲器帶寬,持續穩定的下滑中”,更讓提高運算效能這件事,絕非區區增加幾個特化指令與擴張執行單元,即可迎刃而解,更需搞定帶寬這件事,一旦帶寬不足,就發揮不出完整的運算效能。

聽說nVidia 下一代GPU“Hopper”將改弦易轍,改走多芯片Chiplet“包水餃”路線,也許nVidia 在多芯片連結架構部分,將帶來讓人感到驚奇的技術突破也說不定,讓人對明年HotChips 33 多抱持一分期待。

人工智能熱潮的消退:先講求不要餓死再求發展

話說回來,我們就不得不探究一個大哉問:為何越來越多芯片廠商開始“擠牙膏”?要么不是受摩爾第二定律詛咒,產品技術難以短期內飛躍性提升,要么就是講再多對我也沒任何實質好處,還不如少講一點悶聲發大財。

不過這幾年,難道人工智能芯片不是很火的話題嗎?2017年HotChips 29,不就是從主題演講到議程,從泛用處理器、GPU、ASIC到FGPA,統統“人工智能滿天下”?如此沉默,對公司的未來妥當嗎?

很遺憾的,人工智能芯片從2018 年起,以中國相關領域新創公司為首,熱潮急速退燒,像中國DEEPHi(深鑒科技)被FPGA 巨頭賽靈思收購,已經算是最好的退場。

即使美國企業亦不可免俗,就算公司不會倒,也不保證產品線不會收掉。像這些年來癡迷自駕車和人工智能,耗費數百億美元“生氣亂買公司”的英特爾,2018年宣布中止XeonPhi產品線,決定整個砍掉重練,由2017年底來自AMD的Raja Koduri重建貨真價實的GPU。2019年底以20億美元購并以色列HabanaLabs并在隔年2月停止NNP-T1000(代號Spring Crest,還宣稱跟百度合作),也意味著2016年用3.5億美元買下的Nervana形同棄兒,英特爾人工智能平臺事業群負責人、Nervana聯合創辦人Naveen Rao隨即離職,一點都不讓人意外。

英特爾連續公開栽了兩次(實際上應該更多),事后諸葛的后見之明與背后補刀的內幕爆料,均朝向“做出來的東西根本不能用,也無法符合軟件開發者和潛在客戶的需求”。

所以這也是當人工智能漸漸在HotChips 退燒后,為何Google 和nVidia 可站在臺上活好好的主因:Google 很清楚自身需要,快速演進三代(應該更多)的TPU 就是為了自家Google Cloud AI 和其他服務量身訂做(蘋果塞在自己芯片內的NPU 也是一樣狀況)。nVidia 則是擁有龐大GPU 市占率、累積十多年的CUDA 與高效能運算的“基本盤”足以先養活自己,日后再慢慢發展。

反觀之前那票一窩蜂狂沖“人工智能新大陸”的勇者,又有幾家有本錢和能耐,先不求餓死,再講求和客戶攜手并進的共同勝利?講更白一點,你會相信中國那些開發數字貨幣挖礦芯片的廠商,被迫轉型做出來的人工智能芯片,可以迅速得到指標性客戶的青睞?

天下任何一家求生存的企業,無不企求有所謂的“現金母牛”和忠實客戶,才為穩定營運的基礎。我們可以猜猜看,明年HotChips 33 還剩下哪些幸存者?
責任編輯:tzh

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19259

    瀏覽量

    229652
  • 芯片
    +關注

    關注

    455

    文章

    50714

    瀏覽量

    423142
  • 英特爾
    +關注

    關注

    61

    文章

    9949

    瀏覽量

    171693
  • 人工智能
    +關注

    關注

    1791

    文章

    47183

    瀏覽量

    238254
收藏 人收藏

    評論

    相關推薦

    預測2029年全球處理器市場將達4800億美元

    根據市場研究機構Yole最新發布的《2024年處理器行業現狀》研究報告,全球處理器市場正迎來前所未有的發展機遇。報告指出,2022年OpenAI發布的ChatGPT所引發的生成式AI熱潮
    的頭像 發表于 10-22 17:24 ?428次閱讀

    AMD推出全新銳龍AI 300系列處理器

    在 Computex 2024 上,AMD 宣布了一系列突破性的、旨在開啟 AI 體驗新時代的下一代架構和產品。AMD為下一代 AI PC推出了全新的 AMD 銳龍AI 300 系列處理器
    的頭像 發表于 09-19 10:55 ?822次閱讀
    AMD推出全新銳龍<b class='flag-5'>AI</b> 300系列<b class='flag-5'>處理器</b>

    TDA4 Edge AI處理器的性能和效率基準測試

    電子發燒友網站提供《TDA4 Edge AI處理器的性能和效率基準測試.pdf》資料免費下載
    發表于 09-11 09:21 ?0次下載
    TDA4 Edge <b class='flag-5'>AI</b><b class='flag-5'>處理器</b>的性能和效率基準測試

    使用邊緣AI和Sitara處理器進行關鍵字檢測

    電子發燒友網站提供《使用邊緣AI和Sitara處理器進行關鍵字檢測.pdf》資料免費下載
    發表于 09-02 11:30 ?0次下載
    使用邊緣<b class='flag-5'>AI</b>和Sitara<b class='flag-5'>處理器</b>進行關鍵字檢測

    處理器在人工智能方面的應用

    處理器在人工智能(AI)方面的應用日益廣泛且深入,成為了推動AI技術發展的重要力量。本文將從微處理器AI中的核心作用、具體應用案例、技術
    的頭像 發表于 08-22 14:21 ?958次閱讀

    國產新型AI PC處理器亮相上海

    處理器
    北京中科同志科技股份有限公司
    發布于 :2024年08月01日 09:21:01

    愛芯元智發布“愛芯通元AI處理器

    在近日隆重召開的世界人工智能大會(WAIC)這一全球科技盛會上,愛芯元智科技有限公司憑借其深厚的AI技術研發實力,正式推出了劃時代的“愛芯通元AI處理器”。這款處理器的問世,不僅標志著
    的頭像 發表于 07-09 09:35 ?407次閱讀

    處理器的定義和種類

    處理器,作為計算機系統的核心部件,承載著執行指令、處理數據的重要任務。隨著信息技術的飛速發展,處理器的種類和性能也在不斷提升。本文將對處理器的定義進行闡述,并詳細介紹
    的頭像 發表于 05-12 18:12 ?2442次閱讀

    英特爾酷睿Ultra處理器突破500個AI模型優化

    英特爾在最新推出的英特爾? 酷睿? Ultra處理器上宣布,超過500款AI模型已得到優化運行。這款處理器無疑是市場上領先的AI PC處理器
    的頭像 發表于 05-09 11:18 ?761次閱讀

    臺積電:AI服務處理器預計翻番,拉動收入增長?

    臺積電將 AI 服務處理器嚴格限定為用于 AI 訓練與推理的 GPU、CPU 及 AI 加速
    的頭像 發表于 04-19 15:04 ?357次閱讀

    AMD推AI PC新處理器,挑戰英偉達與英特爾領先地位

    AI PC是搭載特殊處理器的個人電腦,主要完成如實時語音翻譯或文本摘要等復雜AI任務。據AMD介紹,其最新款的Ryzen PRO 8040系列及Ryzen PRO 8000系列分別適配商務筆記本電腦及企業級桌面
    的頭像 發表于 04-17 09:57 ?420次閱讀

    國產GPU搭配國產處理器平臺主機

    處理器gpu
    GITSTAR 集特工控
    發布于 :2024年03月27日 14:11:32

    AMD EPYC處理器AI推理能力究竟有多強?

    如今,AMD EPYC處理器已經成為最常被選擇用于AI推理的服務平臺,尤其是第四代Genoa EPYC 9004系列,執行AI推理的能力又得到了巨大的飛躍。
    發表于 03-15 09:47 ?479次閱讀

    驍龍X Elite處理器AI生成圖片性能超群,英特爾亦被超越

    高通公司稱,該款處理器內置AI處理器(NPU),性能達到驚人的45 TOPS(每秒萬億次運算)。視頻通過實例對比英特爾酷睿 Ultra 7同樣具有NPU的處理器
    的頭像 發表于 02-28 14:09 ?810次閱讀

    英特爾酷睿Ultra處理器開售:引領AI與高性能的未來

     該處理器的一大亮點是其強大的AI功能。內置的NPU(神經網絡處理器)為AI應用提供了強大的加速能力,使得大型語言模型的本地運行成為可能。
    的頭像 發表于 12-27 16:57 ?1043次閱讀
    主站蜘蛛池模板: 1区2区3区4区产品不卡码网站| 亚洲欧美一区二区三区四区| 日韩精品卡1卡2三卡四卡乱码| 青青草原亚洲| 手机在线成人精品视频网 | 欧美日韩一区在线观看| 轻点灬大ji巴太粗太双性高h| 日韩一区二区三区精品| 性吧 校园春色| 一本色道久久综合一区| 973午夜伦伦电影论片| 超碰97人人做人人爱网站| 疯狂第一次国语| 黄色三级网站| 明星三级电影| 色影音先锋av资源网| 亚洲日韩一区精品射精| 97草碰在线视频免费| 贵妃高h荡肉呻吟np杨玉环| 国产在线亚洲精品观| 美女图片131亚洲午夜| 日本熟妇乱人伦A片精品软件| 亚洲AV精品无码喷水直播间| 中国女人hd| 高肉黄暴NP文公交车| 久久精品国产首叶| 日本精品久久久久中文字幕2| 迅雷成人下载| 99视频免视看| 国产偷国产偷亚州清高| 美女大BXXXXN内射| 天天拍拍国产在线视频| 依恋影院在线观看| 丰满少妇69激情啪啪无码| 久久九九有精品国产23百花影院| 欧美日韩1区| 亚洲欧美日韩在线码不卡| voyeurhit农村夫妻偷拍| 国产曰批试看免费视频播放免费| 免费在线视频a| 亚洲精品一区三区三区在线观看|