色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英特爾四大層面,提升DeepRec訓練和推理能力

英特爾中國 ? 來源:英特爾中國 ? 作者:英特爾中國 ? 2022-07-10 10:56 ? 次閱讀

從淘寶到天貓應用,從搜索、推薦到廣告等場景,對井噴式的數據進行超大規模訓練推理的應用,已經在我們身邊落地開花。阿里巴巴集團的開源推薦引擎 DeepRec (PAI-TF) 主要用于稀疏模型訓練和預測,可支撐千億特征、萬億樣本的超大規模稀疏訓練。

從2019 年開始,英特爾就與阿里巴巴PAI團隊緊密合作,將英特爾 AI 技術應用到 DeepRec 中。特別是英特爾處理器內置的英特爾DL Boost (英特爾深度學習加速),為 DeepRec 實現了四個層面上的優化:框架優化、算子優化、子圖優化和模型優化。

四大層面,提升DeepRec 訓練和推理能力

自英特爾 至強 可擴展處理器問世以來,通過從 AVX-256 升級到 AVX-512,英特爾將 AVX 的能力提高了一倍,極大地提升了深度學習訓練和推理能力。第三代英特爾 至強 可擴展處理器之后,英特爾推出支持 BFloat16 (BF16) 數據類型的指令集,也應用到 DeepRec 的優化中。

框架優化:DeepRec 集成了英特爾開源的跨平臺深度學習性能加速庫oneDNN (oneAPI Deep Neural Network Library),該程序庫已經針對大量主流算子實現了性能優化。與搭載 BF16 指令的第三代英特爾至強可擴展處理器同時使用,可顯著提高模型訓練和推理性能。

算子優化:搜索廣告推薦模型中存在著大量稀疏算子,調用 AVX-512 指令加以優化后,大幅提升了數據讀寫效率和性能。

子圖優化:圖優化是 AI 性能優化的主要有效手段之一。在大規模稀疏場景下,DeepRec 加入多種子圖融合功能,減少大量冗余操作,配合英特爾 AVX-512 指令加速,實現了子圖性能的明顯提升。

模型優化:基于CPU 平臺,英特爾在 DeepRec 構建了涵蓋多個主流模型的獨有推薦模型集合,涉及召回、排序、多目標等多種常見場景;并針對硬件平臺進行性能優化,相較于其他框架在 CPU 平臺上帶來跨越式性能提升。

阿里巴巴 PAI 團隊的測試結果證明:基于 Criteo 數據集,使用BF16優化后,模型WDL精度或AUC可以逼近FP32,并且BF16模型的訓練性能提升達1.4倍,效果顯著。

未來,英特爾還會從優化器算子、attention 子圖、添加多目標模型等多個角度進一步實施優化,更大程度地發揮 CPU 平臺硬件優勢、尤其是新硬件特征的效果最大化,從而為稀疏場景打造更高性能的 CPU 解決方案。

當然,英特爾為 DeepRec 的優化并不僅限于 CPU 層面。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10112

    瀏覽量

    173278
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10977

    瀏覽量

    214585

原文標題:發揮CPU平臺硬件優勢,英特爾助力DeepRec優化超大規模稀疏訓練

文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦

    世紀大并購!傳高通有意整體收購英特爾英特爾最新回應

    電子發燒友網報道(文/吳子鵬)9月21日,《華爾街日報》發布博文稱,高通公司有意整體收購英特爾公司,而不是僅僅收購芯片設計部門。“最近幾天,高通已經接觸了芯片制造商英特爾。”報道稱,這筆交易還遠未
    的頭像 發表于 09-22 05:21 ?3341次閱讀
    世紀大并購!傳高通有意整體收購<b class='flag-5'>英特爾</b>,<b class='flag-5'>英特爾</b>最新回應

    1.9倍性能提升英特爾至強6在MLPerf基準測試中表現卓越

    與第五代至強處理器相比,英特爾至強6性能核的性能平均提高了1.9倍。 今日,MLCommons公布了最新的MLPerf推理v5.0基準測試結果,其中,英特爾??至強??6性能核處理器在本次測試的六個
    的頭像 發表于 04-07 10:58 ?55次閱讀

    請問OpenVINO?工具套件英特爾?Distribution是否與Windows? 10物聯網企業版兼容?

    無法在基于 Windows? 10 物聯網企業版的目標系統上使用 英特爾? Distribution OpenVINO? 2021* 版本推斷模型。
    發表于 03-05 08:32

    英特爾?獨立顯卡與OpenVINO?工具套件結合使用時,無法運行推理怎么解決?

    使用英特爾?獨立顯卡與OpenVINO?工具套件時無法運行推理
    發表于 03-05 06:56

    英特爾代工或引入多家外部股東

    英特爾的合作模式為“出錢拿產能”。這兩家ASIC設計大廠將通過股權投資的方式,確保自身能夠獲得英特爾的先進制程生產能力。同時,高通和博通的訂單也將有助于提升
    的頭像 發表于 02-18 10:45 ?564次閱讀

    使用英特爾AI PC為YOLO模型訓練加速

    之后,情況有了新的變化,PyTorch2.5正式開始支持英特爾顯卡,也就是說,此后我們能夠借助英特爾 銳炫 顯卡來進行模型訓練了。
    的頭像 發表于 12-09 16:14 ?902次閱讀
    使用<b class='flag-5'>英特爾</b>AI PC為YOLO模型<b class='flag-5'>訓練</b>加速

    英特爾推出全新英特爾銳炫B系列顯卡

    英特爾銳炫B580和B570 GPU以卓越價值為時新游戲帶來超凡表現。 ? > 今日,英特爾發布全新英特爾銳炫 B系列顯卡(代號Battlemage)。英特爾銳炫 B580和B570
    的頭像 發表于 12-07 10:16 ?1142次閱讀
    <b class='flag-5'>英特爾</b>推出全新<b class='flag-5'>英特爾</b>銳炫B系列顯卡

    使用PyTorch在英特爾獨立顯卡上訓練模型

    《PyTorch 2.5重磅更新:性能優化+新特性》中的一個新特性就是:正式支持在英特爾獨立顯卡上訓練模型!
    的頭像 發表于 11-01 14:21 ?1483次閱讀
    使用PyTorch在<b class='flag-5'>英特爾</b>獨立顯卡上<b class='flag-5'>訓練</b>模型

    英特爾AI PC無所不能的實力

    百業的最后一公里問題。而客戶端的AI能力也在不斷提升,最終將解決個人AI的數據隱私和個性化問題。可見,AI非常適合云邊端三級架構,按照用戶場景進行針對性部署。英特爾為云邊端都提供了強大的AI解決方案。
    的頭像 發表于 10-12 10:26 ?620次閱讀

    四大核心展區,英特爾在工博會展現AI與制造深度融合

    2024年9月25日,上海—— ?在第24屆中國國際工業博覽會(CIIF)上,英特爾攜手多家生態合作伙伴亮相展會,通過精心布局的 “機器視覺”、“負載整合”、“工業控制”、及“工業AI與大模型”四大
    的頭像 發表于 09-27 09:30 ?333次閱讀
    <b class='flag-5'>四大</b>核心展區,<b class='flag-5'>英特爾</b>在工博會展現AI與制造深度融合

    開箱即用,AISBench測試展示英特爾至強處理器的卓越推理性能

    近期,第五代英特爾?至強?可擴展處理器通過了中國電子技術標準化研究院組織的人工智能服務器系統性能測試(AISBench)。英特爾成為首批通過AISBench大語言模型(LLM)推理性能測試的企業
    的頭像 發表于 09-06 15:33 ?565次閱讀
    開箱即用,AISBench測試展示<b class='flag-5'>英特爾</b>至強處理器的卓越<b class='flag-5'>推理</b>性能

    英特爾是如何實現玻璃基板的?

    。 雖然玻璃基板對整個半導體行業而言并不陌生,但憑借龐大的制造規模和優秀的技術人才,英特爾將其提升到了一個新的水平。近日,英特爾封裝測試技術開發(Assembly Test Technology Development)部門介紹
    的頭像 發表于 07-22 16:37 ?479次閱讀

    英特爾CEO:AI時代英特爾動力不減

    英特爾CEO帕特·基辛格堅信,在AI技術的飛速發展之下,英特爾的處理器仍能保持其核心地位。基辛格公開表示,摩爾定律仍然有效,而英特爾在處理器和芯片技術上的創新能力將持續驅動公司前進。
    的頭像 發表于 06-06 10:04 ?566次閱讀

    英特爾助力京東云用CPU加速AI推理,以大模型構建數智化供應鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構建數智化供應鏈
    的頭像 發表于 05-27 11:50 ?699次閱讀
    <b class='flag-5'>英特爾</b>助力京東云用CPU加速AI<b class='flag-5'>推理</b>,以大模型構建數智化供應鏈

    英特爾Gaudi 3 AI芯片:5nm工藝設計,訓練推理皆強

    此外,英特爾在發布會上還宣布更改旗下數據中心CPU產品名稱:原“Granite Rapids”和“Sierra Forest”將更名為“Xeon 6”系列。新品預計今年發售,并支持性能提升后的標準化 MXFP4 數據格式。
    的頭像 發表于 04-10 11:10 ?902次閱讀

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品
    主站蜘蛛池模板: 亚洲黄色大片 | 好大快用力深一点h视频 | 麻花传媒MD0044视频 | 一级特黄aa大片欧美 | 亚洲午夜精品一区二区公牛电影院 | 久久久91精品国产一区二区 | 无套内射纹身女视频 | 伊人久久影院 | 最近更新2019中文字幕免费 | 噜噜噜在线AV免费观看看 | 99热久久精品国产一区二区 | 国产精品成人网 | JK白丝校花爽到娇喘视频 | 国产精品视频大全 | bl撅高扒开臀缝哦 | 92精品国产成人观看免费 | 征服艳妇后宫春色 | 色多多旧版污污破解版 | 国产成人mv 在线播放 | 老湿机一区午夜精品免费福利 | 久久这里只有精品视频9 | 99久久精品国产亚洲AV | 摸董事长的裤裆恋老小说 | 亚洲精品久久久久久久蜜臀老牛 | 亚洲精品无码不卡 | 久久天天躁狠狠躁夜夜呲 | 成人国产精品视频频 | 欧美一级做a爰片免费 | 亚洲高清有码中文字 | 4hu四虎免费影院www | beeg日本老师 | 国产欧美精品一区二区色综合 | 超碰97人人做人人爱少妇 | 果冻传媒在线播放 | 郭德纲于谦2012最新相声 | 精品一区二区三区AV天堂 | 国产高潮久久精品AV无码 | 国产午夜婷婷精品无码A片 国产午夜视频在永久在线观看 | 日本精品卡一卡2卡3卡四卡三卡 | 国产亚洲精品精品精品 | 入禽太深在线观看免费高清 |