色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Merlin HugeCTR第三代 Embedding 功能優化

NVIDIA英偉達企業解決方案 ? 來源:NVIDIA英偉達企業解決方案 ? 作者:NVIDIA英偉達企業解 ? 2022-10-20 09:51 ? 次閱讀

Merlin HugeCTR(以下簡稱 HugeCTR)是 GPU 加速的推薦框架,旨在在多個 GPU 和節點之間分配訓練并估計點擊率(Click-through rate)。

版本新增內容

HugeCTR 第三代 Embedding 更新:

第三代 Embedding 功能優化:自從在 v3.7 中引入新一代 HugeCTR Embedding 以來,進行了一些更新和優化,包括代碼重構以提高可用性。此版本的增強功能如下:

優化了稀疏查找在 warp 間負載不平衡方面的性能。稀疏操作工具包 (SOK) 利用了此優化來提高性能。

修復了用于確定 GlobalEmbeddingData 和 LocalEmbeddingData 類中的最大 Embedding 向量大小的問題。

Sparse Operation Kit 1.1.4 版可以使用 Pip 安裝,并包括前面提到的優化。

Embedding 表放置策略的 interface 簡化:第三代 Embedding 現在為您提供了一種更簡單的方法來配置 Embedding 表的放置策略。您可以使用函數參數配置嵌入表放置策略,而不是使用 JSON。您只需提供 shard_matrix、

table_group_strategy和 table_placement_strategy 參數。使用這些參數,第三代 Embedding 可以將不同的表組合在一起,并根據 shard_matrix 參數放置它們。請參閱示例:https://github.com/NVIDIA-Merlin/HugeCTR/blob/master/test/embedding_collection_test/dlrm_train.py

HugeCTR 分層參數服務器(HPS)更新:

用于 HPS 查找的 on-device 輸入鍵:HPS 查找支持在推理期間位于 GPU 內存上的輸入 Embedding 鍵。此功能移除了主機到設備的副本,并使用 DLPack lookup_fromdlpack() 接口,使得 embedding key 的 DLPack 包裝可以是一個 GPU tensor。

使用可配置的比例來初始化 Embedding Cache:在以前的版本中,cache_refresh_percentage_per_iteration 參數的默認值為 0.1。在此版本中,默認值更改為 0.0,并且該參數提供了額外的用途。如果您將參數設置為大于 0.0 的值并且還將模型的 use_gpu_embedding_cache 設置為 True,則當分層參數服務器 (HPS) 啟動時,HPS 通過從模型的稀疏文件對 Embedding Cache 進行初始化時,HPS 在會創建日志記錄,日志記錄類似于模型的 EC 初始化:“《model-name》”、num_tables:《int》 和設備上的 EC 初始化:《int》。這樣將會減少預熱階段的持續時間。

HPS 插件的隱式初始化:在此版本中,當您使用 Triton 推理服務器部署 TensorFlow 的 SavedModel 時,首次執行加載的模型時會隱式初始化 HPS。在以前的版本中,您需要顯式運行 hps.Init(ps_config_file, global_batch_size)。

ddbb187e-4fb9-11ed-a3b6-dac502259ad0.png

HugeCTR 分層參數服務器(HPS)架構

HugeCTR I/O 模塊更新:

支持了 AWS S3 文件系統:Parquet DataReader 現在可以從 Amazon Web Services S3 文件系統讀取數據集。您還可以在訓練期間從 S3 加載和存儲模型。

文件系統使用的簡化:您不再需要傳遞 DataSourceParams 來使用遠端文件系統進行模型的加載和存儲。 FileSystem 類會根據您在構建模型時指定的路徑 URI 自動推斷正確的文件系統類型:本地、HDFS 或 S3。例如,路徑 hdfs://localhost:9000/ 將被推斷為 HDFS 文件系統,路徑

https://mybucket.s3.myregion.amazonaws.com/ 將被推斷為 S3 文件系統。

支持將模型從遠程文件系統加載到 HPS:此版本使您能夠在推理期間將模型從 HDFS 和 S3 遠程文件系統加載到 HPS。要使用這個新功能,請在 InferenceParams 中為模型文件路徑提供準確的 HDFS 或者 S3 URL。

dde854a6-4fb9-11ed-a3b6-dac502259ad0.png

HugeCTR I/O 框架

文檔和示例更新:

新的 MMoE 模型示例:

https://github.com/NVIDIA-Merlin/HugeCTR/tree/master/samples/mmoe

新的 HPS 示例筆記本:

https://github.com/NVIDIA-Merlin/HugeCTR/tree/master/hierarchical_parameter_server/notebooks

HPS 文檔樣式更新:https://nvidia-

merlin.github.io/HugeCTR/master/hierarchical_parameter_server/index.html

刪除了兩個已棄用的教程 triton_tf_deploy 和 dump_to_tf。

增加了 Performance 相關頁面:https://nvidia-merlin.github.io/HugeCTR/master/performance.html

其他更新:

對重疊 Pipeline 進行了更精細的粒度控制:我們棄用了舊的重疊 Pipeline knob,并引入了四個新的 knob:

train_intra_iteration_overlap

train_inter_iteration_overlap

eval_intra_iteration_overlap

eval_inter_iteration_overlap

以幫助用戶更好地控制重疊行為。有關詳細信息,請參閱 API 文檔

https://nvidia-merlin.github.io/HugeCTR/master/api/python_interface.html#createsolver-method

支持在訓練過程中將 Tensor 的值導出到 Numpy Array: 為 Model 和 InferenceModel 類新增了 check_out_tensor() 方法。現在用戶可以使用這個 Pyhon 方法將 Tensor 的值導出,方便 debug。

修復的問題

InteractionLayer 類已修復,它可以在 num_feas 》 30 時正常工作了。

通過增加工作空間大小和添加結尾掩碼來更正 cuBLASLt 配置。

用于演示特征交叉的示例的預處理腳本已修復。

異步數據讀取器是固定的。以前,由于不正確的 I/O 塊大小和 I/O 對齊問題,它會掛起并報錯。AsyncParam 類已更改以實現修復。io_block_size 參數被 max_nr_request 參數替換,并且異步讀取器使用的實際 I/O 塊大小會相應計算

修復了在調試模式下觸發的構建錯誤。

使用 Parquet DataReader 時,如果 metadata.json 中指定的 Parquet 數據集文件不存在,HugeCTR 不再崩潰,而是跳過丟失的文件并顯示警告消息。

已知問題

以下是目前 HugeCTR 存在的已知問題,我們將在之后的版本中盡快修復:

HugeCTR 使用 NCCL 在隊列之間共享數據,并且 NCCL 可能需要共享系統內存用于 IPC 和固定(頁面鎖定)系統內存資源。如果您在容器內使用 NCCL,請在啟動容器時通過指定參數 -shm-size=1g -ulimit memlock=-1 來增加這些資源。

即使目標 Kafka 代理沒有響應,KafkaProducers 啟動也會成功。為避免與來自 Kafka 的流模型更新相關的數據丟失,您必須確保足夠數量的 Kafka 代理正在運行、正常運行,并且可以從運行 HugeCTR 的節點訪問。

文件列表中的數據文件數量應大于或等于數據讀取器工作人員的數量。否則,不同的 worker 會映射到同一個文件,并且數據加載不會按預期進行。

暫時不支持使用正則化器的聯合損失訓練。

暫時不支持將 Adam 優化器狀態導出到 AWS S3。

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4729

    瀏覽量

    128890
  • 內存
    +關注

    關注

    8

    文章

    3019

    瀏覽量

    74005
  • 工具包
    +關注

    關注

    0

    文章

    46

    瀏覽量

    9529

原文標題:HugeCTR v4.0 & v4.1 發布說明

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    什么是第三代移動通信

    什么是第三代移動通信答復:第三代移動通信系統IMT2000,是國際電信聯盟(ITU)在1985年提出的,當時稱為陸地移動系統(FPLMTS)。1996年正式更名為IMT2000。與現有的第二移動
    發表于 06-13 22:49

    第三代移動通信過渡技術—EDGE

    僅限于新的2GHz頻段, EDGE技術也能夠讓使用800、900、1800、1900MHz頻段的網絡提供第三代移動通信網絡的部分功能。在此基礎上,Ericsson公司于1997年第一次向ETSI提出了EDGE
    發表于 11-13 21:32

    什么是IR-III技術(第三代紅外)?

    IR-III技術定義(IR-III Technology Definition)IR-III技術即紅外夜視第三代技術,根植于上世紀60年美國貝爾實驗室發明的紅外夜視技術,屬于一種主動式紅外
    發表于 02-19 09:34

    第三代紅外技術(IR-III)并不是陣列式

    、帕特羅(PATRO)多功能會議視頻攝像機、帕特羅(PATRO)網絡視頻服務器廣州精典科技有限公司的帕特羅(PATRO)第三代紅外攝像機就是以IR-III技術研究開發的,將作為紅外夜視領域的領先產品
    發表于 02-19 09:35

    liklon的第三代MP3

    `第一沒有留下痕跡。第二之前在論壇展示過:https://bbs.elecfans.com/jishu_282495_1_1.html現在第三代誕生:`
    發表于 08-10 15:35

    第三代半導體科普,國產任重道遠

    硅材料的研究也非常透徹?;诠璨牧仙掀骷脑O計和開發也經過了許多的結構和工藝優化和更新,正在逐漸接近硅材料的極限,基于硅材料的器件性能提高的潛力愈來愈小。以氮化鎵、碳化硅為代表的第三代半導體具備優異
    發表于 05-15 17:09

    第三代移動通信技術定義

    3G定義 3G是英文3rd Generation的縮寫,至第三代移動通信技術。相對于第一模擬制式手機(1G)和第二GSM、TDMA等數字手機(2G)來說,第三代手機是指將無線通信與
    發表于 07-01 07:19

    什么是第三代移動通信網絡規劃?

    隨著第三代移動通信技術的興起,UMTS網絡的建立將帶來一場深刻的革命,這對網絡規劃也提出了更高的要求。在德國轟動一時的UMTS執照拍賣,引起了公眾對這一新技術的極大興趣。第三代移動通信網絡的建設正方
    發表于 08-15 07:08

    基于第三代移動通信系統標準的ALC控制方案研究

    基于第三代移動通信系統標準的ALC控制方案的設計與實現
    發表于 01-13 06:07

    淺析第三代移動通信功率控制技術

    淺析第三代移動通信功率控制技術
    發表于 06-07 07:07

    中國第三代半導體名單!精選資料分享

    據業內權威人士透露,我國計劃把大力支持發展第三代半導體產業,寫入“十四五”規劃,計劃在2021-2025年期間,在教育、科研、開發、融資、應用等等各個方面,大力支持發展第三代半導體產業,...
    發表于 07-27 07:58

    第三代LonWorks技術和產品介紹

    第三代LonWorks技術和產品介紹 文章介紹了第三代LonWorks技術的應用方向和結構,以及美國Echelon公司新推出的一系列的第三代LonWorks產品以及它們的主要技術特點
    發表于 03-18 09:55 ?17次下載

    第三代iPad今夏來襲?

    據一向不靠譜的臺灣媒體DigiTimes報道,蘋果將于今年夏季發布新款第三代iPad。新款第三代iPad將配備來自夏普的IGZO顯示屏,這種技術將使iPad變得更薄,電池更耐用。在第三代iPad發布之
    發表于 06-30 11:48 ?673次閱讀

    什么是第三代半導體?第三代半導體受市場關注

    繼5G、新基建后,第三代半導體概念近日在市場上的熱度高居不下。除了與5G密切相關外,更重要是有證券研報指出,第三代半導體有望納入重要規劃,消息傳出后多只概念股受到炒作。證券業人士提醒,有個人投資者
    發表于 09-21 11:57 ?4003次閱讀

    Merlin HugeCTR v4.3 發布說明

    Embedding 更新: 第三代 Embedding 功能優化: 自從在 v3.7 中引入新一
    的頭像 發表于 01-05 11:55 ?776次閱讀
    主站蜘蛛池模板: 国产一区二区三区四区五在线观看| 99热国产这里只有精品9九| 国产精品高清在线观看93| 亚洲欧美无码2017在线| 男子扒开美女尿口做羞羞的事| 成人免费视频在线观看| 亚洲色t图| 人人做人人干| 狠狠狠狠狠狠干| 69精品人妻一区二区三区蜜桃| 人妻互换免费中文字幕| 国产成人亚洲精品无广告| 亚洲青青草原| 墨西哥美女主播| 丰满大爆乳波霸奶| 亚洲国产综合久久精品| 两个人看的www免费高清直播| xxx成熟xxx| 亚洲精品一线二线三线无人区 | 亚洲精品无码久久久久A片| 免费精品一区二区三区AA片| 二级毛片免费观看全程| 一区三区在线专区在线| 青柠在线电影高清免费观看 | 无码人妻视频又大又粗欧美 | 久青草国产在视频在线观看| 成人伊人青草久久综合网| 亚洲午夜精品aaa级久久久久 | 伊人影院综合在线| 日韩AV成人无码久久精品老人| 娇妻在床上迎合男人| 草莓西瓜樱桃香蕉直播视频| 伊人久久综合| 午夜福利免费院| 青柠在线观看免费高清电视剧荣耀 | 国产成人免费高清视频| 97精品在线| 在线视频中文字幕| 亚洲成年男人的天堂网| 日日夜夜影院在线播放| 欧美00后rapper潮水|