色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

南開/南理工/曠視提出CTKD:動態(tài)溫度超參蒸餾新方法

CVer ? 來源:CVer ? 2023-01-04 14:49 ? 次閱讀

論文題目:Curriculum Temperature for Knowledge Distillation

論文(AAAI 2023):https://arxiv.org/abs/2211.16231

開源代碼(歡迎star):

https://github.com/zhengli97/CTKD

一句話概括:

相對于靜態(tài)溫度超參蒸餾,本文提出了簡單且高效的動態(tài)溫度超參蒸餾新方法。

背景問題:

目前已有的蒸餾方法中,都會采用帶有溫度超參的KL Divergence Loss進行計算,從而在教師模型和學(xué)生模型之間進行蒸餾,公式如下:

b079a2b8-8bf0-11ed-bfe3-dac502259ad0.png

b083b3c0-8bf0-11ed-bfe3-dac502259ad0.png

而現(xiàn)有工作普遍的方式都是采用固定的溫度超參,一般會設(shè)定成4。

方法 FitNet
(ICLR 15')
AT
(ICLR 17')
SP
(ICCV 19')
Snapshot
(CVPR 19')
SSKD
(ECCV 20')
FRSKD
(CVPR 21')
τ的設(shè)定 3 4 4 2 or 3 4 4

那么這就帶來了兩個問題:

1. 不同的教師學(xué)生模型在KD過程中最優(yōu)超參不一定是4。如果要找到這個最佳超參,需要進行暴力搜索,會帶來大量的計算,整個過程非常低效。

2. 一直保持靜態(tài)固定的溫度超參對學(xué)生模型來說不是最優(yōu)的。基于課程學(xué)習(xí)的思想,人類在學(xué)習(xí)過程中都是由簡單到困難的學(xué)習(xí)知識。那么在蒸餾的過程中,我們也會希望模型一開始蒸餾是讓學(xué)生容易學(xué)習(xí)的,然后難度再增加。難度是一直動態(tài)變化的。

于是一個自然而然的想法就冒了出來:

在蒸餾任務(wù)里,能不能讓網(wǎng)絡(luò)自己學(xué)習(xí)一個適合的動態(tài)溫度超參進行蒸餾,并且參考課程學(xué)習(xí),形成一個蒸餾難度由易到難的情況?

于是我們就提出了CTKD來實現(xiàn)這個想法。

方法:

既然溫度超參τ可以在蒸餾里決定兩個分布之間的KL Divergence,進而影響模型的學(xué)習(xí),那我們就可以通過讓網(wǎng)絡(luò)自動學(xué)習(xí)一個合適的τ來達到以上的目的。

于是以上具體問題就直接可以轉(zhuǎn)化成以下的核心思想:

在蒸餾過程里,學(xué)生網(wǎng)絡(luò)被訓(xùn)練去最小化KL loss的情況下,τ作為一個可學(xué)習(xí)的參數(shù),要被訓(xùn)練去最大化KL loss,從而發(fā)揮對抗(Adversarial)的作用,增加訓(xùn)練的難度。隨著訓(xùn)練的進行,對抗的作用要不斷增加,達到課程學(xué)習(xí)的效果。

以上的實現(xiàn)可以直接利用一個非常簡單的操作:利用梯度反向?qū)覩RL (Gradient Reversal Layer )來去反向可學(xué)習(xí)超參τ的梯度,就可以非常直接達到對抗的效果,同時隨著訓(xùn)練的進行,不斷增加反向梯度的權(quán)重λ,進而增加學(xué)習(xí)的難度。

CTKD的論文的結(jié)構(gòu)圖如下:

b08e0366-8bf0-11ed-bfe3-dac502259ad0.jpg

Fig.1 CTKD網(wǎng)絡(luò)結(jié)構(gòu)圖

CTKD方法可以簡單分為左右兩個部分:

對抗溫度超參τ的學(xué)習(xí)部分。

這里只包含兩個小模塊,一個是梯度反向?qū)覩RL,用于反向經(jīng)過溫度超參τ的梯度,另一個是可學(xué)習(xí)超參溫度τ。

其中對于溫度超參τ,有兩種實現(xiàn)方式,第一種是全局方案 (Global Temperature),只會產(chǎn)生一個τ,代碼實現(xiàn)非常簡單,就一句話:

self.global_T = nn.Parameter(torch.ones(1), requires_grad=True)

第二種是實例級別方案(Instance-wise Temperature),即對每個單獨的樣本都產(chǎn)生一個τ。代碼實現(xiàn)也很簡單,就是兩層conv組成的MLP。

b096e724-8bf0-11ed-bfe3-dac502259ad0.jpg

Fig.2 兩種不同的可學(xué)習(xí)溫度超參實現(xiàn)。

2. 難度逐漸增加的課程學(xué)習(xí)部分。

隨著訓(xùn)練的進行,不斷增加GRL的權(quán)重λ,達到增加學(xué)習(xí)難度的效果。

在論文的實現(xiàn)里,我們直接采用Cos的方式,讓反向權(quán)重λ從0增加到1。

以上就是CTKD的全部實現(xiàn),非常的簡單有效。

CTKD總共包含兩個模塊,GRL和溫度生成模塊,都非常的輕量化,

CTKD方法可以作為即插即用的插件應(yīng)用在現(xiàn)有的SOTA的蒸餾方法中,取得廣泛的提升。

實驗結(jié)果

三個數(shù)據(jù)集:CIFAR-100,ImageNet和MS-COCO。

CIFAR-100上,CTKD的實驗結(jié)果:

b09f4a9a-8bf0-11ed-bfe3-dac502259ad0.jpg

作為一個即插即用的插件,應(yīng)用在已有的SOTA方法上:

b0a90f26-8bf0-11ed-bfe3-dac502259ad0.jpg

在ImageNet上的實驗:

b0b54994-8bf0-11ed-bfe3-dac502259ad0.jpg

在MS-COCO的detection實驗上:

b0bf62ee-8bf0-11ed-bfe3-dac502259ad0.jpg

溫度超參的整體學(xué)習(xí)過程可視化:

b0ca1252-8bf0-11ed-bfe3-dac502259ad0.jpg

由以上圖可以看到,CTKD整體的動態(tài)學(xué)習(xí)τ的過程。

將CTKD應(yīng)用在多種現(xiàn)有的蒸餾方案上,可以取得廣泛的提升效果。

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3267

    瀏覽量

    48924
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4802

    瀏覽量

    68743

原文標(biāo)題:AAAI 2023 | 南開/南理工/曠視提出CTKD:動態(tài)溫度超參蒸餾新方法

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    中標(biāo)北京市大數(shù)據(jù)中心感知管理服務(wù)平臺二期建設(shè)項目

    近日,成功中標(biāo)北京市大數(shù)據(jù)中心感知管理服務(wù)平臺(二期)建設(shè)項目,此次中標(biāo)不僅是對技術(shù)實力和服務(wù)能力的認(rèn)可,更標(biāo)志著
    的頭像 發(fā)表于 12-31 09:20 ?222次閱讀

    大華股份榮獲中國創(chuàng)新方法大賽一等獎

    近日,備受矚目的2024年中國創(chuàng)新方法大賽全國總決賽在重慶圓滿落下帷幕。此次大賽由中國科協(xié)與重慶市人民政府聯(lián)合主辦,吸引了眾多創(chuàng)新企業(yè)和團隊參與,共同展示創(chuàng)新成果,角逐榮譽獎項。 在這場創(chuàng)新盛宴中
    的頭像 發(fā)表于 12-27 14:50 ?204次閱讀

    基于遺傳算法的QD-SOA設(shè)計新方法

    了QD-SOA的設(shè)計,提出了一種基于遺傳算法的QD-SOA設(shè)計新方法。由于具有用于設(shè)計的模型是必不可少的,因此在第一步中獲得數(shù)值模型。然后,利用從數(shù)值模型中采樣的訓(xùn)練數(shù)據(jù)建立人工神經(jīng)網(wǎng)絡(luò)模型。實驗表明,該神經(jīng)模型具有較高的精度和較
    的頭像 發(fā)表于 12-17 09:58 ?109次閱讀
    基于遺傳算法的QD-SOA設(shè)計<b class='flag-5'>新方法</b>

    一種降低VIO/VSLAM系統(tǒng)漂移的新方法

    本文提出了一種新方法,通過使用點到平面匹配將VIO/VSLAM系統(tǒng)生成的稀疏3D點云與數(shù)字孿生體進行對齊,從而實現(xiàn)精確且全球一致的定位,無需視覺數(shù)據(jù)關(guān)聯(lián)。所提方法為VIO/VSLAM系統(tǒng)提供了緊密
    的頭像 發(fā)表于 12-13 11:18 ?178次閱讀
    一種降低VIO/VSLAM系統(tǒng)漂移的<b class='flag-5'>新方法</b>

    亮相2024數(shù)字科技生態(tài)大會

    2024數(shù)字科技生態(tài)大會上,展示了多項聯(lián)網(wǎng)領(lǐng)域的前沿技術(shù)及應(yīng)用成果,包括大模型、行業(yè)場景方案以及創(chuàng)新智能終端。
    的頭像 發(fā)表于 12-06 10:34 ?266次閱讀

    大華股份榮獲2024年中國創(chuàng)新方法大賽一等獎

    近日,由中國科協(xié)、重慶市人民政府舉辦的2024年中國創(chuàng)新方法大賽全國總決賽在重慶落下帷幕。大華股份靈活運用創(chuàng)新方法、突破行業(yè)性技術(shù)難題,憑借“不懼強光,分毫必現(xiàn),基于TRIZ的強逆光銳捕技術(shù)”項目,斬獲全國一等獎。
    的頭像 發(fā)表于 12-04 17:19 ?365次閱讀

    利用全息技術(shù)在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法

    本文介紹了一種利用全息技術(shù)在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法。 研究人員提出了一種在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法。傳統(tǒng)上,晶圓上的微結(jié)構(gòu)加工,僅限于通過光刻技術(shù)在晶圓表面加工納米結(jié)構(gòu)。 然而,除了晶
    的頭像 發(fā)表于 11-18 11:45 ?320次閱讀

    上海光機所提出強激光產(chǎn)生高能量子渦旋態(tài)電子新方法

    近期,中國科學(xué)院上海光學(xué)精密機械研究所強場激光物理國家重點實驗室研究團隊發(fā)展了包括軌道角動量量子數(shù)的QED散射理論,并提出強激光產(chǎn)生高能量子渦旋態(tài)電子的新方法。相關(guān)成果以“Generation
    的頭像 發(fā)表于 10-23 10:41 ?180次閱讀
    上海光機所<b class='flag-5'>提出</b>強激光產(chǎn)生高能量子渦旋態(tài)電子<b class='flag-5'>新方法</b>

    保護4-20 mA,±20-mA模擬輸入的新方法

    電子發(fā)燒友網(wǎng)站提供《保護4-20 mA,±20-mA模擬輸入的新方法.pdf》資料免費下載
    發(fā)表于 09-24 09:27 ?0次下載
    保護4-20 mA,±20-mA模擬輸入的<b class='flag-5'>新方法</b>

    實踐JLink 7.62手動增加新MCU型號支持新方法

    大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家分享的是實踐JLink 7.62手動增加新MCU型號支持新方法
    的頭像 發(fā)表于 08-08 15:25 ?778次閱讀
    實踐JLink 7.62手動增加新MCU型號支持<b class='flag-5'>新方法</b>

    一種無透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結(jié)構(gòu)進行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實現(xiàn)近乎完美的高分辨率顯微鏡。 層析成像是一種強大的無
    的頭像 發(fā)表于 07-19 06:20 ?407次閱讀
    一種無透鏡成像的<b class='flag-5'>新方法</b>

    使隱形可見:新方法可在室溫下探測中紅外光

    MIR振動輔助發(fā)光(MIRVAL) 來自伯明翰大學(xué)和劍橋大學(xué)的科學(xué)家們開發(fā)了一種新方法,利用量子系統(tǒng)在室溫下探測中紅外線(MIR)光。 這項研究成果發(fā)表在《自然·光子學(xué)》雜志上,在劍橋大學(xué)卡文迪什
    的頭像 發(fā)表于 04-19 06:31 ?329次閱讀
    使隱形可見:<b class='flag-5'>新方法</b>可在室溫下探測中紅外光

    軋機牌坊滑板壓虧修復(fù)的新方法

    電子發(fā)燒友網(wǎng)站提供《軋機牌坊滑板壓虧修復(fù)的新方法.docx》資料免費下載
    發(fā)表于 03-14 16:16 ?0次下載

    氫壓機軸承位磨損維修的新方法

    電子發(fā)燒友網(wǎng)站提供《氫壓機軸承位磨損維修的新方法.docx》資料免費下載
    發(fā)表于 03-01 16:23 ?0次下載

    基于動態(tài)跟蹤的高精度3D測量技術(shù)探究主動彎曲網(wǎng)格殼數(shù)值模擬方法

    近期,中科廣電CASAIM與華南理工大學(xué)開展專題項目合作,基于動態(tài)跟蹤的高精度3D測量技術(shù)探究主動彎曲網(wǎng)格殼數(shù)值模擬方法
    的頭像 發(fā)表于 01-19 18:13 ?794次閱讀
    主站蜘蛛池模板: 一个人日本的视频免费完整版| 久久vs国产综合色| 亚洲AV色香蕉一区二区9255| 久久婷婷五月综合色情| 国产精品7777人妻精品冫| 嘴巴舔着她的私处插| 我要色色网| 欧美熟妇VIVOE精品| 狠狠色欧美亚洲狠狠色www| 成人国产亚洲欧美成人综合网| 欲奴第一季在线观看全集| 无码国产成人午夜在线观看不卡 | 无套内射无矿码免费看黄| 美国VICTORY DAY在线| 狠狠色欧美亚洲狠狠色www| 国产成人免费全部网站| ca88亚洲城娱乐| 13一18TV处流血TV| 亚洲蜜芽在线观看精品一区| 四虎影5151毛片在线看| 欧美激情一区二区三区视频| 久久视频这里只精品99热在线观看 | 国内精品自产拍在线少密芽| 超碰97人人做人人爱网站| 97欧美精品大香伊蕉在人线| 一本到高清视频在线观看三区| 亚洲AV综合99一二三四区| 污文乖不疼的| 天美传媒麻豆精品| 色中色论坛网站| 日本少妇内射视频播放舔| 日本一本2017国产| 全彩acg无翼乌火影忍者| 欧美一区二区影院| 欧美牲交A欧美牲交| 欧美日韩888在线观看| 欧美肥婆性生活| 欧美夜夜噜2017最新| 欧洲最大无人区免费高清完整版 | 亚洲三级大片| 妖精视频一区二区免费|