色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
电子发烧友
开通电子发烧友VIP会员 尊享10大特权
海量资料免费下载
精品直播免费看
优质内容免费畅学
课程9折专享价
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

南開/南理工/曠視提出CTKD:動態溫度超參蒸餾新方法

CVer ? 來源:CVer ? 2023-01-04 14:49 ? 次閱讀

論文題目:Curriculum Temperature for Knowledge Distillation

論文(AAAI 2023):https://arxiv.org/abs/2211.16231

開源代碼(歡迎star):

https://github.com/zhengli97/CTKD

一句話概括:

相對于靜態溫度超參蒸餾,本文提出了簡單且高效的動態溫度超參蒸餾新方法。

背景問題:

目前已有的蒸餾方法中,都會采用帶有溫度超參的KL Divergence Loss進行計算,從而在教師模型和學生模型之間進行蒸餾,公式如下:

b079a2b8-8bf0-11ed-bfe3-dac502259ad0.png

b083b3c0-8bf0-11ed-bfe3-dac502259ad0.png

而現有工作普遍的方式都是采用固定的溫度超參,一般會設定成4。

方法 FitNet
(ICLR 15')
AT
(ICLR 17')
SP
(ICCV 19')
Snapshot
(CVPR 19')
SSKD
(ECCV 20')
FRSKD
(CVPR 21')
τ的設定 3 4 4 2 or 3 4 4

那么這就帶來了兩個問題:

1. 不同的教師學生模型在KD過程中最優超參不一定是4。如果要找到這個最佳超參,需要進行暴力搜索,會帶來大量的計算,整個過程非常低效。

2. 一直保持靜態固定的溫度超參對學生模型來說不是最優的。基于課程學習的思想,人類在學習過程中都是由簡單到困難的學習知識。那么在蒸餾的過程中,我們也會希望模型一開始蒸餾是讓學生容易學習的,然后難度再增加。難度是一直動態變化的。

于是一個自然而然的想法就冒了出來:

在蒸餾任務里,能不能讓網絡自己學習一個適合的動態溫度超參進行蒸餾,并且參考課程學習,形成一個蒸餾難度由易到難的情況?

于是我們就提出了CTKD來實現這個想法。

方法:

既然溫度超參τ可以在蒸餾里決定兩個分布之間的KL Divergence,進而影響模型的學習,那我們就可以通過讓網絡自動學習一個合適的τ來達到以上的目的。

于是以上具體問題就直接可以轉化成以下的核心思想:

在蒸餾過程里,學生網絡被訓練去最小化KL loss的情況下,τ作為一個可學習的參數,要被訓練去最大化KL loss,從而發揮對抗(Adversarial)的作用,增加訓練的難度。隨著訓練的進行,對抗的作用要不斷增加,達到課程學習的效果。

以上的實現可以直接利用一個非常簡單的操作:利用梯度反向層GRL (Gradient Reversal Layer )來去反向可學習超參τ的梯度,就可以非常直接達到對抗的效果,同時隨著訓練的進行,不斷增加反向梯度的權重λ,進而增加學習的難度。

CTKD的論文的結構圖如下:

b08e0366-8bf0-11ed-bfe3-dac502259ad0.jpg

Fig.1 CTKD網絡結構圖

CTKD方法可以簡單分為左右兩個部分:

對抗溫度超參τ的學習部分。

這里只包含兩個小模塊,一個是梯度反向層GRL,用于反向經過溫度超參τ的梯度,另一個是可學習超參溫度τ。

其中對于溫度超參τ,有兩種實現方式,第一種是全局方案 (Global Temperature),只會產生一個τ,代碼實現非常簡單,就一句話:

self.global_T = nn.Parameter(torch.ones(1), requires_grad=True)

第二種是實例級別方案(Instance-wise Temperature),即對每個單獨的樣本都產生一個τ。代碼實現也很簡單,就是兩層conv組成的MLP。

b096e724-8bf0-11ed-bfe3-dac502259ad0.jpg

Fig.2 兩種不同的可學習溫度超參實現。

2. 難度逐漸增加的課程學習部分。

隨著訓練的進行,不斷增加GRL的權重λ,達到增加學習難度的效果。

在論文的實現里,我們直接采用Cos的方式,讓反向權重λ從0增加到1。

以上就是CTKD的全部實現,非常的簡單有效。

CTKD總共包含兩個模塊,GRL和溫度生成模塊,都非常的輕量化,

CTKD方法可以作為即插即用的插件應用在現有的SOTA的蒸餾方法中,取得廣泛的提升。

實驗結果

三個數據集:CIFAR-100,ImageNet和MS-COCO。

CIFAR-100上,CTKD的實驗結果:

b09f4a9a-8bf0-11ed-bfe3-dac502259ad0.jpg

作為一個即插即用的插件,應用在已有的SOTA方法上:

b0a90f26-8bf0-11ed-bfe3-dac502259ad0.jpg

在ImageNet上的實驗:

b0b54994-8bf0-11ed-bfe3-dac502259ad0.jpg

在MS-COCO的detection實驗上:

b0bf62ee-8bf0-11ed-bfe3-dac502259ad0.jpg

溫度超參的整體學習過程可視化:

b0ca1252-8bf0-11ed-bfe3-dac502259ad0.jpg

由以上圖可以看到,CTKD整體的動態學習τ的過程。

將CTKD應用在多種現有的蒸餾方案上,可以取得廣泛的提升效果。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 模型
    +關注

    關注

    1

    文章

    3480

    瀏覽量

    49947
  • 代碼
    +關注

    關注

    30

    文章

    4886

    瀏覽量

    70217

原文標題:AAAI 2023 | 南開/南理工/曠視提出CTKD:動態溫度超參蒸餾新方法

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 0人收藏

    評論

    相關推薦
    熱點推薦

    運動猿入選2024年度智能體育典型案例

    2025年3月3日,工業和信息化部、國家體育總局聯合公布了“2024年度智能體育典型案例”名單,“運動猿智能體育教育產品方案”成功入選,成為智能青少年體育產品方向的典型案例。此次獲評是對
    的頭像 發表于 03-10 10:04 ?368次閱讀

    大連理工提出基于Wasserstein距離(WD)的知識蒸餾方法

    的機制,應用于中間層蒸餾時存在問題,其無法處理不重疊的分布且無法感知底層流形的幾何結構。 為了解決這些問題,大連理工大學的研究人員提出了一種基于 Wasserstein 距離(WD)的知識蒸餾
    的頭像 發表于 01-21 09:45 ?521次閱讀

    中標北京市大數據中心感知管理服務平臺二期建設項目

    近日,成功中標北京市大數據中心感知管理服務平臺(二期)建設項目,此次中標不僅是對技術實力和服務能力的認可,更標志著
    的頭像 發表于 12-31 09:20 ?654次閱讀

    大華股份榮獲中國創新方法大賽一等獎

    近日,備受矚目的2024年中國創新方法大賽全國總決賽在重慶圓滿落下帷幕。此次大賽由中國科協與重慶市人民政府聯合主辦,吸引了眾多創新企業和團隊參與,共同展示創新成果,角逐榮譽獎項。 在這場創新盛宴中
    的頭像 發表于 12-27 14:50 ?464次閱讀

    基于遺傳算法的QD-SOA設計新方法

    了QD-SOA的設計,提出了一種基于遺傳算法的QD-SOA設計新方法。由于具有用于設計的模型是必不可少的,因此在第一步中獲得數值模型。然后,利用從數值模型中采樣的訓練數據建立人工神經網絡模型。實驗表明,該神經模型具有較高的精度和較
    的頭像 發表于 12-17 09:58 ?364次閱讀
    基于遺傳算法的QD-SOA設計<b class='flag-5'>新方法</b>

    一種降低VIO/VSLAM系統漂移的新方法

    本文提出了一種新方法,通過使用點到平面匹配將VIO/VSLAM系統生成的稀疏3D點云與數字孿生體進行對齊,從而實現精確且全球一致的定位,無需視覺數據關聯。所提方法為VIO/VSLAM系統提供了緊密
    的頭像 發表于 12-13 11:18 ?576次閱讀
    一種降低VIO/VSLAM系統漂移的<b class='flag-5'>新方法</b>

    亮相2024數字科技生態大會

    2024數字科技生態大會上,展示了多項聯網領域的前沿技術及應用成果,包括大模型、行業場景方案以及創新智能終端。
    的頭像 發表于 12-06 10:34 ?617次閱讀

    大華股份榮獲2024年中國創新方法大賽一等獎

    近日,由中國科協、重慶市人民政府舉辦的2024年中國創新方法大賽全國總決賽在重慶落下帷幕。大華股份靈活運用創新方法、突破行業性技術難題,憑借“不懼強光,分毫必現,基于TRIZ的強逆光銳捕技術”項目,斬獲全國一等獎。
    的頭像 發表于 12-04 17:19 ?652次閱讀

    利用全息技術在硅晶圓內部制造納米結構的新方法

    本文介紹了一種利用全息技術在硅晶圓內部制造納米結構的新方法。 研究人員提出了一種在硅晶圓內部制造納米結構的新方法。傳統上,晶圓上的微結構加工,僅限于通過光刻技術在晶圓表面加工納米結構。 然而,除了晶
    的頭像 發表于 11-18 11:45 ?657次閱讀

    上海光機所提出強激光產生高能量子渦旋態電子新方法

    近期,中國科學院上海光學精密機械研究所強場激光物理國家重點實驗室研究團隊發展了包括軌道角動量量子數的QED散射理論,并提出強激光產生高能量子渦旋態電子的新方法。相關成果以“Generation
    的頭像 發表于 10-23 10:41 ?434次閱讀
    上海光機所<b class='flag-5'>提出</b>強激光產生高能量子渦旋態電子<b class='flag-5'>新方法</b>

    保護4-20 mA,±20-mA模擬輸入的新方法

    電子發燒友網站提供《保護4-20 mA,±20-mA模擬輸入的新方法.pdf》資料免費下載
    發表于 09-24 09:27 ?0次下載
    保護4-20 mA,±20-mA模擬輸入的<b class='flag-5'>新方法</b>

    重慶兩江新區與吉利汽車集團、科技簽署合作協議

    日前,重慶兩江新區與吉利汽車集團、科技簽署戰略合作協議。市委書記袁家軍,市委副書記、市長胡衡華會見了吉利控股集團董事長李書福、科技董事長兼CEO印奇一行并見證簽約。
    的頭像 發表于 09-02 14:13 ?768次閱讀

    實踐JLink 7.62手動增加新MCU型號支持新方法

    大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是實踐JLink 7.62手動增加新MCU型號支持新方法
    的頭像 發表于 08-08 15:25 ?1196次閱讀
    實踐JLink 7.62手動增加新MCU型號支持<b class='flag-5'>新方法</b>

    聚焦物聯網場景,科技核心技術能力持續升級

    電子發燒友網報道(文/李彎彎)最近,上交所顯示,科技有限公司已更新提交相關財務資料。該公司早在2021年3月12日上市申請就獲受理,同年9月9日通過上市委會議,2021年9月30日提交注冊。作為
    的頭像 發表于 07-25 00:09 ?4739次閱讀

    一種無透鏡成像的新方法

    使用OAM-HHG EUV光束對高度周期性結構進行成像的EUV聚光顯微鏡 為了研究微電子或光子元件中的納米級圖案,一種基于無透鏡成像的新方法可以實現近乎完美的高分辨率顯微鏡。 層析成像是一種強大的無
    的頭像 發表于 07-19 06:20 ?670次閱讀
    一種無透鏡成像的<b class='flag-5'>新方法</b>
    主站蜘蛛池模板: 久久久无码精品无码国产人妻丝瓜 | 女人高潮时一吸一夹 | 日韩高清一区二区三区不卡 | 男人一生要读的书 | 色戒2小时38分在线观看 | 亚洲AV精品无码国产一区 | 欧美午夜福利主线路 | 久九九精品免费视频 | 国产精品无码中文在线AV | 欧美亚洲日韩一道免费观看 | 兔费看少妇性L交大片免费 偷偷要色偷偷 | 亚洲综合网国产精品一区 | 久久永久免费视频 | 入室强伦女教师被学生 | 国产精品无码视频一区二区 | 同房交换4p好爽 | 色多多污网站在线观看 | 亚洲AV天堂无码麻豆电影 | 国产在线观看成人 | av网站视频在线观看 | 強姧伦久久久久久久久 | 国产亚洲欧美高清在线 | 婷婷色色狠狠爱 | 空姐内射出白浆10p 空姐厕所啪啪啪 | 1000部做羞羞事禁片免费视频网站 | 日韩欧美精品有码在线播放 | 国产在线亚洲精品观看不卡 | AV无码久久无遮挡国产麻豆 | 国产午夜精品AV一区二区麻豆 | 亚洲高清国产品国语在线观看 | 日日a.v拍夜夜添久久免费 | 免费果冻传媒2021视频 | 袖珍人与大黑人性视频 | 国产成人无码精品久久久影院 | 中文国产乱码在线人妻一区二区 | 国产人妻精品无码AV在线五十路 | 99riav9 精品香蕉免费大视频 | 国产精品亚洲欧美一区麻豆 | 美女逼逼毛茸茸 | 一日本道伊人久久综合影 | 2022久久精品国产色蜜蜜麻豆 |

    電子發燒友

    中國電子工程師最喜歡的網站

    • 2931785位工程師會員交流學習
    • 獲取您個性化的科技前沿技術信息
    • 參加活動獲取豐厚的禮品