色之综合网,水多多凹凸福利视频导航,王者荣耀大乔被黄本库

1 表示學(xué)習(xí)中的坍塌問(wèn)題

在表示學(xué)習(xí)中，一種很常見(jiàn)的做法是利用孿生網(wǎng)絡(luò)的結(jié)構(gòu)，讓同一個(gè)樣本的不同數(shù)據(jù)增強(qiáng)后的表示相似。比如對(duì)于一張圖像，使用翻轉(zhuǎn)、裁剪等方法生成另一個(gè)增強(qiáng)圖像，兩個(gè)圖像分別經(jīng)過(guò)兩個(gè)共享參數(shù)的編碼器，得到表示，模型的優(yōu)化目標(biāo)是讓這兩個(gè)表示的距離近。

這種方法一個(gè)比較大的挑戰(zhàn)在于，模型在訓(xùn)練過(guò)程中容易出現(xiàn)坍塌問(wèn)題。模型可以把所有樣本的表示都學(xué)成完全相同的常數(shù)向量（比如每個(gè)樣本模型的輸出都是全0向量），這樣就能滿足上述兩個(gè)表示距離近的要求了。

2 解決坍塌問(wèn)題的方法

業(yè)內(nèi)有很多解決坍塌問(wèn)題的方法，主要可以分為4種類型：

對(duì)比學(xué)習(xí)方法：在訓(xùn)練一對(duì)正樣本對(duì)時(shí)，同時(shí)采樣大量的負(fù)樣本，讓正樣本之間離得近，負(fù)樣本之間離得遠(yuǎn)，避免模型偷懶把所有樣本的表示都學(xué)成一樣的。

聚類方法：在訓(xùn)練過(guò)程中增加一個(gè)聚類過(guò)程，將樣本分配給不同的類簇，然后在類簇級(jí)別進(jìn)行對(duì)比學(xué)習(xí)。

基于蒸餾的方法：通過(guò)模型結(jié)構(gòu)的角度避免坍塌問(wèn)題，學(xué)習(xí)一個(gè)student network來(lái)預(yù)測(cè)te acher network的表示，teacher network是student network參數(shù)的滑動(dòng)平均，teacher network不通過(guò)反向傳播更新參數(shù)。

信息最大化方法：讓生成的embedding中每一維的向量相互正交，使其信息量最大化，這樣可以避免各個(gè)維度的值信息過(guò)于冗余，防止坍塌問(wèn)題。

目前常用的負(fù)樣本采樣方法，一個(gè)比較大的問(wèn)題是計(jì)算開(kāi)銷大，取得好的效果往往需要大量負(fù)樣本，因此有了MoCo等對(duì)比學(xué)習(xí)框架。本文提出的方法基于信息最大化的思路，能夠只使用正樣本對(duì)實(shí)現(xiàn)表示學(xué)習(xí)的同時(shí)，防止坍現(xiàn)象的發(fā)生。關(guān)于對(duì)比學(xué)習(xí)的常用經(jīng)典方法，可以參考這篇文章：對(duì)比學(xué)習(xí)中的4種經(jīng)典訓(xùn)練模式。

3 信息最大化方法歷史工作

基于信息最大化的方法典型的工作有兩篇ICLM 2021的文章，分別是Whitening for Self-Supervised Representation Learning（ICML 2021，W-MSE）和Barlow twins: Self-supervised learning via redundancy reduction（ICML 2021）。下面介紹一下這兩篇文章的整體思路，F(xiàn)acebook的這篇論文也是基于這個(gè)思路設(shè)計(jì)的。

W-MSE的整體網(wǎng)絡(luò)結(jié)構(gòu)如上圖，模型中輸入一對(duì)互為正樣本的樣本對(duì)（例如一個(gè)圖像的不同增強(qiáng)形式），使用共享參數(shù)Encoder分別編碼后，增加一個(gè)whitening模塊，對(duì)每個(gè)batch內(nèi)的所有embedding進(jìn)行白化，讓embedding的各個(gè)維度變量線性無(wú)關(guān)，后面再接norm處理。下圖形式化表明了W-MSE的用途，通過(guò)白化+norm讓樣本形成一個(gè)球形分布，正樣本之間距離近，每個(gè)樣本需要調(diào)整自己在圓周上的位置拉進(jìn)正樣本之間的距離，形成最終的簇。

Barlow twins方法也是同樣的思路，只是做法不同。在得到一對(duì)正樣本的兩個(gè)embedding后，計(jì)算兩個(gè)向量各個(gè)變量之間的相關(guān)性矩陣，優(yōu)化這個(gè)矩陣接近對(duì)角矩陣，以此實(shí)現(xiàn)embedding中各個(gè)變量之間線性無(wú)關(guān)。

4 VICREG

Facebook團(tuán)隊(duì)提出的VICREG是上述基于信息最大化表示學(xué)習(xí)方法的一個(gè)擴(kuò)展，損失函數(shù)主要包括variance、invariance、covariance三個(gè)部分。模型的主體結(jié)構(gòu)如下，仍然是一個(gè)孿生網(wǎng)絡(luò)結(jié)構(gòu)，輸入一個(gè)樣本的不同view互為正樣本。

variance部分主要是讓batch內(nèi)每個(gè)樣本embedding向量的每一維變量之間的方差不小于一個(gè)值，這樣可以有效防止每個(gè)樣本的向量都對(duì)應(yīng)同一個(gè)點(diǎn)的情況，防止坍塌的發(fā)生。

invariance部分即讓正樣本對(duì)的表示embedding距離盡可能小，是正常的表示學(xué)習(xí)loss。

covariance借鑒了Barlow twins中的思路，讓batch內(nèi)的embedding非對(duì)角線元素盡可能為0，即讓表示向量各個(gè)維度變量線性無(wú)關(guān)。

最終的表示學(xué)習(xí)loss是由上述3個(gè)loss的加和：

5 實(shí)驗(yàn)結(jié)果

作者進(jìn)行了一些實(shí)驗(yàn)驗(yàn)證VICREG表示學(xué)習(xí)方法的效果。在ImageNet數(shù)據(jù)集上，使用不同方法預(yù)訓(xùn)練的表示接一個(gè)線性層進(jìn)行分類，或者基于預(yù)訓(xùn)練的表示使用部分?jǐn)?shù)據(jù)進(jìn)行finetune，對(duì)比圖像分類效果，實(shí)驗(yàn)結(jié)果如下：

作者也對(duì)比了在不同方法上是否采用variance或covariance等loss的效果變化：

6 總結(jié)

本文介紹了Facebook AI團(tuán)隊(duì)在2022年ICLR的一篇解決表示學(xué)習(xí)坍塌問(wèn)題的工作，順帶介紹了基于信息最大化的防坍塌工作，有助于幫助我們更深層次理解表示學(xué)習(xí)的原理，以及如何解決實(shí)際應(yīng)用表示學(xué)習(xí)、對(duì)比學(xué)習(xí)時(shí)遇到的坍塌問(wèn)題。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

矩陣

矩陣

+關(guān)注

關(guān)注
0

文章
423

瀏覽量
34581
Network

Network

+關(guān)注

關(guān)注
0

文章
64

瀏覽量
29644

原文標(biāo)題：ICLR2022 | Facebook AI提出解決表示學(xué)習(xí)坍塌問(wèn)題新方法

文章出處：【微信號(hào)：zenRRan，微信公眾號(hào)：深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

廣電計(jì)量新年首篇深度研究報(bào)告出爐

新年伊始，廣電計(jì)量首篇深度研究報(bào)告出爐，公司憑借全面發(fā)展的企業(yè)實(shí)力和資本市場(chǎng)的優(yōu)異表現(xiàn)在新的一年獲得資本市場(chǎng)的認(rèn)可。

發(fā)表于 01-03 11:31 ?271次閱讀

中國(guó)發(fā)展報(bào)告：我國(guó)是無(wú)人機(jī)第一大技術(shù)來(lái)源國(guó)

電子發(fā)燒友網(wǎng)報(bào)道（文/吳子鵬）近日，國(guó)務(wù)院發(fā)展研究中心撰寫并在京發(fā)布的《中國(guó)發(fā)展報(bào)告2024》顯示，與發(fā)展新質(zhì)生產(chǎn)力相適應(yīng)的新型生產(chǎn)關(guān)系正加快完善。比如低空經(jīng)濟(jì)，從20多個(gè)省份將其寫入政府工作報(bào)告

發(fā)表于 01-03 00:17 ?2144次閱讀

廣電計(jì)量助力第二屆低空科技發(fā)展大會(huì)區(qū)順利舉辦

低空經(jīng)濟(jì)是新質(zhì)生產(chǎn)力的典型代表，也將是中國(guó)經(jīng)濟(jì)新的增長(zhǎng)點(diǎn)，其戰(zhàn)略意義重大，發(fā)展前景廣闊。今年年初低空經(jīng)濟(jì)在全國(guó)兩會(huì)上作為“新增長(zhǎng)引擎”寫入政府工作報(bào)告。2024年伊始，低空經(jīng)濟(jì)被寫入陜西省政府工作報(bào)告，陜西低空經(jīng)濟(jì)發(fā)展迎來(lái)全新機(jī)遇。

發(fā)表于 12-24 11:23 ?246次閱讀

維智科技入選中國(guó)數(shù)據(jù)要素X行業(yè)應(yīng)用圖譜

自2014年“大數(shù)據(jù)”首次寫入政府工作報(bào)告以來(lái)，戰(zhàn)略重心逐步由“互聯(lián)網(wǎng)+”、“大數(shù)據(jù)戰(zhàn)略”、“數(shù)字化升級(jí)”向“培育數(shù)據(jù)要素市場(chǎng)”傾斜。

發(fā)表于 12-05 10:16 ?180次閱讀

杰和科技攜新品受邀參加深圳計(jì)算機(jī)行業(yè)協(xié)會(huì)會(huì)員大會(huì)

2024年8月23日杰和科技攜新品受邀參加深圳計(jì)算機(jī)行業(yè)協(xié)會(huì)會(huì)員大會(huì)2024年8月23日，深圳計(jì)算機(jī)行業(yè)協(xié)會(huì)舉行了第十一屆第一次會(huì)員大會(huì)，杰和科技受邀參加此次活動(dòng)，審議第十屆理事會(huì)工作報(bào)告、監(jiān)事會(huì)

發(fā)表于 09-12 08:12 ?282次閱讀

杰和科技攜新品受邀參加深圳計(jì)算機(jī)行業(yè)協(xié)會(huì)會(huì)員大會(huì)

羅德與施瓦茨發(fā)布城市空中交通eVTOL測(cè)試解決方案

2024年政府工作報(bào)告提出，“積極打造生物制造、商業(yè)航天、低空經(jīng)濟(jì)等新增長(zhǎng)引擎”。這是低空經(jīng)濟(jì)首次被寫入政府工作報(bào)告。低空經(jīng)濟(jì)依托于1000米以內(nèi)的低空空域，以各種有人駕駛和無(wú)人駕駛航空器的各類低空飛行活動(dòng)為牽引，輻射帶動(dòng)相關(guān)領(lǐng)域融合發(fā)展。

發(fā)表于 08-16 16:30 ?498次閱讀

AI入門之深度學(xué)習(xí)：基本概念篇

1、什么是深度學(xué)習(xí) 1.1、機(jī)器學(xué)習(xí) ?? ? 圖1：計(jì)算機(jī)有效工作的常用方法：程序員編寫規(guī)則（程序），計(jì)算機(jī)遵循這些規(guī)則將輸入數(shù)據(jù)轉(zhuǎn)換為適當(dāng)?shù)拇鸢浮＿@一方法被稱為符號(hào)主義人工智能，適

發(fā)表于 08-08 11:24 ?1976次閱讀

AI入門之深度<b class='flag-5'>學(xué)習(xí)</b>：基本概念<b class='flag-5'>篇</b>

深視智能參編《2024智能檢測(cè)裝備產(chǎn)業(yè)發(fā)展研究報(bào)告：機(jī)器視覺(jué)篇》

為全面了解機(jī)器視覺(jué)檢測(cè)裝備產(chǎn)業(yè)發(fā)展情況，中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院聯(lián)合業(yè)內(nèi)龍頭企業(yè)、科研院所和產(chǎn)業(yè)聯(lián)盟等（參編單位名單見(jiàn)附件），共同編制了《智能檢測(cè)裝備產(chǎn)業(yè)發(fā)展研究報(bào)告：機(jī)器視覺(jué)篇》。《智能檢測(cè)裝備

發(fā)表于 08-05 08:38 ?317次閱讀

深視智能參編《2024智能檢測(cè)裝備產(chǎn)業(yè)發(fā)展研究<b class='flag-5'>報(bào)告</b>：機(jī)器視覺(jué)<b class='flag-5'>篇</b>》

【《大語(yǔ)言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)篇

今天開(kāi)始學(xué)習(xí)《大語(yǔ)言模型應(yīng)用指南》第一篇——基礎(chǔ)篇，對(duì)于人工智能相關(guān)專業(yè)技術(shù)人員應(yīng)該可以輕松加愉快的完成此篇閱讀，但對(duì)于我還是有許多的知識(shí)點(diǎn)、專業(yè)術(shù)語(yǔ)比較陌生，需要網(wǎng)上搜索

發(fā)表于 07-25 14:33

基于Python和深度學(xué)習(xí)的CNN原理詳解

卷積神經(jīng)網(wǎng)絡(luò) (CNN) 由各種類型的層組成，這些層協(xié)同工作以從輸入數(shù)據(jù)中學(xué)習(xí)分層表示。每個(gè)層在整體架構(gòu)中都發(fā)揮著獨(dú)特的作用。

發(fā)表于 04-06 05:51 ?2188次閱讀

基于Python和深度<b class='flag-5'>學(xué)習(xí)</b>的CNN原理詳解

兩會(huì)過(guò)后，來(lái)CMIMS 2024看新能源汽車產(chǎn)業(yè)穩(wěn)中提質(zhì)

政府工作報(bào)告時(shí)，被多次提及的關(guān)鍵詞匯。政府工作報(bào)告中匯報(bào)了上一年我國(guó)在新能源汽車中取得的顯著成績(jī)，首先是我國(guó)新能源汽車產(chǎn)銷量占全球比重超過(guò)60%，另外，我國(guó)電動(dòng)汽車、鋰電池、光伏產(chǎn)品“新三樣”在去年出口增長(zhǎng)了近30%。

發(fā)表于 03-20 11:52 ?397次閱讀

兩會(huì)過(guò)后，來(lái)CMIMS 2024看新能源汽車產(chǎn)業(yè)穩(wěn)中提質(zhì)

中科曙光推出一種半實(shí)物實(shí)時(shí)仿真系統(tǒng)計(jì)算平臺(tái)及國(guó)產(chǎn)化方案

隨著各地新春第一會(huì)陸續(xù)召開(kāi)，已有31省、自治區(qū)、直轄市發(fā)布政府工作報(bào)告，對(duì)新一年數(shù)字經(jīng)濟(jì)發(fā)展做出詳實(shí)規(guī)劃，尤其對(duì)裝備制造、工業(yè)仿真軟件等做出具體部署。

發(fā)表于 03-19 09:42 ?696次閱讀

颯特紅外2023年售后服務(wù)工作報(bào)告

這是颯特紅外投身紅外熱像儀研制生產(chǎn)的第33個(gè)年頭，這是颯特紅外售后服務(wù)工作與合作伙伴共慶的第33個(gè)315。

發(fā)表于 03-15 09:20 ?387次閱讀

颯特紅外2023年售后服務(wù)<b class='flag-5'>工作報(bào)告</b>

從政府工作報(bào)告看磁元件2024年機(jī)遇

字越少，事越大!政府工作報(bào)告提到的2024年重點(diǎn)工作，對(duì)行業(yè)來(lái)說(shuō)有哪些機(jī)會(huì)? 2024年3月5日，十四屆全國(guó)人大二次會(huì)議在人民大會(huì)堂開(kāi)幕，國(guó)務(wù)院總理李強(qiáng)作政府工作報(bào)告。政府工作報(bào)告中

發(fā)表于 03-11 15:13 ?329次閱讀