色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于有效樣本的類別不平衡損失

自然語言處理愛好者 ? 來源:AI公園 ? 作者:Sik-Ho Tsang ? 2021-08-16 11:14 ? 次閱讀

導讀

使用每個類的有效樣本數量來重新為每個類的Loss分配權重,效果優于RetinaNet中的Focal Loss。

本文綜述了康奈爾大學、康奈爾科技、谷歌Brain和Alphabet公司的基于有效樣本數的類平衡損失(CB損失)。在本文中,設計了一種重新加權的方案,利用每個類的有效樣本數來重新平衡損失,稱為類別平衡損失。

1. 類別平衡問題

假設有像上面那樣的不平衡的類。head:對于索引小的類,這些類有較多的樣本。Tail:對于大索引的類,這些類的樣本數量較少。黑色實線:直接在這些樣本上訓練的模型偏向于優勢類。紅色虛線:通過反向類頻率來重新加權損失可能會在具有高類不平衡的真實數據上產生較差的性能。藍虛線:設計了一個類平衡項,通過反向有效樣本數來重新加權損失。

2. 有效樣本數量

2.1. 定義

6f483fc4-fd9a-11eb-9bcf-12bb97331649.png

數據間信息重疊,左:特征空間S,中:1個樣本數據的單位體積,右:數據間信息重疊

直覺上,數據越多越好。但是,由于數據之間存在信息重疊,隨著樣本數量的增加,模型從數據中提取的邊際效益會減少

左:給定一個類,將該類的特征空間中所有可能數據的集合表示為S。假設S的體積為N且N≥1。中:S子集中的每個樣本的單位體積為1,可能與其他樣本重疊。Right:從S中隨機抽取每個子集,覆蓋整個S集合。采樣的數據越多,S的覆蓋率就越好。期望的采樣數據總量隨著樣本數量的增加而增加,以N為界。

因此,將有效樣本數定義為樣本的期望體積。

這個想法是通過使用一個類的更多數據點來捕捉邊際效益的遞減。由于現實世界數據之間的內在相似性,隨著樣本數量的增加,新添加的樣本極有可能是現有樣本的近重復。另外,cnn是用大量的數據增廣來訓練的,所有的增廣實例也被認為與原始實例相同。對于一個類,N可以看作是唯一原型的數量。

2.2. 數學公式

En表示樣本的有效數量(期望體積)。為了簡化問題,不考慮部分重疊的情況。也就是說,一個新采樣的數據點只能以兩種方式與之前的采樣數據交互:完全在之前的采樣數據集中,概率為p,或完全在原來的數據集之外,的概率為1- p。

有效數字:En = (1?β^n)/(1?β),其中,β = (N? 1)/N,這個命題可以用數學歸納法證明。當E1 = 1時,不存在重疊,E1 =(1?β^1)/(1?β) = 1成立。假設已經有n?1個樣本,并且即將對第n個樣本進行采樣,現在先前采樣數據的期望體積為En ?1,而新采樣的數據點與先前采樣點重疊的概率為 p = E(n?1)/N。因此,第n個實例采樣后的期望體積為:

6f8b26a4-fd9a-11eb-9bcf-12bb97331649.png

此時:

我們有:

6fc6da32-fd9a-11eb-9bcf-12bb97331649.png

上述命題表明有效樣本數是n的指數函數。超參數β∈[0,1)控制En隨著n的增長有多快。

3. 類別平衡 Loss (CB Loss)

類別平衡(CB)loss可以寫成:

6fe31a80-fd9a-11eb-9bcf-12bb97331649.png

其中,ny是類別y的ground-truth的數量。β = 0對應沒有重新加權, β → 1對應于用反向頻率進行加權。

提出的有效樣本數的新概念使我們能夠使用一個超參數β來平滑地調整無重權和反向類頻率重權之間的類平衡項。

所提出的類平衡項是模型不可知的和損失不可知的,因為它獨立于損失函數L和預測類概率p的選擇。

3.1. 類別平衡的 Softmax 交叉熵損失

給定一個標號為y的樣本,該樣本的softmax交叉熵(CE)損失記為:

6ff9c546-fd9a-11eb-9bcf-12bb97331649.png

假設類y有ny個訓練樣本,類平衡(CB)softmax交叉熵損失為:

70271b54-fd9a-11eb-9bcf-12bb97331649.png

3.2. 類別平衡的 Sigmoid 交叉熵損失

當對多類問題使用sigmoid函數時,網絡的每個輸出都執行一個one-vs-all分類,以預測目標類在其他類中的概率。在這種情況下,Sigmoid不假定類之間的互斥性。由于每個類都被認為是獨立的,并且有自己的預測器,所以sigmoid將單標簽分類和多標簽預測統一起來。這是一個很好的屬性,因為現實世界的數據通常有多個語義標簽。sigmoid交叉熵(CE)損失可以寫成:

7032cd82-fd9a-11eb-9bcf-12bb97331649.png

類平衡(CB) sigmoid交叉熵損失為:

709d0724-fd9a-11eb-9bcf-12bb97331649.png

3.3. 類別平衡 Focal Loss

Focal loss (FL)是在RetinaNet中提出的,可以減少分類很好的樣本的損失,聚焦于困難的樣本。

類別平衡的 (CB) Focal Loss為:

70d554f8-fd9a-11eb-9bcf-12bb97331649.png

4. 實驗結果

4.1. 數據集

試驗了CIFAR-10和CIFAR-100的5個不平衡系數分別為10、20、50、100和200的長尾版本。iNaturalist 和ILSVRC是天然的類別不平衡數據集。

上面顯示了每個類具有不同不平衡因素的圖像數量。

4.2. CIFAR 數據集

loss類型的超參數搜索空間為{softmax, sigmoid, focal}, [focal loss]的超參數搜索空間為β∈{0.9,0.99,0.999,0.9999},γ∈{0.5,1.0,2.0}。在CIFAR-10上,最佳的β一致為0.9999。但在CIFAR-100上,不同不平衡因子的數據集往往有不同且較小的最優β。

718c16f2-fd9a-11eb-9bcf-12bb97331649.png

有和沒有類平衡項時的分類錯誤率

在CIFAR-10上,根據β = 0.9999重新加權后,有效樣本數與樣本數接近。這意味著CIFAR-10的最佳重權策略與逆類頻率重權類似。在CIFAR-100上,使用較大的β的性能較差,這表明用逆類頻率重新加權不是一個明智的選擇,需要一個更小的β,具有更平滑的跨類權重。例如,一個特定鳥類物種的獨特原型數量應該小于一個一般鳥類類的獨特原型數量。由于CIFAR-100中的類比CIFAR-10更細粒度,因此CIFAR-100的N比CIFAR-10小。

4.3. 大規模數據集

721263ba-fd9a-11eb-9bcf-12bb97331649.png

在所有數據集驗證集上,使用不同損失函數訓練的大規模數據集上的Top-1和Top-5分類錯誤率

使用了類平衡的Focal Loss,因為它具有更大的靈活性,并且發現β = 0.999和γ = 0.5在所有數據集上都獲得了合理的良好的性能。值得注意的是,使用了類別平衡的Focal Loss來代替Softmax交叉熵,ResNet-50能夠達到和ResNet-152相應的性能。

以上數字顯示類平衡的Focal Loss損失經過60個epochs的訓練后,開始顯示其優勢。

英文原文:https://medium.com/nerd-for-tech/review-cb-loss-class-balanced-loss-based-on-effective-number-of-samples-image-classification-3056a1a1a001

作者:Sik-Ho Tsang

編譯:ronghuaiyang(AI公園)

編輯:jq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6172

    瀏覽量

    105625
  • 數據集
    +關注

    關注

    4

    文章

    1208

    瀏覽量

    24737
  • cnn
    cnn
    +關注

    關注

    3

    文章

    353

    瀏覽量

    22246

原文標題:CB Loss:基于有效樣本的類別不平衡損失

文章出處:【微信號:NLP_lover,微信公眾號:自然語言處理愛好者】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    電容器不平衡保護動作原因分析

    電容器不平衡保護動作的原因多種多樣,主要包括以下幾個方面: 1. 電容器組內部故障 電容量不平衡 :電容器組中的電容器由于老化、損壞或制造差異,可能導致三相電容量不平衡。當三相之間電容值差異較大
    的頭像 發表于 09-20 15:43 ?1162次閱讀

    LCR測試儀如何測量不平衡度?

    在電路設計和維修中,了解電路元件的特性是非常重要的。LCR測試儀就是一種常用的檢測儀器,它可以測量電感(L)、電容(C)和電阻(R)的參數。其中,測量不平衡度是LCR測試儀的一項重要功能。那么
    的頭像 發表于 08-26 16:49 ?502次閱讀
    LCR測試儀如何測量<b class='flag-5'>不平衡</b>度?

    電容電壓分配不平衡的影響

    電容電壓分配不平衡(也稱為電容器電壓不均衡)在電力系統中可能會產生多種負面影響,具體包括以下幾點: 1、過壓導致的電容器損壞 電壓不平衡會導致某些電容器承受過高的電壓,超過其額定值。這種過壓可能會
    的頭像 發表于 08-09 14:15 ?802次閱讀
    電容電壓分配<b class='flag-5'>不平衡</b>的影響

    三相電流不平衡對電壓影響大嗎

    在現代電力系統中,三相交流電是最常見的供電方式。三相電流平衡是保證電力系統穩定運行的關鍵因素之一。然而,由于多種原因,三相電流可能會出現不平衡現象,這對電力系統的電壓穩定性和設備的正常運行
    的頭像 發表于 07-25 16:28 ?1273次閱讀

    三相負載不平衡會引起零序電流嗎

    會。三相負載不平衡是指在三相電力系統中,三個相的負載電流不相等。這種情況在實際應用中是比較常見的,比如在工業生產、民用建筑等場合。三相負載不平衡會引起一系列的問題,其中之一就是零序電流的產生。 一
    的頭像 發表于 07-25 16:26 ?1361次閱讀

    不平衡電流和零序電流的區別是什么

    在電力系統中,電流的平衡不平衡是影響電力系統穩定性和安全性的重要因素。不平衡電流和零序電流是兩種常見的電流類型,它們在電力系統中扮演著不同的角色。 一、定義 不平衡電流 是指三相電力
    的頭像 發表于 07-25 16:24 ?1340次閱讀

    三相電流不平衡會產生零序電流嗎

    會產生。在電力系統中,三相電流不平衡是一個常見的問題,它會導致許多不良后果,如設備過熱、效率降低、電能損耗增加等。而零序電流則是電力系統中一種特殊的電流形式,它與三相電流不平衡有著密切的關系。 一
    的頭像 發表于 07-25 16:22 ?1294次閱讀

    軟啟動三相不平衡的解決辦法有哪些

    軟啟動三相不平衡是指在軟啟動過程中,三相電動機的電流不平衡,導致電動機的運行效率降低,甚至可能引發電動機的損壞。針對這個問題,我們可以從多個方面進行解決。 一、軟啟動三相不平衡的原因分析 電源電壓
    的頭像 發表于 07-02 09:40 ?2859次閱讀

    軟啟動報三相電流不平衡怎么處理

    軟啟動器是一種用于電動機啟動的電氣設備,它可以有效地降低電動機啟動時的電流沖擊,減少對電網和電動機的影響。然而,在實際應用中,軟啟動器有時會出現三相電流不平衡的問題,這會對電動機的正常運行和軟啟動
    的頭像 發表于 06-18 11:44 ?4581次閱讀

    電弧爐三相電流不平衡對補償設備的損害

    電弧爐三相電流不平衡可能對補償設備造成以下幾種損害: 1、過載:當電弧爐三相電流不平衡時,某一相的電流可能會比其他相大很多,導致該相的補償設備承受過載。長時間的過載可能會損壞補償設備或縮短其壽命
    的頭像 發表于 06-04 14:25 ?462次閱讀
    電弧爐三相電流<b class='flag-5'>不平衡</b>對補償設備的損害

    三相四線負荷不平衡影響計量嗎為什么

    三相四線負荷不平衡是指三相電源接線不平衡導致三相電流不相等的情況。負荷不平衡會對電力計量產生一定的影響,包括電能計量的準確性以及電力系統的穩定性。下面將詳細介紹三相四線負荷不平衡對計量
    的頭像 發表于 03-29 15:50 ?2463次閱讀

    三相不平衡調節裝置 三相不平衡會造成什么后果

    三相不平衡調節裝置是一種用于解決三相電力系統中三相電壓或電流不平衡問題的設備。在本文中,我們將探討三相不平衡的原因、后果和解決方案,并詳細介紹三相不平衡調節裝置的工作原理和應用。 引言
    的頭像 發表于 02-06 10:14 ?1930次閱讀

    三相不平衡最佳解決辦法 三相不平衡多少范圍內是合理的

    三相不平衡最佳解決辦法 在電力系統中,三相不平衡是指三個相之間電壓或電流不相等的現象。當三相不平衡的情況發生時,可能會導致線路過載、設備壽命縮短、電能損耗增加等問題。因此,解決三相不平衡
    的頭像 發表于 02-06 10:07 ?3350次閱讀

    三相電流不平衡是指什么?三相電流不平衡允許范圍是多少

    三相電流不平衡是指什么?三相電流不平衡允許范圍是多少? 三相電流不平衡是指三相電路中三個相位電流的大小不相等或相位角不相等的情況。在理想的三相電路中,三個相位電流應當相等,相位角差120度。 然而
    的頭像 發表于 02-02 17:34 ?9020次閱讀

    論述無功補償在三相不平衡治理中的應用和重要性

    論述無功補償在三相不平衡治理中的應用和重要性 三相不平衡是指三相電源中存在電壓或電流的非對稱性,這種非對稱性會影響電力系統的穩定性和效率。無功補償是一種提供無功電流或電壓的技術手段,可以解決三相
    的頭像 發表于 01-23 16:28 ?1602次閱讀
    主站蜘蛛池模板: 乱h好大噗嗤噗嗤烂了| 欧美色图天堂网| 在线亚洲黄色| 攻把受做得合不拢腿play| 久久精品久精品99热| 日本电影免费久久精品| 成人在线观看免费视频| 窝窝色资源站| 成人性生交片无码免费看| 我解开了岳的乳第一个女人 | 不知火舞vs精子| 男人把女人桶到高潮嗷嗷叫| 自拍区偷拍亚洲视频| 极品少妇高潮啪啪AV无码吴梦梦| 中国成人在线视频| 日本888 xxxx| 久久九九有精品国产23百花影院| xxx在线播放| 亚洲伊人久久综合影院2021| 国语自产拍大学生在线观看| 365电影成人亚洲网在线观看| 精品含羞草免费视频观看| av免费网站不卡观看| 亚洲成人网导航| 欧美人与动牲交A精品| 国语对白嫖老妇胖老太| AV亚洲精品少妇毛片无码| 亚洲第一天堂无码专区| 欧美派对xxxhdparty| 黄页网站免费视频大全9| 成人性生交片无码免费看| 影音先锋av色咪影院| 婷婷综合久久狠狠色| 国产亚洲精品AV麻豆狂野| 亚洲国产三级在线观看| 青青草视频在线ac| 久久精品一区二区三区资源网 | 国内自拍 在线 亚洲 欧美| www黄色大片| 午夜家庭影院| 久草在线福利资站免费视频|