色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

半監督學習:比監督學習做的更好

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-08 23:32 ? 次閱讀
首發:AI公園公眾號
作者:Andre Ye
編譯:ronghuaiyang

導讀

為什么半監督學習是機器學習的未來。


監督學習是人工智能領域的第一種學習類型。從它的概念開始,無數的算法,從簡單的邏輯回歸到大規模的神經網絡,都已經被研究用來提高精確度和預測能力。
然而,一個重大突破揭示了添加“無監督數據”可以提高模型泛化和性能。事實上,在非常多的場景中,帶有標簽的數據并不容易獲得。半監督學習可以在標準的任務中實現SOTA的效果,只需要一小部分的有標記數據 —— 數百個訓練樣本。
在這個我們對半監督學習的探索中,我們會有:

  1. _半監督學習簡介_。什么是半監督學習,它與其他學習方法相比如何,半監督學習算法的框架/思維過程是什么?
  2. _算法:Semi-Supervised GANs_。與傳統GANs的比較,過程的解釋,半監督GANs的性能。
  3. _用例和機器學習的未來_。為什么半監督學習會有如此大的需求,哪里可以應用。

半監督學習介紹

半監督學習算法代表了監督和非監督算法的中間地帶。雖然沒有正式定義為機器學習的“第四個”元素(監督、無監督、強化),但它將前兩個方面結合成一種自己的方法。
這些算法操作的數據有一些標簽,但大部分是沒有標簽的。傳統上,人們要么選擇有監督學習的方式,只對帶有標簽的數據進行操作,這將極大地減小數據集的規模,要么,就會選擇無監督學習的方式,丟棄標簽保留數據集的其余部分,然后做比如聚類之類的工作。

這在現實世界中是很常見的。由于標注是很昂貴的,特別是大規模數據集,特別是企業用途的,可能只有幾個標簽。例如,考慮確定用戶活動是否具有欺詐性。在100萬用戶中,該公司知道有1萬用戶是這樣的,但其他9萬用戶可能是惡意的,也可能是良性的。半監督學習允許我們操作這些類型的數據集,而不必在選擇監督學習或非監督學習時做出權衡。
一般來說,半監督學習算法在這個框架上運行:

  1. 半監督機器學習算法使用有限的標記樣本數據集來訓練自己,從而形成一個“部分訓練”的模型。
  2. 部分訓練的模型對未標記的數據進行標記。由于樣本標記數據集有許多嚴重的限制(例如,在現實數據中的選擇偏差),標記的結果被認為是“偽標簽”數據。
  3. 結合標記和偽標簽數據集,創建一個獨特的算法,結合描述和預測方面的監督和非監督學習。

半監督學習利用分類過程來識別數據資產,利用聚類過程將其分成不同的部分。

算法:Semi-Supervised GAN

半監督的GAN,簡稱為SGAN,是[生成對抗網絡](https://medium.com/analytics-... -an-直覺解釋-革命概念-2f962c858b95)架構的一個變體,用于解決半監督學習問題。
在傳統的GAN中,判別器被訓練來預測由生成器模型生成的圖像是真實的還是假的,允許它從圖像中學習判別特征,即使沒有標簽。盡管大多數人通常在GANs中使用訓練很好的生成器,可以生成和數據集中相似的圖像,判別器還是可以通過以轉移學習作為起點在相同的數據集上建立分類器,允許監督任務從無監督訓練中受益。由于大部分的圖像特征已經被學習,因此進行分類的訓練時間和準確率會更好。
然而,在SGAN中,判別器同時接受兩種模式的訓練:無監督和監督。

  • 在無監督模式中,需要區分真實圖像和生成的圖像,就像在傳統的GAN中一樣。
  • 在監督模式中,需要將一幅圖像分類為幾個類,就像在標準的神經網絡分類器中一樣。

為了同時訓練這兩種模式,判別器必須輸出1 + _n_個節點的值,其中1表示“真或假”節點,_n_是預測任務中的類數。
在半監督GAN中,對判別器模型進行更新,預測K+1個類,其中K為預測問題中的類數,并為一個新的“_假_”類添加額外的類標簽。它涉及到同時訓練無監督分類任務和有監督分類任務的判別器模型。整個數據集都可以通過SGAN進行傳遞 —— 當一個訓練樣本有標簽時,判別器的權值將被調整,否則,分類任務將被忽略,判別器將調整權值以更好地區分真實的圖像和生成的圖像。

雖然允許SGAN進行無監督訓練,允許模型從一個非常大的未標記數據集中學習非常有用的特征提取,但有監督學習允許模型利用提取的特征并將其用于分類任務。其結果是一個分類器可以在像MNIST這樣的標準問題上取得令人難以置信的結果,即使是在非常非常少的標記樣本(數十到數百個)上進行訓練。
SGAN巧妙地結合了無監督和監督學習的方面,強強聯合,以最小的標簽量,產生難以置信的結果。

用例和機器學習的未來

在一個可用數據量呈指數級增長的時代,無監督數據根本不能停下來等待標注。無數真實世界的數據場景會像這樣出現 —— 例如,YouTube視頻或網站內容。從爬蟲引擎和內容聚合系統到圖像和語音識別,半監督學習被廣泛應用。
半監督學習將監督學習和非監督學習的過擬合和“不擬合”傾向(分別)結合起來的能力,創建了一個模型,在給出最小數量的標記數據和大量的未標記數據的情況下,可以出色地執行分類任務。除了分類任務,半監督算法還有許多其他用途,如增強聚類和異常檢測。盡管這一領域本身相對較新,但由于在當今的數字領域中發現了巨大的需求,算法一直在不斷地被創造和完善。
半監督學習確實是機器學習的未來。

—END—

英文原文:https://towardsdatascience.co...

推薦閱讀

關注圖像處理,自然語言處理,機器學習等人工智能領域,請點擊關注AI公園專欄
歡迎關注微信公眾號

審核編輯:符乾江
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1791

    文章

    47183

    瀏覽量

    238258
  • 機器學習
    +關注

    關注

    66

    文章

    8406

    瀏覽量

    132565
收藏 人收藏

    評論

    相關推薦

    時空引導下的時間序列自監督學習框架

    【導讀】最近,香港科技大學、上海AI Lab等多個組織聯合發布了一篇時間序列無監督預訓練的文章,相比原來的TS2Vec等時間序列表示學習工作,核心在于提出了將空間信息融入到預訓練階段,即在預訓練階段
    的頭像 發表于 11-15 11:41 ?240次閱讀
    時空引導下的時間序列自<b class='flag-5'>監督學習</b>框架

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    收集海量的文本數據作為訓練材料。這些數據集不僅包括語法結構的學習,還包括對語言的深層次理解,如文化背景、語境含義和情感色彩等。 自監督學習:模型采用自監督學習策略,在大量無標簽文本數據上學習
    發表于 08-02 11:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    章節最后總結了機器學習的分類:有監督學習、無監督學習監督學習、自監督學習和強化
    發表于 07-25 14:33

    神經網絡如何用無監督算法訓練

    神經網絡作為深度學習的重要組成部分,其訓練方式多樣,其中無監督學習是一種重要的訓練策略。無監督學習旨在從未標記的數據中發現數據內在的結構、模式或規律,從而提取有用的特征表示。這種訓練方式對于大規模未
    的頭像 發表于 07-09 18:06 ?775次閱讀

    深度學習中的無監督學習方法綜述

    應用中往往難以實現。因此,無監督學習在深度學習中扮演著越來越重要的角色。本文旨在綜述深度學習中的無監督學習方法,包括自編碼器、生成對抗網絡、聚類算法等,并分析它們的原理、應用場景以及優
    的頭像 發表于 07-09 10:50 ?683次閱讀

    前饋神經網絡的基本結構和常見激活函數

    和激活函數的非線性變換,能夠學習和模擬復雜的函數映射,從而解決各種監督學習任務。本文將詳細闡述前饋神經網絡的基本結構,包括其組成層、權重和偏置、激活函數等,并介紹幾種常見的激活函數及其特性。
    的頭像 發表于 07-09 10:31 ?773次閱讀

    基于FPGA的類腦計算平臺 —PYNQ 集群的無監督圖像識別類腦計算系統

    STDP 無監督學習算法,可運用于圖像的 無監督分類。 從平臺設計角度: (1)本設計搭建的基于 PYNQ 集群的通用低功耗的大規模類腦計算平臺,搭載 PYNN,NEST 等通用 SNN
    發表于 06-25 18:35

    CVPR&apos;24 Highlight!跟蹤3D空間中的一切!

    為了使用三維運動先驗正則化估計的三維軌跡,模型另外預測了每條軌跡的剛性嵌入,這使能夠軟地分組表現出相同剛性體運動的像素,并為每個剛性集群強制執行ARAP正則化。作者證明了剛性嵌入可以通過自監督學習,并產生不同剛性部分的合理分割。
    的頭像 發表于 04-13 12:12 ?1233次閱讀
    CVPR&apos;24 Highlight!跟蹤3D空間中的一切!

    為什么深度學習的效果更好

    導讀深度學習是機器學習的一個子集,已成為人工智能領域的一項變革性技術,在從計算機視覺、自然語言處理到自動駕駛汽車等廣泛的應用中取得了顯著的成功。深度學習的有效性并非偶然,而是植根于幾個基本原則和進步
    的頭像 發表于 03-09 08:26 ?618次閱讀
    為什么深度<b class='flag-5'>學習</b>的效果<b class='flag-5'>更好</b>?

    機器學習基礎知識全攻略

    監督學習通常是利用帶有專家標注的標簽的訓練數據,學習一個從輸入變量X到輸入變量Y的函數映射。Y = f (X),訓練數據通常是(n×x,y)的形式,其中n代表訓練樣本的大小,x和y分別是變量X和Y的樣本值。
    發表于 02-25 13:53 ?240次閱讀
    機器<b class='flag-5'>學習</b>基礎知識全攻略

    OpenAI推出Sora:AI領域的革命性突破

    大模型的核心技術是自然語言處理(NLP)和深度學習。具體而言,它基于Transformer架構,使用了大規模無監督學習方法,例如自回歸語言建模和掩碼語言建模,來訓練一個龐大的神經網絡模型。
    發表于 02-21 16:36 ?1009次閱讀
    OpenAI推出Sora:AI領域的革命性突破

    Meta發布新型無監督視頻預測模型“V-JEPA”

    Meta,這家社交媒體和科技巨頭,近日宣布推出一種新型的無監督視頻預測模型,名為“V-JEPA”。這一模型在視頻處理領域引起了廣泛關注,因為它通過抽象性預測生成視頻中缺失或模糊的部分來進行學習,提供了一種全新的視頻處理方法。
    的頭像 發表于 02-19 11:19 ?1009次閱讀

    描繪未知:數據缺乏場景的缺陷檢測方案

    Neuro-T 視覺平臺 克服了數據缺乏狀況的困難,通過零代碼設置 GAN模型 和 無監督學習模型 ,輕松實現缺陷圖像的標注、繪制和導出。 工業應用中存在較多的缺陷檢測需求。針對缺陷檢測需求,常見的解決方案有兩種: 基于目標正常圖像數據的模板匹配; 訓練深度學習
    的頭像 發表于 01-25 10:46 ?562次閱讀
    描繪未知:數據缺乏場景的缺陷檢測方案

    2024年AI領域將會有哪些新突破呢?

    傳統的機器學習需要大量的標記數據進行訓練,但自監督學習可以通過無監督的方式從大規模未標記的數據中學習到更有用的表示形式,從而提高模型的性能。
    的頭像 發表于 01-24 09:58 ?2007次閱讀

    谷歌MIT最新研究證明:高質量數據獲取不難,大模型就是歸途

    另一個極端是,監督學習方法(即SupCE)會將所有這些圖像視為單一類(如「金毛獵犬」)。這就忽略了這些圖像在語義上的細微差別,例如在一對圖像中狗在騎自行車,而在另一對圖像中狗坐在壽司屋內。
    的頭像 發表于 01-15 15:40 ?537次閱讀
    谷歌MIT最新研究證明:高質量數據獲取不難,大模型就是歸途
    主站蜘蛛池模板: 国产欧美另类久久久精品免费 | 亚洲午夜精品A片久久WWW软件| 无人区日本电影在线观看| 我的美女奴隶| 亚洲色欲色欲无码AV| 最美白虎逼| 被爽到叫呻呤视频免费视频| 国产AV精品无码免费看| 国语对白老女人8av| 李亚男三级| 日本无码人妻丰满熟妇5G影院| 午夜日韩久久影院| 一品道门在线观看免费视频| 97在线视频免费人妻| 国产成人精品男人的天堂网站 | 免费果冻传媒在线完整观看| 日本19xxxx撤尿| 羞羞影院午夜男女爽爽免费| 早乙女由依在线观看| NANANA在线观看高清影院| 国产精品网红女主播久久久| 久久久久久久久久综合情日本 | 97视频在线免费| 国产成人精品永久免费视频| 九色PORNY蝌蚪视频首页| 欧美亚洲另类丝袜自拍动漫| 午夜国产高清精品一区免费| 中文字幕在线免费观看视频| 第四色男人天堂| 久久yy99re66| 肉多的小说腐小说| 一个人看www| 丰满少妇发泄14p| 久久频这里精品99香蕉久网址| 日韩欧美中文字幕一区| 野花日本完整版在线观看免费高清| acg全彩无遮挡口工漫画网址| 国产看午夜精品理论片| 内射后入在线观看一区| 亚洲精品视频免费在线观看| u15女少天堂写真|