色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

機器學習新手基礎:十大算法導覽

新機器視覺 ? 來源:新機器視覺 ? 作者:王抒偉 ? 2020-11-27 10:00 ? 次閱讀

機器學習中,有一個稱為“ No Free Lunch ”的定理。簡單來說,與監督學習特別相關的這個定理,它指出沒有萬能算法,就是用一個算法能很好地解決每個問題。

例如,不能說神經網絡總是比決策樹更好,反之亦然。有許多因素在起作用,例如數據集的大小和結構。

那么,如果我遇到一個問題,首先應該嘗試多種不同的算法來解決問題,同時使用保留的“測試集”數據評估績效并選擇最優的那個算法,然后GitHub 搜索最優代碼修改哈哈哈哈。

當然,如果需要打掃房屋,可以使用吸塵器、掃帚或拖把。你不會用鏟子吧?
所以嘗試的算法必須適合要解決的問題,這才是選擇正確的機器學習任務的來源。

基礎

有一個通用原則是所有用于預測建模的受監督機器學習算法的基礎。

機器學習算法被描述為學習目標函數(f),該函數最好將輸入變量(X)映射到輸出變量(Y):Y = f(X)

這是一個簡單的學習任務,我們想在給定新的輸入變量(X)的情況下,對(Y)進行預測。但是不知道函數(f)。

機器學習的最常見類型是學習映射Y = f(X)可以對新X預測到Y,目標是盡可能進行最準確的預測。

對于初入機器學習領域,沒有機器學習基礎知識的新手,我會對常用的十大機器學習算法做簡單介紹。

1.線性回歸

線性回歸可能是統計和機器學習中最著名和最易理解的算法之一。

主要與最小化模型的誤差或做出盡可能準確的預測有關,但以可解釋性為代價。我們將從許多不同領域(包括統計數據)中學習。

線性回歸的表示法是一個方程,該方程通過找到稱為系數(B),來描述輸入變量(x)與輸出變量(y)之間關系的線。

例如:y = B0 + B1 * x 臥槽,這不是一次函數嗎?哈哈

給定輸入x,我們將預測y,線性回歸學習算法的目標是找到系數B0和B1的值, 例如用于普通最小二乘法和梯度下降優化的線性代數解。

2.LOGISTIC回歸

邏輯回歸是機器學習從統計領域“借”的另一種技術。它是二分類問題(具有兩個類值的問題)的首選方法。

Logistic回歸類似于線性回歸,因為目標是找到權重每個輸入變量的系數的值。與線性回歸不同,輸出的預測使用稱為對數函數的非線性函數進行變換。

邏輯函數看起來像一個大S,它將任何值轉換為0到1的范圍。因為我們可以將規則應用于邏輯函數的輸出為0和1(例如,如果IF小于0.5,則輸出1)并預測類別值。

與線性回歸一樣,當去除與輸出變量無關的屬性以及相關的屬性時,邏輯回歸的效果更好。這是一個快速學習二進制分類問題并有效的模型

3.線性判別分析

Logistic回歸是傳統上僅限于兩類分類問題的分類算法。如果是多分類,則線性判別分析算法(LDA)就是很重要的算法了。

LDA的表示非常簡單,它由數據的統計屬性組成,這些屬性是針對每個類別計算的。對于單個輸入變量,這包括:

每個類別的平均值。

計算所有類別的方差

通過為每個類別計算一個區分值并為具有最大值的類別進行預測來進行預測。
該算法的前提是:數據具有高斯分布(鐘形曲線),因此最好在操作之前從數據中刪除異常值。

4.分類和回歸樹

決策樹是用于預測建模機器學習的重要算法類型。
決策樹模型的表示形式是二叉樹。這是來自算法和數據結構的二叉樹,沒有什么花哨的。每個節點代表一個輸入變量(x)和該變量的分割點(假設變量是數字)。

樹的葉節點包含用于進行預測的輸出變量(y)。通過遍歷樹的拆分直到到達葉節點并在該葉節點輸出類值來進行預測。

樹學習速度很快,做出預測的速度也非常快。它們對于許多問題通常也很準確,不需要為數據做任何特殊預處理。

5-樸素貝葉斯

樸素貝葉斯(Naive Bayes)是一種簡單但功能強大的預測建模算法。

該模型由兩種類型的概率組成,可以直接從您的訓練數據中計算出:
1)每個類別的概率;
2)給定每個x值的每個類別的條件概率。

開始計算,概率模型可用于使用貝葉斯定理對新數據進行預測。當你的數據是實值時,通常會假設一個高斯分布(鐘形曲線),以便可以輕松地估計這些概率。

樸素貝葉斯之所以被稱為樸素,是因為它假定每個輸入變量都是獨立的。這是一個很強的假設,對于真實數據來說是不現實的,盡管如此,該技術對于大量復雜問題非常有效。

6 - K近鄰

KNN算法非常簡單且非常有效。KNN的模型表示是整個訓練數據集。簡單吧?

通過搜索整個訓練集中的K個最相似實例并匯總這K個實例的輸出變量,可以對新數據點進行預測。
對于回歸問題,這可能是平均輸出變量,對于分類問題,這可能是最常見的類別值。

訣竅在于如何確定數據實例之間的相似性。如果您的屬性都具有相同的比例(例如,都是距離數據),最簡單的方法是使用歐幾里得距離,您可以根據每個輸入變量之間的差異直接計算一個數字。

KNN可能需要大量內存或空間來存儲所有數據,因為它把所有數據都遍歷了。您還可以隨著時間的訓練數據,以保持預測的準確性。

距離或緊密度的概念可能會分解為非常高的維度(許多輸入變量),這可能會對問題的算法性能產生負面影響。所以對于數據的輸入就至關重要。

7- 矢量化學習

K最近的缺點是需要整個訓練數據集。學習向量量化算法(簡稱LVQ)是一種人工神經網絡算法,可讓選擇要需要的訓練實例數量。

LVQ的表示形式是向量的集合。這些是在最開始開始時隨機選擇的,適用于在學習算法的多次迭代中最好地總結訓練數據集。
學習之后,可以像使用K近鄰一樣,使用數據進行預測。通過計算每個向量與新數據實例之間的距離,可以找到最相似的數據向量(最佳匹配的向量)。然后返回最佳匹配的類值作為預測。記得數據歸一化,獲得的效果更好。

8-支持向量機

支持向量機可能是最受歡迎的機器學習算法之一。

超平面是分割輸入變量空間的線。
在SVM中,選擇一個超平面以按類別(類別0或類別1)最好地分隔輸入變量空間中的點。
在二維圖中,您可以將其可視化為一條線,并假設所有輸入點都可以被這條線完全隔開。SVM學習算法找到超平面對類進行最佳分離的系數。

超平面和最近的數據點之間的距離稱為邊距。可以將這兩個類別分開的最佳或最佳超平面是邊距最大的線。
僅這些點與定義超平面和分類器的構造有關。這些點稱為支持向量。
在實踐中,使用優化算法來找到使余量最大化的系數的值。

SVM可能是功能最強大的即用型分類器之一,使用頻率很高。

9-BAGGING和隨機森林

隨機森林是最流行,功能最強大的機器學習算法之一。這是一種稱為Bootstrap聚類或BAGGING的集成機器學習算法。

您需要對數據進行大量采樣,計算平均值,然后對所有平均值取平均值,以便更好地估算真實平均值。

在bagging中,使用相同的方法,但用于估計整個統計模型(最常見的是決策樹)。獲取訓練數據的多個樣本,然后為每個數據樣本構建模型。當你需要對新數據進行預測時,每個模型都將進行預測,并對預測取平均值以對真實輸出值進行更好的估計。

隨機森林是對這種方法的一種調整,在該方法中將創建決策樹,不是選擇最佳的拆分點。

因此,為每個數據樣本創建的模型與原先的模型相比,差異更大。將他們的預測結合起來可以更好地估計真實的基礎輸出值。

10-BOOSTING和ADABOOST

Boosting是一種集成技術,嘗試從多個弱分類器創建強分類器。這是通過從訓練數據構建模型,然后創建第二個模型來嘗試糾正第一個模型中的錯誤來完成的。添加模型,直到完美預測訓練集或添加最大數量的模型為止。

AdaBoost是為二進制分類開發的第一個真正成功的增強算法。這是了解增強的最佳起點。現代的增強方法基于AdaBoost,最著名的是隨機梯度增強機.

具體細節可以看這個視頻.

AdaBoost與決策樹一起使用。
創建第一棵樹后,將在每個訓練實例上使用該樹的性能來加權要創建的下一棵樹應注意每個訓練實例的關注程度。
難以預測的訓練數據的權重更高,而易于預測的實例的權重更低。依次創建模型,每個模型都會更新訓練實例上的權重,這些權重會影響序列中下一棵樹執行的學習。構建完所有樹之后,對新數據進行預測,并根據訓練數據的準確性對每棵樹的性能進行加權。

由于該算法在糾正錯誤方面投入了很多精力,因此刪除異常值和數據去噪非常重要。

責任編輯:xj

原文標題:機器學習新手的十大算法導覽

文章出處:【微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4620

    瀏覽量

    93046
  • 機器學習
    +關注

    關注

    66

    文章

    8424

    瀏覽量

    132765

原文標題:機器學習新手的十大算法導覽

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    華為發布2025智能光伏十大趨勢

    華為數字能源以“融合創新,智構未來,加速光伏成為主力能源”為主題,舉辦2025智能光伏十大趨勢發布會。華為數字能源智能光伏產品線總裁周濤發布了智能光伏十大趨勢和重磅白皮書,為光儲產業的高質量發展提供前瞻性支持。
    的頭像 發表于 01-06 17:12 ?312次閱讀

    華為云 Flexus X 實例部署安裝 Jupyter Notebook,學習 AI,機器學習算法

    前言 由于本人最近在學習一些機器算法,AI 算法的知識,需要搭建一個學習環境,所以就在最近購買的華為云 Flexus X 實例上安裝了
    的頭像 發表于 01-02 13:43 ?97次閱讀
    華為云 Flexus X 實例部署安裝 Jupyter Notebook,<b class='flag-5'>學習</b> AI,<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>

    傳統機器學習方法和應用指導

    在上一篇文章中,我們介紹了機器學習的關鍵概念術語。在本文中,我們會介紹傳統機器學習的基礎知識和多種算法特征,供各位老師選擇。 01 傳統
    的頭像 發表于 12-30 09:16 ?250次閱讀
    傳統<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    NPU與機器學習算法的關系

    在人工智能領域,機器學習算法是實現智能系統的核心。隨著數據量的激增和算法復雜度的提升,對計算資源的需求也在不斷增長。NPU作為一種專門為深度學習
    的頭像 發表于 11-15 09:19 ?511次閱讀

    知存科技WTM2101芯片助力行業AI新體驗

    知存科技WTM2101憑借顛覆性的存內計算架構,能夠在極低功耗和延時下運行智能語音、智能健康監測算法,已經率先落地AR眼鏡、藍牙耳機等領域實現百萬級終端應用。近日,WTM2101被創新應用于某語音領導品牌旗下的導游講解器發射
    的頭像 發表于 11-06 15:27 ?423次閱讀

    中國信通院發布“2024云計算十大關鍵詞”

    7月23日,由中國通信標準化協會主辦,中國信息通信研究院(簡稱“中國信通院”)承辦的“2024可信云大會”在京召開。大會上,中國信通院正式發布“2024云計算十大關鍵詞”,中國信通院云計算與大數
    的頭像 發表于 08-02 08:28 ?653次閱讀
    中國信通院發布“2024云計算<b class='flag-5'>十大</b>關鍵詞”

    機器學習算法原理詳解

    機器學習作為人工智能的一個重要分支,其目標是通過讓計算機自動從數據中學習并改進其性能,而無需進行明確的編程。本文將深入解讀幾種常見的機器學習
    的頭像 發表于 07-02 11:25 ?1134次閱讀

    機器學習的經典算法與應用

    關于數據機器學習就是喂入算法和數據,讓算法從數據中尋找一種相應的關系。Iris鳶尾花數據集是一個經典數據集,在統計學習
    的頭像 發表于 06-27 08:27 ?1679次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b>的經典<b class='flag-5'>算法</b>與應用

    LOTO示波器軟件新增功能

    是不熟練的客戶可能記不住各種功能的標簽位置在哪里,反而變得不快捷。為了適應大部分初學者客戶的操作習慣,我們在新版本的上位機軟件上改變了顯示方式,將所有功能分類整理,用的方式展示,這樣更方便不熟悉
    發表于 05-28 10:32

    STM32的ADC項目應用,用什么算法濾波和穩定數據抖動?

    STM32的ADC項目應用,大家都用什么算法濾波和穩定數據抖動。 ADC數據的抖動有時候應用在項目上讓人很是頭疼,什么度娘十大濾波算法也是要斟酌選用。 單片機項目設計中,外設ADC的使用總是少不了的,這也就涉及了相關的
    發表于 04-17 08:20

    機器學習怎么進入人工智能

    ,人工智能已成為一個熱門領域,涉及到多個行業和領域,例如語音識別、機器翻譯、圖像識別等。 在編程中進行人工智能的關鍵是使用機器學習算法,這是一類基于樣本數據和模型訓練來進行預測和判斷的
    的頭像 發表于 04-04 08:41 ?345次閱讀

    新手學習單片機最常見的六大誤區!

    最近看到臺私信要資料的同學比較多,想必大家都是對單片機有著濃厚的學習興趣,但是很多新手開始入門單片機的時候都會遇到一些學習的誤區,今天就來整理一下大家可能會遇到的六大誤區。單片機作為嵌入式系統的核心
    的頭像 發表于 03-28 08:03 ?885次閱讀
    <b class='flag-5'>新手</b><b class='flag-5'>學習</b>單片機最常見的六大誤區!

    計算機視覺的十大算法

    隨著科技的不斷發展,計算機視覺領域也取得了長足的進步。本文將介紹計算機視覺領域的十大算法,包括它們的基本原理、應用場景和優缺點。這些算法在圖像處理、目標檢測、人臉識別等領域有著廣泛的應用,對計算機
    的頭像 發表于 02-19 13:26 ?1262次閱讀
    計算機視覺的<b class='flag-5'>十大</b><b class='flag-5'>算法</b>

    睿創微納8微米榮獲“2023年度山東十大科技創新成果”

    1月11日,兩院院士評選“2023年中國/世界十大科技進展新聞”發布會在煙臺召開,會上公布“2023年度山東省十大科技創新成果”榜單。
    的頭像 發表于 01-16 09:48 ?557次閱讀
    睿創微納8微米榮獲“2023年度山東<b class='flag-5'>十大</b>科技創新成果”

    智慧文物系統的定位技術分析

    智慧文物系統的定位技術可以采用多種方式,下面是幾種常見的定位技術分析: 1. GPS定位:全球定位系統(GPS)是一種基于衛星的定位技術,通過接收衛星信號來獲取設備所在的地理位置。這種技術適用于
    的頭像 發表于 01-10 15:13 ?419次閱讀
    主站蜘蛛池模板: 国产在线视频分类精品| 日本久久网站| 亚洲精品成人| 无码人妻99久久密AV| 538prom国产在线视频一区| 麻豆XXXX乱女少妇精品-百度| 亚洲精品无码专区在线播放| 粉嫩极品国产在线观看| 涩涩爱涩涩电影网站| 国产午夜精品一区二区| 一区三区三区不卡| 黄色软件视频app| 中文字幕AV亚洲精品影视| 欧美丰满白嫩bbxx| 国产国产乱老熟视频网站| 亚洲影院在线播放| 国内精品久久久久久久试看| 微福利92合集| 九九热视频免费| 一级无毛片| 欧洲人交xxx69| WWW色视频片内射| 泡妞高手在都市免费观看| 国产精品视频第一区二区三区| 偷偷鲁手机在线播放AV| 久久精品无码成人国产毛| WWW污污污抽搐喷潮COM| 亚洲AV国产福利精品在现观看| 美女脱了内裤张开腿让男人爽| 国产 亚洲 中文在线 字幕| 野花日本免费完整版高清版动漫| 欧美精品九九99久久在免费线 | 国产成人免费观看| 学生精品国产在线视频| 免费国产在线观看| 91情国产l精品国产亚洲区| 色色色五的天| 麻豆啊传媒app黄版破解免费| 国产青青草原| 印度人XXx| 帅小伙和警官同性3p|