色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

淺析機器學習常用的算法

Q4MP_gh_c472c21 ? 來源:cc ? 2019-01-23 16:04 ? 次閱讀

簡介

機器學習的知識樹,來源GitHub:

簡單的翻譯一下這個樹:

監督學習

監督學習可以看作是原先的預測模型,有基礎的訓練數據,再將需要預測的數據進行輸入,得到預測的結果(不管是連續的還是離散的)

1、決策樹(Decision Tree,DT)

決策樹是一種樹形結構,為人們提供決策依據,決策樹可以用來回答yes和no問題,它通過樹形結構將各種情況組合都表示出來,每個分支表示一次選擇(選擇yes還是no),直到所有選擇都進行完畢,最終給出正確答案。

決策樹(decision tree)是一個樹結構(可以是二叉樹或非二叉樹)。在實際構造決策樹時,通常要進行剪枝,這時為了處理由于數據中的噪聲和離群點導致的過分擬合問題。剪枝有兩種:

先剪枝——在構造過程中,當某個節點滿足剪枝條件,則直接停止此分支的構造。

后剪枝——先構造完成完整的決策樹,再通過某些條件遍歷樹進行剪枝。

2、樸素貝葉斯分類器(Naive Bayesian Model,NBM)

樸素貝葉斯分類器基于貝葉斯定理及其假設(即特征之間是獨立的,是不相互影響的),主要用來解決分類和回歸問題。

具體應用有:

標記一個電子郵件為垃圾郵件或非垃圾郵件;

將新聞文章分為技術類、政治類或體育類;

檢查一段文字表達積極的情緒,或消極的情緒;

用于人臉識別軟件。

學過概率的同學一定都知道貝葉斯定理,這個在250多年前發明的算法,在信息領域內有著無與倫比的地位。貝葉斯分類是一系列分類算法的總稱,這類算法均以貝葉斯定理為基礎,故統稱為貝葉斯分類。樸素貝葉斯算法(Naive Bayesian) 是其中應用最為廣泛的分類算法之一。樸素貝葉斯分類器基于一個簡單的假定:給定目標值時屬性之間相互條件獨立。

3、最小二乘法(Least squares)

你可能聽說過線性回歸。最小均方就是用來求線性回歸的。如下圖所示,平面內會有一系列點,然后我們求取一條線,使得這條線盡可能擬合這些點分布,這就是線性回歸。這條線有多種找法,最小二乘法就是其中一種。最小二乘法其原理如下,找到一條線使得平面內的所有點到這條線的歐式距離和最小。這條線就是我們要求取得線。

4、邏輯回歸(Logistic Regression)

邏輯回歸模型是一個二分類模型,它選取不同的特征與權重來對樣本進行概率分類,用一個log函數計算樣本屬于某一類的概率。即一個樣本會有一定的概率屬于一個類,會有一定的概率屬于另一類,概率大的類即為樣本所屬類。用于估計某種事物的可能性。

5、支持向量機(SVM)

支持向量機(support vector machine)是一個二分類算法,它可以在N維空間找到一個(N-1)維的超平面,這個超平面可以將這些點分為兩類。也就是說,平面內如果存在線性可分的兩類點,SVM可以找到一條最優的直線將這些點分開。SVM應用范圍很廣。

要將兩類分開,想要得到一個超平面,最優的超平面是到兩類的margin達到最大,margin就是超平面與離它最近一點的距離,如下圖,Z2>Z1,所以綠色的超平面比較好。

6、K最近鄰算法(KNN,K-NearestNeighbor)

鄰近算法,或者說K最近鄰(KNN,K-NearestNeighbor)分類算法是數據挖掘分類技術中最簡單的方法之一。KNN算法的核心思想是如果一個樣本在特征空間中的k個最相鄰的樣本中的大多數屬于某一個類別,則該樣本也屬于這個類別,并具有這個類別上樣本的特性。該方法在確定分類決策上只依據最鄰近的一個或者幾個樣本的類別來決定待分樣本所屬的類別。 KNN方法在類別決策時,只與極少量的相鄰樣本有關。由于KNN方法主要靠周圍有限的鄰近的樣本,而不是靠判別類域的方法來確定所屬類別的,因此對于類域的交叉或重疊較多的待分樣本集來說,KNN方法較其他方法更為適合。

主要應用領域是對未知事物的識別,即判斷未知事物屬于哪一類,判斷思想是,基于歐幾里得定理,判斷未知事物的特征和哪一類已知事物的的特征最接近。如上圖,綠色圓要被決定賦予哪個類,是紅色三角形還是藍色四方形?如果K=3,由于紅色三角形所占比例為2/3,綠色圓將被賦予紅色三角形那個類,如果K=5,由于藍色四方形比例為3/5,因此綠色圓被賦予藍色四方形類。由此也說明了KNN算法的結果很大程度取決于K的選擇。

7、集成學習(Ensemble Learning)

集成學習就是將很多分類器集成在一起,每個分類器有不同的權重,將這些分類器的分類結果合并在一起,作為最終的分類結果。最初集成方法為貝葉斯決策。

集成算法用一些相對較弱的學習模型獨立地就同樣的樣本進行訓練,然后把結果整合起來進行整體預測。集成算法的主要難點在于究竟集成哪些獨立的較弱的學習模型以及如何把學習結果整合起來。這是一類非常強大的算法,同時也非常流行。

常見的算法包括:

Boosting, Bootstrapped Aggregation(Bagging),

AdaBoost,堆疊泛化(Stacked Generalization, Blending),

梯度推進機(Gradient Boosting Machine, GBM),隨機森林(Random Forest)。

那么集成方法是怎樣工作的,為什么他們會優于單個的模型?

他們拉平了輸出偏差:如果你將具有民主黨傾向的民意調查和具有共和黨傾向的民意調查取平均,你將得到一個中和的沒有傾向一方的結果。

它們減小了方差:一堆模型的聚合結果和單一模型的結果相比具有更少的噪聲。在金融領域,這被稱為多元化——多只股票的混合投資要比一只股票變化更小。這就是為什么數據點越多你的模型會越好,而不是數據點越少越好。

它們不太可能產生過擬合:如果你有一個單獨的沒有過擬合的模型,你是用一種簡單的方式(平均,加權平均,邏輯回歸)將這些預測結果結合起來,然后就沒有產生過擬合的空間了。

無監督學習

1、聚類算法

聚類算法就是將一堆數據進行處理,根據它們的相似性對數據進行聚類。

聚類,就像回歸一樣,有時候人們描述的是一類問題,有時候描述的是一類算法。聚類算法通常按照中心點或者分層的方式對輸入數據進行歸并。所以的聚類算法都試圖找到數據的內在結構,以便按照最大的共同點將數據進行歸類。常見的聚類算法包括 k-Means算法以及期望最大化算法(Expectation Maximization, EM)。

聚類算法有很多種,具體如下:中心聚類、關聯聚類、密度聚類、概率聚類、降維、神經網絡/深度學習

2、K-均值算法(K-Means)

K-means算法是硬聚類算法,是典型的基于原型的目標函數聚類方法的代表,它是數據點到原型的某種距離作為優化的目標函數,利用函數求極值的方法得到迭代運算的調整規則。K-means算法以歐式距離作為相似度測度,它是求對應某一初始聚類中心向量V最優分類,使得評價指標J最小。算法采用誤差平方和準則函數作為聚類準則函數。K-means算法是很典型的基于距離的聚類算法,采用距離作為相似性的評價指標,即認為兩個對象的距離越近,其相似度就越大。該算法認為簇是由距離靠近的對象組成的,因此把得到緊湊且獨立的簇作為最終目標。

通常,人們根據樣本間的某種距離或者相似性來定義聚類,即把相似的(或距離近的)樣本聚為同一類,而把不相似的(或距離遠的)樣本歸在其他類。

3、主成分分析(Principal Component Analysis,PCA)

主成分分析是利用正交變換將一些列可能相關數據轉換為線性無關數據,從而找到主成分。PCA方法最著名的應用應該是在人臉識別中特征提取及數據降維。

PCA主要用于簡單學習與可視化中數據壓縮、簡化。但是PCA有一定的局限性,它需要你擁有特定領域的相關知識。對噪音比較多的數據并不適用。

4、SVD矩陣分解(Singular Value Decomposition)

也叫奇異值分解(Singular Value Decomposition),是線性代數中一種重要的矩陣分解,是矩陣分析中正規矩陣酉對角化的推廣。在信號處理、統計學等領域有重要應用。SVD矩陣是一個復雜的實復負數矩陣,給定一個m行、n列的矩陣M,那么M矩陣可以分解為M = UΣV。U和V是酉矩陣,Σ為對角陣。

PCA實際上就是一個簡化版本的SVD分解。在計算機視覺領域,第一個臉部識別算法就是基于PCA與SVD的,用特征對臉部進行特征表示,然后降維、最后進行面部匹配。盡管現在面部識別方法復雜,但是基本原理還是類似的。

5、獨立成分分析(ICA)

獨立成分分析(Independent Component Analysis,ICA)是一門統計技術,用于發現存在于隨機變量下的隱性因素。ICA為給觀測數據定義了一個生成模型。在這個模型中,其認為數據變量是由隱性變量,經一個混合系統線性混合而成,這個混合系統未知。并且假設潛在因素屬于非高斯分布、并且相互獨立,稱之為可觀測數據的獨立成分。

ICA與PCA相關,但它在發現潛在因素方面效果良好。它可以應用在數字圖像、檔文數據庫、經濟指標、心里測量等。

上圖為基于ICA的人臉識別模型。實際上這些機器學習算法并不是全都像想象中一樣復雜,有些還和高中數學緊密相關。

強化學習

1、Q-Learning算法

Q-learning要解決的是這樣的問題:一個能感知環境的自治agent,怎樣通過學習選擇能達到其目標的最優動作。

強化學習目的是構造一個控制策略,使得Agent行為性能達到最大。Agent從復雜的環境中感知信息,對信息進行處理。Agent通過學習改進自身的性能并選擇行為,從而產生群體行為的選擇,個體行為選擇和群體行為選擇使得Agent作出決策選擇某一動作,進而影響環境。增強學習是指從動物學習、隨機逼近和優化控制等理論發展而來,是一種無導師在線學習技術,從環境狀態到動作映射學習,使得Agent根據最大獎勵值采取最優的策略;Agent感知環境中的狀態信息,搜索策略(哪種策略可以產生最有效的學習)選擇最優的動作,從而引起狀態的改變并得到一個延遲回報值,更新評估函數,完成一次學習過程后,進入下一輪的學習訓練,重復循環迭代,直到滿足整個學習的條件,終止學習。

Q-Learning是一種無模型的強化學習技術。具體來說,可以使用Q學習來為任何給定的(有限的)馬爾可夫決策過程(MDP)找到最優的動作選擇策略。它通過學習一個動作價值函數,最終給出在給定狀態下采取給定動作的預期效用,然后遵循最優策略。一個策略是代理在選擇動作后遵循的規則。當這種動作值函數被學習時,可以通過簡單地選擇每個狀態中具有最高值的動作來構建最優策略。 Q-learning的優點之一是能夠比較可用操作的預期效用,而不需要環境模型。此外,Q學習可以處理隨機過渡和獎勵的問題,而不需要任何適應。已經證明,對于任何有限的MDP,Q學習最終找到一個最優策略,從總體獎勵的預期值返回到從當前狀態開始的所有連續步驟是最大可實現的意義。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1791

    文章

    47350

    瀏覽量

    238759
  • 機器學習
    +關注

    關注

    66

    文章

    8422

    瀏覽量

    132714

原文標題:機器學習常用算法總結

文章出處:【微信號:gh_c472c2199c88,微信公眾號:嵌入式微處理器】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    分享一些最常見最實用的機器學習算法

    在這篇文章中,分享一些最常用機器學習算法
    的頭像 發表于 10-14 14:24 ?9119次閱讀
    分享一些最常見最實用的<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b>

    【阿里云大學免費精品課】機器學習入門:概念原理及常用算法

    摘要: 阿里云大學聯合螞蟻金服高級算法專家推出了免費的機器學習入門課程:機器學習入門:概念原理及常用
    發表于 06-23 13:51

    常用python機器學習庫盤點

    現在人工智能非常火爆,機器學習應該算是人工智能里面的一個子領域,而其中有一塊是對文本進行分析,對數據進行深入的挖掘提取一些特征值,然后用一些算法學習,訓練,分析,甚至還能預測,那么P
    發表于 05-10 15:20

    機器學習算法分享

    機器學習算法(1)——Logistic Regression
    發表于 06-09 13:30

    一文解析機器學習常用35大算法

    本文將帶你遍歷機器學習領域最受歡迎的算法。系統地了解這些算法有助于進一步掌握機器學習。當然,本文
    的頭像 發表于 06-30 04:24 ?3891次閱讀
    一文解析<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>常用</b>35大<b class='flag-5'>算法</b>

    機器學習算法常用指標匯總

    機器學習性能評價標準是模型優化的前提,在設計機器學習算法過程中,不同的問題需要用到不同的評價標準,本文對
    的頭像 發表于 02-13 15:09 ?4744次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>算法</b><b class='flag-5'>常用</b>指標匯總

    10大常用機器學習算法匯總

    本文介紹了10大常用機器學習算法,包括線性回歸、Logistic回歸、線性判別分析、樸素貝葉斯、KNN、隨機森林等。
    發表于 11-20 11:10 ?2805次閱讀

    17個機器學習常用算法

    根據數據類型的不同,對一個問題的建模有不同的方式。在機器學習或者人工智能領域,人們首先會考慮算法學習方式。在機器
    的頭像 發表于 08-11 11:20 ?1821次閱讀

    17個機器學習常用算法

    源自:AI知識干貨 根據數據類型的不同,對一個問題的建模有不同的方式。在機器學習或者人工智能領域,人們首先會考慮算法學習方式。在機器
    的頭像 發表于 08-22 09:57 ?2215次閱讀
    17個<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的<b class='flag-5'>常用</b><b class='flag-5'>算法</b>!

    常用機器學習算法的基本概念和特點

    。因此對于數據科學家來說,理解算法顯得格外重要,理解不同算法的思想可以幫助數據科學家更從容地面對不同的應用場景。 本文列出了常用機器學習
    的頭像 發表于 01-17 15:43 ?3581次閱讀

    機器學習算法的5種基本算子

    自主決策的方法和插件,其中包含了一系列常用的基本算子。在本文中,我們將會介紹機器學習算法的五種基本算子。 一、 求值算子 求值算子是常用
    的頭像 發表于 08-17 16:11 ?1805次閱讀

    機器學習算法匯總 機器學習算法分類 機器學習算法模型

    是解決具體問題的一系列步驟,機器學習算法被設計用于從大量的數據中自動學習并不斷改進自身的性能。本文將為大家介紹機器
    的頭像 發表于 08-17 16:11 ?1116次閱讀

    機器學習算法總結 機器學習算法是什么 機器學習算法優缺點

    機器學習算法總結 機器學習算法是什么?機器
    的頭像 發表于 08-17 16:11 ?1935次閱讀

    機器學習算法入門 機器學習算法介紹 機器學習算法對比

    機器學習算法入門 機器學習算法介紹 機器
    的頭像 發表于 08-17 16:27 ?965次閱讀

    機器學習有哪些算法機器學習分類算法有哪些?機器學習預判有哪些算法

    機器學習有哪些算法機器學習分類算法有哪些?機器
    的頭像 發表于 08-17 16:30 ?2006次閱讀
    主站蜘蛛池模板: 欧美jizz19性欧美| 国产 亚洲 日韩 欧美 在线观看| 狂野猛交xxxx吃奶| 国产AV国片精品无套内谢无码| 亚洲男同tv| 任你躁国语自产二区在线播放| 黄网址在线观看| 国产白色视频在线观看w| 97午夜理论片影院在线播放| 亚洲精品www久久久久久| 日韩精品无码久久一区二区三| 麻豆精品一卡2卡三卡4卡免费观看| 国产人妻人伦精品久久无码| 超碰在线视频人人AV| 34g污奶绵uk甩奶| 亚洲偷自拍精品视频在线观看 | 美女18毛片免费视频| 国产在线伊人| 国产成在线观看免费视频| www在线小视频免费| 最新果冻传媒在线观看免费版| 亚洲精品一二三| 亚洲AV无码偷拍在线观看| 沈芯语麻豆0076 视频| 日本妞欧洲| 人人射人人爱| 欧美人与禽ZOZO性伦交视频| 亚洲精品在线看| 天天色狠狠干| 三级全黄的视频在线观看| 欧美亚洲日韩一道免费观看| 免费黄色网址在线观看| 久久免费看少妇高潮A片JA| 僵尸女av| 久久www免费人成_看片高清| 娇妻让壮男弄的流白浆| 国产一区二区三区内射高清| 国产色播视频在线观看| 国产在线观看www鲁啊鲁免费| 国产人A片777777久久| 国产午夜三区视频在线|