剛開始學習數據科學時,筆者經常面臨這樣一個問題:遇到具體問題,選擇何種算法才合適。也許你也和我一樣,搜了很多有關機器學習算法的文章,會看到許多詳細的描述,卻并沒有減少讓抉擇的難度。
言歸正傳,筆者建議你好好了解幾個監督和無監督機器學習算法的實現方式和數學直覺思維,如:
線性回歸
邏輯回歸
決策樹
樸素貝葉斯
支持向量機
隨機森林
自適應提升(AdaBoost)
梯度提升樹(GBT)
簡單神經網絡
層次聚類
高斯混合模型
卷積神經網絡
循環神經網絡
推薦系統
在對機器學習任務的類型有一些了解之后,就可以根據問題陳述來探索現實生活中最流行的算法及其應用。讀完本文之后,就試著解決這些問題吧!相信你一定獲益匪淺。
問題陳述1:預測房價走勢。
解決該問題的機器學習算法:諸如隨機森林和梯度提升之類的高級回歸算法。
問題陳述2:深挖客戶統計數據用以識別模式。
解決該問題的機器學習算法:聚類算法(肘部法則)。
問題陳述3:預測貸款還款情況。
解決該問題的機器學習算法:不平衡數據集分類算法。
問題陳述4:根據皮膚病變的特征(大小、形狀、顏色等)判斷病變為良性還是惡性。
解決該問題的機器學習算法:卷積神經網絡(U-Net網絡是用于分割的不二之選)。
問題陳述5:預測客戶流失。
解決該問題的機器學習算法:線性判別分析(LDA)或二次判別分析(QDA)。LDA特別受歡迎,因為它既是分類器又是降維技術。
問題陳述6:為員工招聘提供決策框架。
解決該問題的機器學習算法:在這方面,決策樹堪稱“職業玩家”。
問題陳述7:了解并預測產品的熱銷屬性。
解決該問題的機器學習算法:邏輯回歸或決策樹。
問題陳述8:分析市場情緒,評估市場對產品的認知。
解決該問題的機器學習算法:樸素貝葉斯-支持向量機(NBSVM算法)。
問題陳述9:創建分類系統,過濾垃圾郵件。
解決該問題的機器學習算法:分類算法。建議使用樸素貝葉斯、支持向量機、多層感知器神經網絡(MLPNNs)和徑向基函數神經網絡(RBFNN)算法。
問題陳述10:預測用戶點擊在線廣告的可能性。
解決該問題的機器學習算法:邏輯回歸或支持向量機。
問題陳述11:檢測信用卡交易中的欺詐行為。
解決該問題的機器學習算法:自適應提升、孤立森林或隨機森林。
問題陳述12:根據車輛特性預估車輛價格。
解決該問題的機器學習算法:梯度提升是解決此問題的最佳選擇。
問題陳述13:預測病人加入醫保的概率。
解決該問題的機器學習算法:簡單神經網絡。
問題陳述14:預測已注冊用戶是否愿意為某一產品支付一定金額。
解決該問題的機器學習算法:神經網絡。
問題陳述15:根據顧客的不同特征(如年齡)進行分類。
解決該問題的機器學習算法:K均值聚類算法。
問題陳述16:從語音數據中提取特征用于語音識別系統。
解決該問題的機器學習算法:高斯混合模型。
問題陳述17:多目標跟蹤,用混合成分數目及均值預測目標在視頻序列中每幀的位置。
解決該問題的機器學習算法:高斯混合模型。
問題陳述18:排列一組微陣列實驗中的基因和樣本,揭示生物學上有趣的模式。
解決該問題的機器學習算法:層次聚類算法。
問題陳述19:根據特征相似的其他用戶的偏好,向用戶推薦電影。
解決該問題的機器學習算法:推薦系統。
問題陳述20:根據用戶閱讀的文章,向用戶推薦他們想讀的新聞文章。
解決該問題的機器學習算法:推薦系統。
問題陳述21:優化自動駕駛汽車的駕駛行為。
解決該問題的機器學習算法:強化學習。
問題陳述22:通過醫學掃描診斷健康疾病。
解決該問題的機器學習算法:卷積神經網絡。
問題陳述23:平衡不同需求周期下的電網負荷。
解決該問題的機器學習算法:強化學習。
問題陳述24:處理時間序列數據或序列(如音頻記錄或文本)。
解決該問題的機器學習算法:循環神經網絡或長短期記憶網絡(LSTM)。
問題陳述25:翻譯語言。
解決該問題的機器學習算法:循環神經網絡。
問題陳述26:為圖像生成標題。
解決該問題的機器學習算法:循環神經網絡。
問題陳述27:訓練聊天機器人,處理客戶更細微的需求和問詢。
解決該問題的機器學習算法:循環神經網絡。
希望本文的介紹能讓你對最常用的機器學習算法有所了解,當遇到特定問題時,能夠快速反應,選擇合適的機器學習算法。
責編AJX
-
算法
+關注
關注
23文章
4615瀏覽量
92979 -
機器學習
+關注
關注
66文章
8422瀏覽量
132714
發布評論請先 登錄
相關推薦
評論