機器學習(ML)是教導計算機系統(tǒng)根據(jù)一組數(shù)據(jù)進行預測的過程。通過為系統(tǒng)提供一系列的試驗和錯誤場景,機器學習研究人員致力于創(chuàng)建 可以分析數(shù)據(jù),回答問題并自行做出決定的人工智能系統(tǒng)。
機器學習通常使用基于測試數(shù)據(jù)的算法,該算法有助于在將來的決策中進行推理和模式識別,從而消除了對傳統(tǒng)計算機軟件要求的來自人類的明確指令的需求。
什么是機器學習?
機器學習依賴于大量數(shù)據(jù),這些數(shù)據(jù)被饋送到算法中,以生成一個模型,系統(tǒng)可以根據(jù)該模型來預測其未來的決策。例如,如果您要輸入到系統(tǒng)中的數(shù)據(jù)是一年中每天在午餐中吃的水果,則您可以使用預測算法來分析不同的水果,并為該水果建立預測模型您可能在第二年進食。
該過程基于反復試驗的情況,通常使用多種算法。這些算法分為線性模型,非線性模型,甚至神經(jīng)網(wǎng)絡。它們最終將取決于您正在使用的數(shù)據(jù)集以及您要回答的問題。
機器學習算法如何工作?
機器學習算法會隨著時間的推移使用數(shù)據(jù)來學習和改進,并且不需要人工指導。該算法分為三種類型:有監(jiān)督,無監(jiān)督和強化學習。每種學習類型都有不同的目的,并且可以使數(shù)據(jù)以不同的方式使用。
監(jiān)督學習
監(jiān)督學習涉及標記的訓練數(shù)據(jù),算法使用該訓練數(shù)據(jù)來學習將輸入變量轉(zhuǎn)換為輸出變量以求解方程的映射函數(shù)。其中有兩種監(jiān)督學習類型:分類,當輸出為類別形式時,用于預測給定樣本的結(jié)果;回歸,當輸出時,用于預測給定樣本的結(jié)果。變量是實際值,例如“工資”或“權(quán)重”。
監(jiān)督學習模型的一個示例是K-最近鄰居(KNN)算法,它是一種模式識別方法。KNN本質(zhì)上涉及使用圖表來根據(jù)附近相似物體的傳播情況得出關(guān)于物體分類的有根據(jù)的猜測。
在上表中,綠色圓圈表示一個尚未分類的對象,它只能屬于兩個可能的類別之一:藍色正方形或紅色三角形。為了識別其所屬的類別,在這種情況下,算法將分析圖表上最接近的對象,算法將合理地假設綠色圓圈應屬于紅色三角形類別。
無監(jiān)督學習
當只有輸入變量而沒有相應的輸出變量時,將使用無監(jiān)督學習模型。它使用未標記的訓練數(shù)據(jù)來建模數(shù)據(jù)的基礎結(jié)構(gòu)。
無監(jiān)督學習算法有三種類型:關(guān)聯(lián),廣泛用于市場購物分析;聚類,用于匹配與另一個聚類中的對象相似的樣本;和降維,用于減少數(shù)據(jù)集中變量的數(shù)量,同時保持其重要信息不變。
強化學習
強化學習允許代理通過學習最大化獎勵的行為,根據(jù)其當前狀態(tài)決定其下一步行動。它通常用于游戲環(huán)境,在游戲環(huán)境中提供了規(guī)則的算法,并負責以最有效的方式解決挑戰(zhàn)。該模型最初會隨機開始,但是隨著時間的流逝,通過反復試驗,它將了解需要在游戲中移動的位置和時間以最大化得分。
在這種類型的培訓中,獎勵僅僅是與積極成果相關(guān)的狀態(tài)。例如,如果算法能夠?qū)⑵嚤3衷诘缆飞隙粫驳秸系K物,那么它將“獎勵”任務完成。
為什么機器學習很有用?
本質(zhì)上,機器學習解決了數(shù)據(jù)過多的問題。人們,行動,事件,計算機和小工具所產(chǎn)生的信息太多,以至于人類幾乎不可能從中學習任何東西。在醫(yī)學分析中,要在成千上萬的MRI掃描中找到模式,一個人可能要花費數(shù)小時,數(shù)天或數(shù)周的時間才能完成,但是如果正確標記了機器,機器可以吸收這些信息并在幾秒鐘內(nèi)發(fā)現(xiàn)這些模式。
機器學習在哪里使用?
我們每天都會使用最簡單,最成功的機器學習示例之一-Google搜索。搜索引擎由許多ML算法提供支持,這些算法可以讀取和分析您輸入的文本,并根據(jù)您的搜索歷史和在線習慣來定制結(jié)果。例如,如果您輸入“ Java”,您將獲得圍繞編程語言的結(jié)果,或者更頻繁地浮出水面,這取決于它決定了您的偏好。
我們未來的許多技術(shù)進步都取決于機器學習的發(fā)展,例如無人駕駛汽車和智慧城市。許多為智慧城市提供動力的系統(tǒng)正在進入公共空間,例如面部識別系統(tǒng),該系統(tǒng)中的機器學習算法被教為識別圖像中的模式并根據(jù)其特征識別對象。但是,這已被證明是ML的有爭議用途,尤其是因為它并不總是準確的,并且經(jīng)常涉及對公民的某種定期監(jiān)視。
數(shù)據(jù)偏差
隨著機器學習的改進和更多技術(shù)的使用,人們越來越擔心將偏見嵌入關(guān)鍵的和面向公眾的軟件中。機器學習應用程序依賴于數(shù)據(jù),而正是這些數(shù)據(jù)可能成為偏差的來源。例如,如果一家公司想雇用更多不同種類的人,但使用其當前雇員的簡歷,則默認情況下,其機器學習程序?qū)⒅粚ふ腋嘞嗤娜恕?/p>
正是這種類型的機器學習應用引起了政府的擔憂,因此,許多政府正在采取強制性的法規(guī)來解決這個問題。英國數(shù)據(jù)倫理與創(chuàng)新中心(CDEI)宣布將與內(nèi)閣辦公室種族差異部門合作,調(diào)查算法決策中的潛在偏見。同樣,美國政府將試行AI方面的多樣性法規(guī),以降低計算機系統(tǒng)中性偏見和種族偏見的風險。
責編AJX
-
數(shù)據(jù)
+關(guān)注
關(guān)注
8文章
7002瀏覽量
88943 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238266 -
機器學習
+關(guān)注
關(guān)注
66文章
8406瀏覽量
132567
發(fā)布評論請先 登錄
相關(guān)推薦
評論