五月天精品视频播放在线观看,在线观看国产情趣免费视频,午夜精品久久久久久99热

前言

機(jī)器學(xué)習(xí)作為人工智能領(lǐng)域的核心組成，是計(jì)算機(jī)程序?qū)W習(xí)數(shù)據(jù)經(jīng)驗(yàn)以優(yōu)化自身算法，并產(chǎn)生相應(yīng)的“智能化的”建議與決策的過程。

一個(gè)經(jīng)典的機(jī)器學(xué)習(xí)的定義是：

A computer program is said to learn from experience E with respect to some class of tasks T and perf ormance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

一、機(jī)器學(xué)習(xí)概論

機(jī)器學(xué)習(xí)是關(guān)于計(jì)算機(jī)基于數(shù)據(jù)分布構(gòu)建出概率統(tǒng)計(jì)模型，并運(yùn)用模型對(duì)數(shù)據(jù)進(jìn)行分析與預(yù)測(cè)的方法。按照學(xué)習(xí)數(shù)據(jù)分布的方式的不同，主要可以分為監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)：

1.1 監(jiān)督學(xué)習(xí)

從有標(biāo)注的數(shù)據(jù)(x為變量特征空間, y為標(biāo)簽)中，通過選擇的模型及確定的學(xué)習(xí)策略，再用合適算法計(jì)算后學(xué)習(xí)到最優(yōu)模型，并用模型預(yù)測(cè)的過程。模型預(yù)測(cè)結(jié)果Y的取值有限的或者無限的，可分為分類模型或者回歸模型；

1.2 非監(jiān)督學(xué)習(xí)：

從無標(biāo)注的數(shù)據(jù)(x為變量特征空間），通過選擇的模型及確定的學(xué)習(xí)策略，再用合適算法計(jì)算后學(xué)習(xí)到最優(yōu)模型，并用模型發(fā)現(xiàn)數(shù)據(jù)的統(tǒng)計(jì)規(guī)律或者內(nèi)在結(jié)構(gòu)。按照應(yīng)用場景，可以分為聚類，降維和關(guān)聯(lián)分析等模型；

二、機(jī)器學(xué)習(xí)建模流程

2.1 明確業(yè)務(wù)問題

明確業(yè)務(wù)問題是機(jī)器學(xué)習(xí)的先決條件，這里需要抽象出現(xiàn)實(shí)業(yè)務(wù)問題的解決方案：需要學(xué)習(xí)什么樣的數(shù)據(jù)作為輸入，目標(biāo)是得到什么樣的模型做決策作為輸出。

（如一個(gè)簡單的新聞分類場景就是學(xué)習(xí)已有的新聞及其類別標(biāo)簽數(shù)據(jù)，得到一個(gè)分類模型，通過模型對(duì)每天新的新聞做類別預(yù)測(cè)，以歸類到每個(gè)新聞?lì)l道。）

2.2 數(shù)據(jù)選擇：收集及輸入數(shù)據(jù)

數(shù)據(jù)決定了機(jī)器學(xué)習(xí)結(jié)果的上限，而算法只是盡可能逼近這個(gè)上限。意味著數(shù)據(jù)的質(zhì)量決定了模型的最終效果，在實(shí)際的工業(yè)應(yīng)用中，算法通常占了很小的一部分，大部分工程師的工作都是在找數(shù)據(jù)、提煉數(shù)據(jù)、分析數(shù)據(jù)。數(shù)據(jù)選擇需要關(guān)注的是：

① 數(shù)據(jù)的代表性：無代表性的數(shù)據(jù)可能會(huì)導(dǎo)致模型的過擬合，對(duì)訓(xùn)練數(shù)據(jù)之外的新數(shù)據(jù)無識(shí)別能力；

② 數(shù)據(jù)時(shí)間范圍：監(jiān)督學(xué)習(xí)的特征變量X及標(biāo)簽Y如與時(shí)間先后有關(guān)，則需要明確數(shù)據(jù)時(shí)間窗口，否則可能會(huì)導(dǎo)致數(shù)據(jù)泄漏，即存在和利用因果顛倒的特征變量的現(xiàn)象。（如預(yù)測(cè)明天會(huì)不會(huì)下雨，但是訓(xùn)練數(shù)據(jù)引入明天溫濕度情況）；

③ 數(shù)據(jù)業(yè)務(wù)范圍：明確與任務(wù)相關(guān)的數(shù)據(jù)表范圍，避免缺失代表性數(shù)據(jù)或引入大量無關(guān)數(shù)據(jù)作為噪音；

2.3 特征工程：數(shù)據(jù)預(yù)處理及特征提取

特征工程就是將原始數(shù)據(jù)加工轉(zhuǎn)化為模型有用的特征，技術(shù)手段一般可分為：

數(shù)據(jù)預(yù)處理：特征表示，缺失值/異常值處理，數(shù)據(jù)離散化，數(shù)據(jù)標(biāo)準(zhǔn)化等；特征提取：特征衍生，特征選擇，特征降維等；

特征表示

數(shù)據(jù)需要轉(zhuǎn)換為計(jì)算機(jī)能夠處理的數(shù)值形式。如果數(shù)據(jù)是圖片數(shù)據(jù)需要轉(zhuǎn)換為RGB三維矩陣的表示。

字符類的數(shù)據(jù)可以用多維數(shù)組表示，有Onehot獨(dú)熱編碼表示、word2vetor分布式表示及bert動(dòng)態(tài)編碼等；

異常值處理

收集的數(shù)據(jù)由于人為或者自然因素可能引入了異常值（噪音），這會(huì)對(duì)模型學(xué)習(xí)進(jìn)行干擾。

通常需要對(duì)人為引起的異常值進(jìn)行處理，通過業(yè)務(wù)判斷和技術(shù)手段（python、正則式匹配、pandas數(shù)據(jù)處理及matplotlib可視化等數(shù)據(jù)分析處理技術(shù)）篩選異常的信息，并結(jié)合業(yè)務(wù)情況刪除或者替換數(shù)值。

缺失值處理

數(shù)據(jù)缺失的部分，通過結(jié)合業(yè)務(wù)進(jìn)行填充數(shù)值、不做處理或者刪除。根據(jù)缺失率情況及處理方式分為以下情況：

① 缺失率較高，并結(jié)合業(yè)務(wù)可以直接刪除該特征變量。經(jīng)驗(yàn)上可以新增一個(gè)bool類型的變量特征記錄該字段的缺失情況，缺失記為1，非缺失記為0；

② 缺失率較低，結(jié)合業(yè)務(wù)可使用一些缺失值填充手段，如pandas的fillna方法、訓(xùn)練隨機(jī)森林模型預(yù)測(cè)缺失值填充；

③ 不做處理：部分模型如隨機(jī)森林、xgboost、lightgbm能夠處理數(shù)據(jù)缺失的情況，不需要對(duì)缺失數(shù)據(jù)做任何的處理。

數(shù)據(jù)離散化

數(shù)據(jù)離散化能減小算法的時(shí)間和空間開銷（不同算法情況不一），并可以使特征更有業(yè)務(wù)解釋性。

離散化是將連續(xù)的數(shù)據(jù)進(jìn)行分段，使其變?yōu)橐欢味坞x散化的區(qū)間，分段的原則有等距離、等頻率等方法。

數(shù)據(jù)標(biāo)準(zhǔn)化

數(shù)據(jù)各個(gè)特征變量的量綱差異很大，可以使用數(shù)據(jù)標(biāo)準(zhǔn)化消除不同分量量綱差異的影響，加速模型收斂的效率。常用的方法有：

① min-max 標(biāo)準(zhǔn)化：

將數(shù)值范圍縮放到（0,1）,但沒有改變數(shù)據(jù)分布。max為樣本最大值，min為樣本最小值。

② z-score 標(biāo)準(zhǔn)化：

將數(shù)值范圍縮放到0附近, 經(jīng)過處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布。u是平均值，σ是標(biāo)準(zhǔn)差。

特征衍生

基礎(chǔ)特征對(duì)樣本信息的表述有限，可通過特征衍生出新含義的特征進(jìn)行補(bǔ)充。特征衍生是對(duì)現(xiàn)有基礎(chǔ)特征的含義進(jìn)行某種處理（組合/轉(zhuǎn)換之類），常用方法如：

① 結(jié)合業(yè)務(wù)的理解做衍生，比如通過12個(gè)月工資可以加工出：平均月工資，薪資變化值，是否發(fā)工資等等；

② 使用特征衍生工具：如feature tools等技術(shù)；

特征選擇

特征選擇篩選出顯著特征、摒棄非顯著特征。特征選擇方法一般分為三類：

① 過濾法：按照特征的發(fā)散性或者相關(guān)性指標(biāo)對(duì)各個(gè)特征進(jìn)行評(píng)分后選擇，如方差驗(yàn)證、相關(guān)系數(shù)、IV值、卡方檢驗(yàn)及信息增益等方法。

② 包裝法：每次選擇部分特征迭代訓(xùn)練模型，根據(jù)模型預(yù)測(cè)效果評(píng)分選擇特征的去留。

③ 嵌入法：使用某些模型進(jìn)行訓(xùn)練，得到各個(gè)特征的權(quán)值系數(shù)，根據(jù)權(quán)值系數(shù)從大到小來選擇特征，如XGBOOST特征重要性選擇特征。

特征降維

如果特征選擇后的特征數(shù)目仍太多，這種情形下經(jīng)常會(huì)有數(shù)據(jù)樣本稀疏、距離計(jì)算困難的問題（稱為 “維數(shù)災(zāi)難”），可以通過特征降維解決。常用的降維方法有：主成分分析法（PCA），線性判別分析法（LDA）等。

2.4 模型訓(xùn)練

模型訓(xùn)練是選擇模型學(xué)習(xí)數(shù)據(jù)分布的過程。這過程還需要依據(jù)訓(xùn)練結(jié)果調(diào)整算法的（超）參數(shù)，使得結(jié)果變得更加優(yōu)良。

2.4.1數(shù)據(jù)集劃分

訓(xùn)練模型前，一般會(huì)把數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集，并可再對(duì)訓(xùn)練集再細(xì)分為訓(xùn)練集和驗(yàn)證集，從而對(duì)模型的泛化能力進(jìn)行評(píng)估。

① 訓(xùn)練集（training set）：用于運(yùn)行學(xué)習(xí)算法。

② 開發(fā)驗(yàn)證集（development set）用于調(diào)整參數(shù)，選擇特征以及對(duì)算法其它優(yōu)化。常用的驗(yàn)證方式有交叉驗(yàn)證Cross-validation，留一法等；

③ 測(cè)試集（test set）用于評(píng)估算法的性能，但不會(huì)據(jù)此改變學(xué)習(xí)算法或參數(shù)。

2.4.2模型選擇

常見的機(jī)器學(xué)習(xí)算法如下：

模型選擇取決于數(shù)據(jù)情況和預(yù)測(cè)目標(biāo)。可以訓(xùn)練多個(gè)模型，根據(jù)實(shí)際的效果選擇表現(xiàn)較好的模型或者模型融合。

模型選擇

2.4.3模型訓(xùn)練

訓(xùn)練過程可以通過調(diào)參進(jìn)行優(yōu)化，調(diào)參的過程是一種基于數(shù)據(jù)集、模型和訓(xùn)練過程細(xì)節(jié)的實(shí)證過程。超參數(shù)優(yōu)化需要基于對(duì)算法的原理的理解和經(jīng)驗(yàn)，此外還有自動(dòng)調(diào)參技術(shù)：網(wǎng)格搜索、隨機(jī)搜索及貝葉斯優(yōu)化等。

2.5 模型評(píng)估

模型評(píng)估的標(biāo)準(zhǔn)：模型學(xué)習(xí)的目的使學(xué)到的模型對(duì)新數(shù)據(jù)能有很好的預(yù)測(cè)能力（泛化能力）。現(xiàn)實(shí)中通常由訓(xùn)練誤差及測(cè)試誤差評(píng)估模型的訓(xùn)練數(shù)據(jù)學(xué)習(xí)程度及泛化能力。

2.5.1評(píng)估指標(biāo)

① 評(píng)估分類模型：常用的評(píng)估標(biāo)準(zhǔn)有查準(zhǔn)率P、查全率R、兩者調(diào)和平均F1-score 等，并由混淆矩陣的統(tǒng)計(jì)相應(yīng)的個(gè)數(shù)計(jì)算出數(shù)值：

混淆矩陣

查準(zhǔn)率是指分類器分類正確的正樣本（TP）的個(gè)數(shù)占該分類器所有預(yù)測(cè)為正樣本個(gè)數(shù)（TP+FP）的比例；

查全率是指分類器分類正確的正樣本個(gè)數(shù)（TP）占所有的正樣本個(gè)數(shù)（TP+FN）的比例。

F1-score是查準(zhǔn)率P、查全率R的調(diào)和平均：

② 評(píng)估回歸模型：常用的評(píng)估指標(biāo)有RMSE均方根誤差等。反饋的是預(yù)測(cè)數(shù)值與實(shí)際值的擬合情況。

③ 評(píng)估聚類模型：可分為兩類方式，一類將聚類結(jié)果與某個(gè)“參考模型”的結(jié)果進(jìn)行比較，稱為“外部指標(biāo)”（external index）：如蘭德指數(shù)，F(xiàn)M指數(shù) 等；另一類是直接考察聚類結(jié)果而不利用任何參考模型，稱為“內(nèi)部指標(biāo)”（internal index）：如緊湊度、分離度等。

2.5.2模型評(píng)估及優(yōu)化

根據(jù)訓(xùn)練集及測(cè)試集的指標(biāo)表現(xiàn)，分析原因并對(duì)模型進(jìn)行優(yōu)化，常用的方法有：

2.6 模型決策

決策是機(jī)器學(xué)習(xí)最終目的，對(duì)模型預(yù)測(cè)信息加以分析解釋，并應(yīng)用于實(shí)際的工作領(lǐng)域。

需要注意的是工程上是結(jié)果導(dǎo)向，模型在線上運(yùn)行的效果直接決定模型的成敗，不僅僅包括其準(zhǔn)確程度、誤差等情況，還包括其運(yùn)行的速度(時(shí)間復(fù)雜度)、資源消耗程度（空間復(fù)雜度）、穩(wěn)定性的綜合考慮。

責(zé)任編輯：lq6

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47200

瀏覽量
238270
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8408

瀏覽量
132568

原文標(biāo)題：機(jī)器學(xué)習(xí)入門指南（全）

文章出處：【微信號(hào)：vision263com，微信公眾號(hào)：新機(jī)器視覺】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

構(gòu)建云原生機(jī)器學(xué)習(xí)平臺(tái)流程

構(gòu)建云原生機(jī)器學(xué)習(xí)平臺(tái)是一個(gè)復(fù)雜而系統(tǒng)的過程，涉及數(shù)據(jù)收集、處理、特征提取、模型訓(xùn)練、評(píng)估、部署和監(jiān)控等多個(gè)環(huán)節(jié)。

發(fā)表于 12-14 10:34 ?106次閱讀

什么是機(jī)器學(xué)習(xí)？通過機(jī)器學(xué)習(xí)方法能解決哪些問題？

來源：Master編程樹“機(jī)器學(xué)習(xí)”最初的研究動(dòng)機(jī)是讓計(jì)算機(jī)系統(tǒng)具有人的學(xué)習(xí)能力以便實(shí)現(xiàn)人工智能。因?yàn)闆]有學(xué)習(xí)能力的系統(tǒng)很難被認(rèn)為是具有智能的。目前被廣泛采用的

發(fā)表于 11-16 01:07 ?386次閱讀

什么是<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>？通過<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題？

SOLIDWORKS 2025優(yōu)化的設(shè)計(jì)與建模流程

在快速發(fā)展的制造業(yè)環(huán)境中，設(shè)計(jì)效率與創(chuàng)新力成為了企業(yè)競爭力的關(guān)鍵因素。SOLIDWORKS 2025作為一款先進(jìn)的3D CAD設(shè)計(jì)軟件，通過其優(yōu)化的設(shè)計(jì)與建模流程，為設(shè)計(jì)師和工程師提供了一個(gè)更加有效、智能的工作環(huán)境，推動(dòng)了產(chǎn)品設(shè)計(jì)創(chuàng)新的步伐。

發(fā)表于 11-15 14:49 ?192次閱讀

NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

在人工智能領(lǐng)域，機(jī)器學(xué)習(xí)算法是實(shí)現(xiàn)智能系統(tǒng)的核心。隨著數(shù)據(jù)量的激增和算法復(fù)雜度的提升，對(duì)計(jì)算資源的需求也在不斷增長。NPU作為一種專門為深度學(xué)習(xí)等機(jī)器

發(fā)表于 11-15 09:19 ?434次閱讀

eda在機(jī)器學(xué)習(xí)中的應(yīng)用

在機(jī)器學(xué)習(xí)項(xiàng)目中，數(shù)據(jù)預(yù)處理和理解是成功構(gòu)建模型的關(guān)鍵。探索性數(shù)據(jù)分析（EDA）是這一過程中不可或缺的一部分。 1. 數(shù)據(jù)清洗數(shù)據(jù)清洗是機(jī)器學(xué)習(xí)

發(fā)表于 11-13 10:42 ?291次閱讀

Matlab/Simulink/Stateflow建模開發(fā)及仿真測(cè)試

matlab 模擬仿真熟悉Matlab/Simulink/Stateflow建模開發(fā)及仿真測(cè)試，熟悉V模型開發(fā)流程。熟悉自動(dòng)代碼生成，能夠編寫或者配置自動(dòng)代碼生成腳本。

發(fā)表于 10-24 17:23

如何理解機(jī)器學(xué)習(xí)中的訓(xùn)練集、驗(yàn)證集和測(cè)試集

理解機(jī)器學(xué)習(xí)中的訓(xùn)練集、驗(yàn)證集和測(cè)試集，是掌握機(jī)器學(xué)習(xí)核心概念和流程的重要一步。這三者不僅構(gòu)成了模型學(xué)習(xí)

發(fā)表于 07-10 15:45 ?3809次閱讀

機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程

在機(jī)器學(xué)習(xí)的整個(gè)流程中，數(shù)據(jù)預(yù)處理與特征工程是兩個(gè)至關(guān)重要的步驟。它們直接決定了模型的輸入質(zhì)量，進(jìn)而影響模型的訓(xùn)練效果和泛化能力。本文將從數(shù)據(jù)預(yù)處理和特征工程的基本概念出發(fā)，詳細(xì)探討這兩個(gè)步驟的具體內(nèi)容、方法及其在

發(fā)表于 07-09 15:57 ?395次閱讀

機(jī)器學(xué)習(xí)算法原理詳解

機(jī)器學(xué)習(xí)作為人工智能的一個(gè)重要分支，其目標(biāo)是通過讓計(jì)算機(jī)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)并改進(jìn)其性能，而無需進(jìn)行明確的編程。本文將深入解讀幾種常見的機(jī)器學(xué)習(xí)

發(fā)表于 07-02 11:25 ?991次閱讀

深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

在人工智能的浪潮中，機(jī)器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動(dòng)力。它們各自以其獨(dú)特的方式推動(dòng)著技術(shù)的進(jìn)步，為眾多領(lǐng)域帶來了革命性的變化。然而，盡管它們都屬于機(jī)器

發(fā)表于 07-01 11:40 ?1329次閱讀

FPGA的學(xué)習(xí)筆記---FPGA的開發(fā)流程

與通常的單片機(jī)應(yīng)用開發(fā)不同，F(xiàn)PGA有自己的開發(fā)流程。但具體上怎樣操作，作為初學(xué)者，沒有一點(diǎn)經(jīng)驗(yàn)。網(wǎng)站獎(jiǎng)勵(lì)的清華FPGA需要的開發(fā)軟件，到目前還沒有安裝成功。暫且先看看相關(guān)學(xué)習(xí)，慢慢積累這方面的知識(shí)

發(fā)表于 06-23 14:47

英飛凌科技旗下Imagimob可視化Graph UX改變邊緣機(jī)器學(xué)習(xí)建模

。用戶現(xiàn)在可以將他們的機(jī)器學(xué)習(xí)（ML）建模流程可視化，并利用各種先進(jìn)功能更加高效、快速地開發(fā)適用于邊緣設(shè)備的模型。Imagimob邊緣設(shè)備AI/ML開發(fā)平臺(tái)的最新版本對(duì)用戶體驗(yàn)進(jìn)行了一

發(fā)表于 02-19 14:08 ?321次閱讀

EtherCAT IO的接線方法和流程是怎樣的？

EtherCAT IO的接線方法和流程是怎樣的？ EtherCAT是一種用于實(shí)時(shí)以太網(wǎng)通信的開放式通信協(xié)議，具有低延遲和高帶寬的優(yōu)勢(shì)。 EtherCAT IO是EtherCAT網(wǎng)絡(luò)中連接到IO設(shè)備

發(fā)表于 02-02 16:57 ?2005次閱讀

數(shù)據(jù)預(yù)處理和特征工程的常用功能

機(jī)器學(xué)習(xí)最基礎(chǔ)的5個(gè)流程，分別是數(shù)據(jù)獲取，數(shù)據(jù)預(yù)處理，特征工程，建模、測(cè)試和預(yù)測(cè)，上線與部署。

發(fā)表于 01-25 11:26 ?747次閱讀

如何使用TensorFlow構(gòu)建機(jī)器學(xué)習(xí)模型

在這篇文章中，我將逐步講解如何使用 TensorFlow 創(chuàng)建一個(gè)簡單的機(jī)器學(xué)習(xí)模型。

發(fā)表于 01-08 09:25 ?968次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

機(jī)器學(xué)習(xí)的建模流程是怎樣的？

評(píng)論

構(gòu)建云原生機(jī)器學(xué)習(xí)平臺(tái)流程

什么是機(jī)器學(xué)習(xí)？通過機(jī)器學(xué)習(xí)方法能解決哪些問題？

SOLIDWORKS 2025優(yōu)化的設(shè)計(jì)與建模流程

NPU與機(jī)器學(xué)習(xí)算法的關(guān)系

eda在機(jī)器學(xué)習(xí)中的應(yīng)用

Matlab/Simulink/Stateflow建模開發(fā)及仿真測(cè)試

如何理解機(jī)器學(xué)習(xí)中的訓(xùn)練集、驗(yàn)證集和測(cè)試集

機(jī)器學(xué)習(xí)中的數(shù)據(jù)預(yù)處理與特征工程

機(jī)器學(xué)習(xí)算法原理詳解

深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對(duì)比

FPGA的學(xué)習(xí)筆記---FPGA的開發(fā)流程

英飛凌科技旗下Imagimob可視化Graph UX改變邊緣機(jī)器學(xué)習(xí)建模

EtherCAT IO的接線方法和流程是怎樣的？

數(shù)據(jù)預(yù)處理和特征工程的常用功能

如何使用TensorFlow構(gòu)建機(jī)器學(xué)習(xí)模型