在第 1 部分中,我們通過(guò)BuildingIQ智能氣候控制系統(tǒng)和Scania緊急卡車制動(dòng)系統(tǒng)等示例,推動(dòng)了在嵌入式系統(tǒng)中使用分析。我們涵蓋了數(shù)據(jù)訪問(wèn)、數(shù)據(jù)預(yù)處理和最具預(yù)測(cè)性特征的識(shí)別。現(xiàn)在讓我們轉(zhuǎn)向開發(fā)預(yù)測(cè)分析算法本身。
開發(fā)分析算法
重要的是要考慮分析算法是否是您的最佳方法。在系統(tǒng)行為可以通過(guò)已知的科學(xué)方程很好地表征的情況下,經(jīng)過(guò)驗(yàn)證的數(shù)學(xué)建模可以是一種簡(jiǎn)單而有效的方式來(lái)滿足設(shè)計(jì)目標(biāo)。這種方法使用數(shù)據(jù)擬合、統(tǒng)計(jì)建模、ode 和 pde 求解以及參數(shù)估計(jì)等技術(shù)。以這種方式構(gòu)建的模型具有通過(guò)歷史數(shù)據(jù)或基于第一原理預(yù)先確定的優(yōu)勢(shì),可以在嵌入式系統(tǒng)上實(shí)現(xiàn)內(nèi)存和計(jì)算效率,并且可以更簡(jiǎn)單地開發(fā)和維護(hù)。因此,在考慮以數(shù)據(jù)為中心的機(jī)器學(xué)習(xí)技術(shù)之前,首先要謹(jǐn)慎考慮“主力”建模方法是否可以滿足您的設(shè)計(jì)目標(biāo)。然而,對(duì)于越來(lái)越多的設(shè)計(jì)挑戰(zhàn),例如在 BuildingIQ 示例中動(dòng)態(tài)設(shè)置氣候控制點(diǎn)或在斯堪尼亞制動(dòng)應(yīng)用中進(jìn)行對(duì)象識(shí)別,機(jī)器學(xué)習(xí)是最好的方法。
機(jī)器學(xué)習(xí)
機(jī)器學(xué)習(xí)算法使用計(jì)算方法直接從數(shù)據(jù)中“學(xué)習(xí)”信息,而不依賴于預(yù)定方程作為模型。事實(shí)證明,這種使用數(shù)據(jù)本身訓(xùn)練模型的能力為預(yù)測(cè)建模開辟了廣泛的用例——例如金融信用評(píng)分和電影、歌曲和零售購(gòu)買的在線推薦。在嵌入式系統(tǒng)中,機(jī)器學(xué)習(xí)用于快速增長(zhǎng)的應(yīng)用范圍,包括人臉識(shí)別、腫瘤檢測(cè)、電力負(fù)荷預(yù)測(cè)以及前面提到的 BuildingIQ 和 Scania 應(yīng)用。“大數(shù)據(jù)”、計(jì)算能力和軟件工具的可用性提高,使得在工程應(yīng)用程序中使用機(jī)器學(xué)習(xí)比以往任何時(shí)候都更容易。
機(jī)器學(xué)習(xí)大致分為兩種類型的學(xué)習(xí)方法,監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí),每一種都包含針對(duì)不同問(wèn)題量身定制的幾種算法。
監(jiān)督學(xué)習(xí)是一種使用已知數(shù)據(jù)集(稱為訓(xùn)練數(shù)據(jù)集)進(jìn)行預(yù)測(cè)的 機(jī)器學(xué)習(xí)。 訓(xùn)練數(shù)據(jù)集包括輸入數(shù)據(jù)和標(biāo)記的響應(yīng)值。監(jiān)督學(xué)習(xí)算法從中尋求建立一個(gè)模型,該模型可以預(yù)測(cè)新數(shù)據(jù)集的響應(yīng)值。測(cè)試數(shù)據(jù)集通常用于驗(yàn)證模型。使用更大的訓(xùn)練數(shù)據(jù)集通常會(huì)產(chǎn)生具有更高預(yù)測(cè)能力的模型,可以很好地泛化新數(shù)據(jù)集。
監(jiān)督學(xué)習(xí)包括兩類算法:
分類:用于分類響應(yīng)值,其中數(shù)據(jù)可以分為特定的“類別”。常見的分類算法包括支持向量機(jī) (SVM)、神經(jīng)網(wǎng)絡(luò)、樸素貝葉斯分類器、決策樹、判別分析和最近鄰 ( k NN)。
回歸:用于預(yù)測(cè)何時(shí)需要連續(xù)響應(yīng)值。常見的回歸算法包括線性回歸、非線性回歸、廣義線性模型、決策樹和神經(jīng)網(wǎng)絡(luò)。
選擇算法取決于許多設(shè)計(jì)因素,例如內(nèi)存使用情況、預(yù)測(cè)速度和模型的可解釋性。其他考慮因素包括是否需要單類或多類響應(yīng),以及預(yù)測(cè)變量是連續(xù)的還是分類的。由于模型僅與使用的標(biāo)記訓(xùn)練數(shù)據(jù)一樣好,因此在使用具有代表性的訓(xùn)練數(shù)據(jù)集時(shí)要小心。機(jī)器學(xué)習(xí)工作流程從選擇特征開始,然后指定訓(xùn)練和驗(yàn)證集,使用多種算法進(jìn)行訓(xùn)練,最后評(píng)估結(jié)果。圖 2 所示的交互式應(yīng)用程序使機(jī)器學(xué)習(xí)工作流程易于學(xué)習(xí)和使用。
無(wú)監(jiān)督學(xué)習(xí)是一種機(jī)器學(xué)習(xí),用于從由沒(méi)有標(biāo)記響應(yīng)的輸入數(shù)據(jù)組成的數(shù)據(jù)集中進(jìn)行推斷。
聚類分析是最常見的無(wú)監(jiān)督學(xué)習(xí)方法,用于探索性數(shù)據(jù)分析,以發(fā)現(xiàn)數(shù)據(jù)中的隱藏模式或分組。k-means 是一種流行的集群建模算法,它根據(jù)到集群質(zhì)心的測(cè)量距離將數(shù)據(jù)劃分為 k 個(gè)不同的集群。
層次聚類使用了一種不同的方法來(lái)構(gòu)建多層次的層次聚類樹,它提供了視覺(jué)解釋,但計(jì)算要求更高,因此不太適合大量數(shù)據(jù)。
其他算法包括高斯混合模型、隱馬爾可夫模型和自組織神經(jīng)網(wǎng)絡(luò)圖。
BuildingIQ 團(tuán)隊(duì)使用聚類分析作為其模型創(chuàng)建過(guò)程的一部分。他們使用 k-means 聚類和高斯混合模型來(lái)分割數(shù)據(jù),并確定燃?xì)狻㈦娏Α⒄羝吞?yáng)能對(duì)加熱和冷卻過(guò)程的相對(duì)貢獻(xiàn)。
對(duì)于涉及圖像、文本和信號(hào)的分類問(wèn)題,深度學(xué)習(xí)已成為一種新的高級(jí)分析類別。當(dāng)在大型標(biāo)記訓(xùn)練數(shù)據(jù)集上進(jìn)行訓(xùn)練時(shí)(通常需要使用圖形處理單元 (GPU) 進(jìn)行硬件加速以及強(qiáng)化訓(xùn)練和評(píng)估),深度學(xué)習(xí)模型可以達(dá)到最先進(jìn)的精度,有時(shí)在對(duì)象分類方面的表現(xiàn)甚至超過(guò)人類水平。對(duì)于圖像分類,卷積神經(jīng)網(wǎng)絡(luò) (CNN) 變得流行,因?yàn)樗鼈兺ㄟ^(guò)直接從原始圖像中提取特征來(lái)消除手動(dòng)特征提取的需要。這種自動(dòng)特征提取使 CNN 模型對(duì)于諸如對(duì)象分類等計(jì)算機(jī)視覺(jué)任務(wù)具有高度的準(zhǔn)確性。
系統(tǒng)工程師可以更容易地使用上面列出的方法和算法,以便在他們的嵌入式系統(tǒng)中結(jié)合有效的分析。在這個(gè)由三部分組成的系列的最后一篇文章中,我們將介紹實(shí)時(shí)執(zhí)行分析和預(yù)測(cè)控制并將它們集成到一個(gè)整體解決方案中,包括傳感器和嵌入式系統(tǒng)以及企業(yè) IT 系統(tǒng)和云基礎(chǔ)設(shè)施。
審核編輯:郭婷
-
神經(jīng)網(wǎng)絡(luò)
+關(guān)注
關(guān)注
42文章
4774瀏覽量
100898 -
gpu
+關(guān)注
關(guān)注
28文章
4753瀏覽量
129065 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8425瀏覽量
132771
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論