源自:自動化學報作者:李天梅 司小勝 劉翔 裴洪
摘要
面向大數據背景下隨機退化設備剩余壽命(Remaining useful life, RUL)預測的現實需求, 結合隨機退化設備監測大數據特點及剩余壽命預測不確定性量化這一核心問題, 深入分析了機理模型與數據混合驅動的剩余壽命預測技術、基于機器學習的剩余壽命預測技術、統計數據驅動的剩余壽命預測技術以及機器學習和統計數據驅動相結合的剩余壽命預測技術的基本研究思想和發展動態, 剖析了當前研究存在的局限性和共性難題. 針對存在的局限性和共性難題, 以多源傳感監測大數據下剩余壽命預測問題為例, 提出了一種數模聯動的大數據下隨機退化設備剩余壽命預測解決思路, 并通過航空發動機多源監測數據初步驗證了該思路的可行性和有效性. 最后, 借鑒數模聯動思路, 綜合考慮機器學習方法和統計數據驅動方法的優勢, 緊緊扭住大數據背景下隨機退化設備剩余壽命預測不確定性量化問題, 提出了大數據背景下深度學習與隨機退化建模交互聯動、監測大數據與剩余壽命及其預測不確定性映射機制、非理想大數據下的剩余壽命預測等亟待解決的關鍵科學問題.
關鍵詞
大數據/ 剩余壽命預測/ 數模聯動/ 深度學習/ 隨機退化建模
高速列車、航空航天裝備、導彈武器、風電裝備、工業機器人、石化裝備等現代裝備在功能不斷提升的同時, 正逐漸趨于大型化、多元化和集成化, 這類裝備多是由機械傳動系統、電磁驅動系統、運動控制系統、信息傳感系統等耦合組成的復雜系統, 其服役過程受變環境、變載荷、變工況、大擾動和強沖擊等因素影響, 整體及關鍵部件性能將發生不可避免的退化, 一旦因設備性能退化造成最終失效, 將會造成巨大的人員傷亡和財產損失. 例如, 2014年8月2日發生在我國江蘇省昆山市的重大鋁粉塵爆炸事故, 共造成97人死亡、163人受傷, 直接經濟損失達到3.51億元, 事后調查表明: 除塵器維護不足而造成集塵桶銹蝕退化破損是主要技術原因. 2017年7月發生在美國密西西比州的美國海軍陸戰隊KC-130運輸機墜毀事件, 造成機上16名軍人全部遇難, 該事故的調查結果表明發動機螺旋槳性能退化是造成飛機墜毀的主要原因. 因此, 若能在設備性能退化初期, 尤其在尚未造成重大危害時, 根據狀態監測信息, 及時發現異常或定量評價設備健康狀態并預測其剩余壽命(Remaining useful life, RUL), 據此對設備實施健康管理, 對于切實保障復雜設備的運行安全性、可靠性與經濟性具有重要意義. 其中, 剩余壽命預測是連接系統運行狀態信息感知與基于運行狀態實現個性化精準健康管理的紐帶和關鍵, 在過去十余年得到了長足的發展, 主要技術方法包括失效機理分析方法、數據驅動的方法、機理模型和數據混合驅動方法, 如圖1所示. 基于失效機理分析的方法主要通過構建描述設備失效機理的數學模型, 結合特定設備的經驗知識和缺陷增長方程實現設備的剩余壽命預測. 由于實際工程設備本身的復雜性、任務與運行環境的多樣性,其健康狀態演化規律通常難以物理機理建模或者獲得失效機理模型的代價過高, 導致失效機理方法及機理模型和數據混合驅動方法存在推廣應用難的問題. 因此, 數據驅動的剩余壽命預測技術已成為國際上可靠性工程和自動化技術領域的研究前沿, 過去十余年中得到了長足發展, 在航空航天、軍事、工業制造等領域具有極其重要的應用.
圖1剩余壽命預測方法體系
伴隨著先進傳感技術的快速發展, 工程設備健康狀態感知手段日益豐富, 為設備運行監測大數據的獲取提供了更多的可能. 因此, 數據驅動的剩余壽命預測技術發展迎來了新的契機, 針對大數據處理的隨機退化設備剩余壽命預測問題得到了大量學者的關注, 相關技術蓬勃發展. 在此背景下, 本文的主要目的在于面向大數據背景下隨機退化設備剩余壽命預測的現實需求, 通過分析當前剩余壽命預測技術的發展動態, 旨在探究該領域亟待解決的關鍵問題和新的發展方向. 為此, 第1節首先結合數據特點對大數據下剩余壽命預測的研究背景、主要方法及思路、核心問題等進行了概述. 第2 ~ 5節分別分析了機理模型與數據混合驅動的剩余壽命預測技術、基于機器學習的剩余壽命預測技術、統計數據驅動的剩余壽命預測技術以及機器學習和統計數據驅動相結合的剩余壽命預測技術的基本研究思想和發展動態, 同時結合隨機退化設備監測大數據特點以及剩余壽命預測不確定性量化這一核心問題, 深入剖析了當前研究存在的局限性和共性難題. 第6節針對當前研究存在的局限性, 提出了一種多源傳感監測大數據下數模聯動的隨機退化設備剩余壽命預測問題解決思路(簡稱為數模聯動, 這里需要說明的是, “數”是指數據退化特征提取, “模”是指所提取退化特征時變演化過程隨機建模), 通過構建優化目標函數實現數據特征提取與所提取特征時變演化過程隨機建模的“聯動”, 并通過航空發動機多源監測數據初步驗證了該思路的可行性和有效性. 第7節借鑒數模聯動思路, 圍繞大數據背景下隨機退化設備剩余壽命預測不確定性量化這一核心問題, 探討并提出了大數據背景下深度學習與隨機退化建模交互聯動、監測大數據與剩余壽命及其預測不確定性映射機制、非理想大數據下的剩余壽命預測等亟待解決的關鍵科學問題. 第8節總結全文.
1.大數據下剩余壽命預測問題概述
近年來, 隨著無線傳感、物聯網等技術快速興起與普及, 各式傳感器猶如一張龐大的神經網絡密布在裝備內部, 實時感知裝備的一舉一動, 推動剩余壽命預測進入“大數據” 時代. 例如, 軍事裝備在國家戰略安全中具有不可替代的特殊地位, 其各子系統的安全可靠運行舉足輕重, 必須依靠狀態監測、剩余壽命預測以及預測維護等理論與方法保駕護航. 由于需要監測的軍事裝備群規模大、每個裝備需監測參量多、數據采樣頻率高、服役時間長, 所以獲取了海量監測數據: 一個現代航空發動機, 每10毫秒就能生成幾百個傳感器信息, 每次飛行能產生TB級的運行監測數據; 現代化工業制造生產線安裝有數以萬計的各型傳感器來監測工業裝備的運行過程信息及產品質量信息, 比如大型工業機器人制造商利用云平臺監控著百萬臺工業機器人, 實時獲取機器人每個運動關節的轉速、角度、位置、溫度、振動等信號, 每天需要對TB級以上的數據進行處理. 然而, 這些監測大數據在為設備健康狀態感知及剩余壽命預測提供豐富信息的同時, 由于設備工況多變、多源信號差異大、采樣策略形式多、信息之間相互耦合、數據價值密度低, 導致數據質量參差不齊, 狀態監測大數據呈現不同的統計特性. 根據監測數據呈現的特點,圖2給出了完整監測大數據和非完整監測大數據(具有碎片化、分段的、稀疏性等特征)的示例.
圖2完整的、碎片化的、稀疏的監測大數據示例
這里完整監測大數據主要針對運行模式比較固定的隨機退化設備(如軸承、齒輪等), 能夠實現不間斷連續監測, 監測大數據涵蓋了設備從開始運行到失效比較完整的狀態數據, 而非完整監測大數據主要針對受經濟條件及現實監測條件限制的隨機退化設備(如航空發動機、渦輪泵、配電電池等), 對這類設備進行連續監測采樣是不現實的, 只能間歇性地對其監測, 得到的狀態監測大數據表現出一定的“碎片化、分段、稀疏”等特點. 因此, 當剩余壽命預測進入大數據時代, 如何根據監測大數據呈現出的不同特點, 充分分析利用豐富的監測大數據資源, 從浩如煙海的數據中進行“沙里淘金”, 深度挖掘出反映設備健康狀態的信息并據此進行剩余壽命預測, 是隨機退化設備剩余壽命預測領域亟需解決的關鍵問題.
數據驅動的剩余壽命預測方法基于設備運行監測數據, 通過擬合設備性能變量演化規律并外推到失效閾值, 或建立監測數據與失效時間的映射關系, 以實現剩余壽命預測, 為大數據背景下隨機退化設備剩余壽命預測提供了可行的技術思路. 然而, 剩余壽命指當前時刻到系統失效時刻的有效時間間隔, 因此剩余壽命預測實際上是根據當前得到的監測信息, 對系統將來失效事件的預測, 其預測結果不可避免的具有不確定性. van Asselt等從哲學和認識論的角度討論了預測的不確定性處理問題, 指出預測結果具有不確定性是學術界的共識, 也是當今時代的特征. 聯合攻擊機F-35項目組研究人員Hess等和Smith等、壽命預測領域代表性學者馬里蘭大學先進生命周期工程中心Pecht教授等、可靠性領域知名期刊Quality and Reliability Engineering International主編Brombacher教授通過各種事例強調了預測不確定性的量化是剩余壽命預測從理論到應用轉化的核心. 美國國家航空航天局(National Aeronautics and Space Administration, NASA)預測與健康管理中心研究規劃中也將剩余壽命預測不確定性的管理列為了中心發展路線圖的重要研究內容. 由此可見, 預測不確定性的量化是數據驅動隨機退化設備剩余壽命預測領域的一個核心問題, 也是解決“敢用、能用” 剩余壽命預測理論技術實現實際工程設備個性化精準健康管理、保障設備長周期安全可靠運行的關鍵所在.
隨著信息技術和傳感器技術的迅猛發展, 數據驅動的剩余壽命預測技術由于適用范圍廣、容易實現、無需深入專業機理知識等優點, 作為其中典型代表的機器學習方法和統計數據驅動方法已獲得了大量研究和蓬勃發展, 得到了學術界和工業界的廣泛關注, 相關技術已經在導彈武器、航空航天、風力發電、工業制造等領域產生了重要應用[14-16]. 盡管以機器學習方法和統計數據驅動方法為典型代表的數據驅動隨機退化設備剩余壽命預測已獲得了大量研究和蓬勃發展, 但已有理論與方法在大數據背景下隨機退化設備剩余壽命預測及其預測不確定性量化這一核心問題上, 仍然沒有系統有效的解決方法, 主要體現在統計數據驅動方法處理大數據能力不足, 而機器學習方法量化預測不確定性能力不足. 因此, 通過對大數據背景下剩余壽命預測研究發展脈絡的探究, 深入剖析當前研究存在的瓶頸問題, 對于促進隨機退化設備剩余壽命預測技術的發展具有重要意義. 在第2 ~ 5節, 將針對當前大數據背景下剩余壽命預測典型解決思路的研究動態和存在的問題進行具體的分析.
2.機理模型與數據混合驅動的剩余壽命預測
基于機理模型的方法主要是依據失效機理構建描述設備退化過程的參數化數學模型, 結合設備的設計試驗數據或經驗知識辨識數學模型參數, 進而基于狀態監測數據更新機理模型參數實現設備的剩余壽命預測. 典型的參數識別與更新方法包括: 卡爾曼濾波[17-19]、粒子濾波[20-21]和貝葉斯方法[22-23]等. 常見的用于剩余壽命預測的機理模型包括: Paris模型、Forman模型以及在其基礎上的各種改進和擴展模型, 主要用以描述裂紋擴展和層裂增長[24-25]. 例如, Li等[26-27]基于Paris模型, 建立了缺陷增長率與缺陷面積及材料常數的映射關系, 以預測滾動軸承的剩余壽命; Li等[28]提出了Paris裂紋擴展模型, 根據裂紋尺寸和動態載荷預測齒輪的剩余使用壽命; Liang等[29]研究了基于Paris模型的滾珠軸承剩余使用壽命自適應預測方法, 即使在缺乏先驗信息且缺陷增長為時變的情況下, 也能獲得可靠的預測結果. Oppenheimer等[30]利用線彈性斷裂力學, 對轉軸建立了基于Forman裂紋擴展的壽命模型; 針對層裂增長故障, Marble等[31]開發了一種渦輪發動機軸承的層裂增長預測模型, 能夠根據工況估計層裂增長軌跡和故障時間, 并利用診斷反饋進行自調整, 降低了預測不確定性; Choi等[32]考慮了由于裂紋形成和磨粒磨損引起的層裂增長現象, 提出了滾動接觸的層裂增長壽命模型. 在充分理解失效機理并得到準確的模型估計參數后, 基于機理模型的方法能夠實現對剩余使用壽命的精確預測. 然而, 以上現有基于機理模型的剩余壽命預測方法未能結合實際運行設備的實時監測數據, 難以準確反映設備當前運行的實際狀態, 特別是在設備運行環境、運行工況發生變化時, 若不能利用實時監測數據對模型進行更新, 將產生較大的預測偏差.
為了使得機理模型能夠更好地建模實際服役個體設備的性能演變過程, 將設備實時運行監測數據與機理模型進行混合, 將有助于實現剩余壽命預測準確性的提升. 因此, 機理模型與數據混合驅動的剩余壽命預測方法也得到了較多的關注和發展[4]. 最近該方面的研究包括Liao等[33]、Wang等[34]的論文, 這些研究分別針對鋰電池系統和旋轉機械設備, 提出了機理模型與數據混合驅動的剩余壽命預測方法. 根據機理模型與數據混合驅動實現方式不同, 可將這類混合驅動的剩余壽命預測方法分為兩大類: 1)基于監測數據構建機理模型所刻畫退化狀態的測量模型, 運用卡爾曼濾波、粒子濾波等方法估計退化狀態和機理模型參數, 然后通過機理模型預測設備的剩余壽命[12,35]; 2)首先分別基于數據和機理模型進行設備的剩余壽命預測, 然后利用決策層融合方法實現集成基于數據和基于機理模型的剩余壽命預測[36-37]. 以上兩類機理模型與數據混合驅動實現剩余壽命預測的方式各具優勢: 第1種方式能夠充分考慮退化狀態難以直接測量的實際, 在考慮監測數據中測量噪聲的情況下, 可實現隱含退化狀態的估計和機理模型參數的更新, 使得最終的預測結果能夠更準確地反映設備當前的實際狀態; 第2種方式實現過程相對簡單獨立, 決策層融合的形式較為多樣, 如平均法、權重平均、核回歸、證據組合等, 能夠集成多種方法的優勢, 有助于提升預測結果的魯棒性.
雖然基于機理模型的方法和機理模型與數據混合驅動方法得到了一定的發展, 但其成功應用的基礎是可獲取精確可靠的機理模型. 隨著當代設備逐步呈現復雜化、非線性化以及高維化等特征, 其健康狀態演化規律通常難以精確機理建模或者獲得失效機理模型的成本過高. 現有研究中通過物理機理分析、理化分析、實驗分析等手段獲取的機理模型主要針對特定材料或對象, 這一點也可以通過當前機理模型的種類相當匱乏反映出, 由此在一定程度上限制了這類方法的廣泛應用. 因此, 在大數據背景下, 通過挖掘數據中隱含的設備健康狀態信息, 發展數據驅動的剩余壽命預測方法成為當前的主流和研究的焦點.
3.基于機器學習的剩余壽命預測
基于機器學習的設備剩余壽命預測主要思路是通過機器學習擬合性能變量演化規律并通過滾動外推到失效閾值以預測失效時間, 或直接建立監測數據與失效時間的映射關系實現端到端的預測, 基于此通過預測的失效時間減去當前運行時間得到剩余壽命的預測值. 裴洪等[38]和Khan等[39]分別綜述了機器學習方法和深度學習方法在剩余壽命預測與健康管理領域的研究應用現狀. 為區別于以上綜述中介紹的工作, 本文重點結合最新的研究進展和大數據下剩余壽命預測的現實需求, 對基于機器學習的剩余壽命預測技術發展動態和存在的問題進行分析. 根據機器學習網絡模型結構特點, 這類方法主要分為基于淺層機器學習的方法和基于深度學習的方法.
3.1
基于淺層機器學習的剩余壽命預測
基于淺層機器學習的剩余壽命預測方法中的典型代表為神經網絡、支持向量機等, 具體發展動態分述如下.
1) 神經網絡
神經網絡是一種模擬人類中樞神經系統組織結構與信息處理機制的學習網絡, 主要由輸入層、隱層和輸出層組成[40]. 神經網絡具有自學習、自組織、自適應以及強非線性映射擬合能力等優點[41-42], 因而在設備剩余壽命預測領域受到了學者們的廣泛關注[43-45]. 早在2004年, Gebraeel等[46]就將單隱層前饋神經網絡用于機械設備振動信號建模, 通過外推至失效閾值實現剩余壽命預測. Mahamad等[47]通過改進前饋神經網絡訓練算法, 將改進后的網絡用于旋轉機械的壽命預測. Lim等[48]采用特征時序直方圖法從多源監測數據中提取了具有局部趨勢性的退化指標, 然后將這些退化指標輸入到多層感知機中去預測航空發動機的剩余壽命. Drouillet等[49]將單隱層前饋神經網絡用于高速銑刀剩余壽命預測. Ahmadzadeh[50]等使用多層感知機去預測研磨機剩余壽命. Zhang等[51]基于小波包分解、快速傅里葉變換和反向傳播神經網絡構建了鼓風機剩余壽命預測模型. 徐東輝[52]提出了多類神經網絡組合預測的方法, 利用改進的Elman神經網絡和非線性自回歸神經網絡兩個單項預測模型進行預測, 并且借助于徑向基函數神經網絡對兩個單項模型的預測值進行非線性組合, 實現了剩余壽命預測. 楊洋[53]研究了一種基于自回歸移動平均和后向傳播神經網絡組合模型的鋰電池壽命預測方法, 有效結合了兩者在短期預測方面與非線性擬合方面的優勢. 在最新的研究中, Bektas等[54]通過引入傳感器選擇、數據歸一化、特征提取等數據預處理技術, 將預處理后的數據用于訓練神經網絡, 提出了一種基于神經網絡和相似性的剩余壽命預測方法. Li等[55]利用監測數據訓練了多個神經網絡, 基于加權平均思想提出了一種基于集成網絡的剩余壽命預測方法.
2)支持向量機
支持向量機是由Cortes[56]和Vapnik[57]于1995年首次提出的, 在小樣本和高維數據機器學習領域受到廣泛關注, 主要原理是首先通過非線性變換將多維輸入向量映射到高維特征空間, 然后在高維特征空間中構造最優超平面來實現樣本分類或回歸. 由于支持向量機能夠有效避免“維數災難”問題, 且具有較好的泛化能力, 因而廣泛應用于設備的剩余壽命預測中[58-61]. 例如, Soualhi等[62]利用Hilbert-Huang變換構建了滾動軸承的敏感退化指標, 然后將這些退化指標輸入到支持向量機中實現了旋轉軸承的剩余壽命預測; Sun等[63]構建了貝葉斯最小二乘法支持向量機預測模型, 并將其用于微波器件的剩余壽命預測; Nieto等[64]將支持向量機應用到了航空發動機的剩余壽命預測中; Khelif等[65]研究提出了一種不需要建立健康指標、故障狀態等直接基于支持向量回歸模型建立監測數據與設備壽命的擬合關系, 進而實現了剩余壽命預測. Huang等[66]對基于支持向量機的剩余壽命預測方法研究現狀、應用領域及發展趨勢進行了系統地梳理和分析.
3)其他淺層模型
除了以上幾種常用的淺層模型外, 一些其他機器學習模型也被應用到裝備的剩余壽命預測中, 如極限學習機[67]、貝葉斯網絡[68]、隨機森林[69]、梯度提升決策樹[70]、基于案例的學習方法[71]、基于案例的推理方法[72]等. 文獻[38]對基于淺層機器學習的剩余壽命預測方法進行了詳細綜述, 本文不再贅述.
通過文獻總結分析可以發現, 雖然淺層神經網絡訓練相對比較容易, 基于淺層機器學習方法實現設備剩余壽命預測的研究具有較長的歷史, 但這類方法中采用的網絡結構簡單、預測性能較多地依賴于專家先驗知識與信號處理技術, 且難于量化剩余壽命預測結果的不確定性. 此外, 這類研究中較多的方法需借助人工經驗與知識預先提取監測數據中的關鍵信息并構建退化指標, 因此退化指標的好壞將很大程度上決定淺層神經網絡的預測性能. 在大數據時代, 設備退化特征愈發表現出耦合性、不確定性、非完整性等特點, 淺層機器學習算法自學習能力較弱, 難以自動處理和分析海量監測數據. 因此, 大數據下剩余壽命預測的智能學習模型由“淺”入“深”、勢在必行.
3.2
基于深度學習的剩余壽命預測
深度學習作為一種大數據處理工具, 旨在模擬大腦學習過程, 構建深度模型, 通過海量數據學習特征, 刻畫數據豐富的內在信息, 最終提升建模精度. 深度學習自從2006年在Science上首次提出便掀起了學術界和工業界的研究浪潮, 如雨后春筍, 以其強大的海量數據處理能力在諸多領域的大數據分析中方興未艾. 經過了十余年的探索, 深度學習當前已成功應用于許多工程領域, 如圖像識別[73]、自然語言處理[74]、語音識別[75]、故障診斷[76]等, 同時在剩余壽命預測領域也嶄露頭角. 如圖1所示, 根據網絡結構的不同, 這類方法主要包括: 基于深度自編碼器的方法、基于深度置信網絡的方法、基于卷積神經網絡的方法、基于循環神經網絡的方法以及多種網絡組合而成的混合網絡方法. 無論基于哪種深度網絡結構形式, 其基本思想都是采用現有深度學習模型建立性能測試數據與剩余壽命標簽或退化標簽之間的潛在關系. 下面針對幾種典型的深度學習網絡, 介紹其應用于剩余壽命預測時的研究動態并分析當前研究存在的問題.
1)深度自編碼網絡
深度自編碼網絡是由多個自編碼器或降噪自編碼器堆疊組成的深度神經網絡. 基于深度自編碼網絡的剩余壽命預測通過提取出原始數據的深層次特征, 然后通過邏輯回歸層或全連接層實現機械裝備的剩余壽命預測[77-80]. 由于自編碼器是以重構原始輸入為學習目標, 因而其學習到的特征對數據有更本質的刻畫, 有利于提高預測精度, 且深度自編碼網絡能夠以無監督學習方式逐層對網絡參數進行預訓練, 將訓練結果作為反向微調的初始值, 確保了網絡參數的在線更新, 在剩余壽命預測領域得到了廣泛的應用[81-85]. 例如, Xia等[79]提出了一種基于深度自編碼網絡的兩階段剩余壽命預測方法, 首先運用深度降噪自編碼器網絡對監測大數據進行階段劃分, 然后訓練深度自編碼網絡得到每個階段的退化特征, 最后通過回歸方法分析各階段特征實現剩余壽命預測. 然而, 深度自編碼網絡在處理力信號、振動信號、聲發射信號、光信號等高維原始監測數據時, 其仍需要借助各類信號處理技術來提取設備的退化指標.
2)深度置信網絡
深度置信網絡主要是由多個受限波爾茲曼機堆疊與一個分類層或回歸層組合形成的深度網絡, 通過逐層預訓練和反向精調策略解決深度模型普遍存在的訓練困難問題, 不僅能實現數據從淺層到深層的特征表示與提取, 而且能發現輸入數據的分布式特征, 在深層特征提取方面獲得了廣泛的應用. 例如, Jiao等[86]提出了一種基于深度置信網絡的健康指標構建方法用于裝備的剩余壽命預測, 該方法采用無監督學習的策略融合多個傳感器監測數據對裝備健康狀態進行評估, 得到描述其退化程度的健康指標用于剩余壽命預測. 需要注意的是, 深度置信網絡在實際中的應用主要集中在深層次特征提取方面, 單純利用深度置信網絡實現剩余壽命預測的研究還相當有限, 需要與其他網絡混合進行才能進行剩余壽命預測.
3)卷積神經網絡
卷積神經網絡作為一類經典的前饋神經網絡, 是由LeCun等[87]首次提出并用于解決圖像處理問題的, 主要由若干卷積層和池化層組成, 既能輸入序列數據, 也能處理網格化數據, 在計算機視覺、語音識別等領域應用十分廣泛. 針對設備性能監測大數據的特點, 先后發展出了多種用于剩余壽命預測的卷積神經網絡, 主要包括深度卷積神經網絡[88]、多層可分離卷積神經網絡[89]、多尺度卷積神經網絡[90]、聯合損失卷積神經網絡[91]等. Babu等[92]首次將深度卷積神經網絡應用于剩余壽命預測領域, 采用兩個卷積層和兩個池化層提取原始信號特征, 同時結合多層感知器實現剩余壽命的預測. 最近, Yang等[93]提出了一種基于兩個卷積神經網絡的剩余壽命預測方法, 其中一個是分類網絡用于監測性能退化的初始時刻, 另一個是回歸網絡用于預測剩余壽命. 相比于其他深度學習網絡, 卷積神經網絡能夠更有效地處理力信號、振動信號、聲發射信號、光信號等高維原始數據, 可實現從監測數據中自動提取退化特征信息, 適合處理監測大數據且具有降噪的功能, 同時其網絡參數量相對較少, 訓練更加方便高效, 因此易于構建更深的網絡結構. 然而, 隨機退化設備的監測數據蘊含的健康特征往往是時序相關的, 而卷積神經網絡在應對大數據下時序特征提取能力不足, 容易造成重要時序特征的丟失, 這對于剩余壽命預測是不利的, 因此卷積神經網絡在應用于剩余壽命預測時經常與其他深度網絡組合使用.
4)循環神經網絡
循環神經網絡作為一類包含前饋連接與內部反饋連接的前饋神經網絡, 主要用于處理具有相互依賴特性的監測向量序列, 由于其特殊的網絡結構, 能夠保留隱含層上一時刻的狀態信息, 目前已經在剩余壽命預測領域得到廣泛的關注, 被應用于鋰電池系統[94]、風力發電設備[95]、航空發動機[96]等. 為解決循環神經網絡通常存在“記憶衰退”進而導致預測偏差較大這一問題, 學者們對循環神經網絡模型進行了改進, 提出了一種長短期記憶(Long short term memory, LSTM)模型, 門結構作為LSTM的獨特結構, 能夠在最優條件下確定出所通過信息特征, 在剩余壽命預測領域獲得了廣泛的應用[97-98]. 例如: 為解決運行和環境擾動引起的不確定性問題, Elsheikh等[99]對LSTM的結構分別進行了改進, 提出了基于雙向LSTM的剩余壽命預測方法. 雖然循環神經網絡在隨機退化設備退化過程建模方面具有先天優勢, 但當處理長期依賴型退化數據時, 循環神經網絡在訓練過程中也經常面臨梯度消失或爆炸問題. 同時, 以上基于循環神經網絡的剩余壽命預測研究中都未考慮預測結果不確定性的量化問題, 只能輸出一個剩余壽命的點估計, 難以評估預測結果的置信度.
最近, 針對剩余壽命預測不確定性量化問題, Zhang等[100]在假定退化數據服從正態分布的前提下利用Monte Carlo方法從退化數據中隨機采樣, 通過改變LSTM網絡輸入, 在不同網絡輸入下得到不同的剩余壽命預測值, 由此構造剩余壽命的數值分布, 試圖量化預測不確定性. Huang等[101]利用雙向LSTM網絡預測剩余壽命輸出的均方根誤差構建剩余壽命預測的誤差帶, 以區間的形式表示預測不確定性. Yu等[102]對退化監測數據進行劃分、以退化量為標簽, 建立了多個基于LSTM網絡的退化量預測模型, 然后通過滾動預測的思想將預測值作為模型輸入迭代預測至退化量超過失效預測的時刻, 由此確定設備的剩余壽命預測值. 進一步, 為綜合多個LSTM網絡預測值, 引入Bayesian模型平均方法, 估計各個模型的后驗概率, 由此可以確定最終的剩余壽命預測值和預測置信區間, 有效提高了剩余壽命預測精度的同時以置信區間的形式表示了預測不確定性. 以上思路在基于機器學習方法的剩余壽命預測不確定性量化方面做出了有益的嘗試, 然而無論是改變輸入條件構建數值分布、基于均方根誤差構建誤差帶, 還是構建多個預測模型通過Bayesian模型平均構建置信區間, 都更多地反映了網絡訓練的效果而不能全面反映設備性能退化固有的時變隨機性和動態特性.
5)混合深度網絡
基于混合深度網絡的方法可看作多個深度學習網絡以一定方式組合連接(如串聯、并聯等)用于彌補現有單一深度學習網絡的不足, 目前主要的混合形式包括深度置信網絡 + 前饋神經網絡[103]、受限玻爾茲曼機 + LSTM網絡[104]、LSTM網絡 + 卷積神經網絡[105]、LSTM網絡 + 編碼?解碼模型[106]、循環神經網絡 + 自編碼器[107]、多損失編碼器 + 兩階段卷積神經網絡[108]等. 這類方法主要通過繼承不同深度學習模型的優勢, 進而期望實現取長補短、改善剩余壽命預測的效果. 例如: Ren等[109]提出了一種堆棧自編碼器與前饋神經網絡組合的軸承剩壽命預測方法, 該方法能夠有效利用堆棧自編碼器在特征表示方面的優勢, 同時將其引入至前饋神經網絡可有效避免訓練過程中的局部最優問題; Deutsch等[104]提出了一種融合深度置信網絡與前饋神經網絡的旋轉設備剩余壽命預測方法, 這是基于深度置信網絡方法的改進和拓展, 能夠有效結合深度置信網絡特征提取能力與前饋神經網絡的預測性能. 雖然通過混合深度網絡進行剩余壽命預測有助于產生互補效應, 但混合多種深度網絡將不可避免地導致剩余壽命預測模型的訓練復雜化, 而且混合方式的選擇基本上是啟發式的, 缺乏公認統一的形式. 因此, 發展剩余壽命預測相關性能要求牽引下的混合深度網絡構建方式以提高混合方式的可解釋性仍有待深入研究.
需要說明的是, 基于深度學習的剩余壽命預測研究正在蓬勃發展, 以上介紹到的文獻僅是冰山一角. 通過對當前相關研究發展動態的分析不難發現, 無論是傳統的基于淺層機器學習還是正在蓬勃發展的基于深度學習的剩余壽命預測研究, 基本上都可以歸結到兩種思路, 即基于退化量滾動預測和基于學習網絡建立監測數據與失效時間端到端的映射. 雖然在以上兩種思路下的剩余壽命預測方法研究快速發展, 且都屬于數據驅動的方法, 但當前研究面對剩余壽命預測現實需求時主要存在以下有待解決的問題:
1)目前這些基于機器學習的剩余壽命預測研究, 基本上都是將其他領域應用需求驅動下提出并發展起來的各種深度網絡直接應用, 其網絡結構和參數均是確定性的, 一般只能得到確定性的剩余壽命預測值, 很難得到能夠量化剩余壽命預測不確定性的概率分布. 正如第1節所討論的, 剩余壽命預測針對的是設備將來的失效事件, 而設備性能退化在預測區間內受到環境、負載等多重隨機因素影響, 導致剩余壽命預測結果不可避免地具有不確定性, 因此剩余壽命預測不確定性的量化表征是該領域的一個核心問題. 然而, 目前基于機器學習的方法對這方面重視不夠, 在預測不確定性量化能力上存在不足. 無法量化預測不確定性也意味著無法量化預測結果帶來的風險, 由此導致難以滿足以最小化運行風險或最小化費用為目標的健康管理相關決策(如維護決策、備件訂購等)對運行風險定量評估的應用需求[39]. 造成以上問題的根本原因在于所采用的學習網絡并不是針對剩余壽命預測的核心需求設計的, 更多的是直接采用或借鑒其他任務需求下發展起來的學習網絡. 因此, 如何設計并發展面向剩余壽命預測及其不確定性量化需求的專用學習網絡, 使得其能夠從監測數據中學習到反映預測不確定性的剩余壽命概率分布相關的信息, 是克服現有研究發展瓶頸的根本途徑和有重要價值的研究方向.
2)現有研究中通過學習網絡建立監測數據與失效時間端到端映射以預測剩余壽命的思路, 其成功實現的前提是能夠獲取充分的同類設備失效時間數據以制作訓練標簽. 然而, 在工程實際中, 由于受到安全性與經濟性等因素的限制, 設備運行至失效狀態是極其危險的, 一般在失效前對設備進行替換. 在該情況下, 所能獲取的更多的是設備在服役過程中積累的大量狀態監測數據, 關于設備失效時間的數據幾乎沒有, 因而這類狀態監測大數據大多屬于非全壽命周期類型. 盡管大數據背景下非全壽命周期數據包含了豐富的設備退化機制與壽命信息, 但由于失效數據匱乏將導致現有基于機器學習的剩余壽命預測方法中所需的壽命標簽難以制作(即零壽命標簽問題), 由此為構建監測數據與剩余壽命之間端到端的映射關系帶來了極大的挑戰. 與此同時, 基于退化量滾動預測的思路以退化量為標簽構建預測模型, 能夠減少對壽命標簽數據的依賴, 但在實現過程中將本身存在誤差的退化量預測值作為預測模型輸入進行滾動預測, 容易造成預測誤差的累積, 進而影響剩余壽命預測的準確性. 此外, 目前基于以上思路的剩余壽命預測研究主要針對完整監測數據, 而對于圖2所示的“碎片化、分段的、稀疏的”非完整監測大數據與剩余壽命之間的映射關系鮮有研究. 因此, 零壽命標簽情形下如何通過非完整監測大數據構建隨機退化設備剩余壽命預測模型, 發展剩余壽命預測研究的新范式仍有待解決.
3)如前所述, 剩余壽命預測是銜接設備健康狀態感知與基于狀態感知信息實現設備的個性化精準健康管理的橋梁, 因此剩余壽命預測方法的可解釋性對于將預測結果用于設備的健康管理(如預測維護、備件訂購等)至關重要. 然而, 現有基于機器學習的剩余壽命預測方法通過學習網絡建立監測數據與剩余壽命之間的映射關系, 監測數據與剩余壽命之間的關系難以顯式表示, 呈現“黑箱” 特點, 難以解釋設備退化失效機理. 此外, 當前的研究較多地關注了剩余壽命預測的準確性, 但機器學習模型中超參數的選擇對預測結果的準確性和魯棒性具有重要影響, 預測的效果對調參技巧和經驗有較大的依賴, 而如何合理有效地選擇機器學習模型的超參數在機器學習領域本身就是一個極具挑戰性的問題. 綜合以上兩個方面可見, 發展具有可解釋性的基于機器學習的剩余壽命預測方法, 將有助于打通當前這類方法從理論研究到推廣應用于設備健康管理的最后一公里. 提高基于機器學習的剩余壽命預測方法的可解釋性的研究方向包括在學習網絡設計中考慮設備退化失效的機理知識、基于學習網絡從監測數據中提取退化特征時將特征的趨勢性或單調性作為約束條件考慮、將超參數的選擇問題轉化為提升預測效果的優化問題納入模型訓練過程等.
審核編輯 黃昊宇
-
數模
+關注
關注
0文章
40瀏覽量
15103 -
大數據
+關注
關注
64文章
8894瀏覽量
137475 -
深度學習
+關注
關注
73文章
5504瀏覽量
121217
發布評論請先 登錄
相關推薦
評論