作者:李天梅 司小勝 劉翔 裴洪
4.統計數據驅動的剩余壽命預測
傳統統計數據驅動的剩余壽命預測方法通過對設備失效時間數據統計分析, 構造壽命TT的分布函數, 由此設備在tt時刻的剩余壽命即為T?t|T>t,zT?t|T>t,z, 其中zz代表該類設備的事件數據集(主要指失效時間數據), 然后通過分布擬合得到壽命TT的概率分布, 再通過上述條件隨機變量的關系實現剩余壽命預測[110]. 然而, 隨著生產制造水平的不斷提升, 設備的可靠性逐步提高, 很難在短期內(即使是加速條件下)獲得足夠多的失效數據或對于昂貴的設備獲取成本過高, 而且這類方法沒有用到設備運行過程中的監測數據, 預測結果難以反映當前運行實際情況, 由此導致難以實現個體服役設備的精準健康管理.
相比之下, 隨著信息技術和傳感器技術的迅猛發展, 通過設備性能退化變量的監測數據, 建立描述設備性能演化過程的隨機模型, 便可預測設備剩余壽命[111]. 這類方法以概率統計理論為基礎, 在隨機模型框架下建模性能退化變量演變規律, 以概率分布的形式給出剩余壽命分布的表達式, 不僅能得到剩余壽命的點估計, 而且能描述預測的不確定性(方差、置信區間等各種不確定性量化指標), 這對維修、替換、后勤保障等的科學決策極為重要, 因而已成為國內外研究的熱點.
基于隨機模型建模性能退化變量監測數據的關鍵是選擇合適的隨機模型, 常用的隨機模型主要指各種隨機過程模型, 包括Wiener過程、Gamma過程、Markov鏈、隱Markov過程和逆高斯過程等[112-115]. 這類方法采用隨機過程描述性能退化變量的演變過程, 通過監測數據實現模型參數的估計, 基于此通過求解所建立的隨機退化過程首達失效閾值時間的概率分布實現剩余壽命預測, 在剩余壽命預測不確定性量化方面具有天然優勢. 從物理機制看, 設備退化是其內部應力和外部環境綜合作用而引起的設備老化和性能衰變, 與采樣時間和采樣頻率無關, 亦即設備的退化過程應該滿足無限可分性. 迄今, 從數學上已證明滿足無限可分性的隨機過程模型只有Gamma過程、逆高斯過程和Wiener過程[116-117]. 因此, 利用這三類隨機過程建立設備退化模型, 在數學上和物理上均具有較強的可解釋性, 受到了國內外研究者的廣泛關注[118-119]. 然而, 前兩種隨機過程都是單調隨機過程, 只能描述單調退化, 例如磨損、疲勞裂紋增長等. 在實際中, 由于設備內部應力的吸收與釋放、使用強度、使用頻率、載荷大小、外界環境等的動態變化, 性能退化變量的監測信號往往呈現非單調波動的特點, 而Wiener過程是由Brownian運動驅動的一類擴散過程, 其增量獨立且為高斯分布, 適合刻畫非單調退化過程, 在退化測量信號的建模上更具靈活性, 因此廣泛應用于滾動軸承、液晶顯示器、激光器、慣性器件等的退化建模及剩余壽命預測. 2018年, Zhang等[120]系統全面地總結了基于Wiener過程的各種退化建模及剩余壽命預測方法最新研究進展情況.
目前, 這類基于隨機過程的方法主要針對圖2所示的完整監測數據, 且需要能夠從監測數據中提取具有一定趨勢特征的性能退化變量, 以確定所采用隨機過程的參數化形式并基于監測數據實現隨機過程模型參數辨識, 最終通過求解隨機過程首達失效閾值時間的概率分布達到預測剩余壽命的目的. 根據建模過程中涉及的性能退化變量數目, 主要分為單變量模型和多變量模型兩種情況.
單變量下隨機退化設備剩余壽命預測研究得到了廣泛關注和深入研究. Gebraeel等[121]以軸承振動數據為背景, 將設備退化數據演化過程描述為線性Wiener過程, 最早將Bayesian更新策略用于剩余壽命分布的在線遞歸預測. Huang等[122]通過采用時間尺度變換線性化技術研究了一類基于一般Wiener隨機退化過程的剩余壽命預測問題, 提出了漂移系數自適應更新方法; 為處理本質非線性退化數據, Si等[123]提出了一類一般非線性擴散過程模型描述退化數據, 通過時間?空間變換, 得到了剩余壽命分布的解析形式, 并將所得結果應用于慣性平臺的漂移退化和2017-T4鋁合金的疲勞裂紋增長. 在文獻[123]基礎之上, 出現了諸多的理論擴展及應用研究[124-125]. 最新出版的學術專著 [126] 對基于Wiener過程及其變形開展的單變量下隨機退化設備剩余壽命預測基礎理論和方法, 從線性到非線性、從固定模式到切換模式進行了詳細的論述.
在工程實際中, 設備存在運行工況、運行環境、運行負載多變等復雜運行模式, 反映設備性能退化的變量往往不止一個且相互關聯, 呈現多性能退化變量的特點, 表征設備健康狀態的性能退化指標往往并不唯一. 文獻[127]在Bayesian框架下研究了多變量動態系統的可靠性估計問題, 但將各個變量單獨建模, 未考慮多退化變量之間相互耦合的實際. 當前, 對多變量耦合的情況主要有兩種思路. 第1種是基于Copula函數的方法. 其中, Copula函數是一種連接多維聯合分布與一維邊緣分布的特殊函數, 基于此函數, 多個相關退化量的聯合分布可以通過每個退化量的邊緣分布和Copula函數融合為一個整體分布[128]. Pan等[129]、Peng等[130]、劉勝南等[131]、張建勛等[132]采用不同的隨機過程模型和Copula函數研究了多元退化變量的建模問題, 并用于剩余壽命預測. 然而, 基于Copula函數的方法成功應用的關鍵在于Copula函數的選擇, 不同的退化數據常常適用于不同的Copula函數, 而且可供選擇的Copula函數形式是非常有限的, 選擇的過程有一定的主觀性, 選擇結果也不唯一, 因此這類方法難以對多個性能退化變量之間的相互作用關系進行合理的定量描述. 第2種是基于信息融合的方法. 這種方法的主要思路是在進行退化建模之前, 首先根據多維數據之間的關系, 通過優化、加權、融合濾波等方式, 將多維數據投影變換到一維數據上來, 提取一個單變量復合性能指標, 再應用已有針對單變量的方法對此一維數據進行建模和預測. 例如, Liu等先后提出了基于退化信號加權組合[133-134]、基于信號質量優化[135]、基于多源信息融合[136-137]的復合性能指標獲取方法, 據此采用單變量退化建模方法實現剩余壽命預測. 此類方法的優點在于融合后的性能指標可以采用傳統針對單變量的退化建模和剩余壽命預測方法. 然而, 在多維數據融合時其相互之間的關系一般難以界定, 使得融合后的指標難以全面反映整個設備的退化, 而且融合后的指標物理意義不明確, 導致退化失效閾值的確定成為一個新的難題.
通過以上文獻分析可以看出, 統計數據驅動方法以概率統計理論為基礎, 利用隨機模型對監測數據進行建模, 進而對剩余壽命進行推斷, 可以得到剩余壽命的概率分布, 在量化剩余壽命預測不確定性上具有天然優勢, 且隨機模型參數與設備退化失效過程緊密相關使得模型可解釋性較強(如反映退化快慢的退化率參數、反映退化過程時變不確定性的擴散系數等), 因此得到了可靠性領域學者的大力推崇, 發展迅速. 但需要注意到的是, 無論是單變量下還是多變量下, 這類方法主要針對圖2所示的完整監測數據且需要能夠從監測數據中提取具有一定統計特征的退化趨勢數據以實現參數化的演變軌跡建模. 然而, 在大數據時代, 通常采用傳感器網絡收集多物理源信號以全面反映設備狀態, 由于多源信號差異大、采樣策略形式多, 數據價值密度低, 導致數據質量參差不齊, 現有統計數據驅動的方法從大數據中提取退化特征信息如同大海撈針, 處理如圖2所示的“碎片化、分段的、稀疏的”監測大數據更是難上加難, 沒有良好統計特征的退化數據做輸入, 這類方法必將迷失于浩瀚的數據海洋. 此外, 單變量下隨機退化設備剩余壽命預測研究試圖提取單一特征表征設備健康狀態全貌的思路, 已與復雜運行條件下設備健康狀態需從多維度表征的需求不相適應, 而現有多變量下隨機退化設備剩余壽命預測問題的研究基本都是試圖通過轉換為單變量情況再來處理, 未充分考慮多性能退化變量相互耦合、相互影響的機制, 多變量耦合導致的剩余壽命分布求解難題仍未能得到有效解決. 因此, 針對大數據環境下隨機退化設備的剩余壽命預測問題, 發展新的理論和方法勢在必行.
5.機器學習方法與統計數據驅動方法相結合的剩余壽命預測
通過第3節和第4節的文獻分析可以看出, 以深度學習為代表的機器學習方法在監測大數據深層次特征自動提取、復雜結構數據擬合、非線性映射等方面具有強大的處理能力, 但很難得到體現剩余壽命預測不確定性的概率分布, 這與其強大的數據處理能力和學習能力還不相匹配. 統計數據驅動的方法雖能得到剩余壽命的概率分布、在量化剩余壽命預測不確定性上具有天然優勢, 但對具有多源信號差異大、采樣策略形式多、數據價值密度低、數據質量參差不齊等特點的監測大數據處理能力非常有限. 因此, 若能將機器學習方法與統計數據驅動方法相結合, 有望綜合兩者的優勢、彌補各自局限性. 最近, 一些學者也開始了這方面的探索性研究. Deutsch等[138]將深度置信網絡用于提取退化特征, 然后用隨機退化模型表示特征的演變趨勢, 利用粒子濾波算法實現模型更新, 并得到了剩余壽命概率分布的數值形式. 彭開香等[139]研究提出了一種基于深度置信網絡的無監督健康指標構建方法, 并結合隱馬爾可夫模型對特征進行建模用于剩余壽命預測. 進一步, 該方法被改進為深度置信網絡與粒子濾波相結合的形式[140], 可以實現剩余壽命概率分布的數值計算. 最近, Hu等[141]利用深度置信網絡的無監督學習特性構建性能退化指標, 然后采用非線性擴散過程建模性能退化指標演變趨勢, 從而得到了剩余壽命的概率分布.
這些研究在做出了有益嘗試的同時, 還存在不容忽視的局限性: 1)以上方法中深度網絡用于特征提取而隨機模型用于建模特征實現剩余壽命的概率分布輸出, 但在實現過程中特征提取和模型建立是孤立進行的, 由此導致機器學習方法和統計數據驅動方法實際是簡單的組合關系, 提取的深度退化特征能否適應并匹配所采用的隨機模型仍是問題, 因為在特征提取過程中并沒有考慮提取后采用何種形式的模型對其建模表征; 2)深度網絡通常可以從監測大數據中提取深層次、多維度的退化特征, 但以上方法通過指標篩選技術從多維度特征中選擇單個特征用于隨機退化建模, 由此這類方法還存在第4節討論的所選單一特征難以表征設備健康狀態全貌、未考慮多變量耦合下剩余壽命分布求解等問題; 3)通過深度網絡從大數據中提取的退化特征實際上是虛擬退化指標, 物理意義不明確, 由此導致這些退化指標所對應的失效閾值確定成為一個新的難題.
通過上述分析可見, 若能綜合統計數據驅動方法在預測不確定性量化能力上的優勢與機器學習方法在大數據處理能力上的優勢, 實現交互聯動、交叉融合、強強聯合, 發展大數據環境下隨機退化設備剩余壽命預測新理論與新方法, 有望為大數據時代設備剩余壽命預測與健康管理打造一把利器. 然而, 現有為數不多的綜合機器學習方法和統計數據驅動方法的剩余壽命預測研究中, 基于監測數據的退化特征提取過程與所提取特征的隨機過程建模是孤立進行的, 由此導致機器學習方法和統計數據驅動方法實際上是簡單的組合關系. 此外, 這些研究中提取退化特征的過程中主要關注了特征本身的特性(如單調性、趨勢性等), 但如此提取的特征能否適應并匹配所采用的隨機過程模型并不能保證. 因此, 發展大數據下退化特征提取與隨機退化建模交互聯動的剩余壽命預測方法, 將有助于形成大數據下剩余壽命預測研究的新模式.
了解更多信息請關注:人工智能技術與咨詢
審核編輯 黃昊宇
-
數據驅動
+關注
關注
0文章
128瀏覽量
12365 -
大數據
+關注
關注
64文章
8902瀏覽量
137601
發布評論請先 登錄
相關推薦
評論