期刊VIP學術指導 符合學術規范和道德
保障品質 保證專業,沒有后顧之憂
摘 要:預測性維護是工業互聯網應用的重點,實現預測性維護的關鍵是對設備系統或核心部件的壽命進行有效預測。隨著近年來機器學習的發展,機械設備海量數據已成為工業互聯網分析核心部件剩余壽命的關鍵指標,也成為設備健康管理決策性數據?;诠こ虣C械設備大數據,結合XGBoost、隨機森林、LightGBM等多種機器學習模型,多維度探究影響機械核心部件壽命的機器學習模型效果,建立Stacking算法模型融合的部件壽命預測模型,并在核心部件數據上驗證模型預測有效性,從而減少設備非計劃停機時間,推進智能制造和預測性維護的進步。
關鍵詞:工程機械;壽命預測;機器學習;Stacking
《軟件工程師》為中國軟件行業協會會刊,被中國期刊全文數據庫、中國知網、龍源期刊網、萬方數字——數據期刊群以及中國核心期刊(遴選)數據庫等全文收錄。
1 引言(Introduction)
在工業4.0的環境下,工程機械設備自動化發展高速,設備部件在傳統機械行業運行通信環境惡劣,為工程機械設備監控管理帶來了新的挑戰。設備部件長期運行,零部件壽命減少,可靠性降低將大大影響工程設備使用,甚至威脅人類生命財產安全。那么及時維護更換工程設備核心部件成為設備健康管理的關鍵。壽命預測是工程機械設備安全運行的重要基礎[1]。早期部件壽命研究指的是基于理論物理學和統計學,計算部件壽命,探索其電壓、電流、轉速、工作時長、溫度等數據挖掘出指標之間的規律[2]。統計學模型則選擇合適的壽命分布模型,建立統計學可靠性高的概率性公式研究零部件特征分布,如正態分布、指數分布等[3]。物理學壽命預測模型則是根據零部件運行過程物理感應失效模型,損傷力學,能量等方法對零部件失效類型進行了定義分析,對各類零部件退化機能對應物理模型定義,均偏重理論研究[4,5]。目前已經廣泛運用在汽車零部件等制造業中,但是在工程機械使用過程中,存在著數據非線性、不等長、維度多等波動,眾多參數甚至是傳感器無法及時傳播的,導致理論壽命計算出現較大誤差。
本文運用大數據分析機器學習的方法評估零部件運行中晚期健康狀態,數據挖掘分析核心部件電動機在相同情況下歷史數據,探究影響機械核心部件壽命指標關聯關系,如電流電壓、振動、噪聲、轉速、溫度等,結合機器學習K-means聚類分析、線性回歸算法、隨機森林、LightGBM和XGBoost等方法,構建與壽命相關的高質量特征Stacking集成算法預測模型,可預先知曉設備零部件結果,及時檢測更換,有利于在機械設備使用中期發現設備零部件異常狀態,增強零部件健康質量把控。
2 工程機械核心部件壽命預測數據處理(Processing of life prediction data for core components of construction machinery)
中期壽命預測是工程設備監控管理的重要內容,主要針對機械設備運行過程中出現的狀態把控,防止運行過程中發生意外[6]。很多設備零部件在未充分使用到設計壽命規定年限時,就已經損耗嚴重需要報廢。如果不能及時發現,將會造成很大的影響,設備不合理使用也將會造成極大的浪費[7]。通常在實際使用環境中預測存在較大偏差。因為現實采集到的數據數量龐大,復雜多變,基礎數據質量差,能都對大量數據探索性分析研究,從中挖掘出與壽命相關隱藏的信息非常重要。
針對工程機械設備耗損性部件電動機,獲取到數據集包含訓練集和測試集兩部分。訓練集中涵蓋電動機全壽命物聯網采樣數據,即從安裝后一直到更換之間的對應數據,形式為多維時間序列[8]。字段“部件工作時長”的最大值,即為該部件實例的實際壽命。測試集中包含部件一段時間內的電動機物聯網采樣數據,基于該段數據,預測電動機此后的剩余壽命。數據集中樣本EDA后特征數據字段如表1所示。
數據標準化(歸一化)處理,將消除指標之間的量綱影響,解決數據指標之間的可比性,使各指標處于同一數量級,適合進行綜合對比評價[9]。采用Min-Max Normalization如公式(1),對數據進行歸一化構造量化[0,1]區間,特征縮放后梯度下降過程會更加筆直,收斂可以得到更快的提升,得到數據歸一化處理結果如表2所示。
3 工程機械核心部件壽命預測模型構造(Construction of life prediction model for core components of construction machinery)
3.1 K-Means聚類
使用K-Means聚類無須進行模型的訓練,無監督學習效率高,處理大數據集,算法保持可伸縮性和高效性當簇接近高斯分布時,效果較好[10]。本文利用優秀的特征進行聚類,使用最小距離分類器MDC進行測試獲得最佳K均值聚類k值為5,結果得分如表所示。
3.2 Stacking模型融合
Stacking堆疊(元組合)是指組合多個預測模型信息生成新模型的一種模型組合技術。堆疊模型(也稱為二級模型),可以組合每個基本模型優秀的能力,忽略其他模型缺點,組合起來將優于單個模型[11]。因此,當基本模型模擬效果不同各有優缺點時,選擇模型堆疊是最有效地。本研究選擇了八個單模型進行預測,有Lasso回歸、ElasticNet彈性網絡、核嶺回歸Kernel Ridge Regression、決策樹DecisionTree、隨機森林RandomForest、GBDT、XGBoost、LightGBM。
各個模型預測效果精度得分如表4和圖1所示,可以觀察到決策樹、XGBoost和LightGBM模型效果較好平均精度得分可以達到0.03左右,三種模型入選第二層學習器,為了防止過擬合現象發生,將隨機森林模型也加入第二層學習器中。
使用Stacking(堆疊)模型對多個單一模型進行組合。以初級訓練集八種模型訓練出初級訓練器,生成一個新數據集訓練刺激第二層學習器,結合四個LR頂層模型進行次級訓練[12],多模型融合過程如圖2所示。
n=8個初級學習器,對初級學習器Mn,利用測試集數據D進行訓練,將訓練完成的Mn預測訓練集D和測試集T的標簽列,得到結果為Pn和Tn[13]。隨后將n個學習模型結果合并,得到次級學習器的訓練集和測試集。利用訓練次級學習器,并預測得到最終的預測結果。
3.3 模型融合交叉驗證
交叉驗證指的是通過估計模型的泛化誤差,選擇模型的方法。優點在于不做任何假定前提,具有應用的普遍性,操作簡便,是一種行之有效地模型選擇方法[14]。通過將數據集均分成K個子集,并依次將其中的K-1個子集作為訓練集,剩下的1個子集用作測試集。在K折交叉驗證的過程中,每個子集均會被驗證一次。本研究使用四折交叉驗證方法構造,穩健性強,交叉驗證過程如圖3所示,對每一折進行預測,采用兩層循環,第一層循環控制基模型的數目,第二層循環控制交叉驗證四次,則對每一個基模型會訓練四次,最后求均方根拼接得到預測結果。
4 模型預測結果(Model prediction results)
使用Stacking模型融合方法對所有測試集進行預測,使用時間為四天以內的電動機生命周期在8000—12000天,預測壽命和實際壽命相對均方根誤差在0.1以內。使用時間為30天以內的電動機生命周期在2000—6000天,預測壽命和實際壽命相對均方根誤差在0.4以內。使用1600天以內的電動機生命周期在4000天以內,相對預測壽命和實際壽命相對均方根誤差在0.75以內。由此可見,基于Stacking算法的工程機械核心部件壽命預測模型預測效果良好。
5 結論(Conclusion)
本文將大數據分析機器學習的方法運用到工程機械自動化領域,提出了一種基于Stacking模型融合的工程機械核心部件壽命預測算法。從原始電動機傳感數據入手,經過數據準備和預處理,K-means聚類生成訓練樣本,選擇Lasso回歸、ElasticNet彈性網絡、核嶺回歸Kernel Ridge Regression、決策樹DecisionTree、隨機森林RandomForest、GBDT、XGBoost、LightGBM。八種子模型作為Stacking模型融合的基分類器,隨機森林、GBDT、XGBoost和LightGBM作為Stacking模型融合的次級分類器進行識別,最終證明本算法具有良好的壽命預測效果,均方根誤差小,精度高。有助于改變機械自動化領域傳統被動的維修模式,轉向預測維修自動化方面,從而降低核心部件使用風險,提高設備使用效能。
參考文獻(References)
[1] Sbarufatti,M. Corbetta,A.Manes,et al.Monte-Carlo sampling based on a committee of artificial neural networks for posterior state estimation and residual lifetime prediction[J].International Journal of Fatigue,2016:35-38.
[2] Xiang Wan,Dong Wang,Peter W.Tse,et al.A critical study of different dimensionality reduction methods for gear crack degradation assessment under different operating conditions[J]. Measurement,2016(02):22-24.
[3] 杜黨波,司小勝,胡昌華,等.基于隨機退化建模的共載系統壽命預測方法[J].儀器儀表學報,2018(08):61-62.
[4] 牛乾.機械旋轉部件的性能退化及其壽命預測方法研究[D].浙江大學,2018:6-8.
[5] 封楊,黃筱調,陳捷,等.基于小樣本試驗的大型回轉支承剩余壽命預測[J].中南大學學報(自然科學版),2015(09):12-13.
[6] 尤明懿.基于狀態監測數據的產品壽命預測與預測維護規劃方法研究[D].上海交通大學,2012:43-46.
[7] ChunLin Zhang,Bing Li,BinQiang Chen,et al.Weak fault signature extraction of rotating machinery using flexible analytic wavelet transform[J].Mechanical Systems and Signal Processing,2015(06):89-90.
[8] 周志華.機器學習[M].北京:清華大學出版社,2016:67-69.
[9] Audi Ahmad,Pierrot-Deseilligny Marc,Meynard Christophe,et al. Implementation of an IMU Aided Image Stacking Algorithm in a Digital Camera for Unmanned Aerial Vehicles.[J].Sensors (Basel, Switzerland),2017(7):11-13.
[10] Truong Giang Nguyen,Muller Jean-Micha?l,Rupnik Ewelina,et al.Second Iteration of Photogrammetric Processing to Refine Image Orientation with Improved Tie-Points[J].Sensors (Basel, Switzerland),2018(7):21-22.
[11] YiJun Chen,Man-Leung Wong,Haibing Li.Applying Ant Colony Optimization to configuring stacking ensembles for data mining[J].Expert Systems With Applications,2014(6):46-47.
[12] 沈長青.旋轉機械設備關鍵部件故障診斷與預測方法研究[D].中國科學技術大學,2014:67-68.
[13] 肖婷,湯寶平,秦毅,等.基于流形學習和最小二乘支持向量機的滾動軸承退化趨勢預測[J].振動與沖擊,2015(09):11-13.
[14] 孫闖,何正嘉,張周鎖,等.基于狀態信息的航空發動機運行可靠性評估[J].機械工程學報,2013(06):90-92.