通過改進自動編碼器提升數(shù)據(jù)不足條件下的變壓器故障診斷精度
變壓器發(fā)生故障的情況較少,使得基于機器學習的變壓器故障診斷方法存在數(shù)據(jù)不足的問題。為此,智能電網(wǎng)教育部重點實驗室(天津大學)、瑞典皇家理工學院電氣工程與計算機科學學院、國網(wǎng)冀北電力有限公司檢修分公司的研究人員葛磊蛟、廖文龍、王煜森、宋麗可,在2021年《電工技術學報》增刊1上撰文,提出一種基于改進自動編碼器(IAE)的變壓器故障數(shù)據(jù)增強方法。
首先,針對傳統(tǒng)自動編碼器生成的數(shù)據(jù)有限和缺乏多樣性的問題,提出改進的變壓器故障數(shù)據(jù)生成策略。其次,考慮到傳統(tǒng)卷積神經(jīng)網(wǎng)絡的池化操作會丟失大量特征信息,構(gòu)建改進的卷積神經(jīng)網(wǎng)絡(ICNN)作為故障診斷的分類器。最后,通過實際數(shù)據(jù)驗證了所提方法的有效性和適應性。仿真結(jié)果表明,相對于隨機過采樣算法、合成少數(shù)類過采樣技術及自動編碼器等傳統(tǒng)的數(shù)據(jù)增強方法,IAE能同時兼顧數(shù)據(jù)的分布和多樣性特征,生成的變壓器故障數(shù)據(jù)對分類器的性能提升效果最好。和傳統(tǒng)分類器相比,ICNN在數(shù)據(jù)增強前、后都具有更高的故障診斷精度。
變壓器是一種利用電磁感應原理來實現(xiàn)電壓變換的裝置,它在輸電側(cè)和配電側(cè)都起著至關重要的作用。一旦變壓器發(fā)生故障,會嚴重影響電力系統(tǒng)的正常運行,造成負荷大面積失電等嚴重事故,并帶來一定的經(jīng)濟損失。因此,開展變壓器故障診斷研究具有重要的理論意義和工程實際應用價值。
目前,大部分的大型電力變壓器屬于油浸式變壓器,變壓器油中的溶解氣體含量是故障診斷的重要依據(jù)?;诜治鋈芙鈿怏w含量發(fā)展而來的傳統(tǒng)故障診斷方法主要包括三比值法、支持向量機(Support Vector Machine, SVM)法、貝葉斯網(wǎng)絡法、多層感知機(Multi-Layer Perceptron, MLP)法及輕梯度提升機(Light Gradient Boosting Machine, LightGBM)法等。這些傳統(tǒng)方法的原理簡單、對于數(shù)據(jù)量要求比較小,但它們存在共性的問題,即特征能力不足,故障診斷的精度有限。
近年來,深度學習技術在自然語言處理、計算機視覺和視頻分析等多個領域都取得了優(yōu)異的成績,這為提升變壓器故障診斷精度帶來了新的契機?;谏疃葘W習技術的變壓器故障診斷方法主要包括卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network, CNN)法和深度信念網(wǎng)絡法,它們不僅具有強大的特征提取能力,還能映射溶解氣體和故障類型之間復雜的非線性關系,相較于傳統(tǒng)方法具有更高的診斷精度。
訓練集中包含充足且分布均勻的故障樣本,是保障深度神經(jīng)網(wǎng)絡具有較強泛化能力的關鍵條件。然而,變壓器發(fā)生各類故障的頻率差異較大,可能存在信息記錄不全或者數(shù)據(jù)缺失等問題,導致難以滿足深度神經(jīng)網(wǎng)絡對于故障樣本數(shù)據(jù)量的要求。因此,如何在數(shù)據(jù)不足的條件下對變壓器故障數(shù)據(jù)進行增強是亟待解決的問題。
一些專家學者已經(jīng)對此展開了初步的研究,有學者分別利用隨機過采樣(Randdom Over-Sampling, ROS)算法和合成少數(shù)類過采樣技術(Synthetic Minority Over-sampling Technique, SMOTE)讓每個正樣本和附近的多個樣本隨機結(jié)合,極大地增加了原有樣本的個數(shù),但無法兼顧故障數(shù)據(jù)的整體分布特征和多樣性的問題。
為了解決這些問題,有學者構(gòu)建了條件生成對抗網(wǎng)絡(Conditional Generative Adversarial Network, CGAN),以服從高斯分布的隨機噪聲作為生成器的輸入,產(chǎn)生指定類型的變壓器故障樣本數(shù)據(jù),在一定程度上提升了故障診斷的性能,但存在訓練過程不穩(wěn)定,容易出現(xiàn)梯度消失及調(diào)參難度大等問題。
作為備受歡迎的新型深度生成模型,自動編碼器(Auto-Encoder, AE)是一種利用輸出向量來重構(gòu)輸入特征的前饋神經(jīng)網(wǎng)絡。目前,AE在機器翻譯、數(shù)據(jù)降維、表征學習及圖像修復等領域具有較好的應用效果,但在變壓器故障數(shù)據(jù)增強中的應用仍處于初級階段。理論上,AE可以利用具有強大學習能力的編碼器有效地提取溶解氣體的潛在特征,并通過解碼器反向重構(gòu)溶解氣體數(shù)據(jù),更可為變壓器故障診斷提供數(shù)據(jù)保障。
然而,已有的自動編碼器的變體,如變分自動編碼器,雖然可以應用于數(shù)據(jù)生成,但它需要將海量的故障樣本用于訓練模型,這有違數(shù)據(jù)不足的先決條件。相對而言,傳統(tǒng)AE對數(shù)據(jù)量的要求不高,但它生成的數(shù)據(jù)和輸入數(shù)據(jù)高度相似,不僅缺少多樣性,而且生成的樣本個數(shù)有限。如何根據(jù)變壓器的溶解氣體特征,設計一種能夠兼顧變壓器故障數(shù)據(jù)多樣性和樣本個數(shù)的自動編碼器結(jié)構(gòu),有待進一步的研究。
針對上述的問題,智能電網(wǎng)教育部重點實驗室(天津大學)等單位的科研人員在數(shù)據(jù)不足條件下提出了一種基于改進自動編碼器的變壓器故障數(shù)據(jù)增強方法。
圖1 所提方法的計算流程
首先,在分析傳統(tǒng)AE的基礎上,提出了IAE用于變壓器故障數(shù)據(jù)的增強。其次,針對傳統(tǒng)CNN的池化操作會丟失大量特征信息的問題,構(gòu)建了ICNN作為變壓器故障診斷的分類器。再次,以溶解氣體數(shù)據(jù)作為模型的輸入特征,并對變壓器狀態(tài)進行編碼,提出了相關的指標用于評估模型的性能。最后,通過實際數(shù)據(jù)進行仿真得出以下結(jié)論:
1)IAE的訓練過程平穩(wěn)、收斂速度快,可以很好地擬合原始數(shù)據(jù)的分布,并生成和原始數(shù)據(jù)特征相似的數(shù)據(jù)。相對于ROS、SMOTE和AE等傳統(tǒng)的數(shù)據(jù)增強方法,IAE在考慮數(shù)據(jù)分布的同時還能兼顧數(shù)據(jù)的多樣性,生成的變壓器故障數(shù)據(jù)對分類器的精度提升效果最好。
2)和MLP、SVM、LightGBM以及CNN等分類器相比,ICNN在數(shù)據(jù)增強前、后都具有更高的故障診斷精度。CNN的池化操作會讓其損失部分特征信息,限制了模型的診斷精度。ICNN通過調(diào)節(jié)卷積核尺寸來替代傳統(tǒng)CNN的池化層可以提升診斷性能。
3)相對于原始訓練樣本,經(jīng)過IAE進行數(shù)據(jù)增強后,MLP、SVM、LightGBM、CNN和ICNN等分類器的診斷精度都有著不同程度的提升,說明利用IAE來生成變壓器故障樣本數(shù)據(jù)不受限于某個分類器,具有一定的適應性。
在本項目中,科研人員對深度學習技術在變壓器故障數(shù)據(jù)增強中的應用進行了初步的研究。后續(xù)收集到更多的變壓器故障樣本數(shù)據(jù),可以進一步探究當訓練集樣本個數(shù)是否越多,IAE產(chǎn)生的數(shù)據(jù)對于分類器性能提升效果越好。
以上研究成果發(fā)表在2021年《電工技術學報》增刊1,論文標題為“數(shù)據(jù)不足條件下基于改進自動編碼器的變壓器故障數(shù)據(jù)增強方法”,作者為葛磊蛟、廖文龍 等。
了解更多關于編碼器知識,請關注西安德伍拓自動化傳動系統(tǒng)有限公司網(wǎng)站。公司專業(yè)技術團隊為您免費提供
旋轉(zhuǎn)編碼器的選型、安裝、調(diào)試、保養(yǎng)等技術指導服務,盡量避免企業(yè)因為編碼器技術人員的短缺帶來的損失,采取“線上+線下”服務的服務形式,幫助企業(yè)解決技術難題。