版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
風(fēng)電機(jī)組風(fēng)速-功率異常運(yùn)行數(shù)據(jù)特征及清洗方法沈小軍;付雪姣;周沖成;王偉【摘要】風(fēng)功率曲線是考核風(fēng)電機(jī)組發(fā)電性能的重要指標(biāo),對風(fēng)電場的運(yùn)行管理和電力系統(tǒng)的運(yùn)行調(diào)度都具有重要意義.實(shí)際運(yùn)行過程的設(shè)備故障及人為控制因素會導(dǎo)致風(fēng)速-功率曲線中存在大量的異常數(shù)據(jù),給風(fēng)功率曲線的后續(xù)應(yīng)用帶來嚴(yán)重影響.本文在分析風(fēng)電機(jī)組風(fēng)速-功率異常運(yùn)行數(shù)據(jù)特征的基礎(chǔ)上,根據(jù)空間分布位置和形態(tài)將異常數(shù)據(jù)分為曲線底部、中部、上部堆積型異常數(shù)據(jù)和曲線周圍分散型異常數(shù)據(jù)等四類,提出了基于變點(diǎn)分組法與四分位法組合的異常數(shù)據(jù)識別清洗方法及流程,與四分位-變點(diǎn)分組法以及局部離群因子算法的對比算例驗(yàn)證結(jié)果表明,提出的交點(diǎn)分組-四分位法可有效識別四種類型的異常數(shù)據(jù),流程合理,清洗效果好,效率高,并具有較強(qiáng)的通用性.期刊名稱】《電工技術(shù)學(xué)報》年(卷),期】2018(033)014【總頁數(shù)】9頁(P3353-3361)【關(guān)鍵詞】風(fēng)電機(jī)組;風(fēng)功率曲線;異常數(shù)據(jù);數(shù)據(jù)清洗【作者】沈小軍;付雪姣;周沖成;王偉【作者單位】同濟(jì)大學(xué)電氣工程系上海200092;同濟(jì)大學(xué)電氣工程系上海200092;同濟(jì)大學(xué)電氣工程系上海200092;全球能源互聯(lián)網(wǎng)研究院北京102209【正文語種】中文中圖分類】TP274風(fēng)能是一種清潔、可再生的能源,正迅速成為可持續(xù)發(fā)展和能源戰(zhàn)略的重要組成部分[1,2]。但是風(fēng)力發(fā)電過程中隨機(jī)變化的風(fēng)速風(fēng)向使得風(fēng)電功率具有波動性、間歇性和隨機(jī)性等特征,對電力系統(tǒng)運(yùn)行的穩(wěn)定性和可靠性造成不利影響[3-5]。消除這些不利影響的一種重要手段就是通過風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)的挖掘提高風(fēng)力發(fā)電的可預(yù)見性。通過實(shí)測風(fēng)速和功率得到的風(fēng)功率曲線可用于評估風(fēng)電機(jī)組的性能和運(yùn)行狀況,對判斷風(fēng)機(jī)故障有重要價值,同時時序功率數(shù)據(jù)也是研究風(fēng)電功率預(yù)測以及評估風(fēng)功率對電網(wǎng)影響的基礎(chǔ)[6]。因此,準(zhǔn)確獲得風(fēng)電機(jī)組實(shí)際運(yùn)行的風(fēng)速和功率數(shù)據(jù),能夠?yàn)轱L(fēng)電場的經(jīng)濟(jì)安全運(yùn)行和優(yōu)化控制策略提供根本的數(shù)據(jù)支撐。但是在風(fēng)電場運(yùn)行過程中,由于機(jī)組停機(jī)、減載、通信噪聲和設(shè)備故障等因素,會產(chǎn)生大量異常數(shù)據(jù)。目前風(fēng)電機(jī)組運(yùn)行數(shù)據(jù)的收集、管理、分析和挖掘方法仍存在諸多不足,不能準(zhǔn)確辨識所采集數(shù)據(jù)的質(zhì)量差異,進(jìn)而有效支撐粗糙數(shù)據(jù)的正確篩選和合理化優(yōu)化,造成數(shù)據(jù)質(zhì)量得不到保障[7]。如果這些數(shù)據(jù)不經(jīng)處理直接使用,得到的風(fēng)力發(fā)電統(tǒng)計特性發(fā)生畸變,會影響風(fēng)電機(jī)組的運(yùn)行狀態(tài)和運(yùn)行特性的分析結(jié)果。為了提高數(shù)據(jù)質(zhì)量,數(shù)據(jù)清洗已成為數(shù)據(jù)挖掘過程中不可或缺的環(huán)節(jié)[8]。風(fēng)電機(jī)組異常運(yùn)行數(shù)據(jù)的識別與清洗是當(dāng)前的研究熱點(diǎn),已開展大量工作并取得了諸多研究成果,其中風(fēng)電機(jī)組風(fēng)功率曲線數(shù)據(jù)清洗的代表性成果有:文獻(xiàn)[9]采用的四分位法是一種常用的異常數(shù)據(jù)識別方法,但是當(dāng)異常數(shù)據(jù)所占的比重較大時,四分位法識別異常數(shù)據(jù)的效果變差;文獻(xiàn)[10]采用四分位法與k-means聯(lián)合算法剔除異常數(shù)據(jù),但由于k-means算法屬于分類算法,可能會導(dǎo)致正常數(shù)據(jù)的誤刪,且k值的確定比較復(fù)雜,對數(shù)據(jù)處理結(jié)果影響較大;文獻(xiàn)[11]采用組內(nèi)最優(yōu)方差算法實(shí)現(xiàn)了功率曲線下方的堆積型異常數(shù)據(jù)的有效識別效果,但該算法將每個風(fēng)速區(qū)間內(nèi)最大的功率默認(rèn)為風(fēng)機(jī)滿發(fā)功率,無法識別功率曲線上方的異常數(shù)據(jù);文獻(xiàn)[12]通過建立風(fēng)功率曲線的非線性模型實(shí)現(xiàn)異常數(shù)據(jù)的識別,該方法需要大量的正常數(shù)據(jù)作為樣本,否則訓(xùn)練誤差會較大,另外數(shù)據(jù)處理速度較慢;文獻(xiàn)[13]在假設(shè)風(fēng)功率的概率密度函數(shù)服從正態(tài)分布的基礎(chǔ)上,提出了基于3s法則的異常數(shù)據(jù)清洗方法,與實(shí)際風(fēng)電運(yùn)行數(shù)據(jù)中由于堆積型異常數(shù)據(jù)的存在風(fēng)功率的概率密度函數(shù)往往呈雙峰或多峰分布不符,其普適性及異常數(shù)據(jù)識別效果不好;文獻(xiàn)[14,15]采用基于密度的局部離群因子(LocalOutlierFactor,LOF)算法,把具有足夠高密度的區(qū)域劃分為簇,實(shí)現(xiàn)了分散型異常數(shù)據(jù)的有效識別,但不能有效識別密度較高的堆積型異常數(shù)據(jù)。綜上所述,當(dāng)前風(fēng)電機(jī)組風(fēng)速-功率運(yùn)行數(shù)據(jù)清洗方法從原理上可分為三類:第一類方法是根據(jù)數(shù)據(jù)點(diǎn)的密度或距離來判斷該點(diǎn)是否為異常點(diǎn),但該類方法對分布密集的堆積型異常數(shù)據(jù)識別效果有限;第二類方法是建立風(fēng)功率曲線的數(shù)學(xué)模型,但此類方法需要大量正常數(shù)據(jù)作為樣本,且普適性較差;第三類方法是根據(jù)異常數(shù)據(jù)的位置分布特征識別異常數(shù)據(jù),該類方法的依據(jù)是異常數(shù)據(jù)點(diǎn)位于風(fēng)功率曲線正常出力特性范圍之外,理論上可實(shí)現(xiàn)多類型異常數(shù)據(jù)的清洗,而且不需要數(shù)據(jù)樣本訓(xùn)練,通用性強(qiáng),后續(xù)應(yīng)用值得期待,但現(xiàn)有研究成果對大量堆積型異常數(shù)據(jù)的識別與清洗效果有待提高。另外,全面研究分析風(fēng)速-功率曲線異常數(shù)據(jù)的空間分布位置和形態(tài)對改進(jìn)該類方法識別清洗效果具有實(shí)際的指導(dǎo)意義,相關(guān)研究開展得尚不系統(tǒng)。鑒于此,本文首先分析了風(fēng)電機(jī)組風(fēng)速-功率異常數(shù)據(jù)的分布特征及分類,然后根據(jù)異常數(shù)據(jù)分布特征提出一種基于變點(diǎn)分組與四分位法的聯(lián)合數(shù)據(jù)清洗算法和流程,最后從提出算法的有效性、流程的合理性及清洗效率等維度進(jìn)行了分析驗(yàn)證。風(fēng)功率曲線是描述風(fēng)速與機(jī)組輸出功率之間的關(guān)系曲線。它不僅是設(shè)計風(fēng)電機(jī)組控制系統(tǒng)的重要依據(jù),還是考核風(fēng)電機(jī)組發(fā)電性能和風(fēng)電場運(yùn)行狀況的重要指標(biāo)[10]從風(fēng)電場采集到的數(shù)據(jù)中通常包含大量異常數(shù)據(jù)點(diǎn)。導(dǎo)致數(shù)據(jù)異常的原因有很多,包括計劃外停機(jī)、棄風(fēng)限電、風(fēng)速傳感器失靈、通信設(shè)備故障、電磁干擾、風(fēng)機(jī)脫網(wǎng)、極端天氣情況、風(fēng)機(jī)葉片污垢或受損等因素。不同原因產(chǎn)生的異常數(shù)據(jù),在風(fēng)功率曲線上的分布特征也不相同。按照數(shù)據(jù)點(diǎn)在風(fēng)功率曲線上的分布特征,異常數(shù)據(jù)可分為四類,包括曲線底部、中部、上部堆積型異常數(shù)據(jù)和曲線周圍分散型異常數(shù)據(jù)。各類異常數(shù)據(jù)的分布如圖1所示。(1)曲線底部堆積型異常數(shù)據(jù)。曲線底部堆積型異常數(shù)據(jù)在風(fēng)功率曲線中表現(xiàn)為一條橫向密集數(shù)據(jù)帶。此類異常數(shù)據(jù)產(chǎn)生的原因包括機(jī)組故障、通信設(shè)備或測量終端故障、計劃外停機(jī)檢修等情況。在這些情況下,風(fēng)力發(fā)電機(jī)組的理論輸出功率均為零。若風(fēng)機(jī)葉片不轉(zhuǎn)動,而風(fēng)機(jī)的測控系統(tǒng)需要電力驅(qū)動,則數(shù)據(jù)中也可能出現(xiàn)風(fēng)電功率為負(fù)值的情況[14]。因此,曲線底部異常數(shù)據(jù)會在功率零值附近波動,表現(xiàn)為數(shù)據(jù)堆積。(2)曲線中部堆積型異常數(shù)據(jù)。曲線中部堆積型異常數(shù)據(jù)在風(fēng)功率曲線中表現(xiàn)為一條或多條位于概率功率曲線下界之外的橫向密集數(shù)據(jù)帶。此類異常數(shù)據(jù)產(chǎn)生的原因是棄風(fēng)限電或通信故障。棄風(fēng)限電是指限制風(fēng)電機(jī)組的輸出功率,使其低于正常出力的控制措施。在風(fēng)電場的實(shí)際運(yùn)行過程中,由于目前電力系統(tǒng)的調(diào)峰調(diào)頻能力和輸電能力不足,強(qiáng)制棄風(fēng)已成為常態(tài)[16],這就使得原始記錄數(shù)據(jù)中會存在大量的異常數(shù)據(jù)。在實(shí)際運(yùn)行中,由于許多數(shù)據(jù)集沒有記錄棄風(fēng)措施的信息,因此本文將棄風(fēng)限電作為異常數(shù)據(jù)的來源之一。在這種情況下,風(fēng)速數(shù)據(jù)記錄的是實(shí)際變化情況,而風(fēng)電機(jī)組的輸出功率長期維持在一個較低的水平保持不變,即使風(fēng)速超過額定風(fēng)速,輸出功率也長期低于滿發(fā)狀態(tài),限定在某一個值。因此,曲線中部異常數(shù)據(jù)會在較大風(fēng)速范圍內(nèi)維持在低于滿發(fā)的狀態(tài)保持不變,表現(xiàn)為數(shù)據(jù)堆積。(3)曲線上部堆積型異常數(shù)據(jù)。曲線上部堆積型異常數(shù)據(jù)在風(fēng)功率曲線中表現(xiàn)為一條或多條位于概率功率曲線上界之外的橫向密集數(shù)據(jù)帶。此類異常數(shù)據(jù)產(chǎn)生的原因通常是通信錯誤[17]或風(fēng)速傳感器失靈。風(fēng)速傳感器是監(jiān)測風(fēng)速的重要儀表,安裝在發(fā)電機(jī)組機(jī)艙尾部,難以時常清洗和維護(hù),常出現(xiàn)故障或卡滯現(xiàn)象,導(dǎo)致測量的風(fēng)速數(shù)據(jù)不符合實(shí)際情況。曲線上部堆積型異常數(shù)據(jù)會在低風(fēng)速調(diào)度時段內(nèi)保持功率不變,表現(xiàn)為數(shù)據(jù)堆積。曲線周圍分散型異常數(shù)據(jù)。曲線周圍分散型異常數(shù)據(jù)在風(fēng)功率曲線中表現(xiàn)為功率曲線附近密度較低的無規(guī)律散點(diǎn)。此類異常數(shù)據(jù)是由信號傳播噪聲、傳感器失靈、極端天氣情況等隨機(jī)影響因素造成的。隨機(jī)因素造成的異常數(shù)據(jù)會在正常值附近隨機(jī)波動,波動程度的大小也是隨機(jī)的。因此,曲線周圍分散型異常數(shù)據(jù)會在概率功率曲線邊界之外隨機(jī)分散分布。根據(jù)上述四類異常數(shù)據(jù)的分布特征和產(chǎn)生原因可知,堆積型異常數(shù)據(jù)通常是由于無法瞬時恢復(fù)的故障或異常狀態(tài)產(chǎn)生的,例如,通信設(shè)備故障、計劃外的停機(jī)檢修、強(qiáng)制棄風(fēng)和風(fēng)機(jī)葉片損壞等。由于這些故障或異常狀態(tài)難以在短時間內(nèi)恢復(fù),因此該類異常數(shù)據(jù)在集中的一段時間內(nèi)連續(xù)產(chǎn)生,具有量多且分布集中的特征。分散型異常數(shù)據(jù)則一般是由可短時間內(nèi)恢復(fù)的故障或異常狀態(tài)造成的,如通信噪聲或極端天氣狀況等。這些因素是隨機(jī)產(chǎn)生且變化的,因此該類異常數(shù)據(jù)具有隨機(jī)性和不確定性,表現(xiàn)為分散分布的形態(tài)。變點(diǎn)(change-point)問題最早在工業(yè)質(zhì)量控制中發(fā)揮了巨大的作用,經(jīng)過幾十年的發(fā)展,變點(diǎn)分析在醫(yī)學(xué)研究、地理科學(xué)、信號過程和經(jīng)濟(jì)金融等領(lǐng)域都有十分廣泛的應(yīng)用[18,19]。變點(diǎn)是指在一個序列或過程中的某個或某些量突然變化的點(diǎn),這種突然變化往往反映數(shù)據(jù)的某種質(zhì)的變化[20]。在數(shù)理統(tǒng)計中,堆積型異常數(shù)據(jù)的分布特征是數(shù)據(jù)量多且分布集中,受異常數(shù)據(jù)的影響,序列的均值、方差或變化率等統(tǒng)計特性均會發(fā)生變化[21]。因此,采用變點(diǎn)分析對風(fēng)功率曲線中的異常數(shù)據(jù)進(jìn)行清洗具有理論可行性。變點(diǎn)問題根據(jù)變點(diǎn)處的變化形式主要分為突變和漸變問題,根據(jù)分布的均值和方差等主要數(shù)字特征的變化,分為位置參數(shù)和刻度參數(shù)變點(diǎn)問題。在研究數(shù)據(jù)清洗問題時,研究的是風(fēng)功率序列中數(shù)據(jù)特征突變的位置參數(shù)。通過研究發(fā)現(xiàn),如果一個風(fēng)速區(qū)間內(nèi)存在堆積型異常數(shù)據(jù),功率序列的變化率、均值、方差以及方差的變化率等數(shù)據(jù)的特征都會發(fā)生突變。以方差的變化率作為變點(diǎn)分組依據(jù)時,數(shù)據(jù)清洗效果最好,數(shù)據(jù)損失量最少,因此本文采用方差變化率的變點(diǎn)作為分組依據(jù)?;诜讲钭兓实淖凕c(diǎn)分組法具體如下:記某一風(fēng)速區(qū)間內(nèi)的數(shù)據(jù)樣本集合為式中,Vi和pi分別表示第i個數(shù)據(jù)樣本的風(fēng)速和功率,且數(shù)據(jù)按照功率值降序排列,即令。求出各點(diǎn)方差為式中,si為第i個點(diǎn)的方差;pj為第j個點(diǎn)的功率值;為第1~i個點(diǎn)的功率的平均值。這樣si可以衡量pi與該點(diǎn)之前所有數(shù)據(jù)的離散程度。得到各點(diǎn)的方差后,通過方差的變化率k(i)來觀察方差變化是否明顯。令對風(fēng)機(jī)功率的方差變化率進(jìn)行變點(diǎn)識別,可以從統(tǒng)計學(xué)的角度得到功率值明顯變化的位置。變點(diǎn)檢測的方法經(jīng)過幾十年的發(fā)展不斷完善,包括Bayes方法、最小二乘法、極大似然法、局部比較法和小波分析法等。最小二乘法是處理變點(diǎn)問題時使用較多的一種方法,以觀察值與理論值之差的二次方和作為目標(biāo)函數(shù),以其達(dá)到極小值之點(diǎn)的時刻或位置作為有關(guān)參數(shù)的估計[22],其優(yōu)點(diǎn)是對隨機(jī)誤差的分布不需要作特定的假設(shè)。此處采用最小二乘法對方差變化率k(i)進(jìn)行變點(diǎn)識別。設(shè)有自變量x1,...,xr和因變量k均為變量i的函數(shù),記為xq(i),q=1,...,r和k(i)。xq(i)是i的完全已知非隨機(jī)函數(shù),k(i)為隨機(jī)變量,分為前后兩段,兩段各服從一線性模型,回歸系數(shù)在i=j處發(fā)生突變,即式中,系數(shù)列向量和不相等,則j為回歸變點(diǎn)。由于k(i)是連續(xù)的,因此有約束條件根據(jù)最小二乘法的原理,此數(shù)據(jù)樣本模型的加權(quán)目標(biāo)函數(shù)為式中,各項的權(quán)wi與樣本k(i)的誤差方差成反比。求在約束式(5)之下式(6)的極小值,以確定變點(diǎn)j的估計[23]求出變點(diǎn)j后,變點(diǎn)之后的數(shù)據(jù)離散程度越來越高,可以作為異常數(shù)據(jù)刪除,因而可以將數(shù)據(jù)劃分為正常數(shù)據(jù)和異常數(shù)據(jù)兩部分,即式中,Wn為該風(fēng)速區(qū)間的正常數(shù)據(jù)集;Wo為該風(fēng)速區(qū)間的異常數(shù)據(jù)集。對其他風(fēng)速區(qū)間進(jìn)行相同處理,即可得到風(fēng)電機(jī)組整個風(fēng)速區(qū)間的功率曲線正常數(shù)據(jù)集和異常數(shù)據(jù)集。下面以某臺風(fēng)電機(jī)組的實(shí)測運(yùn)行數(shù)據(jù)中選取8.5~9m/s風(fēng)速段數(shù)據(jù)為例展示方差變化率變點(diǎn)分組法的工作過程。經(jīng)統(tǒng)計,原始數(shù)據(jù)在該風(fēng)速區(qū)間共有1837個數(shù)據(jù)組。按照功率值對數(shù)據(jù)進(jìn)行降序排列,使其滿足。根據(jù)式(2)依次計算1837組數(shù)據(jù)功率的方差si,然后求出各點(diǎn)的方差變化率k(i),如圖2所示。由圖2可知,在第1500-1600個點(diǎn)之間,方差變化率出現(xiàn)了顯著變化。通過最小二乘法變點(diǎn)識別可以求出,序列的變點(diǎn)j=1562,即在第1562個點(diǎn),曲線模型發(fā)生了突變。方差變化率的突變,是由于原始數(shù)據(jù)中存在大量離散程度高的異常數(shù)據(jù)所致,因此可以判定第1562個點(diǎn)之后的數(shù)據(jù)為異常數(shù)據(jù)。根據(jù)變點(diǎn)j將正常數(shù)據(jù)和異常數(shù)據(jù)分離,得到正常數(shù)據(jù)集Wn和異常數(shù)據(jù)Wo。圖3是變點(diǎn)分組法對8.5~9m/s風(fēng)速段數(shù)據(jù)中異常數(shù)據(jù)的識別效果。由圖3可知,變點(diǎn)分組法準(zhǔn)確識別出了風(fēng)速-功率曲線下方的第一、二類堆積型異常數(shù)據(jù)和部分分散型異常數(shù)據(jù),但是對風(fēng)功率曲線上界的第三類堆積型異常數(shù)據(jù)和部分分散型異常數(shù)據(jù)無法有效識別。四分位數(shù)及其上、下邊界可以衡量數(shù)據(jù)的整體分布情況,反映數(shù)據(jù)分布的中心位置和分散范圍,理論上利用四分位法中的異常值截斷點(diǎn)可有效識別剩余的異常數(shù)據(jù)。四分位數(shù)(Quartile)是指將一個排好序的數(shù)據(jù)樣本平均劃分成四部分的處于三個分割點(diǎn)位置的數(shù)值,分別記作Q1、Q2、Q3。四分位數(shù)的計算方法有很多,對于一個按照升序排列的樣本,四分位數(shù)計算方法如下[7]。(1)計算第2個四分位數(shù),即中位數(shù)Q2為(2)計算第1和第3個四分位數(shù)Q1和Q3。當(dāng)n=2k()時,從Q2處將數(shù)據(jù)樣本X分為兩部分,Q2不包含在兩部分?jǐn)?shù)據(jù)之內(nèi),分別按式(9)計算兩部分的中位數(shù)和(v,則Q1二,Q2=。當(dāng)n=4k+1時,有當(dāng)n=4k+3時,有通過四分位數(shù)可得到四分位距(InterQuartileRange,IQR),用IQR表示為根據(jù)四分位距IQR可以確定數(shù)據(jù)樣本X中的異常值的內(nèi)限為處于內(nèi)限以外的數(shù)據(jù)都被判定為異常值。四分位法對圖3中剩余的異常數(shù)據(jù)清洗效果如圖4所示,變點(diǎn)分組法無法識別的第三類堆積型異常數(shù)據(jù)和部分分散型異常數(shù)據(jù)通過四分位法實(shí)現(xiàn)有效識別清洗,可見,聯(lián)合變點(diǎn)分組法和四分位法可較好地識別四類典型異常數(shù)據(jù)。從2.1節(jié)和2.2節(jié)的結(jié)果表明,聯(lián)合變點(diǎn)分組法和四分位法可有效實(shí)現(xiàn)風(fēng)電機(jī)組風(fēng)速-功率曲線異常數(shù)據(jù)的識別清洗。理論上變點(diǎn)分組法和四分位法的聯(lián)合存在變點(diǎn)分組-四分位和四分位-變點(diǎn)分組兩組基本組合方式。但分析風(fēng)電機(jī)組的實(shí)際運(yùn)行狀況發(fā)現(xiàn),風(fēng)速-功率運(yùn)行數(shù)據(jù)中堆積型異常數(shù)據(jù)出現(xiàn)的頻率較高,且第一、二類堆積型異常數(shù)據(jù)居多。若首先應(yīng)用四分位法進(jìn)行原始異常數(shù)據(jù)識別清洗,四分位法的異常值內(nèi)限容易受到大量堆積型異常數(shù)據(jù)的影響,特別是正常數(shù)據(jù)與異常數(shù)據(jù)的數(shù)量相當(dāng)時,會出現(xiàn)完全無法識別異常數(shù)據(jù)的現(xiàn)象,影響總體的異常數(shù)據(jù)識別效果。而采用變點(diǎn)分組-四分位法可有效避免上述缺陷,因?yàn)樽凕c(diǎn)估計不受堆積型異常數(shù)據(jù)的影響,首先使用變點(diǎn)分組法可有效剔除第一、二類堆積型異常數(shù)據(jù),減少異常數(shù)據(jù)量,在一定程度上克服四分位法在異常數(shù)據(jù)較多時易發(fā)生失效的缺陷??梢?,采用變點(diǎn)分組-四分位的組合理論上具有更好的異常數(shù)據(jù)辨識效果:首先采用變點(diǎn)分組法識別風(fēng)速-功率數(shù)據(jù)集中第一、二類堆積型異常數(shù)據(jù)和部分第四類分散型異常數(shù)據(jù),然后采用四分位法識別第三類堆積型異常數(shù)據(jù)和剩余的第四類分散型異常數(shù)據(jù),具體數(shù)據(jù)清洗流程如圖5所示。為了驗(yàn)證所提數(shù)據(jù)清洗方法及流程的有效性,選取國內(nèi)某風(fēng)電場風(fēng)電機(jī)組的運(yùn)行數(shù)據(jù)進(jìn)行實(shí)例驗(yàn)證,該風(fēng)電場風(fēng)電機(jī)組的基本參數(shù)如下:額定功率2OOOkW,風(fēng)輪直徑95.9m,切入風(fēng)速3m/s,額定風(fēng)速11m/s,切出風(fēng)速(10min平均值)25m/s。這里選取異常數(shù)據(jù)分布比較典型的1號機(jī)組、2號機(jī)組和7號機(jī)組的運(yùn)行數(shù)據(jù)來說明聯(lián)合算法對數(shù)據(jù)的清洗效果。1號機(jī)組、2號機(jī)組和7號機(jī)組連續(xù)12個月的原始數(shù)據(jù)如圖6所示。由圖6可知,1號機(jī)組的數(shù)據(jù)中包含第一、二、四類異常數(shù)據(jù),2號機(jī)組和7號機(jī)組含有所有類型異常數(shù)據(jù),但具體的分布位置及數(shù)量不同。變點(diǎn)分組-四分位法對三個機(jī)組的異常數(shù)據(jù)識別結(jié)果如圖7所示。由圖7可知,三個風(fēng)電機(jī)組中所包含的所有類型異常數(shù)據(jù)都能被有效識別,且圖中被判定為正常數(shù)據(jù)的部分接近理想狀態(tài)的風(fēng)功率曲線,說明本文提出的變點(diǎn)分組-四分位法對風(fēng)電機(jī)組風(fēng)速-功率異常運(yùn)行數(shù)據(jù)的識別清洗是可行的,且清洗效果不受堆積型異常數(shù)據(jù)的影響。三個風(fēng)電機(jī)組中所包含的異常數(shù)據(jù)類型不同,但數(shù)據(jù)清洗效果相似,不受實(shí)際異常數(shù)據(jù)類型及數(shù)量的影響,說明此方法具有一定的通用性。表1中記錄了變點(diǎn)分組-四分位法對三個機(jī)組的數(shù)據(jù)刪除率和清洗效率。此方法對異常數(shù)據(jù)的刪除率均在20%左右,這與異常數(shù)據(jù)的多少有關(guān)。三個機(jī)組12個月的運(yùn)行數(shù)據(jù)清洗耗時在40s左右,清洗效率較高。為了說明變點(diǎn)分組-四分位法這一數(shù)據(jù)清洗流程的合理性和有效性,文中利用7號機(jī)組的原始運(yùn)行數(shù)據(jù)從清洗效果、清洗效率以及數(shù)據(jù)刪除率等維度對比分析了提出的方法與四分位-變點(diǎn)分組法及傳統(tǒng)的局部離群因子(LocalOutlierFactor,LOF)數(shù)據(jù)清洗方法。表1從數(shù)據(jù)刪除率和清洗效率兩個角度對三種方法對比結(jié)果。其中,清洗效率均是在相同的運(yùn)行環(huán)境下得到的,因此具有一定的可比性。采用四分位-變點(diǎn)分組法對7號機(jī)組的數(shù)據(jù)清洗效果如圖8所示。對比圖8和圖7c可知,將變點(diǎn)分組和四分位法的順序?qū)φ{(diào),18m/s附近風(fēng)速區(qū)間的異常數(shù)據(jù)不能完全識別。結(jié)合表1和圖7,可得1號、2號和7號機(jī)組的運(yùn)行數(shù)據(jù)中異常數(shù)據(jù)所占的比例分別不會超過21.65%,19.06%和21.04%。但四分位-變點(diǎn)分組法對這三個機(jī)組的數(shù)據(jù)刪除率分別高達(dá)24.06%、22.51%和27.10%,這說明有正常數(shù)據(jù)被錯誤識別為異常數(shù)據(jù)。雖然四分位-變點(diǎn)分組法的效率稍高,但此方法正常數(shù)據(jù)損失率偏高,會對數(shù)據(jù)的完整度造成不利影響,更主要的是不能完全識別清除所有異常數(shù)據(jù)。使用LOF算法清洗7號機(jī)組運(yùn)行數(shù)據(jù)的效果如圖9所示。LOF算法是一種典型的聚類算法,通過比較每個點(diǎn)和其鄰域點(diǎn)的密度來判斷該點(diǎn)是否為異常點(diǎn),本文中選擇的鄰域點(diǎn)的個數(shù)為20。LOF算法中,異常數(shù)據(jù)所占的比例需要提前設(shè)定,為了便于和變點(diǎn)分組-四分位法進(jìn)行比較,將所有數(shù)據(jù)點(diǎn)中前21.04%的局部離群因子最高的點(diǎn)判定為異常值,使之與變點(diǎn)分組-四分位法識別的異常數(shù)據(jù)量相同。對比圖7c和圖9可以看出,當(dāng)兩種方法識別的異常數(shù)據(jù)量相同時,LOF算法對堆積型異常數(shù)據(jù)的識別效果不佳。綜上所述,變點(diǎn)分組-四分位法為風(fēng)電機(jī)組風(fēng)速-功率運(yùn)行數(shù)據(jù)的清洗提供了高效、合理、可靠的方法。變點(diǎn)分組-四分位法能實(shí)現(xiàn)對風(fēng)功率曲線中堆積型異常數(shù)據(jù)和分散型異常數(shù)據(jù)的有效識別,可滿足不同機(jī)組、不同異常數(shù)據(jù)分布狀況的清洗需求,特別是當(dāng)機(jī)組的風(fēng)速-功率數(shù)據(jù)中存在大量第一、二類堆積型異常數(shù)據(jù)時具有明顯的優(yōu)勢。異常數(shù)據(jù)識別清洗效果及效率不僅與清洗方法有關(guān),還與清洗的順序相關(guān),應(yīng)引起注意。通過對風(fēng)電運(yùn)行數(shù)據(jù)的清洗,可以提高風(fēng)功率預(yù)測和風(fēng)電場相關(guān)性等效建模的質(zhì)量,為風(fēng)電場的經(jīng)濟(jì)安全運(yùn)行和優(yōu)化控制策略提供根本的數(shù)據(jù)支撐。風(fēng)電機(jī)組風(fēng)速-功率異常數(shù)據(jù)會對風(fēng)電數(shù)據(jù)挖掘帶來負(fù)面影響。本文總結(jié)了風(fēng)電機(jī)組風(fēng)速-功率異常數(shù)據(jù)的分布特征,提出并建立了變點(diǎn)分組-四分位法數(shù)據(jù)清洗方法及流程。實(shí)例驗(yàn)證表明,所提的數(shù)據(jù)清洗方法及流程能夠有效識別異常數(shù)據(jù),效率較高,且不依賴于正常數(shù)據(jù)集進(jìn)行訓(xùn)練,通用性較好。沈小軍男,1979年生,博士,副教授,研究方向?yàn)樾履茉锤咝Ю门c節(jié)能技術(shù)電網(wǎng)實(shí)景三維重構(gòu)及其應(yīng)用、電力設(shè)備狀態(tài)評估等。E-mail:(通信作者)付雪姣女,1993年生,碩士研究生,研究方向?yàn)樾履茉锤咝Ю门c節(jié)能技術(shù)。E-mail:【相關(guān)文獻(xiàn)】GeShen,BinXu,YunxianJing,etal.Monitoringwindfarmsoccupyinggrasslandsbasedonremote-sensingdatafromChina'sGF-2HDsatellite—AcasestudyofJiuquancity,Gansuprovince,China[J].Resources,ConservationandRecycling,2017,12(1):128136.田中大,李樹江,王艷紅,等.基于小波變換的風(fēng)電場短期風(fēng)速組合預(yù)測[J].電工技術(shù)學(xué)報,2015,30(9):112-120.TianZhongda,LiShujiang,WangYanhong,etal.Short-termwindspeedcombinedpredictionforwindfarmsbasedonwavelettransform[J].TransactionsofChinaElectrotechnicalSociety,2015,30(9):112-120.韋姝,魏海坤,朱婷婷,等.考慮風(fēng)速分布與日非平穩(wěn)性的風(fēng)速數(shù)據(jù)預(yù)處理方法研究[J].電網(wǎng)與清潔能源,2015,31(3):93-98,123.WeiShu,WeiHaikun,ZhuTingting,etal.Researchondatapre-processingmethodconsideringdistri-butionanddiurnalnon-stationaryofwindspeed[J].PowerSystemandCleanEnergy,2015,31(3):93-98,123.郭鵬,文晶,朱丹丹,等.基于源-荷互動的大規(guī)模風(fēng)電消納協(xié)調(diào)控制策略[J].電工技術(shù)學(xué)報,2017,32(3):1-9.GuoPeng,WenJing,ZhuDandan,etal.Thecoor-dinationcontrolstrategyforlarge-scalewindpowerconsumptionbasedonsource-loadinteractive[J].TransactionsofChinaElectrotechnicalSociety,2017,32(3):1-9.孫欣,方陳,沈風(fēng),等.考慮風(fēng)電出力不確定性的發(fā)用電機(jī)組組合方法[J].電工技術(shù)學(xué)報,2017,32(4):204-211.SunXin,FangChen,ShenFeng,etal.Anintegratedgeneration-consumptionunitcommitmentmodelconsideringtheuncertaintyofwindpower[J].Transa-ctionsofChinaElectrotechnicalSociety,2017,32(4):204-211.⑹ 楊茂,熊昊,嚴(yán)干貴,等.基于數(shù)據(jù)挖掘和模糊聚類的風(fēng)電功率實(shí)時預(yù)測研究[J].電力系統(tǒng)保護(hù)與控制,2013,41(1):1-6.YangMao,XiongHao,YanGangui,etal.Real-timepredictionofwindpowerbasedondataminingandfuzzyclustering[J].PowerSystemProtectionandControl,2013,41(1):1-6.王欽,蔣懷光,文福拴,等?智能電網(wǎng)中大數(shù)據(jù)的概念、技術(shù)與挑戰(zhàn)J].電力建設(shè),2016,37(12):1-10.WangQin,JiangHuaiguang,WenFushuan,etal.Concept,technologyandchallengesofbigdatainsmartgrids[J].ElectricPowerConstruction,2016,37(12):1-10.SwapnaS,NiranjanP,SrinivasB,etal.Datacleaningfordataquality[C]//IEEEInternationalConferenceonComputingforSustainableGlobalDevelopment,NewDelhi,India,2016.朱倩雯,葉林,趙永寧,等.風(fēng)電場輸出功率異常數(shù)據(jù)識別與重構(gòu)方法研究[J].電力系統(tǒng)保護(hù)與控制,2015,43(3):38-45.ZhuQianwen,YeLin,ZhaoYongning,etal.Methodsforeliminationandreconstructionofabnormalpowerdatainwindfarms[J].PowerSystemProtectionandControl,2015,43(3):38-45.趙永寧,葉林,朱倩雯?風(fēng)電場棄風(fēng)異常數(shù)據(jù)簇的特征及處理方法J]?電力系統(tǒng)自動化,2014,38(27):39-46.ZhaoYongning,YeLin,ZhuQianwen.Characteri-sticsandprocessingmethodofabnormaldataclustercausedbywindcurtailmentsinwindfarms[J].AutomationofElectricPowerSystems,2014,38(27):39-46.婁建樓,胥佳,陸恒,等.基于功率曲線的風(fēng)電機(jī)組數(shù)據(jù)清洗算法[J].電力系統(tǒng)自動化,2016,40(10):116-121.LouJianlou,XuJia,LuHeng,etal.Windturbinedata-cleaningalgorithmbasedonpowercurve[J].AutomationofElectricPowerSystems,2016,40(10):116-121.AndrewKusiak,SongHaiyang,SongZhe.Modlesformonitoringwindfarmpower[J].RenewableEnergy,2009,34(3):583-590.YueWang,DavidGInfield,BruceStephen,etal.Copula-basedmodelforwindturbinepowercurveoutlierrejection[J].WindEnergy,2014,17(11):1677-1688.范曉泉,杜大軍,費(fèi)敏銳.風(fēng)電異常測量數(shù)據(jù)智能識別方法研究[J].儀表技術(shù),2017(1):10-14.FanXiaoquan,DuDajun,FeiMinrui.Researchontheintelligentidentificationmethodforabnormalmeasurementdataofthewindpower[J].Instru-mentationTechnology,2017(1):10-14.ZhengL,HuW,MinY.Rawwinddatapreprocessing:adata-miningapproach[J].IEEETransactionsonSustainableEnergy,2014,6(1):11-19.田書欣,程浩忠,曾平良,等.基于調(diào)頻層面的風(fēng)電棄風(fēng)分析[J].電工技術(shù)學(xué)報,2015,30(7):18-26.TianShuxin,ChengHaozhong,ZengPingliang,etal.Analysisonwindpowercurtailmentatfrequencyadjustmentlevel[J].TransactionsofChinaElectro-technicalSocie
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高考地理一輪復(fù)習(xí)第十六章區(qū)際聯(lián)系與區(qū)域協(xié)調(diào)發(fā)展第二節(jié)資源跨區(qū)域調(diào)配課件
- 自建房建筑安全合同(2篇)
- 海爾凈水 課件
- 西京學(xué)院《影視廣告》2022-2023學(xué)年第一學(xué)期期末試卷
- 初三(4)班月考動員
- 幼兒園小班歌唱活動《表情歌》教案
- 第二節(jié)國民黨政府處在全民的包圍中
- 西華師范大學(xué)《中國地理》2021-2022學(xué)年第一學(xué)期期末試卷
- 高考地理一輪復(fù)習(xí)第三章地球上的大氣及其運(yùn)動第一節(jié)大氣的組成和垂直分層及大氣受熱過程課件
- 西華師范大學(xué)《寫意花鳥畫》2023-2024學(xué)年第一學(xué)期期末試卷
- 如何提高醫(yī)務(wù)人員的個人防護(hù)裝備使用效率
- 公共服務(wù)質(zhì)量評價指標(biāo)體系
- 2023中國智慧手術(shù)室發(fā)展與實(shí)踐白皮書
- 江西省2023年高等職業(yè)院校單獨(dú)招生考試-江西電力職業(yè)技術(shù)學(xué)院-樣卷
- 《熱力學(xué)基礎(chǔ) 》課件
- 完整版體檢中心應(yīng)急預(yù)案
- 無人機(jī)培訓(xùn)教材
- 人教版必修四蘇武傳3課時課件
- 六年級《牽手兩代-第二講-乖孩子為什么會厭學(xué)》家長課程培訓(xùn)
- 醫(yī)院項目設(shè)計階段的造價控制重點(diǎn)及難點(diǎn)(含指標(biāo)清單、費(fèi)用明細(xì)、選材清單)
- 體育概論 第五章體育科學(xué)課件
評論
0/150
提交評論