基于數(shù)據(jù)分析的電力用戶用電特征研究_第1頁
基于數(shù)據(jù)分析的電力用戶用電特征研究_第2頁
基于數(shù)據(jù)分析的電力用戶用電特征研究_第3頁
基于數(shù)據(jù)分析的電力用戶用電特征研究_第4頁
基于數(shù)據(jù)分析的電力用戶用電特征研究_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

基于數(shù)據(jù)分析的電力用戶用電特征研究0引言隨著大數(shù)據(jù)、物聯(lián)網(wǎng)、通信技術(shù)[1-3]的不斷發(fā)展,電力行業(yè)信息化進(jìn)程不斷加快。豐富的電力數(shù)據(jù)資源為智能電力系統(tǒng)[4-5]的建立和管理奠定了基礎(chǔ)。因此,可以根據(jù)用戶的歷史用電記錄分析電力需求和用戶之間的相關(guān)性,將用戶劃分為不同的組,從而滿足用戶和社會對于電力企業(yè)不斷提高的服務(wù)需求。然而,基于用電數(shù)據(jù)的電力用戶分割仍存在著許多新的挑戰(zhàn)。首先,由于電力數(shù)據(jù)量巨大,直接分析復(fù)雜的原始數(shù)據(jù)費(fèi)時費(fèi)力,不僅難以提取關(guān)鍵信息,而且無法充分利用數(shù)據(jù)資源。其次,電力系統(tǒng)通常沒有用戶用電行為的標(biāo)簽信息。同時,并非所有用電數(shù)據(jù)都有分析價(jià)值,且大多數(shù)用戶的用電行為在時間維度上具有一定的周期性,因此原始數(shù)據(jù)中存在大量冗余記錄。這會給分析過程帶來干擾。最后,現(xiàn)有的方法在有效提取特征、模型訓(xùn)練效率等方面仍有很大的探索空間。針對上述問題,本文分析了用戶用電行為在時間維度上的特征,提出了基于用戶電力特征的分割網(wǎng)絡(luò)模型。該模型能夠有效地提取電力消費(fèi)特征,對電力用戶進(jìn)行細(xì)分。此外,本文在電力用戶的分割學(xué)習(xí)過程中使用改進(jìn)的粒子群優(yōu)化算法自動選擇超參數(shù),從而加快模型訓(xùn)練效率。1電力用戶分割網(wǎng)絡(luò)模型用戶的用電行為特征通常反映在其歷史用電記錄中。因此,本文從時間維度分析用戶的用電行為。首先,構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)的時間維度電力用戶用電特征編碼,主要分析用戶在相鄰時段內(nèi)用電記錄的相關(guān)性。其次,為了減少信息冗余和高維數(shù)據(jù)帶來的維度爆炸或噪聲干擾影響,對電力用戶用電記錄進(jìn)行多角度特征提取。在此基礎(chǔ)上,為了使學(xué)習(xí)到的特征包含盡可能多的重要信息,本文引入了電力用戶用電特征重構(gòu)層。在該層中,基于反卷積網(wǎng)絡(luò)解碼器從提取的特征中重構(gòu)原始記錄。重構(gòu)層可以保證提取的特征包含足夠的信息,從而在無監(jiān)督的情況下對用戶的用電行為進(jìn)行建模。最后,基于改進(jìn)PSO算法的超參數(shù)優(yōu)化,提高模型處理效率。本文提出的電力用戶分割網(wǎng)絡(luò)模型結(jié)構(gòu)如圖1所示。圖1電力用戶分割網(wǎng)絡(luò)模型結(jié)構(gòu)1.1電力用戶用電特征編碼本小節(jié)簡要介紹一些使用的符號及其相關(guān)定義。令電力系統(tǒng)記錄數(shù)據(jù)集中的所有用戶集合定義如式(1)所示。U={u1,u2,...,uN}——(1)式中:N為用戶數(shù)量;?ui∈U,i為用戶序號且i=1,2,...,N,ui為第i個用戶。在對電力用戶用電特征建立模型前,需要根據(jù)用戶的用電信息記錄數(shù)據(jù)構(gòu)建電力用戶用電矩陣,并在此基礎(chǔ)上提取用戶用電特征。以下對電力用戶用電矩陣和用電特征進(jìn)行定義。定義1電力用戶用電矩陣。對于用戶?ui∈U,用電矩陣應(yīng)包括兩個因素,即用戶每日用電特征信息和一段時間內(nèi)的用電趨勢。因此,ui的用電矩陣定義如式(2)所示。式中:D為用電記錄中包含的天數(shù);T為每日用電量的特征數(shù)。定義2電力用戶用電特征。用電特征是反映用戶ui用電行為的低維表示,可描述為Pi∈Rl。其中,l為特征維度。需注意,電力用戶用電特征是實(shí)現(xiàn)電力用戶分割的基礎(chǔ)和前提??紤]到用戶的用電行為具有一定的時間相關(guān)性,為此,本文構(gòu)建了基于CNN的時間維度用戶用電特征編碼。CNN是近年來非常流行的機(jī)器學(xué)習(xí)方法。其本質(zhì)為一種前饋神經(jīng)網(wǎng)絡(luò),可通過卷積、池化等操作學(xué)習(xí)并分析數(shù)據(jù)之間的相關(guān)性信息。需要注意的是,電力用戶用電行為數(shù)據(jù)是一種典型的高緯度數(shù)據(jù),具有周期性、短期和長期趨勢等。因此,對其分析過程通常不應(yīng)局限于某個特定角度,而需從不同方面入手,多角度分析用戶的行為特征。因此,本文引入多個卷積核來提取原始用戶用電記錄矩陣的特征,從而更全面地分析用戶的用電行為。在編碼中,本文將用電矩陣Ui作為輸入,并在基于時間維度上對其進(jìn)行卷積操作。為此,第k個卷積核的輸出如式(3)所示。式中:e為自然對數(shù)。式中:k為卷積核總數(shù)。1.2電力用戶用電特征重構(gòu)考慮到電力用戶用電特征包含的信息種類繁多、樣式復(fù)雜,如果模型學(xué)習(xí)時無法充分學(xué)習(xí)眾多特征,將對電力用戶分割精度產(chǎn)生不可估量的影響。因此,本文采用基于反CNN的解碼操作對提取的電力用戶特征進(jìn)行重構(gòu)操作,從而使電力特征盡可能覆蓋原始記錄中包含的信息。在不引入任何監(jiān)督信息的情況下,重構(gòu)操作可以盡可能地將電力用戶用電特征恢復(fù)到原始矩陣。在訓(xùn)練過程中,解碼操作的輸出應(yīng)盡可能保持與編碼操作輸入相等,并通過學(xué)習(xí)恒等映射函數(shù)找到原始數(shù)據(jù)之間隱藏的關(guān)聯(lián)信息。式中:fenc為編碼操作;fdec為解碼操作。上述編碼器-解碼器結(jié)構(gòu)可以在沒有監(jiān)督信息的情況下實(shí)現(xiàn)重構(gòu)電力用戶用電矩陣過程,從而使學(xué)習(xí)到的特征能夠盡可能多地捕獲原始記錄中的重要信息,以提高特征表示的質(zhì)量。進(jìn)一步,本文模型的總體損失函數(shù)如式(8)所示。式中:L(W,b,c)為重構(gòu)操作損失誤差。需注意,本文利用歐氏距離度量重構(gòu)操作輸出結(jié)果與輸入電力用戶用電矩陣之間的差異。此外,W、b、c為可訓(xùn)練的參數(shù)。該模型的優(yōu)化目標(biāo)是使損失L(W,b,c)最小化?;谏鲜隹蚣?,即可得到用戶的用電特征表示方式,并利用提取的特征進(jìn)一步實(shí)現(xiàn)電力用戶的分割。2基于改進(jìn)PSO算法的超參數(shù)優(yōu)化2.1PSO算法PSO[11]是一種典型的群體智能算法,已廣泛應(yīng)用于解決各種數(shù)學(xué)、工程、設(shè)計(jì)、網(wǎng)絡(luò)、機(jī)器人和圖像處理優(yōu)化問題。在PSO算法中,粒子通過遵循個體和全局最佳經(jīng)驗(yàn)探索整個搜索空間。PSO算法探索過程如式(9)、式(10)所示?!?10)式中:c1和c2為加速度系數(shù),用于平衡個體和全局搜索;r1和r2為隨機(jī)向量,且向量中每個元素的值都在0和1之間;pid和pgd為個人和全局最優(yōu)經(jīng)驗(yàn);w為慣性權(quán)重,主要表征前一時刻速度對當(dāng)前時刻速度的影響。然而,由于搜索過程只有一個領(lǐng)導(dǎo)者,傳統(tǒng)PSO算法操作容易陷入局部最優(yōu)。2.2基于超橢圓系數(shù)的改進(jìn)PSO算法本文在電力用戶的分割學(xué)習(xí)過程中使用改進(jìn)的PSO算法自動選擇超參數(shù)。首先,改進(jìn)的PSO算法采用了超橢圓搜索操作,從而平衡局部探索和全局探索。其次,使用平均最佳領(lǐng)導(dǎo)者搜索策略增加搜索多樣性。最后,使用隨機(jī)最佳領(lǐng)導(dǎo)者改進(jìn)群領(lǐng)導(dǎo),以克服“停滯”引起的陷入局部最優(yōu)問題。超橢圓曲線[12]在模擬自然界中許多復(fù)雜形狀和曲線方面發(fā)揮了重要的作用。超橢圓曲線如式(11)所示。式中:a和b為超橢圓曲線的半直徑且n、a和b均為正數(shù)。2.2.1超橢圓搜索策略受超橢圓式的啟發(fā),本文提出了一種加速的超橢圓搜索策略。該操作的搜索系數(shù)通過超橢圓式的實(shí)例化生成,從而使粒子以不規(guī)則的加速網(wǎng)狀方式向群領(lǐng)導(dǎo)者移動。加速的超橢圓搜索行為如式(12)所示。式中:v為超橢圓的角度,v∈[0,2π];m、k、n1均為超參數(shù),且根據(jù)不同參數(shù)可繪制不同超橢圓。本文研究令m=k=2、n1=5。式中:τ為超橢圓半徑;n2為超參數(shù)。本研究令n2=4。x=α×cosv——(14)式中:x為坐標(biāo)系中橢圓橫坐標(biāo)。y=α×sinv——(15)式中:y為坐標(biāo)系中橢圓縱坐標(biāo)。根據(jù)選定的搜索參數(shù),引導(dǎo)當(dāng)前粒子向全局最佳解移動,如式(16)所示。式中:s1為使用超橢圓式隨機(jī)生成的值。超橢圓搜索操作使粒子能夠通過加速搜索步驟跟隨最佳解向領(lǐng)導(dǎo)者移動。此外,可通過分配正系數(shù)和負(fù)系數(shù),增加搜索經(jīng)驗(yàn)。式中:s2、s3均為從超橢圓式中生成的值中隨機(jī)選擇的分?jǐn)?shù)。這些選定分?jǐn)?shù)的絕對值用作搜索系數(shù)以加速收斂。該機(jī)制通過使粒子以相對更混亂和不規(guī)則的方式圍繞個體和全局最佳經(jīng)驗(yàn)運(yùn)行,從而增加搜索多樣化,達(dá)到全局最優(yōu)。2.2.2平均最佳領(lǐng)導(dǎo)者搜索策略為了增加搜索多樣性,本文提出了另一種平均最佳領(lǐng)導(dǎo)者搜索策略。此操作采用當(dāng)前粒子的所有相鄰解的平均位置引導(dǎo)搜索過程。具體地說,主要是識別出比粒子群中當(dāng)前個體的適應(yīng)度得分更好的所有粒子,計(jì)算這些粒子的平均位置,并用于引導(dǎo)全局搜索過程。該搜索操作如式(18)所示。平均最佳領(lǐng)導(dǎo)者驅(qū)動機(jī)制使當(dāng)前粒子能夠充分利用平均最佳位置經(jīng)驗(yàn),從而加速粒子尋優(yōu)過程。2.2.3隨機(jī)最佳領(lǐng)導(dǎo)者搜索策略為了降低陷入局部最優(yōu)的概率,本文還提出了1種隨機(jī)最佳領(lǐng)導(dǎo)者搜索策略。此操作隨機(jī)選擇當(dāng)前粒子的1個更合適的相鄰解來探索搜索空間。其步驟為:首先,檢索所有適應(yīng)度得分高于當(dāng)前個體的粒子;然后,隨機(jī)選擇其中1個粒子來引導(dǎo)搜索過程。隨機(jī)最佳引導(dǎo)者驅(qū)動操作如式(19)所示。隨機(jī)最佳引導(dǎo)者搜索通過跟隨多個不同的領(lǐng)導(dǎo)者探索搜索空間,可快速跳過局部最優(yōu),加速尋找全局最優(yōu)過程。3仿真與分析3.1數(shù)據(jù)集與試驗(yàn)環(huán)境為驗(yàn)證本文模型性能,以某電力公司采集的500名用戶用電數(shù)據(jù)為例,對用戶用電行為進(jìn)行分類分析。用電數(shù)據(jù)主要來自智能電表采集的用戶1年內(nèi)的日用電量數(shù)據(jù)以及峰值、谷值、平時用電量。仿真軟件環(huán)境為Pycharm搭建算法框架,并由Python基于Tensorflow搭建學(xué)習(xí)算法。同時,算法運(yùn)行硬件環(huán)境為酷睿i7CPU,內(nèi)存為64GBARM的聯(lián)想服務(wù)器,操作系統(tǒng)為Windows1064位。3.2網(wǎng)絡(luò)搭建網(wǎng)絡(luò)搭建相關(guān)參數(shù)如表1所示。表1網(wǎng)絡(luò)搭建相關(guān)參數(shù)網(wǎng)絡(luò)輸入數(shù)據(jù)維度為500×365×4。該模型是1個卷積自編碼器,主要由卷積層、池化層和Inception構(gòu)成。當(dāng)執(zhí)行完自編碼過程后,接1個全連接層,并將輸出特征向量維數(shù)分別設(shè)置為7、14和21。需注意,反卷積過程中的參數(shù)與上述相應(yīng)參數(shù)一致。為了比較不同模型性能,假定在特征提取過程中,其他模型的特征參數(shù)與本文模型設(shè)置相同。此外,本文使用Adam優(yōu)化器學(xué)習(xí)參數(shù),特征編碼網(wǎng)絡(luò)和特征重構(gòu)網(wǎng)絡(luò)中,學(xué)習(xí)率分別設(shè)置為10-4和10-2;學(xué)習(xí)率衰減周期分別設(shè)置為20和10;學(xué)習(xí)率衰減倍數(shù)分別設(shè)置為0.01和0.02;批處理大小分別設(shè)置為16和32;最大迭代次數(shù)設(shè)置為150。改進(jìn)PSO算法參數(shù)設(shè)置如下:粒子數(shù)為20;最大迭代次數(shù)為60;粒子最大速度為0.6;慣性權(quán)重為0.6;搜索系數(shù)由超橢圓式隨機(jī)生成。3.3性能分析由于本文的主要任務(wù)是實(shí)現(xiàn)電力用戶分割,用戶特征提取的質(zhì)量也會反映在分割結(jié)果中。因此,本文分別對支持向量機(jī)(supportvectormachine,SVM)、變分自編碼、生成對抗網(wǎng)絡(luò)模型和本文模型進(jìn)行對比。此外,本文采用輪廓系數(shù)來評價(jià)聚類效果。輪廓系數(shù)具體計(jì)算如式(20)所示。式中:a(i)為向量i和同一簇中的其他樣本之間的平均距離;b(i)為向量i與其他簇中所有樣本之間的平均距離。需注意,s(i)∈[-1,1]。s(i)越接近1,表明樣本的聚類越合理;s(i)越接近-1,表明聚類效果越差,樣本應(yīng)該聚類到其他類別。3.3.1特征提取對比分析首先,令特征編碼網(wǎng)絡(luò)和特征重構(gòu)網(wǎng)絡(luò)特征提取維度為14。表2所示為特征提取(featureextraction,F(xiàn)E)方法前后不同模型輪廓系數(shù)對比結(jié)果。表2不同模型輪廓系數(shù)對比結(jié)果由表2可知,經(jīng)特征提取后,SVM、VA、GAN和本文模型輪廓系數(shù)分別提升2.58%、4.24%、0.39%和0.86%。由于剔除了冗余以及不相關(guān)的變量,有助于改善模型訓(xùn)練效果,從而提高分類器性能特征提取。3.3.2模型優(yōu)化對比分析令傳統(tǒng)PSO算法粒子數(shù)、最大迭代次數(shù)、粒子最大速度、慣性權(quán)重與改進(jìn)PSO算法保持一致,并設(shè)搜索系數(shù)c1=c2=1.5。不同優(yōu)化方案訓(xùn)練損失曲線如圖2所示。由圖2可知,使用優(yōu)化模型后,網(wǎng)絡(luò)訓(xùn)練性能明顯提升。其中,無優(yōu)化情況下,網(wǎng)絡(luò)訓(xùn)練至134代才可達(dá)到最優(yōu);傳統(tǒng)PSO算法優(yōu)化下,網(wǎng)絡(luò)在84代達(dá)到最優(yōu);基于改進(jìn)PSO優(yōu)化下,網(wǎng)絡(luò)在27代可達(dá)到最優(yōu)。因此,經(jīng)所提改進(jìn)PSO算法優(yōu)化后,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論