時(shí)間序列相似性度量_第1頁
時(shí)間序列相似性度量_第2頁
時(shí)間序列相似性度量_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、討論一般時(shí)間序列相似的度雖方式1、概念:時(shí)間序歹0的相似性度量是衡量?jī)蓚€(gè)時(shí)間序歹0的相似程度的方法。它是時(shí)間序 列分類、聚類、異常發(fā)現(xiàn)等諸多數(shù)據(jù)挖掘問題的基礎(chǔ);也是時(shí)間序列挖掘的核心 問題之一。2、意義:時(shí)間序列式進(jìn)行序列查詢、分類、預(yù)測(cè)的基本工作,尋求一種好的度量對(duì)提 高挖掘任務(wù)的效率和準(zhǔn)確性有著至關(guān)重要的意義。3、影響因素:兩個(gè)序列是否相似,主要看它們的變化趨勢(shì)是否一致。由丁時(shí)間序列數(shù)據(jù)的 復(fù)雜性特點(diǎn),實(shí)際中不可能存在兩條完全相同的時(shí)間序列,即使相似的時(shí)間序列往往也會(huì)呈現(xiàn)出各種各樣的變化。所以,任何兩個(gè)序列之間都存在著某種差異, 影響這種差異的主要因素有:(1) 噪聲:現(xiàn)實(shí)的大多數(shù)時(shí)間序列

2、數(shù)據(jù)都存在噪聲,體現(xiàn)在圖形上式指數(shù)據(jù)的 曲線不光滑,即存在“毛刺”。(2) 振幅平移:即兩條形態(tài)相似的時(shí)間序列分別繞高低不同的均值波動(dòng)。(3) 振幅伸縮:即兩條時(shí)間序列的變化趨勢(shì)相同,但其中一條時(shí)間序列在縱軸 上似乎被拉伸或者壓縮過一樣,即兩個(gè)序歹0的振幅不同。(4) 時(shí)間軸伸縮:是指兩條時(shí)間序列的波形相似,但其中一條時(shí)間序列在時(shí)間 軸上按比例伸縮。(5) 線性漂移:是指兩條時(shí)間序歹0的波動(dòng)節(jié)奏相似,但其中一條時(shí)間序歹0呈現(xiàn) 線性遞增或遞減趨勢(shì)。(6) 不連續(xù)性:是指兩條時(shí)間序歹0整體的波動(dòng)趨勢(shì)相同,只是在別的時(shí)間點(diǎn)或 段出現(xiàn)問斷。然而,在實(shí)際應(yīng)用中情況要復(fù)雜得多,往往是以上多種因素交織在一起

3、。 時(shí)間序 列的相似性并沒有一個(gè)客觀的定義, 具有一定的個(gè)人偏好性,也就是說,不同的 人或不同的應(yīng)用場(chǎng)合對(duì)各種差異影響的重視程度是不一樣的。給定兩條時(shí)間序列X =Xi,X2,., Xn和Y=y,y2,.ymh相似性度量的問題就是在各種各樣差異因素的影響下,尋求一個(gè)合適的相似性度量函數(shù)Sim(X,Y),使得該函數(shù)能很好地反映時(shí)間序列數(shù)據(jù)的特點(diǎn)。4、方法:目前時(shí)間序列相似性度量,最常用的有Minkowski距離和動(dòng)態(tài)時(shí)間 彎曲。一、Minkowski 距離給定兩條時(shí)間序列X = x1x2.Xn和Y=y y .yJ它們之間的Minkowski距離如下:rp/pd(X,Y )=21但Xi yiJMin

4、kowski距離是一種距離度量,因?yàn)樗鼭M足距離的三個(gè)條件:(1) 非負(fù)性:d(X,Y尹0,當(dāng)且僅當(dāng)X =Y,d(X,Y )=0 ;(2) 對(duì)稱性:d(X,Y )=d(Y,X );(3) 三角不等式:d(Y,Z )<d(X,Y )十d(X,Z )大多簡(jiǎn)單的相似性度量是 Minkowski距離及其它的變種,Minkowski距離的 優(yōu)點(diǎn)是簡(jiǎn)單、直觀且計(jì)算復(fù)雜度不高,與時(shí)間序列的長(zhǎng)度成線性關(guān)系即序列長(zhǎng)度 的增加不會(huì)造成計(jì)算復(fù)雜程度的迅速提高。所以當(dāng)訓(xùn)練集比較大時(shí),Minkowski距離比其他更有效。但是 Minkowski距離不支持時(shí)間序列的線性漂移和時(shí)間彎 曲,且無法處理不等長(zhǎng)的時(shí)間序列。參考文獻(xiàn)1王達(dá);榮剛;時(shí)間序列的模式距離;浙江大學(xué)學(xué)報(bào)(工學(xué)版)2004;39( 7);795-79912】方開泰;潘恩培;聚類分析;北京地質(zhì)出版社;1992; 44-51

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論