數(shù)據(jù)分析方法各章d6z_第1頁
數(shù)據(jù)分析方法各章d6z_第2頁
數(shù)據(jù)分析方法各章d6z_第3頁
數(shù)據(jù)分析方法各章d6z_第4頁
數(shù)據(jù)分析方法各章d6z_第5頁
免費預覽已結束,剩余11頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、 p1m m k 13. Minkowski 距離 d ( xi , x j ) xik x jk1k p4. Chebyshev 距離 d ( xi , x j ) max xik x jk)2ijs2p (x xk 1kikjk5. 方差距離d ( x , x ) 6. 馬氏距離 d(x, y) (x y)T S1(x y)令 dij d ( xi , x j ) , 可得距離矩陣 D (dij )nn .6.2 快速聚類法 (指定分類數(shù),對結果有較大影響)1. 快速聚類法的步驟(1) 選擇聚點經(jīng)驗選擇k 個樣品作為聚點;人為選擇k 個樣品作為聚點;最小最大原則先選 2 個, d ( xi

2、 , xi ) maxd ij12(ii) 再選第 3 個, mind ( xi , xi ), d ( xi , xi )3132 maxmin(d ( x j, xi ),d (x j, xi ), j i1,i 2123r(iii) 一般設已選l 個, 則第l 1 個由以下式子確定 mind ( xi , xi ), r 1 l1 maxmind ( x j, xi ), r 1 l, j i1 il(2) 具體步驟假設采用歐氏距離.k1) 設初始聚點集 L(0) x(0) , x(0) , x(0)12初始分類( i 1 k )(最近者)G(0) x | d ( x, x(0) ) d

3、 ( x, x(0) ), j 1 k, j iiijG(0) G(0) ,G(0) ,G(0)12k2) 計算新聚點i iiin( 0 )i x Gx(1) 1 x , i 1 k .新聚點集12kL(1) x(1) , x(1) , x(1)12k,G(1)新分類集 G(1) G(1) ,G(1) ,3) 設在第m 步已得12k,G(m )G(m) G(m) ,G(m) ,以推得k,G(m1)G(m1) G(m1) ,G(m1),12若 d (m) d (0) , 則停止.ii其中 d(m ) maxd(x(m) , x(m1) ),i 1 k)iid(0 ) maxd(x(0) , x(

4、0) ),i, j 1 k,i j)一般 0.02 .例 6.1 根據(jù)表 6.1, 把 13 個國家分成 4 類.解 按最小最大原則, 得最初 4 個聚點最終聚類結果以 X1 (90 年得分)為橫坐標,X 2 (95 年得分)為縱坐標得類間距為例 6.2 由 19521998 年國內(nèi)生產(chǎn)總值的三個指標:X1 :第一產(chǎn)業(yè)(農(nóng)業(yè))占生產(chǎn)總值的百分比;X 2 :第二產(chǎn)業(yè)(工業(yè)及建筑業(yè))占生產(chǎn)總值的百分比;X 3 :第三產(chǎn)業(yè)占生產(chǎn)總值的百分比.(1) 分為 3 類;(2) 分為 4 類.解 分類結果如下分成 4 類結果類似.2. 用 Lm 距離進行快速聚類1(1) 對 L1 ,記d ( xi , x

5、j ) xik xjk xi x j1k p當 p 1 維 x1, x2 , xn , 有(證略)njj1 jnj1| x c | min c M med x當 p 維, x1, x2 , xn , 也有M (M1, M2 , Mp )T (稱為中位向量)其中分量 Mi ,i 1 p 均為中位數(shù).使得nj1| x jk Mk | min, k 1 p1nj1j1 k 1n p | x jk Mk | min從而 x j Mm(2) 對一般Lm1 ,記d ( xi , x j ) xi x j當 p 1 維 x1, x2 , xn , 稱n| x j c |m min c 為m 中心j1當 p 維 x1, x2 , xn , 稱c (c ,c ,c )T 為m 中心向量1 2p其中分量cj , j 1 p 均為 x jk 的m 中心, 滿足njkkj1m| x M | min, k 1 pnn pmmmj1j1 k 1 min從而 x j M | x jk Mk |結論: 1 中心向量=中位向量; 2 中心向量=均值向量.對一維數(shù)據(jù),宜用 L1 ; 此外宜用 Lm1 .結果與m 有關.例 6.3 利用表 6.1 的 13 個國家可持續(xù)發(fā)展綜合國力的數(shù)據(jù)進行分類(4 類),(1) 用 L1 ; (2) 用 L1 5 .解 (1) 由proc fastclus 過程(l

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論