![數(shù)據(jù)分析方法各章d6z_第1頁](http://file4.renrendoc.com/view/7a8f34b6c925cee9451b4c5bc972b299/7a8f34b6c925cee9451b4c5bc972b2991.gif)
![數(shù)據(jù)分析方法各章d6z_第2頁](http://file4.renrendoc.com/view/7a8f34b6c925cee9451b4c5bc972b299/7a8f34b6c925cee9451b4c5bc972b2992.gif)
![數(shù)據(jù)分析方法各章d6z_第3頁](http://file4.renrendoc.com/view/7a8f34b6c925cee9451b4c5bc972b299/7a8f34b6c925cee9451b4c5bc972b2993.gif)
![數(shù)據(jù)分析方法各章d6z_第4頁](http://file4.renrendoc.com/view/7a8f34b6c925cee9451b4c5bc972b299/7a8f34b6c925cee9451b4c5bc972b2994.gif)
![數(shù)據(jù)分析方法各章d6z_第5頁](http://file4.renrendoc.com/view/7a8f34b6c925cee9451b4c5bc972b299/7a8f34b6c925cee9451b4c5bc972b2995.gif)
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、 p1m m k 13. Minkowski 距離 d ( xi , x j ) xik x jk1k p4. Chebyshev 距離 d ( xi , x j ) max xik x jk)2ijs2p (x xk 1kikjk5. 方差距離d ( x , x ) 6. 馬氏距離 d(x, y) (x y)T S1(x y)令 dij d ( xi , x j ) , 可得距離矩陣 D (dij )nn .6.2 快速聚類法 (指定分類數(shù),對結果有較大影響)1. 快速聚類法的步驟(1) 選擇聚點經(jīng)驗選擇k 個樣品作為聚點;人為選擇k 個樣品作為聚點;最小最大原則先選 2 個, d ( xi
2、 , xi ) maxd ij12(ii) 再選第 3 個, mind ( xi , xi ), d ( xi , xi )3132 maxmin(d ( x j, xi ),d (x j, xi ), j i1,i 2123r(iii) 一般設已選l 個, 則第l 1 個由以下式子確定 mind ( xi , xi ), r 1 l1 maxmind ( x j, xi ), r 1 l, j i1 il(2) 具體步驟假設采用歐氏距離.k1) 設初始聚點集 L(0) x(0) , x(0) , x(0)12初始分類( i 1 k )(最近者)G(0) x | d ( x, x(0) ) d
3、 ( x, x(0) ), j 1 k, j iiijG(0) G(0) ,G(0) ,G(0)12k2) 計算新聚點i iiin( 0 )i x Gx(1) 1 x , i 1 k .新聚點集12kL(1) x(1) , x(1) , x(1)12k,G(1)新分類集 G(1) G(1) ,G(1) ,3) 設在第m 步已得12k,G(m )G(m) G(m) ,G(m) ,以推得k,G(m1)G(m1) G(m1) ,G(m1),12若 d (m) d (0) , 則停止.ii其中 d(m ) maxd(x(m) , x(m1) ),i 1 k)iid(0 ) maxd(x(0) , x(
4、0) ),i, j 1 k,i j)一般 0.02 .例 6.1 根據(jù)表 6.1, 把 13 個國家分成 4 類.解 按最小最大原則, 得最初 4 個聚點最終聚類結果以 X1 (90 年得分)為橫坐標,X 2 (95 年得分)為縱坐標得類間距為例 6.2 由 19521998 年國內(nèi)生產(chǎn)總值的三個指標:X1 :第一產(chǎn)業(yè)(農(nóng)業(yè))占生產(chǎn)總值的百分比;X 2 :第二產(chǎn)業(yè)(工業(yè)及建筑業(yè))占生產(chǎn)總值的百分比;X 3 :第三產(chǎn)業(yè)占生產(chǎn)總值的百分比.(1) 分為 3 類;(2) 分為 4 類.解 分類結果如下分成 4 類結果類似.2. 用 Lm 距離進行快速聚類1(1) 對 L1 ,記d ( xi , x
5、j ) xik xjk xi x j1k p當 p 1 維 x1, x2 , xn , 有(證略)njj1 jnj1| x c | min c M med x當 p 維, x1, x2 , xn , 也有M (M1, M2 , Mp )T (稱為中位向量)其中分量 Mi ,i 1 p 均為中位數(shù).使得nj1| x jk Mk | min, k 1 p1nj1j1 k 1n p | x jk Mk | min從而 x j Mm(2) 對一般Lm1 ,記d ( xi , x j ) xi x j當 p 1 維 x1, x2 , xn , 稱n| x j c |m min c 為m 中心j1當 p 維 x1, x2 , xn , 稱c (c ,c ,c )T 為m 中心向量1 2p其中分量cj , j 1 p 均為 x jk 的m 中心, 滿足njkkj1m| x M | min, k 1 pnn pmmmj1j1 k 1 min從而 x j M | x jk Mk |結論: 1 中心向量=中位向量; 2 中心向量=均值向量.對一維數(shù)據(jù),宜用 L1 ; 此外宜用 Lm1 .結果與m 有關.例 6.3 利用表 6.1 的 13 個國家可持續(xù)發(fā)展綜合國力的數(shù)據(jù)進行分類(4 類),(1) 用 L1 ; (2) 用 L1 5 .解 (1) 由proc fastclus 過程(l
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑工地三通一平合同范本
- 2025關于清潔工勞動合同
- 2025年比特幣投資項目提案報告模范
- 2025年外研版三年級起點九年級生物上冊月考試卷
- 2025年超低頻傳感器標定系統(tǒng)項目申請報告模板
- 2025年鎳壓延加工材項目提案報告模范
- 建筑工程施工現(xiàn)場的衛(wèi)生管理
- 2025專利申請專項資金使用償還的合同書范本
- 建筑工程協(xié)作與溝通
- 新年公司年會的致辭(15篇)
- 2024年江西省南昌市中考一模數(shù)學試題(含答案)
- 48貴州省貴陽市2023-2024學年五年級上學期期末數(shù)學試卷
- 《采暖空調(diào)節(jié)能技術》課件
- CONSORT2010流程圖(FlowDiagram)【模板】文檔
- 游戲綜合YY頻道設計模板
- arcgis軟件操作解析課件
- 中興ZCTP 5GC高級工程師認證考試題庫匯總(含答案)
- 大學生創(chuàng)新創(chuàng)業(yè)教程PPT全套完整教學課件
- 小學科學項目化作業(yè)的設計與實施研究
- 2020年中考生物試卷及答案
- MCNP-5A程序使用說明書
評論
0/150
提交評論