聚類分析實驗指導書_第1頁
聚類分析實驗指導書_第2頁
聚類分析實驗指導書_第3頁
聚類分析實驗指導書_第4頁
聚類分析實驗指導書_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)挖掘?qū)嶒瀳蟾嬖?(部): 管理工程學院專 業(yè):信息管理與信息系統(tǒng)實驗項目:班 級:信管112姓 名:學 號:02聚類分析實驗指導書實驗目的:1熟悉R語言的相關(guān)對象與函數(shù)的用法2掌握利用R進行聚類分析的基本步驟實驗內(nèi)容:說明:本實驗采用iris數(shù)據(jù)集,下面中的數(shù)據(jù)集如無上下文說明,即是指irisiris以鳶尾花的特征作為數(shù)據(jù)來源,數(shù)據(jù)集包含150個數(shù)據(jù)集,分為3類,每類50個數(shù)據(jù), 每個數(shù)據(jù)包含4個屬性,是在數(shù)據(jù)挖掘、數(shù)據(jù)分類中非常常用的測試集、訓練集。四個屬性分別為:花萼長度、花萼寬帶、花瓣長度、花瓣寬度三類分別為:setosa, versicolor, virginica(山鳶尾、變色鳶

2、尾和維吉尼亞鳶尾)1對數(shù)據(jù)集進行初步的統(tǒng)計與分析(1)數(shù)據(jù)集的維度-dim dirr. )1 1E0 S(2)數(shù)據(jù)集中的列名-names(Iris)1 Sepal.LEngtri Sepal .Widt?irr Petal. Lengt?irr rrPetal. WidtArr5 Species(3)數(shù)據(jù)集的內(nèi)部結(jié)構(gòu)-str(4)數(shù)據(jù)集的屬性-attributes查看數(shù)據(jù)集的前五條數(shù)據(jù)情況12S13 二:,Sepal. Lezigt?!Sepal .Widtn Petal.LengtnPetal .WidtiiSpeeies15.13 . S1.40.2setosa4.93.01.40.2se

3、tosa34.73.21.30.2setosa44 .-63.11.50.2setosa55.03 M1.40.2setosa1查看數(shù)據(jù)集中屬性前10行數(shù)據(jù) i-isSepal.LerctnJ1 5.14.7 4.6 5.04.6 5.0(7 )顯示數(shù)據(jù)集中每個變量的分布情況-summary suimaiy (iris)Sepal .Length.WidthPetal. LenathPetal ,Widt-hSpeciesMin.=4.300Min-:2.000Mir.1.0D0Min.010Dsetosa:501st Qu .:5.1001st Qu.:2.3001st Qu -1.6001

4、st Qu .0.30Dversicolor-: 50Median:5.800Median:3.000Median4.350Median1-30Dvirginica : 50Meazi:5.843Mean;3.057Mean3 . 758Mean1 1993rd Qu.= 6.4003rd Qu.:3.3003rd 01 5.1D03rd Q口.1.80Di-fax.:7.900Max:1 00Max.6.900Max.2 SOD數(shù)據(jù)集列Species中各個值出現(xiàn)頻次 tatle (iristopecies)setosa versicolor virginica5050SO根據(jù)列Species

5、畫出餅圖-pie算出列的所有值的方差-varvar (Sepal. Lerct?:)1 D.6556335算出列iris$和iris$的協(xié)方差-covcov (z.rz.3S5epaL . Lect?firi3iFetaL.Lect?i)1 2.27431S算出列iris$和iris$的相關(guān)系數(shù)-cor cor (z.rz.3tBepaL. Lerctrir z.2sz.3tPetal. Lerctr:J 1 0.5717535(13)畫出列iris$分布柱狀圖a1Histogram of iris$Sepal.Length56iri s$ Sep a I. Length(15)畫出列iris

6、$和iris$的散點圖回國叵食一s費舄M4.55.05.56.06.57.07.5 B.OirisSepal.Lngth!_l寸(16)繪出矩陣各列的散布圖-plot2使用knn包進行Kmean聚類分析(1)將數(shù)據(jù)集進行備份newiris-iris,將列newiris$Species置為空newiris$Species (ktz = kma a nssr S)- JK-means clusterxno- with 3 clTjJtezs nE sizes 50. 38. 62Clojtcr rasm二:IClustrrinij sector:1 1111111137J 1111111173J

7、33333233|109| 2222233 215| 2 2 3 2 2 31111111111111111111111111332333333333333333333333333333332 22323232233222223 21111111113333333333232222 3 2Wirhiri cluster a al sqiares &y aluater s 1 15.15100 23.E7947 39.E2097(fceHeen_3S / total_55 = S8. %)Available canz-OBenca:1 clinscez*,-senteTa11p,cot9 2,r5 .wiLtiinssr, rrtecwean.33H, size9 *ifaultH,wi&hxnsa11n,lEerB,創(chuàng)建一個連續(xù)表,在三個聚類中分別統(tǒng)計各種花出現(xiàn)的次數(shù)-tabletable (irisSpaciesf kcjcluster)123setosa 50 0 Dversicolar 0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論