版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘?qū)嶒瀳蟾嬖?(部): 管理工程學院專 業(yè):信息管理與信息系統(tǒng)實驗項目:班 級:信管112姓 名:學 號:02聚類分析實驗指導書實驗目的:1熟悉R語言的相關(guān)對象與函數(shù)的用法2掌握利用R進行聚類分析的基本步驟實驗內(nèi)容:說明:本實驗采用iris數(shù)據(jù)集,下面中的數(shù)據(jù)集如無上下文說明,即是指irisiris以鳶尾花的特征作為數(shù)據(jù)來源,數(shù)據(jù)集包含150個數(shù)據(jù)集,分為3類,每類50個數(shù)據(jù), 每個數(shù)據(jù)包含4個屬性,是在數(shù)據(jù)挖掘、數(shù)據(jù)分類中非常常用的測試集、訓練集。四個屬性分別為:花萼長度、花萼寬帶、花瓣長度、花瓣寬度三類分別為:setosa, versicolor, virginica(山鳶尾、變色鳶
2、尾和維吉尼亞鳶尾)1對數(shù)據(jù)集進行初步的統(tǒng)計與分析(1)數(shù)據(jù)集的維度-dim dirr. )1 1E0 S(2)數(shù)據(jù)集中的列名-names(Iris)1 Sepal.LEngtri Sepal .Widt?irr Petal. Lengt?irr rrPetal. WidtArr5 Species(3)數(shù)據(jù)集的內(nèi)部結(jié)構(gòu)-str(4)數(shù)據(jù)集的屬性-attributes查看數(shù)據(jù)集的前五條數(shù)據(jù)情況12S13 二:,Sepal. Lezigt?!Sepal .Widtn Petal.LengtnPetal .WidtiiSpeeies15.13 . S1.40.2setosa4.93.01.40.2se
3、tosa34.73.21.30.2setosa44 .-63.11.50.2setosa55.03 M1.40.2setosa1查看數(shù)據(jù)集中屬性前10行數(shù)據(jù) i-isSepal.LerctnJ1 5.14.7 4.6 5.04.6 5.0(7 )顯示數(shù)據(jù)集中每個變量的分布情況-summary suimaiy (iris)Sepal .Length.WidthPetal. LenathPetal ,Widt-hSpeciesMin.=4.300Min-:2.000Mir.1.0D0Min.010Dsetosa:501st Qu .:5.1001st Qu.:2.3001st Qu -1.6001
4、st Qu .0.30Dversicolor-: 50Median:5.800Median:3.000Median4.350Median1-30Dvirginica : 50Meazi:5.843Mean;3.057Mean3 . 758Mean1 1993rd Qu.= 6.4003rd Qu.:3.3003rd 01 5.1D03rd Q口.1.80Di-fax.:7.900Max:1 00Max.6.900Max.2 SOD數(shù)據(jù)集列Species中各個值出現(xiàn)頻次 tatle (iristopecies)setosa versicolor virginica5050SO根據(jù)列Species
5、畫出餅圖-pie算出列的所有值的方差-varvar (Sepal. Lerct?:)1 D.6556335算出列iris$和iris$的協(xié)方差-covcov (z.rz.3S5epaL . Lect?firi3iFetaL.Lect?i)1 2.27431S算出列iris$和iris$的相關(guān)系數(shù)-cor cor (z.rz.3tBepaL. Lerctrir z.2sz.3tPetal. Lerctr:J 1 0.5717535(13)畫出列iris$分布柱狀圖a1Histogram of iris$Sepal.Length56iri s$ Sep a I. Length(15)畫出列iris
6、$和iris$的散點圖回國叵食一s費舄M4.55.05.56.06.57.07.5 B.OirisSepal.Lngth!_l寸(16)繪出矩陣各列的散布圖-plot2使用knn包進行Kmean聚類分析(1)將數(shù)據(jù)集進行備份newiris-iris,將列newiris$Species置為空newiris$Species (ktz = kma a nssr S)- JK-means clusterxno- with 3 clTjJtezs nE sizes 50. 38. 62Clojtcr rasm二:IClustrrinij sector:1 1111111137J 1111111173J
7、33333233|109| 2222233 215| 2 2 3 2 2 31111111111111111111111111332333333333333333333333333333332 22323232233222223 21111111113333333333232222 3 2Wirhiri cluster a al sqiares &y aluater s 1 15.15100 23.E7947 39.E2097(fceHeen_3S / total_55 = S8. %)Available canz-OBenca:1 clinscez*,-senteTa11p,cot9 2,r5 .wiLtiinssr, rrtecwean.33H, size9 *ifaultH,wi&hxnsa11n,lEerB,創(chuàng)建一個連續(xù)表,在三個聚類中分別統(tǒng)計各種花出現(xiàn)的次數(shù)-tabletable (irisSpaciesf kcjcluster)123setosa 50 0 Dversicolar 0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年芳綸纖維合作協(xié)議書
- 2024年路機車項目合作計劃書
- ?小學一年級描寫季節(jié)的作文10篇
- 小學一年級關(guān)于秋天的手抄報文字內(nèi)容
- ?小學二年級語文作文(十篇)
- T145-生命科學試劑-MCE
- Sulfamonomethoxine-Standard-生命科學試劑-MCE
- 高中英語走遍美國第五課中英文對照素材
- 2025屆高考數(shù)學統(tǒng)考一輪復習課后限時集訓71算法與程序框圖理含解析新人教版
- RS485水表使用說明書范本
- 2023年高中學業(yè)水平考核美術(shù)試題
- 質(zhì)保書模板(2024版)
- 統(tǒng)編版2024年新教材七年級上冊道德與法治8.1《認識生命》教案
- 注水泵工(中級)技能鑒定理論考試題庫(含答案)
- 胃癌介入治療的臨床分析與療效評價課件
- DL∕T 1683-2017 1000MW等級超超臨界機組運行導則
- 2024年(學習強國)思想政治理論知識考試題庫與答案
- 基于LoRa通信的智能家居系統(tǒng)設計及研究
- 心臟驟停與心源性猝死的急救與護理課件
- 河南省鄭州市鄭州一八聯(lián)合國際學校2025屆物理九年級第一學期期中考試模擬試題含解析
- 地球物理勘探合同范本
評論
0/150
提交評論