版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
聚類分析目錄CONTENTSK-Means聚類
系統(tǒng)聚類
目的與方法
二階聚類
一、目的與方法01K-Means聚類-快速聚類1.聚類分析是對(duì)樣本和變量進(jìn)行分析的一種統(tǒng)計(jì)方法。目的是根據(jù)事物本性的特性,將相似的事物歸類。被歸為一類的生物具有較高的相似性,不同類間的事物有著很大的差異。2.不同類型的數(shù)據(jù)計(jì)算距離遠(yuǎn)近的方法(1)定距型變量:歐氏距離、平方歐氏距離、契比雪夫距離(2)定序型變量:卡方距離、Phi距離(3)二值變量:簡單相關(guān)系數(shù)、雅可比系數(shù)3.分類過程的:快速聚類、系統(tǒng)聚類和兩步聚類
二、K-Means聚類及其實(shí)現(xiàn)過程K-Means聚類01實(shí)現(xiàn)過程0201K-Means聚類1.K-Means聚類也稱快速聚類,是MacQueen于1967年提出的。它將數(shù)據(jù)看成k維空間上的點(diǎn),以距離作為測度個(gè)體“親疏程變”的指標(biāo),并通過犧牲多個(gè)解為代價(jià)換得高的執(zhí)行效率。2.參與聚類分析的變量必須是數(shù)值型變量,且至少要有1個(gè)。3.指定一個(gè)表明觀測量特征的變量作為標(biāo)示變量。02K-Means聚類的實(shí)現(xiàn)過程分析(A)-分類(F)-K-均值聚類-參數(shù)設(shè)定-確定操作過程
【例】研究者統(tǒng)計(jì)了某班級(jí)學(xué)生身高、體重與肺活量三類數(shù)據(jù),請(qǐng)使用快速聚類,將29個(gè)學(xué)生分成3類。
三、系統(tǒng)聚類系統(tǒng)聚類01實(shí)現(xiàn)過程0201系統(tǒng)聚類-分層聚類系統(tǒng)聚類也稱為分層聚類,首先將一定數(shù)量的樣品或指標(biāo)各自看成一類,根據(jù)樣品(或指標(biāo))的親疏程度,將親疏程度最高的兩類進(jìn)行合并,然后考慮合并后的類與其他類之間的親疏程度,再進(jìn)行合并。2.分系統(tǒng)聚類分為Q型聚類和R型聚類兩種:Q型聚類是對(duì)樣本進(jìn)行聚類,R型聚類是對(duì)變量進(jìn)行聚類02系統(tǒng)聚類的實(shí)現(xiàn)過程分析(A)-分類(F)-系統(tǒng)聚類-參數(shù)設(shè)定-確定操作過程
【例】某市場調(diào)查公司對(duì)5個(gè)商場從購物環(huán)境和服務(wù)質(zhì)量兩個(gè)方面進(jìn)行的評(píng)價(jià),請(qǐng)使用層次聚類,對(duì)5個(gè)商場進(jìn)行分類。
四、二階聚類二階聚類01實(shí)現(xiàn)過程0201二階聚類二階聚類也稱為兩步聚類:第一步,構(gòu)建一個(gè)分類的特征樹(CF);第二步,使用凝聚算法對(duì)特征樹的葉節(jié)點(diǎn)進(jìn)行分組。二階聚類是一個(gè)探索性的分析工具,主要是用來揭示原始數(shù)據(jù)的自然的分類或分組。該方法能同時(shí)處理分類變量和連續(xù)變量。02二階聚類的實(shí)現(xiàn)過程分析(A)-分類(F)-二階聚類-參數(shù)設(shè)定-確定操作過程
【例】有一份關(guān)于企業(yè)員工收入情況的調(diào)查數(shù)據(jù),研究
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度蟲草市場調(diào)研與收購信息共享合同3篇
- 2025年度個(gè)人二手車買賣雙方權(quán)益保障合同
- 2025年度老舊小區(qū)改造工程承包合同書12篇
- 二零二四年度醫(yī)院醫(yī)療廢棄物收集運(yùn)輸合同3篇
- 二零二五年度定制木門安裝與環(huán)保檢測合同4篇
- 二零二五年度智能化農(nóng)機(jī)設(shè)備交易合作合同4篇
- 2025年度農(nóng)民工勞動(dòng)合同簽訂與職業(yè)健康保障協(xié)議3篇
- 2025年度個(gè)人戶外活動(dòng)貸款合同擔(dān)保書與安全風(fēng)險(xiǎn)評(píng)估4篇
- 2025版互聯(lián)網(wǎng)數(shù)據(jù)中心股東權(quán)益轉(zhuǎn)移合同4篇
- 二零二五年度面粉行業(yè)新零售模式代理銷售合同范本2篇
- 安檢人員培訓(xùn)
- 山東省濰坊市2024-2025學(xué)年高三上學(xué)期1月期末 英語試題
- 危險(xiǎn)性較大分部分項(xiàng)工程及施工現(xiàn)場易發(fā)生重大事故的部位、環(huán)節(jié)的預(yù)防監(jiān)控措施
- 《榜樣9》觀后感心得體會(huì)四
- 2023事業(yè)單位筆試《公共基礎(chǔ)知識(shí)》備考題庫(含答案)
- 化學(xué)-廣東省廣州市2024-2025學(xué)年高一上學(xué)期期末檢測卷(一)試題和答案
- 2025四川中煙招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- EHS工程師招聘筆試題與參考答案(某大型央企)2024年
- 營銷策劃 -麗亭酒店品牌年度傳播規(guī)劃方案
- 2025年中國蛋糕行業(yè)市場規(guī)模及發(fā)展前景研究報(bào)告(智研咨詢發(fā)布)
- 潤滑油過濾培訓(xùn)
評(píng)論
0/150
提交評(píng)論