




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
聚類分析宋宜飛基于密度方法的聚類全解聚類分析宋宜飛主要內(nèi)容回顧密度聚類方法DBSCAN算法OPTICS算法網(wǎng)格聚類方法CLIQUE算法回顧>聚類聚類(lustering也稱為聚類分析指將樣本分到不同的組中使得同組中的樣本差異盡可能的小,而不同組中的樣本差異盡可能的大聚類得到的不同的組稱為簇(cluster)個好的聚類方法將產(chǎn)生以下的聚類最大化類中的相似性好最小化類間的相似性主要內(nèi)容回顧密度聚類方法DBSCAN算法OPTICS算法網(wǎng)格聚類方法CLIQUE算法回顧>聚類聚類(lustering也稱為聚類分析指將樣本分到不同的組中使得同組中的樣本差異盡可能的小,而不同組中的樣本差異盡可能的大聚類得到的不同的組稱為簇(cluster)個好的聚類方法將產(chǎn)生以下的聚類最大化類中的相似性好最小化類間的相似性回顧聚類的分類劃分采類方法層次聚類方法度聚類方法網(wǎng)格聚類方法模型聚類方法劃分聚類方法在基于劃分的聚類中,任務(wù)就是將數(shù)據(jù)劃分成K個不相交的點集,使每個子集中的點盡可能同質(zhì)?;趧澐值姆椒?其代表算法有k-means算法、K-medoids等k-means算法k-means算法基本步驟1.從n個數(shù)據(jù)對象任意選擇k個對象作為初始聚類中心2.根據(jù)每個聚類對象的均值(中心對象),計算每個對象與這些中心對象的距離并根據(jù)最小距離重新對相應(yīng)對象進行劃分:3.重新計算每個(有變化)聚類的均值(中心對象)4.計算標(biāo)準(zhǔn)測度函數(shù),當(dāng)滿足一定條件,如函數(shù)收斂時,則算法終止;如果條件不滿足則回到步驟2。k-means優(yōu)缺點主要優(yōu)點〔是解決聚類問題的一種經(jīng)典算法,簡單、快速弩對處理大數(shù)據(jù)集,該算法是相對可伸縮和高效率的弩當(dāng)結(jié)果簇是密集的,它的效果較好。主要缺點〔在簇的平均值被定義的情況下才能使用必須事先給出k(要生成的簇的數(shù)目),而且對初值敏感,對于不同的初始值,可能會導(dǎo)致不同結(jié)果。不適合于發(fā)現(xiàn)非凸面形狀的簇或者大小差別很大的簇。而且,它對于“躁聲”和孤立點數(shù)據(jù)是敏感的。層次聚類方法層次聚類方法對給定的數(shù)據(jù)集進行層次的分解,直到某種條件滿足為止。具體又可分為凝聚的層次聚類:一種自底向上的策略,首先將每個對象作為一個簇然后合并這些原子簇為越來越大的簇,直到某個終結(jié)條件被滿足分裂的層次聚類:采用自頂向下的策略,它首先將所有對象置于一個簇中,然后逐漸細分為越來越小的簇,直到達到了某個終結(jié)條件。層次凝聚的代表是AGNES算法。層次分裂的代表是DIANA算法層次聚類優(yōu)缺點層次聚類方法是不可逆的,也就是說,當(dāng)通過凝聚式的方法將兩組合并后,無法通過分裂式的辦法再將其分離到之前的狀態(tài),反之亦然另外,層次聚類過程中調(diào)查者必須決定聚類在什么時候停止,以得到某個數(shù)量的分類在不必要的情況下應(yīng)該小心使用層次聚類方法密度聚類方法劃分聚類方法層次聚拱方法密度聚樊方法:基于密度的聚類方法以數(shù)據(jù)集
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年保安證考試數(shù)據(jù)試題及答案
- 科學(xué)備考保安證試題及答案
- 2025年保安證考試互動學(xué)習(xí)試題及答案
- 新能源光伏組件
- 2025年保安證考試價值梳理試題及答案
- 2025年保安證考試課程設(shè)計試題及答案
- 2025年保安證考試案例研究試題及答案
- 寧夏警官職業(yè)學(xué)院《數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)綜合實訓(xùn)》2023-2024學(xué)年第二學(xué)期期末試卷
- 保安證考試名師分享試題及答案
- 浙江樹人學(xué)院《蘇州傳統(tǒng)民間藝術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- DB11-T 1832.8-2022建筑工程施工工藝規(guī)程 第8部分:門窗工程
- 質(zhì)量管理小組QC活動知識培訓(xùn)講義122頁(PPT 圖表豐富)_ppt
- 《綠化養(yǎng)護服務(wù)協(xié)議》
- 醫(yī)療期規(guī)定(表格化)
- 電子營業(yè)執(zhí)照下載確認(rèn)書
- FANUC機器人培訓(xùn)教程(完成版)(PPT134頁)
- 油缸設(shè)計規(guī)范(企業(yè)標(biāo)準(zhǔn))QB2
- 新版《義務(wù)教育英語課程標(biāo)準(zhǔn)(2022年版)》PPT課件
- 認(rèn)識昆蟲.ppt
- 體育測量與評價PPT課件-第三章 身體形態(tài)的測量與評價
- 小學(xué)生電力科普小講座PPT課件
評論
0/150
提交評論