誤差分析課件 聚類分析之譜系聚類法_第1頁
誤差分析課件 聚類分析之譜系聚類法_第2頁
誤差分析課件 聚類分析之譜系聚類法_第3頁
誤差分析課件 聚類分析之譜系聚類法_第4頁
誤差分析課件 聚類分析之譜系聚類法_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 聚類分析之 -譜系聚類法1類間距離及其遞推公式譜系聚類法的應(yīng)用分析譜系聚類法的步驟譜系聚類2引言 譜系聚類法也稱為系統(tǒng)聚類法,是目前應(yīng)用較為廣泛的一種聚類方法,它根據(jù)植物分類學(xué)的思想對研究對象進(jìn)行分類。 在植物分類學(xué)中,分類的單位是:門、綱、目、科、屬、種,其中種是分類的基本單位。分類單位越小,它所包含的植物就越少,植物間的共同特征就越多。譜系聚類3 利用這種分類思想,譜系聚類法首先視各樣品自成一類,然后把最相似的樣品聚為小類,再將已聚合的小類按其相似性再聚合,隨著相似性的減弱,最后將一切子類都聚合成一個(gè)大類,從而得到一個(gè)按相近性大小聚結(jié)起來的譜系圖,再進(jìn)一步根據(jù)實(shí)際情況確定合適的分類個(gè)數(shù)。

2、譜系聚類4問題判斷兩個(gè)樣品最相似的依據(jù)是什么?譜系聚類5類間距離及其遞推公式 常用的類間距離有四種: 最短距離 最長距離 類平均距離 重心距離類間距離譜系聚類6 以 分別表示樣品 ,以 簡記 與 的距離 ,設(shè) 分別表示兩個(gè)類,它們分別含有 個(gè)樣品.我們用 來表示類 與 之間的距離.最短距離 即用兩類中樣品之間距離最短者作為兩類間的距離.譜系聚類7最長距離 即用兩類中樣品之間距離最長者作為這兩類間的距離.類平均距離 即用兩類中所有兩兩樣品之間的距離的平均作為兩類之間的距離.或者 即用兩類中所有兩兩樣品之間的平方距離的平均作為兩類間的平方距離.譜系聚類8重心距離設(shè)類 中的樣品為 , , ,則其均值

3、稱為類 的重心. 其中, , 分別是 的重心 ,即用兩類的重心之間的距離作為兩類間的距離.譜系聚類9 按照譜系聚類的思想,先將樣品聚合成小類,再逐步聚為大類.設(shè)類 由類 合并所得,則 包含 個(gè)樣品. 為了更方便地實(shí)現(xiàn)譜系聚類,我們需要建立類間距離的遞推公式,即計(jì)算類 與其他類 之間的距離. 類間距離的遞推公式譜系聚類10常用的四種類間距離的遞推公式最短距離最長距離譜系聚類11類平均距離對于類平均距離的下列定義方式 同理可得遞推公式如下: 譜系聚類12重心距離由 的合并集 的重心是 而 由 , 有 譜系聚類13 若采用歐氏距離的距離,以上介紹的4種類間距離的遞推公式可統(tǒng)一表示為 計(jì)算樣品之間 譜

4、系聚類14各種類間距離的參數(shù)如下表所示譜系聚類15譜系聚類法的步驟(1) n個(gè)樣品開始時(shí)作為n個(gè)類,計(jì)算兩兩之間的距離, 構(gòu)成一個(gè)對稱距離矩陣 此時(shí), 譜系聚類16 (2) 選擇 中主對角線以下(或以上)的最小距離,設(shè)這個(gè)元素是 ,這時(shí) ,首先將 合并為一個(gè)新類 .在 中消去 , 所對應(yīng)的行與列,并加入由新類 與剩下的其他未聚合的類間的距離所組成的一行和一列,得到一個(gè)更新的距離矩陣 ,它是 階方陣. (3) 從 出發(fā)重復(fù)步驟(2)的做法得 ,再由 出發(fā)重復(fù)上述步驟,直到 個(gè)樣品聚為一個(gè)大類為止. (4)在合并過程中要記下合并樣品的編號及兩類合并時(shí)的距離(稱為距離水平),并繪制聚類譜系圖. 譜系

5、聚類17譜系聚類法的應(yīng)用分析 核電企業(yè)對自身庫存的優(yōu)化管理 倉庫內(nèi)存貨位置擺放的合適與否會直接影響到總搬運(yùn)費(fèi)用、大修工作效率以及倉庫人員的工作積極性。因此將備品備件正確地分類存放是非常重要的。 應(yīng)用譜系聚類法中的最短距離法對核電企業(yè)的備品備件進(jìn)行分類, 然后根據(jù)分類的結(jié)果對這些類之間的關(guān)系做總結(jié)歸納。譜系聚類18譜系聚類法的應(yīng)用分析 將備品備件大致分為以下幾類:機(jī)械類: 緊固件、密封、軸承、過濾器、壓縮機(jī)、管道、 熱交換器等;電氣類: 熔斷器、斷路器、變壓器、電氣元件、電機(jī)、電纜等;儀表類: 電子元件、電路板、電源、工業(yè)計(jì)算機(jī)及備件、各種測量儀等;五金類: 金屬材料等;其他類: 焊接材料、潤滑

6、油、安全防護(hù)、消防器材等。譜系聚類19譜系聚類法的應(yīng)用分析 為了便于說明, 列舉了部分變量指標(biāo), 對這五類備品備件的各項(xiàng)變量打分如下表( 滿分10 分) : 譜系聚類20譜系聚類法的應(yīng)用分析 然后利用歐式距離公式,根據(jù)表內(nèi)的打分計(jì)算各類之間的相互距離, 得到矩陣如下:譜系聚類21譜系聚類法的應(yīng)用分析 由上述矩陣知, G4與G5之間距離最短, 所以組成一個(gè)新類G6。然后再用G6 與其他類再次比較,即用G6 里面的子類G4 與G5 分別與其他類的歐氏距離進(jìn)行比較, 選擇其中距離小的為兩類之間的距離。故得到新矩陣如下:譜系聚類22譜系聚類法的應(yīng)用分析 此時(shí), G3 與G6 之間的距離最短, 所以G3

7、、G4 和G5 共同組成一個(gè)新類G7, 同上述步驟一樣, 得出新的矩陣如下:譜系聚類23譜系聚類法的應(yīng)用分析 同理, G2 與G7 組成一個(gè)新類G8, G8 與G1 的歐氏距離為: 綜上所述, 我們在距離為11 的水平上首先合并五金類和其他類, 得到新類G6=G4, G5; 然后, 更新距離矩陣后又在距離為12 的水平上合并G3 與G6 得到新類G7=G3, G4, G5; 在距離為13 的水平上合并G2 與G7 為新類G8; 最后在距離為41 的水平上將G1 與G8 合并成一個(gè)大類。 譜系聚類24譜系聚類法的應(yīng)用分析 將上述聚類過程連同合并時(shí)的水平用圖表示出來, 可以畫出譜系圖如下:譜系聚類25譜系聚類法的應(yīng)用分析 由此可見, 這五類歸納為兩類比較合適, 即電氣類、儀表類、五金類和其他類為一類, 機(jī)械類自成一類。 把聚類結(jié)果按照現(xiàn)實(shí)中的具體情況再加

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論