多元統(tǒng)計分析及R語言建模(第五版)課件第六七章_第1頁
多元統(tǒng)計分析及R語言建模(第五版)課件第六七章_第2頁
多元統(tǒng)計分析及R語言建模(第五版)課件第六七章_第3頁
多元統(tǒng)計分析及R語言建模(第五版)課件第六七章_第4頁
多元統(tǒng)計分析及R語言建模(第五版)課件第六七章_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第6章 判別分析及R使用多元統(tǒng)計分析及R語言建模 第6章 判別分析及R使用多元統(tǒng)計分析及R語言建模 多元統(tǒng)計分析及R語言建模6 判別分析及R使用多元統(tǒng)計分析及R語言建模6 判別分析及R使用多元統(tǒng)計分析及R語言建模6 判別分析及R使用基本要求理解判別分析的目的及其統(tǒng)計思想了解并熟悉判別分析的三種類型掌握不同判別方法的判別規(guī)則和判別函數(shù)利用R語言程序,實際計算教材中的習(xí)題多元統(tǒng)計分析及R語言建模6 判別分析及R使用基本要求理解判別多元統(tǒng)計分析及R語言建模6 判別分析及R使用主要內(nèi)容判別分析的目的和意義幾種判別分析準則和性質(zhì) 包括Fisher判別法、距離判別法、Bayes判別法R語言程序中有關(guān)判別分

2、析的算法多元統(tǒng)計分析及R語言建模6 判別分析及R使用主要內(nèi)容判別分析6 判別分析及R使用6.1 判別分析的概念概念和方法判別分析概念判別分析方法 是在已知的分類之下,對新的樣本,可以利用此法選定一判別標準,以判定將該新樣品放置于哪個類中。 判別分析(Discriminat Analysis)是多元分析中用于判別樣本所屬類型的一種統(tǒng)計分析方法。6 判別分析及R使用6.1 判別分析的概念概念和方法判別分析6 判別分析及R使用6.1 判別分析的概念判別分析的種類一、確定性判別:Fisher型判別 (1)線性型 (2)距離型 (3)非線性型二、概率性判別:Bayes型判別 (1)概率型 (2)損失型6

3、 判別分析及R使用6.1 判別分析的概念判別分析的種類一、6 判別分析及R使用6.2 線性判別分析 6 判別分析及R使用6.2 線性判別分析 6 判別分析及R使用6.2 線性判別分析 一、求Fisher線性判別函數(shù)二、計算判別界值三、建立判別標準6 判別分析及R使用6.2 線性判別分析 一、求Fisher6 判別分析及R使用6.2 線性判別分析【例6.1】今天和昨天濕溫差 x1及氣溫差x2是預(yù)報明天 下雨否的其中兩個重要因子, 試建立Fisher線性判別函數(shù)如測得今天 x1=8.1, x2=2.0試報明天是雨天還是晴天?6 判別分析及R使用6.2 線性判別分析【例6.1】今天和昨6 判別分析及

4、R使用6.2 線性判別分析一、基本統(tǒng)計分析6 判別分析及R使用6.2 線性判別分析一、基本統(tǒng)計分析6 判別分析及R使用6.2 線性判別分析二、Logistic模型分析6 判別分析及R使用6.2 線性判別分析二、Logistic6 判別分析及R使用6.2 線性判別分析三、Fisher判別分析6 判別分析及R使用6.2 線性判別分析三、Fisher判別6 判別分析及R使用6.2 線性判別分析6 判別分析及R使用6.2 線性判別分析6 判別分析及R使用6.3 距離判別法6.3.1 兩總體距離判別馬氏距離:判別準則:6 判別分析及R使用6.3 距離判別法6.3.1 兩總體距離6 判別分析及R使用6.3

5、 距離判別法6.3.1 兩總體距離判別一、等方差陣:直線判別6 判別分析及R使用6.3 距離判別法6.3.1 兩總體距離6 判別分析及R使用6.3 距離判別法6.3.1 兩總體距離判別二、異方差陣:曲線判別6 判別分析及R使用6.3 距離判別法6.3.1 兩總體距離6 判別分析及R使用6.3 距離判別法【例6.2】對例6.1天氣數(shù)據(jù)做距離判別分析6 判別分析及R使用6.3 距離判別法【例6.2】對例6.16 判別分析及R使用6.3 距離判別法6.3.2 多總體距離判別一、協(xié)方差矩陣相同:線性判別6 判別分析及R使用6.3 距離判別法6.3.2 多總體距離6 判別分析及R使用6.3 距離判別法6

6、.3.2 多總體距離判別二、協(xié)方差矩陣不同:非線性判別6 判別分析及R使用6.3 距離判別法6.3.2 多總體距離6 判別分析及R使用6.3 距離判別法【例6.3】電視機品牌調(diào)查分析20 個電視機 5 種暢銷 8 種平銷 7 種滯銷試建立判別函數(shù),當(dāng)一新產(chǎn)品其質(zhì)量評分為8.0, 功能評分為7.5, 銷售價格為65百元,問該廠產(chǎn)品的銷售前景如何?6 判別分析及R使用6.3 距離判別法【例6.3】電視機品牌6 判別分析及R使用6.3 距離判別法6 判別分析及R使用6.3 距離判別法6 判別分析及R使用6.3 距離判別法1. 線性判別(等方差)1 0.96 判別分析及R使用6.3 距離判別法1. 線

7、性判別(等方差6 判別分析及R使用6.3 距離判別法6 判別分析及R使用6.3 距離判別法6 判別分析及R使用6.3 距離判別法2. 二次判別(異方差)1 0.956 判別分析及R使用6.3 距離判別法2. 二次判別(異方差6 判別分析及R使用6.4 Bayes 判別法6.4.1 Bayes判別準則Fisher判別缺點Bayes判別準則一是判別方法與各總體出現(xiàn)的概率無關(guān)二是判別方法與錯判后造成的損失無關(guān)以個體歸屬于某類的概率(或判別值)最大或錯判總平均損失最小為標準6 判別分析及R使用6.4 Bayes 判別法6.4.1 B6 判別分析及R使用6.4 Bayes 判別法6.4.1 Bayes判

8、別準則一、概率判別k個總體的先驗概率密度函數(shù)分別為x來自第j類的后驗概率為 (Bayes公式) 6 判別分析及R使用6.4 Bayes 判別法6.4.1 B6 判別分析及R使用6.4 Bayes 判別法6.4.1 Bayes判別準則二、損失判別 x錯判為第g總體的平均損失6 判別分析及R使用6.4 Bayes 判別法6.4.1 B6 判別分析及R使用6.4 Bayes 判別法6.4.2 正態(tài)總體的Bayes判別一、Bayes判別函數(shù)求解k個總體的先驗概率密度函數(shù)分別為6 判別分析及R使用6.4 Bayes 判別法6.4.2 正6 判別分析及R使用6.4 Bayes 判別法6.4.2 正態(tài)總體的

9、Bayes判別二、協(xié)方差陣相等情形6 判別分析及R使用6.4 Bayes 判別法6.4.2 正6 判別分析及R使用6.4 Bayes 判別法6.4.2 正態(tài)總體的Bayes判別三、后驗概率的計算6 判別分析及R使用6.4 Bayes 判別法6.4.2 正6 判別分析及R使用6.4 Bayes 判別法【例6.4】對例6.3數(shù)據(jù)應(yīng)用Bayes判別法進行判別(1)先驗概率相等:6 判別分析及R使用6.4 Bayes 判別法【例6.4】對6 判別分析及R使用6.4 Bayes 判別法【例6.4】對例6.3數(shù)據(jù)應(yīng)用Bayes判別法進行判別(2)先驗概率不等6 判別分析及R使用6.4 Bayes 判別法【

10、例6.4】對6 判別分析及R使用6.4 Bayes 判別法兩種結(jié)果比較:6 判別分析及R使用6.4 Bayes 判別法兩種結(jié)果比較:兩種結(jié)果比較兩種結(jié)果比較6 判別分析及R使用6.4 Bayes 判別法兩種結(jié)果比較6 判別分析及R使用6.4 Bayes 判別法兩種結(jié)果比較6 判別分析及R使用小結(jié)1. 判別分析方法是按已知所屬組的樣本確定判別函數(shù),制定判別規(guī)則,然后再判斷每一個新樣品應(yīng)屬于哪一類。2. 常用的判別方法有Fisher判別、距離判別、貝葉斯判別等,每個方法根據(jù)其出發(fā)點不同各有其特點。3. Fisher類判別對判別變量的分布類型并無要求,而Bayes類判別要變量的分布類型。因此,F(xiàn)is

11、her類判別較Bayes類判別簡單一些。4. 當(dāng)兩個總體時,若它們的協(xié)方差矩陣相同,則距離判別和Fisher判別等價。當(dāng)變量服從正態(tài)分布時,它們還和Bayes判別等價。5. 判別分析中的各種誤判的后果允許看作是相同的,通常將犯第一類錯誤的后果看得更嚴重些,但本章對此關(guān)注的不夠。6 判別分析及R使用小結(jié)1. 判別分析方法是按已知所屬組的樣6 判別分析及R使用第六章講到這里就結(jié)束了歡迎大家繼續(xù)學(xué)習(xí)第七章!6 判別分析及R使用第六章第7章 聚類分析及R使用多元統(tǒng)計分析及R語言建模 第7章 聚類分析及R使用多元統(tǒng)計分析及R語言建模 多元統(tǒng)計分析及R語言建模7 聚類分析及R使用多元統(tǒng)計分析及R語言建模7

12、 聚類分析及R使用多元統(tǒng)計分析及R語言建模7 聚類分析及R使用基本要求理解聚類分析的目的意義及統(tǒng)計思想了解變量類型的幾種尺度定義熟悉Q型和R型聚類分析的統(tǒng)計量的定義了解六種系統(tǒng)聚類方法及它們的統(tǒng)一公式掌握R語言中六種方法的具體使用步驟了解R語言中快速聚類的基本思想和用法多元統(tǒng)計分析及R語言建模7 聚類分析及R使用基本要求理解聚類多元統(tǒng)計分析及R語言建模7 聚類分析及R使用主要內(nèi)容聚類分析的目的和意義聚類分析中所使用的幾種尺度的定義初步掌握選用聚類方法與相應(yīng)距離的原則六種系統(tǒng)聚類方法的定義及其基本性質(zhì)R語言程序中有關(guān)聚類分析的算法基礎(chǔ)掌握R語言中kmeans聚類的方法和用法多元統(tǒng)計分析及R語言建

13、模7 聚類分析及R使用主要內(nèi)容聚類分析7 聚類分析及R使用7.1 聚類分析的概念和類型概念和方法基本概念聚類分析法(Cluster Analysis)是研究“物以類聚”的一種現(xiàn)代統(tǒng)計分析方法,在眾多的領(lǐng)域中,都需要采用聚類分析作分類研究。分析方法7 聚類分析及R使用7.1 聚類分析的概念和類型概念和方法基7 聚類分析及R使用7.1 聚類分析的概念和類型 7 聚類分析及R使用7.1 聚類分析的概念和類型 7 聚類分析及R使用7.1 聚類分析的概念和類型 【例7.1】兩個變量、九個樣品數(shù)據(jù)及其散點圖7 聚類分析及R使用7.1 聚類分析的概念和類型 【例7.17 聚類分析及R使用7.2 聚類統(tǒng)計量7

14、 聚類分析及R使用7.2 聚類統(tǒng)計量7 聚類分析及R使用7.2 聚類統(tǒng)計量距離矩陣相關(guān)矩陣7 聚類分析及R使用7.2 聚類統(tǒng)計量距離矩陣相關(guān)矩陣7 聚類分析及R使用7.2 聚類統(tǒng)計量相關(guān)系數(shù)矩陣:cor(X)7 聚類分析及R使用7.2 聚類統(tǒng)計量相關(guān)系數(shù)矩陣:cor(7 聚類分析及R使用7.2 聚類統(tǒng)計量7 聚類分析及R使用7.2 聚類統(tǒng)計量多元統(tǒng)計分析及R語言建模(第五版)課件第六七章7 聚類分析及R使用7.3 系統(tǒng)聚類法 先將個樣品分成類,每個樣品自成一類,然后每次將具有最小距離的兩類合并,合并后重新計算類與類之間的距離,這個過程一直繼續(xù)到所有的樣品歸為一類為止,并把這個過程做成一張系統(tǒng)聚

15、類圖。系統(tǒng)聚類法的基本思想7 聚類分析及R使用7.3 系統(tǒng)聚類法 先將個樣品分成類7 聚類分析及R使用7.3 系統(tǒng)聚類法類間距離計算方法(1)最短距離法(single)(2)最長距離法(complete)(3)中間距離法(median)(4)類平均法(average)(5)重心法(centroid)(6)離差平方和法(Ward)7 聚類分析及R使用7.3 系統(tǒng)聚類法類間距離計算方法(1)類間距離計算公式類間距離計算公式7 聚類分析及R使用7.3 系統(tǒng)聚類法7 聚類分析及R使用7.3 系統(tǒng)聚類法7 聚類分析及R使用7.3 系統(tǒng)聚類法系統(tǒng)聚類法過程(1)計算n個樣品兩兩間的距離(2)構(gòu)造n個類,每

16、類包含1個樣品(3)合并距離最近兩類為新類(4)計算新類與各類距離,若類個數(shù)為1,轉(zhuǎn)到第5步,否則回到第3步(4)繪制系統(tǒng)聚類圖(5)確定類的個數(shù)和樣品名稱7 聚類分析及R使用7.3 系統(tǒng)聚類法系統(tǒng)聚類法(1)計算n例7-1數(shù)據(jù)的系統(tǒng)聚類最短距離法(采用歐氏距離)例7-1數(shù)據(jù)的系統(tǒng)聚類最短距離法(采用歐氏距離)例7-1數(shù)據(jù)的系統(tǒng)聚類最長距離法(采用歐氏距離)例7-1數(shù)據(jù)的系統(tǒng)聚類最長距離法(采用歐氏距離)例7-1數(shù)據(jù)的系統(tǒng)聚類例7-1數(shù)據(jù)的系統(tǒng)聚類7 聚類分析及R使用7.3 系統(tǒng)聚類法系統(tǒng)聚類R語言步驟一、計算距離陣: dist二、進行系統(tǒng)聚類: hclust三、繪制聚類圖: plot四、畫分

17、類框: rect.hclust五、確認分類結(jié)果: cutree7 聚類分析及R使用7.3 系統(tǒng)聚類法系統(tǒng)聚類一、計算距離陣【例7.2】續(xù)例3.1,研究全國31個省、市、自治區(qū)2007年城鎮(zhèn)居民生活消費的分布規(guī)律,根據(jù)調(diào)查資料做區(qū)域消費類型劃分?!纠?.2】續(xù)例3.1,研究全國31個省、市、自治區(qū)2007多元統(tǒng)計分析及R語言建模(第五版)課件第六七章多元統(tǒng)計分析及R語言建模(第五版)課件第六七章多元統(tǒng)計分析及R語言建模(第五版)課件第六七章多元統(tǒng)計分析及R語言建模(第五版)課件第六七章多元統(tǒng)計分析及R語言建模(第五版)課件第六七章多元統(tǒng)計分析及R語言建模(第五版)課件第六七章多元統(tǒng)計分析及R語言

18、建模(第五版)課件第六七章多元統(tǒng)計分析及R語言建模(第五版)課件第六七章多元統(tǒng)計分析及R語言建模(第五版)課件第六七章多元統(tǒng)計分析及R語言建模(第五版)課件第六七章多元統(tǒng)計分析及R語言建模(第五版)課件第六七章7 聚類分析及R使用7.4 kmeans聚類法概念和原理概念 kmeans法是一種快速聚類法,這種算法的基本思想是將每一個樣品分配給最近中心(均值)的類中。原理 kmeans算法以k為參數(shù),把n個對象分為k個類,使類內(nèi)具有較高的相似度,類間的相似度較低。7 聚類分析及R使用7.4 kmeans聚類法概念和原理概念7 聚類分析及R使用7.4 kmeans聚類法概念和原理相似度計算是根據(jù)類中對象的均值mean來進行7 聚類分析及R使用7.4 kmeans聚類法概念和原理相似7 聚類分析及R使用7.4 kmeans 聚類法【例7.3】kmeans算法的R語言實現(xiàn)及模擬分析:模擬正態(tài)隨機變量7 聚類分析及R使用7.4 kmeans 聚類法【例7.3】多元統(tǒng)計分析及R語言建模(第五版)課件第六七章7 聚類分析及R使用7.4 kmeans 聚類法7 聚類分析及R使用7.4 kmeans 聚類法7 聚類分析及R使用7.4 kmeans聚類法模擬10個變量2000個樣品的正

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論