版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通第八章第八章 判別分析判別分析l 判別分析簡(jiǎn)介l 一般判別分析l 典型判別分析l 逐步判別分析sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通一、判別分析簡(jiǎn)介一、判別分析簡(jiǎn)介 判別分析是一種應(yīng)用性很強(qiáng)的統(tǒng)計(jì)方法。它通常是根據(jù)已有的數(shù)據(jù)資料,來(lái)建立一種判別方法,然后再來(lái)判斷一個(gè)新的樣品歸屬于哪一類(lèi)。 例如,醫(yī)院擁有以往就診的各種病人的資料,包括他們的心率、血壓、體溫、化驗(yàn)指標(biāo)等很多數(shù)據(jù)?,F(xiàn)在有一個(gè)新的病人來(lái)醫(yī)院就診,對(duì)他也測(cè)量了相關(guān)的指標(biāo)數(shù)據(jù),要判斷他患有哪一種病,這就屬于一個(gè)判別歸類(lèi)的問(wèn)題。又如,在礦產(chǎn)勘探中積累了豐富
2、的地質(zhì)資料,現(xiàn)在某地區(qū)新采到了一個(gè)巖石標(biāo)本,要從它的基本特征判斷該地區(qū)有無(wú)礦產(chǎn),是貧礦還是富礦,則也需要進(jìn)行判別分析。sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通二、一般判別分析二、一般判別分析1、距離判別法、距離判別法 距離判別法是通過(guò)計(jì)算距離函數(shù)來(lái)進(jìn)行判別,即樣品與哪個(gè)總體之間的距離最近,則判斷它屬于哪個(gè)總體。如何衡量樣品與總體間的這種抽象的距離?我們一般利用馬氏距離來(lái)描述。 sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通二、一般判別分析二、一般判別分析2、bayes判別法判別法 前一節(jié)介紹距離判別法十分簡(jiǎn)便實(shí)用,但是也存在一些缺點(diǎn)。例如,距離判別法沒(méi)有考
3、慮到關(guān)于總體的先驗(yàn)概率,而且沒(méi)有考慮可能出現(xiàn)錯(cuò)判而帶來(lái)的損失。bayes判別法正是為了克服這些缺陷而提出來(lái)的一種判別方法。 bayes判別法是基于bayes統(tǒng)計(jì)的思想,即假定事先對(duì)所研究的對(duì)象有一定的了解,并通過(guò)先驗(yàn)概率分布來(lái)進(jìn)行描述,當(dāng)抽取樣本后,用樣本來(lái)修正先驗(yàn)概率分布,并得到后驗(yàn)概率分布,然后根據(jù)后驗(yàn)概率分布進(jìn)行各種統(tǒng)計(jì)推斷。 bayes判別法首先計(jì)算給定樣品屬于各個(gè)總體的條件概率,然后比較這些概率值的大小,將樣品判歸于條件概率最大的總體。 sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通一般判別分析一般判別分析discrim過(guò)程過(guò)程proc discrim data=數(shù)據(jù)
4、集名 ; class 分類(lèi)變量名; var 變量名列表; priors 概率值; by 分組變量名;run;sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通一般判別分析一般判別分析discrim過(guò)程過(guò)程sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通一般判別分析一般判別分析discrim過(guò)程過(guò)程sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通二、一般判別分析二、一般判別分析3、discrim過(guò)程過(guò)程語(yǔ)句說(shuō)明: (1)proc語(yǔ)句用于規(guī)定開(kāi)始運(yùn)行discrim過(guò)程并指定要分析的數(shù)據(jù)集名。選項(xiàng)有: testdata=數(shù)據(jù)集名指定需要進(jìn)行分類(lèi)的觀測(cè)組成的數(shù)據(jù)
5、集。該數(shù)據(jù)集中定量變量的名稱(chēng)必須和data=數(shù)據(jù)集中的定量變量的名稱(chēng)相匹配。 method=選項(xiàng)規(guī)定進(jìn)行分類(lèi)的方法。 list規(guī)定對(duì)每個(gè)觀測(cè)顯示重新分類(lèi)的結(jié)果。 testlist規(guī)定顯示testdata=數(shù)據(jù)集中觀測(cè)的分類(lèi)結(jié)果。 sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通二、一般判別分析二、一般判別分析3、discrim過(guò)程過(guò)程 (2)class語(yǔ)句用于規(guī)定分類(lèi)變量,可以是數(shù)值型變量也可以是字符型變量。分類(lèi)變量的不同取值則代表了不同的類(lèi)別。 (3)var語(yǔ)句用于規(guī)定要分析的定量變量。若不使用此語(yǔ)句,則默認(rèn)分析數(shù)據(jù)集中所有的數(shù)值型變量。 (4)priors語(yǔ)句用于規(guī)定各類(lèi)別的
6、先驗(yàn)概率。 (5)by語(yǔ)句規(guī)定了分組變量,它使得by過(guò)程對(duì)分組內(nèi)進(jìn)行處理。在使用by語(yǔ)句前,應(yīng)對(duì)數(shù)據(jù)集按照分組變量進(jìn)行排序。sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通三、典型判別分析三、典型判別分析1、fisher判別法判別法 典型判別分析采用了與主成分分析和典型相關(guān)分析類(lèi)似的降維技術(shù),以找到能最好概括類(lèi)別區(qū)分的變量的線(xiàn)性組合。降維時(shí)要求同一類(lèi)中的區(qū)別盡可能小,而不同類(lèi)間的區(qū)別盡可能大。 sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通典型判別分析典型判別分析candisc過(guò)程過(guò)程proc candisc data=數(shù)據(jù)集名 ; class 分類(lèi)變量名; va
7、r 變量名列表; by 分組變量名;run;sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通典型判別分析典型判別分析candisc過(guò)程過(guò)程sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通典型判別分析典型判別分析candisc過(guò)程過(guò)程sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通典型判別分析典型判別分析discrim過(guò)程過(guò)程proc discrim data=典型變量數(shù)據(jù)集; class 分類(lèi)變量名; var 典型變量名;run;sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通四、逐步判別分析四、逐步判別分析1、基本原理、基本原理 逐步判
8、別分析考察了p維指標(biāo)(即p個(gè)變量)對(duì)總體的區(qū)分能力是否顯著,對(duì)判別分類(lèi)不起作用的變量則予以刪除,優(yōu)化了判別的效果。 逐步判別的基本思想與我們?cè)谏弦徽陆榻B的逐步回歸相似:在建立判別函數(shù)時(shí)逐個(gè)引入變量,每一步選擇都一個(gè)判別能力最顯著的變量進(jìn)入判別函數(shù),同時(shí)對(duì)已有的變量也進(jìn)行檢驗(yàn),將不顯著的變量剔除。直到在可選的變量中,既沒(méi)有變量被選入也沒(méi)有變量被刪除為止。這樣在最后得到的判別函數(shù)中,所有變量都是顯著的。通過(guò)使用逐步判別法,提高了判別樣品的能力,也增強(qiáng)了判別函數(shù)的穩(wěn)定性。 sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通stepdisc過(guò)程過(guò)程proc stepdisc data=數(shù)據(jù)
9、集名 ; class 分類(lèi)變量名; var 變量名列表; by 分組變量;run;逐步判別分析逐步判別分析sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通stepdisc過(guò)程過(guò)程逐步判別分析逐步判別分析sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通stepdisc過(guò)程過(guò)程逐步判別分析逐步判別分析sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通stepdisc過(guò)程過(guò)程逐步判別分析逐步判別分析sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)到精通2、stepdisc過(guò)程過(guò)程語(yǔ)句說(shuō)明: (1)proc語(yǔ)句用于規(guī)定運(yùn)行stepdisc過(guò)程,并指定要分析的數(shù)據(jù)集名。選項(xiàng)有: method=選項(xiàng)規(guī)定對(duì)判別函數(shù)中的變量進(jìn)行選擇的方法。 (2)class語(yǔ)句用于規(guī)定分類(lèi)變量,可以是數(shù)值型變量也可以是字符型變量。分類(lèi)變量的不同取值則代表了不同的類(lèi)別。 (3)var語(yǔ)句用于規(guī)定要篩選的定量變量。若不使用此語(yǔ)句,則默認(rèn)篩選數(shù)據(jù)集中所有的數(shù)值型變量。 (4)by語(yǔ)句規(guī)定了分組變量,它使得by過(guò)程對(duì)分組內(nèi)進(jìn)行處理。在使用by語(yǔ)句前,應(yīng)對(duì)數(shù)據(jù)集按照分組變量進(jìn)行排序。 四、逐步判別分析四、逐步判別分析sas 統(tǒng)計(jì)分析與應(yīng)用統(tǒng)計(jì)分析與應(yīng)用 從入門(mén)到精通從入門(mén)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 大學(xué)英語(yǔ)提高班2(2022-2023-2)學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 2024年低溫巴氏乳合作協(xié)議書(shū)
- 2024年P(guān)P-R再生料合作協(xié)議書(shū)
- 小學(xué)二年級(jí)日記350字(10篇)
- Ternidazole-hydrochloride-Standard-生命科學(xué)試劑-MCE
- TAU-IN-2-生命科學(xué)試劑-MCE
- 2025屆高考英語(yǔ)一輪復(fù)習(xí)第二部分語(yǔ)法專(zhuān)項(xiàng)突破第一板塊構(gòu)建基礎(chǔ)詞法專(zhuān)題二名詞學(xué)案新人教版
- 九年級(jí)物理全冊(cè)20.2電生磁習(xí)題3新版新人教版
- 2024年CDMA移動(dòng)通信手機(jī)項(xiàng)目合作計(jì)劃書(shū)
- 2024-2025學(xué)年新教材高中地理課時(shí)分層作業(yè)8自然保護(hù)區(qū)與生態(tài)安全含解析中圖版選擇性必修3
- 小學(xué)英語(yǔ)教學(xué)活動(dòng)設(shè)計(jì)主要方法與技巧
- 《體育科學(xué)研究論文的撰寫(xiě)與評(píng)價(jià)》PPT課件
- 祖國(guó)的燦爛文化PPT通用課件
- 隧道支護(hù)結(jié)構(gòu)計(jì)算
- 第十二講溝通
- 歐洲合同法PECL韓世遠(yuǎn)譯
- 上海市徐匯區(qū)初三英語(yǔ)二模精美含答案聽(tīng)力材料
- 校本教研特色匯報(bào)
- 項(xiàng)目管理組織機(jī)構(gòu)框圖及說(shuō)明
- 成都住房公積金單位繳存登記表
- 飽和蒸汽溫度密度壓力對(duì)照表
評(píng)論
0/150
提交評(píng)論