實驗十一判別分析_第1頁
實驗十一判別分析_第2頁
實驗十一判別分析_第3頁
實驗十一判別分析_第4頁
實驗十一判別分析_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、實驗十一 判別分析實驗?zāi)康模赫莆张袆e分析在SPSS中的實現(xiàn)方法。實驗工具:SPSS分析工具菜單項。知識準(zhǔn)備:一、判別分析的基本原理在已經(jīng)將研究對象分成若干組的情況下,根據(jù)收集到的新的觀測樣品的數(shù)據(jù)和判別規(guī)則,來判斷新樣品應(yīng)該屬于哪個組。具體判別過程中,根據(jù)分組情況,可以有兩組判別和多組判別之分;根據(jù)判別規(guī)則不同,有距離判別、貝葉斯判別和典型判別等方法。二、判別分析的基本步驟1.了解總體分組情況。了解總體可以分為幾個組,各個組的數(shù)值特征。2.選取判別方法。根據(jù)所收集的樣本的數(shù)據(jù)類型以及總體分組情況,決定是采用兩組判別還是多組判別,判別時是用距離判別、貝葉斯判別和典型判別中的哪一種。3.判別結(jié)果檢

2、驗。用驗證樣本帶入判別規(guī)則(函數(shù)),檢驗其是否具有有效性。三、判別分析的幾種方法簡介1.距離判別。在距離判別中,經(jīng)常用馬哈拉諾比斯提出的“馬氏距離”來進(jìn)行判斷。設(shè)是從均值為,協(xié)方差矩陣為的總體中抽取的兩個樣品(維),則總體內(nèi)兩點與之間的平方馬氏距離定義為:點到總體的平方馬氏距離為:。1) 兩總體距離判別。設(shè)有兩總體和的均值分別為和,協(xié)方差矩陣分別為和(),是一個新樣本,判斷其屬于哪個總體。定義到和的距離為和,則按如下判別規(guī)則進(jìn)行判斷:當(dāng)=時,該判別式可進(jìn)行如下簡化:= = = = = 其中,令,則判別規(guī)則就成為:顯然是的線性函數(shù),故稱其為線性判別函數(shù),稱為判別系數(shù)。當(dāng)時,=判別規(guī)則為: 2)

3、多總體距離判別。設(shè)有個總體,它們的均值分別是,協(xié)方差矩陣分別是,則樣本到各組的平方馬氏距離是: , 判別規(guī)則為: ,若 2.貝葉斯判別。設(shè)有個總體,且 , , 。又設(shè)樣本來自總體的先驗概率為,滿足。到的平方馬氏距離是:來自的的概率密度為:根據(jù)貝葉斯定理,屬于的后驗概率為: , 判別規(guī)則如下: , 若 3.費希爾判別。用維向量 的少數(shù)幾個線性組合(稱為判別式或典型變量)(一般明顯小于)來代替原始的個變量 ,以達(dá)到降維的目的,并根據(jù)這個判別式對樣品的歸屬作出判別。 設(shè)來自組 的維觀測值為,將它們投影到某一共同方向,得到的投影點是線性組合,其中表示投影方向。這時的可以組成一元方差分析數(shù)據(jù)。其組間平方

4、和表示為 式中 ,和分別為第組均值和總均值向量。組內(nèi)平方和為:式中,。如果組均值有顯著差異,則應(yīng)充分地大,或者應(yīng)充分地大。所以問題轉(zhuǎn)化為求,使得達(dá)到最大。當(dāng)用任意非零常數(shù)乘以,所得仍可達(dá)到最大,所以并不唯一。因此,將約束為,是當(dāng)時的無偏估計。由矩陣知識可知,的極大值為是的最大特征值。設(shè)的全部非零特征值依次為,對應(yīng)特征向量為。當(dāng)時,可使達(dá)到最大。由于的大小可衡量判別函數(shù)的效果,故稱為判別效率。在許多情況下,僅用一個判別函數(shù)不能很好區(qū)別各個總體,可取對應(yīng)的特征向量,建立,如不夠,還可建立第三個判別函數(shù),依次類推。在確定了判別式后,可制定相應(yīng)的判別規(guī)則:若其中。實驗背景:對28名一級和25名健將級標(biāo)

5、槍運動員測試了6個影響標(biāo)槍成績的訓(xùn)練項目,這些訓(xùn)練項目為:30米跑()、投擲小球()、挺舉重量()、拋實心球()、前拋鉛球()和五級跳()。測得的數(shù)據(jù)全部列于下表。組別 13.64.382.3709018.5213.34.187.488010018.4813.34.2287.748511518.5613.214.0588.67510019.113.14.3889.989512020.1413.24.6989.18510519.4413.34.289758519.1713.54.584.28010018.813.74.682.1708517.6813.44.490.187510019.1413.

6、64.382.1709018.113.64.582557017.413.64.282.2709018.1213.44.285.48510018.6613.34.390.18010019.8613.124.289851002013.14.290.28511520.813.64.281.96658017.213.74.48180951713.34.3908011019.813.84.0980608016.8913.74.383.98510018.7613.54.285.48510018.713.44.186.78511018.513.34.188.1758518.9613.74.184.17095

7、18.713.64.382709018.413.24.289.28511519.8823.441039511024.823.34.51189012025.723.14.51058511025.123.84.1104.538010024.98234.21129512525.3523.93.798.2859021.823.54.198.79012022.7823.13.998.2609021.9823.33.910910012025.323.13.9598.49511525.223.143.995.39011021.4223.64.393.6758520.8423.123.995.88010521

8、.8233.993.8859021.0823.43.9196.311012021.9823.633.7898.568512022.3623.33.9897.48510022.3423.34.41127511025.123.54.1107.787.511025.123.44.292.18012022.1623.64.199.488512023.123.14.41167511025.323.124102.78011024.6823.64.11158511523.723.54.397.87510024.1根據(jù)以上資料進(jìn)行判別分析,并進(jìn)行誤判率的分析。實驗過程:1)激活數(shù)據(jù)管理窗口,定義變量,按要求輸

9、入數(shù)據(jù)。2)選擇Analyze Classify Discriminant,打開判別分析對話框。選擇變量type進(jìn)入Grouping Variable,定義分組變量取值范圍最小值1和最大值2。選擇到進(jìn)入Independents(如圖1)。圖13)點擊Statistics按鈕,選擇需要輸出的統(tǒng)計量(如圖2)。圖23)點擊Classify,選擇輸出結(jié)果(如圖3)。圖3結(jié)果說明Log Determinants組別RankLog Determinant16-.727266.424Pooled within-groups64.546The ranks and natural logarithms of

10、determinants printed are those of the group covariance matrices.上表說明的是各組及總的組內(nèi)協(xié)方差矩陣的秩和行列式的對數(shù)值,由表中數(shù)據(jù)可以看出,矩陣是滿秩的,符合用于分析的條件。Test ResultsBox's M97.309FApprox.4.043df121df29296.244Sig.000Tests null hypothesis of equal population covariance matrices.上表是對各總體協(xié)方差矩陣是否相等做的檢驗,從F值或顯著性水平值來看,各組協(xié)方差矩陣相等的假設(shè)能夠通過。Ei

11、genvaluesFunctionEigenvalue% of VarianceCumulative %Canonical Correlation15.687a100.0100.0.922a. First 1 canonical discriminant functions were used in the analysis.上表反映的是判別函數(shù)建立時所依據(jù)的特征值、解釋方差的比例和典型相關(guān)系數(shù)。Wilks' LambdaTest of Function(s)Wilks' LambdaChi-squaredfSig.1.15091.2106.000上表是對判別函數(shù)進(jìn)行的顯著性檢

12、驗,有顯著性水平來看,在0.05的顯著性水平下能通過檢驗。Standardized Canonical Discriminant Function CoefficientsFunction30米跑.261投擲小球-.600挺舉重量.125拋實心球-.022前拋鉛球-.321五級跳1.152上表給出的是標(biāo)準(zhǔn)化的典型判別函數(shù)的系數(shù),其實就是給出了標(biāo)準(zhǔn)化的判別函數(shù),只不過這時判別函數(shù)中的自變量要求帶入的是標(biāo)準(zhǔn)化后的數(shù)值。這時的判別函數(shù)表示為:Function五級跳.772挺舉重量.610前拋鉛球.212投擲小球-.211拋實心球.18030米跑-.075上表給出的是結(jié)構(gòu)矩陣,其實就是判別載荷,說明的是各個解釋變量對判別函數(shù)的貢獻(xiàn)大小。Classification Function Coefficients組別1230米跑109.359114.700投擲小球112.47897.644挺舉重量1.2781.380拋實心球1.7011.690前拋鉛球-.177-.305五級跳5.0779.161(Constant)-588.157-626.001上表給出的是費希爾判別的2個判別式。Classification Resultsa組別Predic

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論