![《社會統(tǒng)計分析方法(第二版)》課件第十章 鑒別分析_第1頁](http://file4.renrendoc.com/view/3a90e57c9609232fcd63aa4ae9d67616/3a90e57c9609232fcd63aa4ae9d676161.gif)
![《社會統(tǒng)計分析方法(第二版)》課件第十章 鑒別分析_第2頁](http://file4.renrendoc.com/view/3a90e57c9609232fcd63aa4ae9d67616/3a90e57c9609232fcd63aa4ae9d676162.gif)
![《社會統(tǒng)計分析方法(第二版)》課件第十章 鑒別分析_第3頁](http://file4.renrendoc.com/view/3a90e57c9609232fcd63aa4ae9d67616/3a90e57c9609232fcd63aa4ae9d676163.gif)
![《社會統(tǒng)計分析方法(第二版)》課件第十章 鑒別分析_第4頁](http://file4.renrendoc.com/view/3a90e57c9609232fcd63aa4ae9d67616/3a90e57c9609232fcd63aa4ae9d676164.gif)
![《社會統(tǒng)計分析方法(第二版)》課件第十章 鑒別分析_第5頁](http://file4.renrendoc.com/view/3a90e57c9609232fcd63aa4ae9d67616/3a90e57c9609232fcd63aa4ae9d676165.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第十章鑒別分析知識鏈接SPSS之判別分析/article/ed15cb1b72e7061be36981a1.html知識鏈接spss進行判別分析步驟/s/blog_613316c00101duen.html一、簡介鑒別分析是一種進行統(tǒng)計鑒別和分組的技術(shù)方法。它可以就一定數(shù)量案例已知的一個分類變量和相應(yīng)的其他多元變量的信息,檢查和定量描述分組與其他多元變量之間的關(guān)系,建立鑒別函數(shù)。然后便可以利用這些函數(shù)關(guān)系對其他已知多元變量信息但未知類別信息的案例進行鑒別分組。鑒別分析又稱“分辨法”,是在分類確定的條件下,根據(jù)某一研究對象的各種特征值判別其類型歸屬問題的一種多變量統(tǒng)計分析方法。其基本原理是按照一定的判別準則,建立一個或多個判別函數(shù),用研究對象的大量資料確定判別函數(shù)中的待定系數(shù),并計算判別指標。據(jù)此即可確定某一樣本屬于何類。當?shù)玫揭粋€新的樣品數(shù)據(jù),要確定該樣品屬于已知類型中哪一類,這類問題屬于鑒別分析問題。總的來說,鑒別分析包括兩個階段的工作:第一階段是分析和解釋各組的鑒別變量值特征之間存在的差異,并建立鑒別函數(shù)。第二階段所要處理的是那些未知類別屬性的其他案例,以第一階段的鑒別函數(shù)為根據(jù)將這些“新”案例進行鑒別分類。二、鑒別分析的假定條件和基本模型(一)鑒別分析的假定條件鑒別分析最基本的要求是:分組類別(group,用表示)在兩種以上,g≥2;在第一階段工作時每組案例的規(guī)模必須至少在一個以上,即n>1(下標j表示所在類型組);各鑒別變量均為間距測度等級;各分組的案例在各鑒別變量的數(shù)值上能夠體現(xiàn)出差別。在這種情況下,鑒別分析能夠幫助我們分析各類別反映在鑒別變量上的差別,并提供一套鑒別統(tǒng)計指標。(二)鑒別分析的基本模型鑒別分析的基本模型就是鑒別函數(shù),它是鑒別分析中的擔綱模型表達式,鑒別分析中眾多統(tǒng)計指標和統(tǒng)計檢驗都與鑒別函數(shù)有關(guān)。如前所述,盡管鑒別分析本質(zhì)上要反映一個分組變量與一套鑒別變量之間的關(guān)系,但是這種關(guān)系的數(shù)學(xué)模型表達式卻并沒有直接將分組變量表示為鑒別變量(即自變量)的線性函數(shù),而是采取了迂回的途徑。鑒別分析首先結(jié)合案例分類信息與其鑒別變量信息優(yōu)化地構(gòu)造了一套間距測度等級變量——鑒別值,在這套鑒別值上可以最有效地反映出各組之間差異。所構(gòu)造的鑒別值實際上是按獲得各組案例最大區(qū)分度的原則對原鑒別變量的數(shù)據(jù)空間進行坐標轉(zhuǎn)換的結(jié)果,其原理和證明不屬本書內(nèi)容范圍。這一過程的具體計算均由SPSS軟件去完成,而我們只需要知道,鑒別函數(shù)的因變量就是這樣推導(dǎo)出來的鑒別值。三、例題數(shù)據(jù)說明本章例題是在第三章因子分析的示例數(shù)據(jù)的基礎(chǔ)上加上了一個分組變量構(gòu)成的。該數(shù)據(jù)文件名為discriminant.sav,在本書所附光盤中提供。該數(shù)據(jù)有全國30個省市自治區(qū)的案例,包括有5個狓變量,分別為多孩率、綜合節(jié)育率、初中及以上受教育程度的人口比例、人均國民收入、城鎮(zhèn)人口比例。將這些變量作為鑒別變量來對各地區(qū)類型進行鑒別分組,以便更好地進行分類指導(dǎo)。假設(shè)有理由可以將其中一些地區(qū)分別歸為一類、二類和三類地區(qū),但是同時還有一些地區(qū)則很難進行類型歸屬,于是我們虛構(gòu)了一個分組變量type來反映每個案例的分組屬性。其中,編碼1、2、3分別表示一類、二類和三類地區(qū),“.”則表示案例的這個變量值缺失,即不知道該案例屬于哪一類地區(qū)。下面我們先對SPSS軟件根據(jù)已知分組類型的案例建立鑒別方程,對計算輸出各種鑒別分析統(tǒng)計指標的意義加以說明。然后,我們再示范取得這些統(tǒng)計指標的SPSS操作,最后在此基礎(chǔ)上完成對未知分組屬性的那些案例的鑒別分組工作。四、鑒別分析模型的各參數(shù)指標及統(tǒng)計檢驗個鑒別分析不光要有基本模型,還需要多個不同指標來表示模型的不同方面。有的用于表示數(shù)量聯(lián)系關(guān)系,有的用于評價和比較。下面分別對鑒別模型中所涉及的主要指標加以介紹。為了避免有的參數(shù)計算過程所必須涉及的矩陣代數(shù)形式或其他復(fù)雜的數(shù)學(xué)公式,這里將不對每個參數(shù)的來龍去脈加以詳細討論。由于本章在介紹鑒別分析時將與SPSS統(tǒng)計軟件的應(yīng)用相結(jié)合,讀者不用在估計過程的原理和細節(jié)上花費許多功夫,因為只要我們正確地輸入數(shù)據(jù)和設(shè)置好鑒別分析的程序命令,計算機便能夠提供全部統(tǒng)計結(jié)果。本節(jié)先討論本例鑒別分析中SPSS輸出的各種指標的意義和用途。有關(guān)SPSS的操作步驟在第五節(jié)中介紹。(一)非標準化鑒別系數(shù)鑒別系數(shù)又稱函數(shù)系數(shù),其中還進一步分為兩種:非標準化的和標準化的。(二)標準化鑒別系數(shù)通過對于非標準化系數(shù)加以特定形式的調(diào)整,就得到標準化鑒別系數(shù)。以標準化系數(shù)表達的鑒別函數(shù)不再有常數(shù)項,并且函數(shù)中出現(xiàn)的自變量不再是原始變量,而是標準化的變量。也就是說,如果將經(jīng)過標準化的鑒別變量輸入鑒別模型,那么可以直接得到標準化的回歸系數(shù)。(三)結(jié)構(gòu)系數(shù)鑒別分析中的結(jié)構(gòu)系數(shù)又被稱為鑒別負載。它實際上是某個鑒別變量x與鑒別值y之間的相關(guān)系數(shù),用于表達兩者之間的擬合水平。當結(jié)構(gòu)系數(shù)的絕對值很大(接近+1或-1)時,這個鑒別函數(shù)(值)表達的信息與這個鑒別變量的信息幾乎相同。當這個系數(shù)接近于0時,兩者之間就沒有什么共同之處。類似在因子分析中的做法,如果鑒別分析中一些鑒別變量與一個鑒別函數(shù)之間有很大的結(jié)構(gòu)系數(shù)值,我們就可以用這些變量的名字來命名這個函數(shù)。如果這些變量似乎有類似方面的特征,我們也可以用這種共同的特征來命名這個函數(shù)。(四)分組的矩心分組的矩心描述在鑒別空間中每一組案例的中心位置。它是通過計算各組案例鑒別值的平均值來確定各組中心坐標的。其結(jié)果,每個分組在各維鑒別值上的平均值便是該組在鑒別空間中該維上的矩心坐標值??疾煸阼b別空間中每個案例點與各組的矩心之間的距離,便于分析具體案例分組屬性的傾向。(五)鑒別力指數(shù)鑒別力指數(shù)就是這樣一個評價各鑒別函數(shù)的指標,有時它也被更直接地稱為方差百分比。鑒別分析通過一個鑒別函數(shù)所能代表的所有原始數(shù)據(jù)中組間總差異的百分比來表示每個鑒別函數(shù)的鑒別力。在鑒別分析中,一個鑒別函數(shù)所代表的組間總差異的相對數(shù)量用特征值來表示。這個特征值其實就是該維函數(shù)的組間差異量相對于組內(nèi)差異量的倍數(shù)。換句話說,它是以組內(nèi)差異量為基準單位計量的組間差異量。而組內(nèi)差異指是數(shù)據(jù)中與分組類別毫無關(guān)系的那些差異,即所有鑒別函數(shù)都不能解釋的差異,那么根據(jù)上述分析假定,可認為各組的組內(nèi)差異相等。(六)殘余鑒別力的檢驗就此,我們已經(jīng)討論的前五個指標都不用考慮數(shù)據(jù)的抽樣及推斷性質(zhì)。它們對于總體資料和任何類型的樣本都同樣適宜。但殘余鑒別力有所不同。(七)Fisher鑒別系數(shù)Fisher鑒別系數(shù)可以用來對一個案例原始鑒別變量直接進行鑒別分組。也就是說,如果有這套系數(shù),再有一個新案例的數(shù)據(jù),就可以通過這套Fisher鑒別系數(shù)直接進行手工計算的鑒別。因此,Fisher鑒別系數(shù)主要服務(wù)于在沒有計算機及統(tǒng)計軟件的情況下對新案例的鑒別。五、用SPSS對例題做鑒別分析的操作在SPSS中進行鑒別分析時,所有鑒別變量的格式與一般情況毫無二致,只是對于分組變量有一定要求。分組變量的案例有兩種情況:第一種是已知所屬分組類型,鑒別分析根據(jù)它們來建立鑒別函數(shù);第二種是未知所屬分組類型,需要通過分析進行鑒別。(二)spss鑒別分析設(shè)置的操作(三)犛犘犛犛鑒別分類結(jié)果的輸出格式關(guān)于鑒別分析各項主要統(tǒng)計指標的意義及輸出格式已經(jīng)在前面介紹過了,這里主要討論的是關(guān)于案例鑒別結(jié)果和概要鑒別結(jié)果的輸出指標及格式。1.每個案例的鑒別結(jié)果鑒別分析的主要目的是通過已知分組案例信息建立鑒別函數(shù),再利用鑒別函數(shù)對所有案例進行重新鑒別分組。SPSS鑒別分析可以輸出所有案例的鑒別分類結(jié)果,既包括原來分組變量中已知類別的案例,也包括其他類別未知的案例。研究人員可以從前一種案例重新鑒別結(jié)果來考查鑒別函數(shù)的效果,又可以取得對后一種案例的鑒別分類估計。2.鑒別分析的概要結(jié)果SPSS鑒別分析輸出鑒別的概要結(jié)果可以提供按原始分組類別與預(yù)測分組類別型的案例數(shù)交互表,并提供相應(yīng)的所占比例。這種信息提供了對鑒別函數(shù)效果的評價。表10-9是SPSS輸出的本例鑒別的概要結(jié)果。3.圖形輸出SPSS鑒別分析所輸出的本例所有各組合并的鑒別圖展示在圖10-1中。為了便于查看,我們利用SPSS圖形編輯器將其中原來分屬第一、二、三組的案例用分別三角、圓圈和方塊符號表示,而原來未分組的案例則用交叉符號表示。原鑒別圖中還自動提供各組矩心的位置,我們將其改用十字符號表示。從統(tǒng)計方法論角度而言,并不能用已知分組的案例建立的鑒別函數(shù)反過來的再次鑒別(即我們沿用SPSS軟件所說的“預(yù)測”)的正確率來證明這套鑒別函數(shù)一定適合于那些尚未分組的案例,而對其進行分類的結(jié)果又無法證明自身的鑒別是否正確。其他統(tǒng)計評價指標所說明的是已知分組屬性的那些案例在鑒別變量方面的差異是否被鑒別函數(shù)所表達,因而也只是一個參考。為了實證一個鑒別方案的效力,可以考慮另一種做法。即先將已知分類的案例先隨機地分成兩半,用其中的一半建立鑒別函數(shù),計算各統(tǒng)計指標。而將另一半權(quán)且當作未知分類的案例來進行鑒別。最后再將這一半的鑒別結(jié)果與原來的已知分組進行比較,以證明鑒別方案的實際效力。如果鑒別效果同樣很好,這一鑒別方案便可以在實際中應(yīng)用了。當然,這就要求已知分組的案例數(shù)量相對較多才能實施?;靖拍罘纸M變量鑒別變量維空間鑒別函數(shù)多元共線性問題協(xié)方差矩陣相等假定多元正態(tài)分布假定非標準化鑒別系數(shù)鑒別值標準化鑒別系數(shù)結(jié)構(gòu)系數(shù)總結(jié)構(gòu)系數(shù)組內(nèi)結(jié)構(gòu)系數(shù)分組的矩心鑒別力指數(shù)方差百分比典型相關(guān)系數(shù)殘余鑒別力wilks檢驗fisher鑒別系數(shù)案例鑒別結(jié)果最大可能組預(yù)測組別條件概率后驗概率馬氏距離的平方鑒別概要表鑒別圖本章要點1.鑒別分析是根據(jù)以往經(jīng)驗歸納對案例進行統(tǒng)計鑒別和分類的方法。2.鑒別分析的第一階段以一部分已知類型的觀測案例的多元變量觀測值作為鑒別變量,建立不同類型的鑒別函數(shù),即用純統(tǒng)計的手段對不同類型與鑒別變量之間的數(shù)量關(guān)系進行歸納。雖然從數(shù)學(xué)上可能得
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 五年級數(shù)學(xué)口算題
- 青島版數(shù)學(xué)七年級上冊5.2《代數(shù)式》聽評課記錄
- 魯教版地理六年級下冊6.2《自然環(huán)境》聽課評課記錄3
- 蘇教版三年級下冊《兩位數(shù)乘整十數(shù)的口算》教案
- 委托經(jīng)營管理協(xié)議書范本
- 蘇州蘇教版三年級數(shù)學(xué)上冊《周長是多少》聽評課記錄
- 產(chǎn)品銷售合作協(xié)議書范本(代理商版本)
- 書稿專用版權(quán)合同范本
- 酒店房屋出租辦公經(jīng)營協(xié)議書范本
- 部編版道德與法治九年級下冊《1.2復(fù)雜多變的關(guān)系》聽課評課記錄
- 2025年中國黃芪提取物市場調(diào)查研究報告
- 七年級英語閱讀理解55篇(含答案)
- 管理ABC-干嘉偉(美團網(wǎng)COO)
- 肉制品加工技術(shù)完整版ppt課件全套教程(最新)
- (中職)Dreamweaver-CC網(wǎng)頁設(shè)計與制作(3版)電子課件(完整版)
- 東南大學(xué) 固體物理課件
- 行政人事助理崗位月度KPI績效考核表
- 紀檢監(jiān)察機關(guān)派駐機構(gòu)工作規(guī)則全文詳解PPT
- BP-2C 微機母線保護裝置技術(shù)說明書 (3)
- 硫酸分公司30萬噸硫磺制酸試車方案
- 電子電路基礎(chǔ)習(xí)題解答
評論
0/150
提交評論