判別分析案例學(xué)習(xí)教案_第1頁
判別分析案例學(xué)習(xí)教案_第2頁
判別分析案例學(xué)習(xí)教案_第3頁
判別分析案例學(xué)習(xí)教案_第4頁
判別分析案例學(xué)習(xí)教案_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、會(huì)計(jì)學(xué)1判別分析案例判別分析案例(n l)第一頁,共50頁。機(jī)妙算”n“像泰山那么穩(wěn)固”n“像鉆石那么堅(jiān)硬”n一些判別標(biāo)準(zhǔn)都是有原型的,雖然(surn)這些判別的標(biāo)準(zhǔn)并不那么精確或嚴(yán)格,但大都是根據(jù)一些現(xiàn)有的模型得到的。第1頁/共49頁第二頁,共50頁。sher判別(pnbi)法Bayes判別(pnbi)法逐步判別(pnbi)法第2頁/共49頁第三頁,共50頁。第3頁/共49頁第四頁,共50頁。第4頁/共49頁第五頁,共50頁。一類。第5頁/共49頁第六頁,共50頁。n主要(zhyo)利用一些檢驗(yàn)來判斷變量的判別能力。第6頁/共49頁第七頁,共50頁。數(shù)據(jù)數(shù)據(jù)介紹介紹SPSS實(shí)現(xiàn)實(shí)現(xiàn)結(jié)果結(jié)果分

2、析分析R語言語言實(shí)現(xiàn)實(shí)現(xiàn)disc.sav, disc.txt第7頁/共49頁第八頁,共50頁。找出分類標(biāo)準(zhǔn),并對(duì)沒分類的企業(yè)進(jìn)行分類。第8頁/共49頁第九頁,共50頁。變量名稱變量名稱涵義描述涵義描述group表示類別。group-1代表上升,group-2代表穩(wěn)定,group-3代表下降。is表示企業(yè)規(guī)模。se表示服務(wù)。sa表示雇員工資比例。prr表示利潤增長。ms表示市場份額。msr表示市場份額增長。cp表示流動(dòng)資金比例。cs表示資金周轉(zhuǎn)速度。第9頁/共49頁第十頁,共50頁。該數(shù)據(jù)disc.sav共有90個(gè)樣本,其中30個(gè)屬于上升型,30個(gè)屬于穩(wěn)定性,30屬于下降型。這個(gè)已知類別的數(shù)據(jù)稱

3、為(chn wi)一個(gè)“訓(xùn)練樣本”。group表示(biosh)類別8個(gè)用來建立判別標(biāo)準(zhǔn)的變量第10頁/共49頁第十一頁,共50頁。File Open Data “Disc.sav”第11頁/共49頁第十二頁,共50頁。第12頁/共49頁第十三頁,共50頁。第13頁/共49頁第十四頁,共50頁。第14頁/共49頁第十五頁,共50頁。兩種變量選擇兩種變量選擇(xunz)方法方法自變量同時(shí)自變量同時(shí)進(jìn)入方程進(jìn)入方程逐步逐步判別法判別法第15頁/共49頁第十六頁,共50頁。group選入分組變量(binling)is-cs選入自變量選擇(xunz)自變量同時(shí)進(jìn)入方程的方法第16頁/共49頁第十七頁,

4、共50頁。第17頁/共49頁第十八頁,共50頁。選擇(xunz)Means進(jìn)行均數(shù)估計(jì)選擇(xunz)Boxs M進(jìn)行各組協(xié)方差陣相等檢驗(yàn)生成Bayes判別方程系數(shù)和Fisher判別方程系數(shù)。選擇ANOVAs進(jìn)行各組均值相等檢驗(yàn)第18頁/共49頁第十九頁,共50頁。第19頁/共49頁第二十頁,共50頁。選擇(xunz)以樣本量百分比為先驗(yàn)概率顯示每個(gè)單位判別分析后所屬類別顯示判別符合率表類別顯示在同一散點(diǎn)圖中以剔出某觀察單位所建立的判別函數(shù)判別該觀察單位所屬類別第20頁/共49頁第二十一頁,共50頁。在數(shù)據(jù)中保存判別(pnbi)后數(shù)據(jù)所屬類別在數(shù)據(jù)中保存數(shù)據(jù)的判別分第21頁/共49頁第二十二頁

5、,共50頁。90個(gè)變量100%讀入,沒有(mi yu)缺失值第22頁/共49頁第二十三頁,共50頁。各自(gz)變量的方差分析及統(tǒng)計(jì)量說明在3類企業(yè)間,各變量均有顯著(xinzh)差異統(tǒng)計(jì)量在0-1之間。越接近0組間差異越顯著;越接近1組間差異越不顯著。第23頁/共49頁第二十四頁,共50頁。各組協(xié)方差陣相等(xingdng)的檢驗(yàn)說明拒絕協(xié)方差矩陣相等(xingdng)的假設(shè),即不能認(rèn)為各組間協(xié)方差矩陣相等(xingdng)。從一些統(tǒng)計(jì)實(shí)踐的結(jié)果來看,很少有碰到檢驗(yàn)不顯著的情況。而在一些實(shí)踐中,比如線性判別分析,即使方差協(xié)方差結(jié)構(gòu)不相等,對(duì)于結(jié)果的影響也不會(huì)有非常大的影響。第24頁/共49頁

6、第二十五頁,共50頁。標(biāo)準(zhǔn)化典型(dinxng)判別函數(shù)系數(shù)876543211435. 0019. 0355. 0457. 0334. 0365. 0433. 0415. 0 xxxxxxxxy得到2個(gè)標(biāo)準(zhǔn)化典型(dinxng)判別方程:876543212193. 0285. 0634. 0369. 0541. 0426. 0127. 0065. 0 xxxxxxxxy需要注意的是:這是標(biāo)準(zhǔn)化后的判別函數(shù),若要將變量帶入計(jì)算判別分,必須將變量進(jìn)行標(biāo)準(zhǔn)化處理(即減均值除以標(biāo)準(zhǔn)差)。第25頁/共49頁第二十六頁,共50頁。結(jié)構(gòu)(jigu)系數(shù)矩陣用來說明判別變量對(duì)標(biāo)準(zhǔn)化典型判別方程的相關(guān)程度結(jié)果說

7、明,前6個(gè)變量(binling)(*)對(duì)方程1貢獻(xiàn)比較大,后兩個(gè)變量(binling)對(duì)方程2貢獻(xiàn)較大。第26頁/共49頁第二十七頁,共50頁。未標(biāo)準(zhǔn)化典型判別函數(shù)系數(shù)(xsh)Fisher判別法876543211384. 0004. 0023. 0068. 0007. 0037. 0257. 3035. 0088. 3xxxxxxxxy得到2個(gè)未標(biāo)準(zhǔn)化典型(dinxng)判別方程:876543212171. 0058. 0041. 0054. 0011. 0043. 0953. 0005. 0392. 5xxxxxxxxy可以將原變量值直接代入計(jì)算判別分進(jìn)行分類。第27頁/共49頁第二十八頁

8、,共50頁。生成(shn chn)3個(gè)新的變量dis_1表示判別(pnbi)后所屬組別的值dis1_1表示樣本代入第1個(gè)判別函數(shù)所得的判別分dis2_1表示樣本代入第2個(gè)判別函數(shù)所得的判別分第28頁/共49頁第二十九頁,共50頁。Fisher判別(pnbi)法得到的分組圖各組重心描述在判別空間每一組的中心(zhngxn)位置第29頁/共49頁第三十頁,共50頁。判別(pnbi)力指數(shù)兩個(gè)判別(pnbi)函數(shù)的作用并不是平等的,判別(pnbi)力指數(shù)給出了判別(pnbi)函數(shù)的重要程度。說明(shumng)第一個(gè)判別函數(shù)的貢獻(xiàn)率高達(dá)98.8%,第二個(gè)判別函數(shù)的貢獻(xiàn)率僅為1.1%。第30頁/共49

9、頁第三十一頁,共50頁。殘余判別力指數(shù)殘余判別力的含義(hny)是:在以前計(jì)算的函數(shù)已經(jīng)提取過原始信息之后,殘余的變量信息對(duì)于判別分組的能力。值越小表示越高的判別力。說明方程1提取了很大的信息量,而殘余變量(binling)信息對(duì)于判別分組的能力很小了。第31頁/共49頁第三十二頁,共50頁。分類(fn li)結(jié)果從表上看,我們的分類函數(shù)(hnsh)能夠100%的把訓(xùn)練數(shù)據(jù)的每一個(gè)觀測值分到其本來的類。該表分成兩部分:上面一半是用從全部數(shù)據(jù)得到的判別函數(shù)(hnsh)來判斷每一個(gè)點(diǎn)的結(jié)果;下面一半是對(duì)每一個(gè)觀測值,都用僅缺少該觀測值的全部數(shù)據(jù)得到的判別函數(shù)(hnsh)來進(jìn)行判斷的結(jié)果。第32頁/

10、共49頁第三十三頁,共50頁。各分類(fn li)的先驗(yàn)概率先驗(yàn)概率是根據(jù)樣本出現(xiàn)(chxin)概率確定的,本例3類企業(yè)各有30個(gè),因此先驗(yàn)概率相等都為33.3%。第33頁/共49頁第三十四頁,共50頁。Bayes判別(pnbi)法得到的判別(pnbi)函數(shù)系數(shù)得到(d do)3個(gè)判別方程:87654321273. 7942. 0362. 0481. 0900 . 0401. 0068. 7122. 0355.67(1)xxxxxxxx原分類87654321985. 4853. 0167. 0857. 0320 . 0593. 0030. 72342. 0765.61(2)xxxxxxxx原分

11、類87654321496. 2895. 00.074323. 1020 . 0864. 0601. 74558. 0964.104(3)xxxxxxxx原分類將觀察單位的各個(gè)變量分別代入3個(gè)判別函數(shù)中,可求出3個(gè)判別函數(shù)值,哪一個(gè)最大就屬于哪一類。第34頁/共49頁第三十五頁,共50頁。結(jié)果就不一樣了。第35頁/共49頁第三十六頁,共50頁。使用企業(yè)規(guī)模(ie)、服務(wù)(se)和雇員工資比例(bl)(sa)三個(gè)變量進(jìn)行判別,得到的分類圖。與8個(gè)變量進(jìn)行判別相對(duì)(xingdu)比,明顯的三類點(diǎn)分的就不那么開了。第36頁/共49頁第三十七頁,共50頁?;?個(gè)變量的分類(fn li)結(jié)果表結(jié)果顯示,

12、對(duì)于(duy)全部數(shù)據(jù)的判別,有85個(gè)點(diǎn)(94.4%)得到正確劃分,5個(gè)點(diǎn)錯(cuò)判;其中第二類有3個(gè)被誤判到第一類;有2個(gè)被誤判到第三類。對(duì)于(duy)交叉驗(yàn)證的判別,有83個(gè)點(diǎn)(92.2%)得到正確劃分,有7個(gè)點(diǎn)被錯(cuò)判;其中第二類有3個(gè)被誤判為第一類,4個(gè)被誤判為第三類。第37頁/共49頁第三十八頁,共50頁。選擇(xunz)逐步判別法Method模塊(m kui)被激活第38頁/共49頁第三十九頁,共50頁。第39頁/共49頁第四十頁,共50頁。選擇(xunz)Wilks 統(tǒng)計(jì)量最小化法選擇輸出每一步統(tǒng)計(jì)量當(dāng)F3.84時(shí)選入;當(dāng)F 2.71時(shí)剔出。第40頁/共49頁第四十一頁,共50頁。經(jīng)過(

13、jnggu)分析,淘汰了不顯著的資金流動(dòng)比例(cp)變量,當(dāng)然判別系數(shù)也發(fā)生相應(yīng)變化。第41頁/共49頁第四十二頁,共50頁。C C l la a s ss si if fi ic c a a t ti io on n R Re es su ul lt ts sb b, ,c c300030030030003030100.0.0.0100.0.0100.0.0100.0.0.0100.0100.0300030030030003030100.0.0.0100.0.0100.0.0100.0.0.0100.0100.0組別上升企業(yè)穩(wěn)定企業(yè)下降企業(yè)上升企業(yè)穩(wěn)定企業(yè)下降企業(yè)上升企業(yè)穩(wěn)定企業(yè)下降企業(yè)上升

14、企業(yè)穩(wěn)定企業(yè)下降企業(yè)Count%Count%OriginalCross-validateda上升企業(yè)穩(wěn)定企業(yè)下降企業(yè)Predicted Group MembershipTotalCross validation is done only for those cases in the analysis. In crossvalidation, each case is classified by the functions derived from all casesother than that case.a. 100.0% of original grouped cases correctl

15、y classified.b. 100.0% of cross-validated grouped cases correctly classified.c. 雖然判別系數(shù)(xsh)改變,但結(jié)果并未改變。第42頁/共49頁第四十三頁,共50頁。V1代表(dibio)Group。 V1=factor(V1) #把分組變量(binling)變成定性變量(binling)。第43頁/共49頁第四十四頁,共50頁。 train=sample(1:90,45) #隨即抽取一般樣本作訓(xùn)練樣本。 table(V1train) #顯示訓(xùn)練樣本中各類的比例。 library(MASS); z=lda(V1.,d

16、ata=w,prior=c(1,1,1)/3,subset=train)#用V1作分組變量,V2-V9作判別變量,使用(shyng)訓(xùn)練樣本生成判別函數(shù),先驗(yàn)概率各為33.3%。第44頁/共49頁第四十五頁,共50頁。先驗(yàn)概率各為33.3%。判別(pnbi)系數(shù)第1個(gè)判別函數(shù)貢獻(xiàn)率為98.7%;第2個(gè)判別函數(shù)貢獻(xiàn)率為1.3%。第45頁/共49頁第四十六頁,共50頁。練樣本外的點(diǎn) a2=predict(z,w) #對(duì)z的結(jié)果預(yù)測所有樣本點(diǎn) a2$class #給出分類(fn li)結(jié)果 a2$x #給出每個(gè)點(diǎn)的二維坐標(biāo) y=cbind(a2$x,a2$class); y1=yy,3=1,-3; y2=yy,3=2,-3; y3=yy,3=3,-3; plot(y1,1,y1,2,pch=0,xlim=c(-10,8.5),ylim=c(-4,3),ylab=,xlab=) points(y2,1,y2,2,pch=1) points(y3,1,y2,2,pch=2)第46頁/共49頁第四十七頁,共50頁。第一類第二類第三類第47頁/共

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論