




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、用身高和/或體重?cái)?shù)據(jù)進(jìn)行性別分類 1、【實(shí)驗(yàn)?zāi)康摹浚?)掌握最小錯(cuò)誤率Bayes分類器的決策規(guī)則(2)掌握Parzen窗法(3)掌握Fisher線性判別方法(4)熟練運(yùn)用matlab的相關(guān)知識(shí)。2、【實(shí)驗(yàn)原理】(1)、最小錯(cuò)誤率Bayes分類器的決策規(guī)則如果在特征空間中觀察到某一個(gè)(隨機(jī))向量x = ( x1 , x2 , xd )T,已知類別狀態(tài)的先驗(yàn)概率為:和類別的條件概率密度為,根據(jù)Bayes公式得到狀態(tài)的后驗(yàn)概率 有:基本決策規(guī)則:如果,則,將 x 歸屬后驗(yàn)概率最大的類別 。(2)、掌握Parzen窗法對(duì)于被估計(jì)點(diǎn)X:其估計(jì)概率密度的基本公式,設(shè)區(qū)域 RN 是以 hN 為棱長(zhǎng)的 d 維
2、超立方體,則立方體的體積為;選擇一個(gè)窗函數(shù),落入該立方體的樣本數(shù)為,點(diǎn) x 的概率密度:其中核函數(shù):,滿足的條件:;。(3)、Fisher線性判別方法Fisher線性判別分析的基本思想:通過(guò)尋找一個(gè)投影方向(線性變換,線性組合),將高維問(wèn)題降低到一維問(wèn)題來(lái)解決,并且要求變換后的一維數(shù)據(jù)具有如下性質(zhì):同類樣本盡可能聚集在一起,不同類的樣本盡可能地遠(yuǎn)。 Fisher線性判別分析,就是通過(guò)給定的訓(xùn)練數(shù)據(jù),確定投影方向W和閾值y0,即確定線性判別函數(shù),然后根據(jù)這個(gè)線性判別函數(shù),對(duì)測(cè)試數(shù)據(jù)進(jìn)行測(cè)試,得到測(cè)試數(shù)據(jù)的類別。線性判別函數(shù)的一般形式可表示成 ,其中 根據(jù)Fisher選擇投影方向W的原則,即使原樣
3、本向量在該方向上的投影能兼顧類間分布盡可能分開(kāi),類內(nèi)樣本投影盡可能密集的要求,用以評(píng)價(jià)投影方向W的函數(shù)為: 上面的公式是使用Fisher準(zhǔn)則求最佳法線向量的解,該式比較重要。另外,該式這種形式的運(yùn)算,我們稱為線性變換,其中式一個(gè)向量,是的逆矩陣,如是d維,和都是d×d維,得到的也是一個(gè)d維的向量。向量就是使Fisher準(zhǔn)則函數(shù)達(dá)極大值的解,也就是按Fisher準(zhǔn)則將d維X空間投影到一維Y空間的最佳投影方向,該向量的各分量值是對(duì)原d維特征向量求加權(quán)和的權(quán)值。以上討論了線性判別函數(shù)加權(quán)向量W的確定方法,并討論了使Fisher準(zhǔn)則函數(shù)極大的d維向量的計(jì)算方法,但是判別函數(shù)中的另一項(xiàng)尚未確定
4、,一般可采用以下幾種方法確定如或者或當(dāng)與已知時(shí)可用當(dāng)W0確定之后,則可按以下規(guī)則分類:3、【實(shí)驗(yàn)內(nèi)容及要求】(1)、實(shí)驗(yàn)對(duì)象Datasetf1.TXT 女生的身高、體重?cái)?shù)據(jù)Datasetm1.TXT男生的身高、體重?cái)?shù)據(jù)- 訓(xùn)練樣本集 Dataset1.txt 328個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)Dataset2.txt 124個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)- 測(cè)試樣本集(2)基本要求: (1) 用Datasetf1.TXT和Datasetm1.TXT的數(shù)據(jù)作為訓(xùn)練樣本集,建立Bayes分類器,用測(cè)試樣本數(shù)據(jù)對(duì)該分類器進(jìn)行測(cè)試。調(diào)整特征、分類器等方面的一些因素,考察它們對(duì)分類器性能的影響,從而加深對(duì)
5、所學(xué)內(nèi)容的理解和感性認(rèn)識(shí)。(試驗(yàn)直接設(shè)計(jì)線性分類器的方法,與基于概率密度估計(jì)的貝葉斯分離器進(jìn)行比較)(2) 試驗(yàn)非參數(shù)估計(jì),體會(huì)與參數(shù)估計(jì)在適用情況、估計(jì)結(jié)果方面的異同。4、【實(shí)驗(yàn)結(jié)果與分析】(1)、Bayes分類器的實(shí)驗(yàn)結(jié)果與分析A、對(duì)于Dataset1.txt 328個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)的測(cè)試樣本集:A1、當(dāng)先驗(yàn)概率為:男0.5,女0.5時(shí):身高分類錯(cuò)誤個(gè)數(shù): 15 身高分類錯(cuò)誤率為: 12.10%體重分類錯(cuò)誤個(gè)數(shù): 15 體重分類錯(cuò)誤率為: 12.10%【實(shí)驗(yàn)結(jié)果:】A2、當(dāng)先驗(yàn)概率為:男0.75,女0.25時(shí):身高分類錯(cuò)誤個(gè)數(shù): 19 身高分類錯(cuò)誤率為: 15.32%體重分類錯(cuò)
6、誤個(gè)數(shù): 14 體重分類錯(cuò)誤率為: 11.29%B、對(duì)于Dataset2.txt 124個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)的測(cè)試樣本集:B1、當(dāng)先驗(yàn)概率為:男0.5,女0.5時(shí):身高分類錯(cuò)誤個(gè)數(shù): 16 身高分類錯(cuò)誤率為: 12.90%體重分類錯(cuò)誤個(gè)數(shù): 21 體重分類錯(cuò)誤率為: 16.94%【實(shí)驗(yàn)結(jié)果:】B2、當(dāng)先驗(yàn)概率為:男0.75,女0.25時(shí):身高分類錯(cuò)誤個(gè)數(shù): 31 身高分類錯(cuò)誤率為: 25.00%體重分類錯(cuò)誤個(gè)數(shù): 35 體重分類錯(cuò)誤率為: 28.23%【結(jié)果分析:】Dataset1.txt樣本數(shù)據(jù)集中,男女先驗(yàn)概率為(0.71vs0.29);Dataset2.txt樣本數(shù)據(jù)集中,男女先
7、驗(yàn)概率為(0.66vs0.34)。對(duì)比實(shí)驗(yàn)結(jié)果,可以發(fā)現(xiàn)身高的分類錯(cuò)誤率都小于體重的分類錯(cuò)誤率,樣本集越大,各個(gè)特征對(duì)應(yīng)的分類錯(cuò)誤率就越小。假設(shè)先驗(yàn)概率為(0.5vs0.5)的分類錯(cuò)誤率小于假設(shè)先驗(yàn)概率為(0.75vs0.25)的分類集,就算假設(shè)的先驗(yàn)概率與實(shí)際的很相近,可是結(jié)果不準(zhǔn)確。程序框圖Bayes分類器源程序?qū)嶒?yàn)代碼:clear all;load datasetf1.txt; load datasetm1.txt;%樣本的分析figure;for i=1:250 if(i<79) plot(datasetf1(i,2),datasetf1(i,1),'r+');
8、end plot(datasetm1(i,2),datasetm1(i,1),'k*'); hold on;endtitle('樣本數(shù)據(jù)');xlabel('體重(Kg)'),ylabel('身高(cm)');legend('男生','女生');fid=fopen('dataset1.txt','r'); test1=fscanf(fid,'%f %f %s',3,inf);test=test1'fclose(fid);Fmean = mean
9、(datasetf1);Mmean = mean(datasetm1);Fvar = std(datasetf1);Mvar = std(datasetm1);preF = 0.5;preM = 0.5;error = 0;Nerror = 0;%身高的決策figure;for i = 1:124PFheight = normpdf(test(i,1),Fmean(1,1),Fvar(1,1) ;PMheight = normpdf(test(i,1),Mmean(1,1),Mvar(1,1) ;pFemale = preF*PFheight;pMale = preM*PMheight; if
10、(pFemale<pMale) plot(i,test(i,1),'k*'); if (test(i,3)='f') Nerror = Nerror +1; end else plot(i,test(i,1),'r+'); if (test(i,3)='M') Nerror = Nerror +1; end end hold on;end;error = Nerror/124*100;title('身高最小錯(cuò)誤率Bayes分類');xlabel('測(cè)試序號(hào)'),ylabel('身高(c
11、m)');sprintf('%s %d %s %0.2f%s','身高分類錯(cuò)誤個(gè)數(shù):',Nerror,'身高分類錯(cuò)誤率為:',error,'%')%體重決策figure;error = 0;Nerror = 0;for j= 1:124PFweight = normpdf(test(j,2),Fmean(1,2),Fvar(1,2) ;PMweight = normpdf(test(j,2),Mmean(1,2),Mvar(1,2) ;pwFemale = preF*PFweight;pwMale = preM*PMwei
12、ght;if(pwFemale<pwMale) plot(j,test(j,2),'k*'); if (test(j,3)='f') Nerror = Nerror +1; end else plot(j,test(j,2),'r+'); if (test(j,3)='M') Nerror = Nerror +1; end end hold on;end;error = Nerror/124*100;title('體重最小錯(cuò)誤率Bayes分類');xlabel('測(cè)試序號(hào)'),ylabel(&
13、#39;體重(kg)');sprintf('%s %d %s %0.2f%s','體重分類錯(cuò)誤個(gè)數(shù):',Nerror,'體重分類錯(cuò)誤率為:',error,'%')(2)、Parzen窗法的實(shí)驗(yàn)結(jié)果與分析(先驗(yàn)概率為0.5vs0.5)A、對(duì)于Dataset1.txt中有78個(gè)女生和250個(gè)男生, 共328個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)的測(cè)試樣本集的結(jié)果:女生人數(shù)為:84; 男生人數(shù)為:244; 拒分人數(shù):0;女生錯(cuò)分人數(shù):4; 男生錯(cuò)分人數(shù):33;總的錯(cuò)分人數(shù):37;女生分類錯(cuò)誤率: 0.0800; 男生分類錯(cuò)誤率:0.132
14、0; 總的分類錯(cuò)誤率:0.1128;B、對(duì)于Dataset2.txt中有40個(gè)女生和84個(gè)男生, 共124個(gè)同學(xué)的身高、體重、性別數(shù)據(jù)的測(cè)試樣本集:女生人數(shù)為:41; 男生人數(shù)為:83;拒分人數(shù):0;女生錯(cuò)分人數(shù):15; 男生錯(cuò)分人數(shù):6;總的錯(cuò)分人數(shù):21;女生分類錯(cuò)誤率: 0.3000; 男生分類錯(cuò)誤率:0.0240 ; 總的分類錯(cuò)誤率: 0.1694 ;結(jié)果分析:Parzen窗法的分類結(jié)果比較準(zhǔn)確,樣本集越大,錯(cuò)誤率就越小。Parzen窗法的源程序代碼:clc; clear all; FH FW=textread('datasetf1.txt','%f%f'
15、;); MH MW=textread('datasetm1.txt','%f%f'); FA=FH FW; MA=MH MW; N1=max(size(FA);h1=7; hn1=h1/(sqrt(N1); VN1=hn12; N2=max(size(MA); h2=7; hn2=h2/(sqrt(N2); VN2=hn22; tH tW=textread('dataset1.txt','%f%f%*s'); X=tH tW; M N=size(X); s=zeros(M,1); error=0; errorgirl=0; err
16、orboy=0; errorrate=0; errorgirlrate=0; errorboyrate=0; girl=0; boy=0; bad=0; for k=1:M A=X(k,1) X(k,2); x=A; p=0.5;%p為屬于女生的先驗(yàn)概率,則1-p為男生的先驗(yàn)概率 pp=0; for i=1:N1 fa=FA(i,1) FA(i,2); n=1/sqrt(2*pi)*exp(-0.5*abs(x-fa)*(x-fa)')/(hn12); pp=pp+n; end p1=1/VN1*pp' y1=1/N1*p1;%是女生的條件概率密度函數(shù) qq=0; for j=1:N2 ma=MA(j,1) MA(j,2); m=1/sqrt(2*pi)*exp(-0.5*abs(x-ma)*(x-ma)')/(hn22); qq=m+qq; end q1=sum(1/VN2*qq'); y2=1/N2*q1;%男生的概率密度函數(shù),即其條件概率 g=p*y1-(1-p)*y2;%g為判別函數(shù) if g>0 if k<=50 s(k,1)=0;%判為女生 girl=girl+1; else errorboy=errorboy+1; end else if g<0 if k<=5
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 運(yùn)營(yíng)咨詢顧問(wèn)合同協(xié)議
- 月結(jié)貨款協(xié)議書(shū)
- 汽車(chē)分伙協(xié)議書(shū)
- 《晚期肺癌持續(xù)治療策略》課件
- 遺產(chǎn)協(xié)議書(shū)范本
- 軟件制圖交易合同協(xié)議
- 手車(chē)位買(mǎi)賣(mài)協(xié)議書(shū)
- 舊船買(mǎi)賣(mài)協(xié)議書(shū)
- 追償糾紛和解協(xié)議書(shū)模板
- 教育咨詢員服務(wù)合同書(shū)
- 數(shù)字貿(mào)易學(xué) 課件 第7章 智能制造
- 熱射病的防治與急救課件
- CATIAV5應(yīng)用教程-從機(jī)械設(shè)計(jì)到產(chǎn)品設(shè)計(jì)
- JJF 2109-2024標(biāo)準(zhǔn)物質(zhì)定值技術(shù)要求有機(jī)同位素稀釋質(zhì)譜法
- 小升初語(yǔ)文真題專項(xiàng)訓(xùn)練專題6+文學(xué)常識(shí)與名著閱讀(有解析)
- 新GCP醫(yī)療器械臨床試驗(yàn)知識(shí)試題(附含答案)
- 滴滴出行營(yíng)銷策略分析報(bào)告總結(jié)
- 國(guó)際貿(mào)易風(fēng)險(xiǎn)管理與進(jìn)出口業(yè)務(wù)培訓(xùn)資料
- 數(shù)獨(dú)4宮練習(xí)題(全)
- 《支持向量機(jī)SVM》課件
- 生態(tài)環(huán)境分區(qū)管控總結(jié)與展望報(bào)告
評(píng)論
0/150
提交評(píng)論