模式識(shí)別基礎(chǔ)復(fù)習(xí)資料_第1頁
模式識(shí)別基礎(chǔ)復(fù)習(xí)資料_第2頁
模式識(shí)別基礎(chǔ)復(fù)習(xí)資料_第3頁
模式識(shí)別基礎(chǔ)復(fù)習(xí)資料_第4頁
模式識(shí)別基礎(chǔ)復(fù)習(xí)資料_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、真誠為您提供優(yōu)質(zhì)參考資料,若有不當(dāng)之處,請(qǐng)指正。模式識(shí)別基礎(chǔ)復(fù)習(xí)資料教師:張學(xué)工2009秋季X清華大學(xué) 自動(dòng)化系2009秋季Contents卷一、模式識(shí)別機(jī)經(jīng)3卷二、20082009秋_模式識(shí)別_張學(xué)工_期末B4卷三、20072008秋_模式識(shí)別_張學(xué)工_期末B6卷四、20072008秋_模式識(shí)別_張學(xué)工_期末A8卷五、20062007秋_模式識(shí)別_張學(xué)工_期末B9卷六、20052006秋_模式識(shí)別_張學(xué)工_期末10卷七、20042005秋_模式識(shí)別_張學(xué)工_期末11卷八、20032004秋_模式識(shí)別_張學(xué)工_期末12卷九、19992000春_模式識(shí)別_張學(xué)工_期

2、末13附錄、名詞以及原理15卷一、模式識(shí)別機(jī)經(jīng) 1.(16分)正態(tài)分布N(0,9)與均勻分布5,10,先驗(yàn)概率1/2最小錯(cuò)誤率分類器,并畫圖.最小錯(cuò)誤率分類器缺點(diǎn) 答:設(shè)計(jì)最小錯(cuò)誤率分類器:如果則為反之則為(特別的,當(dāng),可以接受為任何一類也可以拒絕。在連續(xù)情況下這種情況幾乎完全不出現(xiàn)。,2畫圖如下,紅色表示(5,10均勻分布的后驗(yàn)概率),藍(lán)色表示(N(0,9)的后驗(yàn)概率)(注意!圖是錯(cuò)的作者)(圖是錯(cuò)的)3最小錯(cuò)誤分類器有許多局限性。其一,其只考慮到錯(cuò)誤率的限制,并未考慮到實(shí)際情況中不同錯(cuò)誤的代價(jià)等等,為了克服這類局限性,學(xué)者們?cè)谧钚″e(cuò)誤率之外又設(shè)計(jì)了最小風(fēng)險(xiǎn)分類器、限定一類錯(cuò)誤率令另一類錯(cuò)誤

3、率最小的分類器等;其二,其只能用于監(jiān)督學(xué)習(xí),要求已知分類情況,并且要滿足I.I.D條件即樣本與總體分布相符;其三,其要求必須知道先驗(yàn)概率,許多實(shí)際問題的先驗(yàn)概率是難以得到的。 2.(22分)8個(gè)樣品w13個(gè).,w25個(gè).1)最近鄰分類,畫圖2)給兩個(gè)點(diǎn).,問怎么分3)最近鄰分類器線性分類器?4)設(shè)計(jì)二次曲面分之5)壓縮近鄰法壓縮過程及結(jié)果6)壓縮近鄰法分界面并比較1)答:(題目不完整)最近鄰法(k=1),k近鄰(k個(gè)最近的點(diǎn)投票),可以考慮加權(quán)3.(5分)證明兩個(gè)樣品構(gòu)成得協(xié)方差矩陣一般是奇異的(不可逆的)答:設(shè),從而其第i行j列元素為,表示第m個(gè)樣本第n個(gè)維度的值。從而這是一個(gè)行列式為零的矩

4、陣(第一行除以(),第二行除以之后想減得零,故該協(xié)方差陣是奇異的。 4.(26分)距離不同會(huì)有不同結(jié)果1)給出兩種你認(rèn)為重要的距離,如何定義及物理意義2)貝葉斯分類器,近鄰法,fisher投影法,c均值法是否受距離度量影響,不受則說明理由,受,距離說明答:距離可以是任意一種范數(shù),設(shè)對(duì)點(diǎn)歐幾里得距離(2范數(shù)):每個(gè)坐標(biāo)的絕對(duì)值差之和(1范數(shù)):貝葉斯分類器不受、fisher投影法不受:都屬于判別函數(shù)與距離度量無關(guān)的,故不受影響,近鄰法,c均值法與受到距離度量的5.(15分)AB玩游戲,A問是非問題,B回答是或非.問1)游戲與模式識(shí)別什么內(nèi)容有關(guān)系?用模式識(shí)別語言描述2)B應(yīng)如何調(diào)整問題3)如果做

5、成計(jì)算機(jī)游戲,寫出設(shè)計(jì)思路,方法,難點(diǎn),解決方案.游戲受歡迎嗎?為什么?答:?這是一類決策樹問題。可以將每一個(gè)是非問題看做一個(gè)決策樹節(jié)點(diǎn),是非答案決定了分支的方向(左或右)。調(diào)整問題應(yīng)該使得在有效分類的情況下樹深度最淺,就能在單次游戲最壞情況下最快猜出。(我覺得挺2的,應(yīng)該不會(huì)受歡迎。不過可以用作公安局犯罪嫌疑人指認(rèn)的軟件)6.(6分)自己設(shè)計(jì)模糊數(shù)學(xué)用于模式識(shí)別的其他理論方法(除去聚類).寫出思路必要細(xì)節(jié).分析可能結(jié)果.答:例如k-近鄰法的模糊性質(zhì)。定義隸屬函數(shù)表示屬于類的程度,值域上界為1,表示完全屬于,下界為0,表示完全不屬于,將對(duì)任意一個(gè)待判定的樣本,選取某個(gè)距離度量(如歐幾里得距離)

6、最近的k個(gè)已知類別的訓(xùn)練樣本,從而令得到x對(duì)于類的隸屬函數(shù)。7.(10分)專家經(jīng)常根據(jù)特殊筆跡或特殊長相分類.問如何在一個(gè)人臉自動(dòng)識(shí)別系統(tǒng)或筆跡自動(dòng)識(shí)別系統(tǒng)中實(shí)現(xiàn)人的這一經(jīng)驗(yàn).從數(shù)據(jù)預(yù)處理,特征提取,選擇分類器設(shè)計(jì)等角度描述實(shí)現(xiàn)這一經(jīng)驗(yàn)的方法與可能性.優(yōu)點(diǎn)?缺點(diǎn)?答:這是一類特殊的圖像識(shí)別問題,可以采用K-L分類卷二、20082009秋_模式識(shí)別_張學(xué)工_期末B1.(30)簡要介紹下列概念ROC曲線、交叉驗(yàn)證、似然函數(shù)、特征選擇與提取、推廣能力、隨機(jī)森林答:1 ROC曲線(Receiver Operational Characteristic Curve)是以False Positive Rate為橫坐標(biāo),True Positive Rate為縱坐標(biāo)的繪制的曲線,通過改變分點(diǎn)給出對(duì)應(yīng)的FP和TP繪成。曲線的點(diǎn)表示了在敏感度和特殊性之間的平衡,例如越往左,也就是假陽性越小,則真陽性也越小。曲線下方的面積越大,則表示該方法越有利于區(qū)分兩種類別。2 交叉驗(yàn)證是指交叉驗(yàn)證(Cross-validation)主要用于建模應(yīng)用中,在給定的建模樣本中,拿出大部分樣本進(jìn)行建模型,留小部分樣本用剛建立的模型進(jìn)行預(yù)報(bào),并求這小部分樣本的預(yù)報(bào)誤差,記錄它們的平方加和。這個(gè)過程一直進(jìn)行,直到所有的樣本都被預(yù)報(bào)了一次而且僅被預(yù)報(bào)一次。把每個(gè)樣本的預(yù)報(bào)誤差平方加和,這個(gè)數(shù)越小,表示該方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論