中科院《模式識(shí)別》——第一章資料_第1頁(yè)
中科院《模式識(shí)別》——第一章資料_第2頁(yè)
中科院《模式識(shí)別》——第一章資料_第3頁(yè)
中科院《模式識(shí)別》——第一章資料_第4頁(yè)
中科院《模式識(shí)別》——第一章資料_第5頁(yè)
已閱讀5頁(yè),還剩52頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、模式識(shí)別- 概念、原理(yunl)(算法)及其應(yīng)用黃慶明中科院研究生院信息學(xué)院(xuyun) / 助教:劉純熙() 李國(guó)榮()共五十七頁(yè)引 言 共五十七頁(yè)課程(kchng)對(duì)象計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)碩士(shush)研究生的專業(yè)基礎(chǔ)課電子科學(xué)與技術(shù)學(xué)科碩士研究生的專業(yè)基礎(chǔ)課 共五十七頁(yè)與模式識(shí)別(m sh sh bi)相關(guān)的學(xué)科統(tǒng)計(jì)學(xué)概率論線性代數(shù)(矩陣計(jì)算)形式語(yǔ)言機(jī)器學(xué)習(xí)人工智能(rn n zh nn)圖像處理計(jì)算機(jī)視覺(jué)共五十七頁(yè)教學(xué)方法著重講述模式識(shí)別的基本概念,基本方法和算法原理。注重理論與實(shí)踐(shjin)緊密結(jié)合實(shí)例教學(xué):通過(guò)大量實(shí)例講述如何將所學(xué)知識(shí)運(yùn)用到實(shí)際應(yīng)用之中避免引用過(guò)多的、

2、繁瑣的數(shù)學(xué)推導(dǎo)。 共五十七頁(yè)教學(xué)(jio xu)目標(biāo)掌握模式識(shí)別的基本概念和方法有效(yuxio)地運(yùn)用所學(xué)知識(shí)和方法解決實(shí)際問(wèn)題為研究新的模式識(shí)別的理論和方法打下基礎(chǔ) 共五十七頁(yè)題外話基本:完成課程學(xué)習(xí),通過(guò)考試,獲得學(xué)分。提高:能夠?qū)⑺鶎W(xué)知識(shí)和內(nèi)容用于課題研究,解決實(shí)際問(wèn)題(wnt)。飛躍:通過(guò)模式識(shí)別的學(xué)習(xí),改進(jìn)思維方式,為將來(lái)的工作打好基礎(chǔ),終身受益。共五十七頁(yè)參考文獻(xiàn)R. Duda, P. Hart, D. Stork, Pattern Classification, second edition, 2000(有中譯本).邊肇祺,模式識(shí)別(第二版),清華大學(xué)出版社,2000。蔡元龍(

3、yun ln),模式識(shí)別,西北電訊工程學(xué)院出版社,1986。共五十七頁(yè)機(jī)構(gòu)、會(huì)議(huy)、刊物1973年 IEEE發(fā)起了第一次關(guān)于模式識(shí)別的國(guó)際會(huì)議“ICPR”(此后兩年一次),成立(chngl)了國(guó)際模式識(shí)別協(xié)會(huì)-“IAPR”1977年IEEE成立PAMI委員會(huì),創(chuàng)立IEEE Trans. on PAMI,并支持ICCV, CVPR兩個(gè)會(huì)議 其它刊物Pattern Recognition (PR)Pattern Recognition Letters (PRL)Pattern Analysis and Application (PAA)International Journal of Pa

4、ttern Recognition and Artificial Intelligence (IJPRAI)共五十七頁(yè)第一章 模式識(shí)別(m sh sh bi)概論共五十七頁(yè)什么(shn me)是模式(Pattern)?共五十七頁(yè)什么(shn me)是模式?廣義地說(shuō),存在于時(shí)間和空間中可觀察的物體,如果我們可以區(qū)別它們是否相同或是否相似,都可以稱之為模式。模式所指的不是事物本身,而是從事物獲得的信息,因此,模式往往表現(xiàn)為具有時(shí)間和空間分布的信息。模式的直觀(zhgun)特性:可觀察性可區(qū)分性相似性共五十七頁(yè)模式識(shí)別(m sh sh bi)的概念模式識(shí)別 直觀,無(wú)所不在,“人以類聚,物以群分”周圍

5、物體(wt)的認(rèn)知:桌子、椅子人的識(shí)別:張三、李四聲音的辨別:汽車、火車,狗叫、人語(yǔ)氣味的分辨:炸帶魚(yú)、紅燒肉人和動(dòng)物的模式識(shí)別能力是極其平常的,但對(duì)計(jì)算機(jī)來(lái)說(shuō)卻是非常困難的。共五十七頁(yè)模式識(shí)別(m sh sh bi)的研究目的:利用計(jì)算機(jī)對(duì)物理對(duì)象(duxing)進(jìn)行分類,在錯(cuò)誤概率最小的條件下,使識(shí)別的結(jié)果盡量與客觀物體相符合。Y = F(X)X的定義域取自特征集Y的值域?yàn)轭悇e的標(biāo)號(hào)集F是模式識(shí)別的判別方法共五十七頁(yè)模式識(shí)別(m sh sh bi)簡(jiǎn)史1929年 G. Tauschek發(fā)明閱讀機(jī) ,能夠閱讀0-9的數(shù)字。30年代 Fisher提出統(tǒng)計(jì)分類理論,奠定了統(tǒng)計(jì)模式識(shí)別的基礎(chǔ)。50

6、年代 Noam Chemsky 提出形式語(yǔ)言理論傅京蓀 提出句法結(jié)構(gòu)模式識(shí)別。60年代 L.A.Zadeh提出了模糊(m hu)集理論,模糊(m hu)模式識(shí)別方法得以發(fā)展和應(yīng)用。80年代以Hopfield網(wǎng)、BP網(wǎng)為代表的神經(jīng)網(wǎng)絡(luò)模型導(dǎo)致人工神經(jīng)元網(wǎng)絡(luò)復(fù)活,并在模式識(shí)別得到較廣泛的應(yīng)用。90年代小樣本學(xué)習(xí)理論,支持向量機(jī)也受到了很大的重視。共五十七頁(yè)模式識(shí)別(m sh sh bi)的應(yīng)用(舉例)生物學(xué)自動(dòng)細(xì)胞學(xué)、染色體特性研究、遺傳研究天文學(xué)天文望遠(yuǎn)鏡圖像分析、自動(dòng)光譜學(xué)經(jīng)濟(jì)學(xué)股票交易預(yù)測(cè)、企業(yè)(qy)行為分析醫(yī)學(xué)心電圖分析、腦電圖分析、醫(yī)學(xué)圖像分析共五十七頁(yè)模式識(shí)別(m sh sh bi)

7、的應(yīng)用(舉例)工程產(chǎn)品缺陷檢測(cè)、特征識(shí)別、語(yǔ)音識(shí)別、自動(dòng)導(dǎo)航系統(tǒng)、污染分析軍事航空攝像分析、雷達(dá)和聲納(shngn)信號(hào)檢測(cè)和分類、自動(dòng)目標(biāo)識(shí)別安全指紋識(shí)別、人臉識(shí)別、監(jiān)視和報(bào)警系統(tǒng)共五十七頁(yè)模式識(shí)別(m sh sh bi)方法模式識(shí)別系統(tǒng)的目標(biāo):在特征空間和解釋空間之間找到一種(y zhn)映射關(guān)系,這種映射也稱之為假說(shuō)。特征空間:從模式得到的對(duì)分類有用的度量、屬性或基元構(gòu)成的空間。解釋空間:將c個(gè)類別表示為其中 為所屬類別的集合,稱為解釋空間。 共五十七頁(yè)假說(shuō)(ji shu)的兩種獲得方法監(jiān)督學(xué)習(xí)、概念驅(qū)動(dòng)或歸納假說(shuō):在特征空間中找到一個(gè)與解釋空間的結(jié)構(gòu)相對(duì)應(yīng)的假說(shuō)。在給定(i dn)模式

8、下假定一個(gè)解決方案,任何在訓(xùn)練集中接近目標(biāo)的假說(shuō)也都必須在“未知”的樣本上得到近似的結(jié)果。依靠已知所屬類別的的訓(xùn)練樣本集,按它們特征向量的分布來(lái)確定假說(shuō) (通常為一個(gè)判別函數(shù)),在判別函數(shù)確定之后能用它對(duì)未知的模式進(jìn)行分類;對(duì)分類的模式要有足夠的先驗(yàn)知識(shí),通常需要采集足夠數(shù)量的具有典型性的樣本進(jìn)行訓(xùn)練。共五十七頁(yè)假說(shuō)(ji shu)的兩種獲得方法(續(xù))非監(jiān)督學(xué)習(xí)、數(shù)據(jù)驅(qū)動(dòng)或演繹假說(shuō):在解釋空間中找到一個(gè)與特征空間的結(jié)構(gòu)相對(duì)應(yīng)的假說(shuō)。這種方法試圖找到一種只以特征空間中的相似關(guān)系為基礎(chǔ)的有效假說(shuō)。在沒(méi)有先驗(yàn)知識(shí)的情況下,通常采用聚類分析方法,基于“物以類聚”的觀點(diǎn),用數(shù)學(xué)方法分析各特征向量之間的距

9、離及分散情況;如果特征向量集聚集若干個(gè)群,可按群間距離遠(yuǎn)近把它們劃分成類;這種按各類之間的親疏程度的劃分,若事先能知道應(yīng)劃分成幾類,則可獲得(hud)更好的分類結(jié)果。共五十七頁(yè)模式分類的主要(zhyo)方法數(shù)據(jù)(shj)聚類統(tǒng)計(jì)分類結(jié)構(gòu)模式識(shí)別神經(jīng)網(wǎng)絡(luò)共五十七頁(yè)數(shù)據(jù)(shj)聚類目標(biāo):用某種相似性度量的方法將原始數(shù)據(jù)組織(zzh)成有意義的和有用的各種數(shù)據(jù)集。是一種非監(jiān)督學(xué)習(xí)的方法,解決方案是數(shù)據(jù)驅(qū)動(dòng)的。共五十七頁(yè)統(tǒng)計(jì)(tngj)分類基于概率統(tǒng)計(jì)模型得到(d do)各類別的特征向量的分布,以取得分類的方法。特征向量分布的獲得是基于一個(gè)類別已知的訓(xùn)練樣本集。是一種監(jiān)督分類的方法,分類器是概念驅(qū)動(dòng)

10、的。共五十七頁(yè)結(jié)構(gòu)(jigu)模式識(shí)別該方法通過(guò)考慮識(shí)別對(duì)象的各部分之間的聯(lián)系來(lái)達(dá)到識(shí)別分類的目的。識(shí)別采用結(jié)構(gòu)匹配的形式,通過(guò)計(jì)算一個(gè)匹配程度值(matching score)來(lái)評(píng)估一個(gè)未知的對(duì)象或未知對(duì)象某些部分與某種典型(dinxng)模式的關(guān)系如何。當(dāng)成功地制定出了一組可以描述對(duì)象部分之間關(guān)系的規(guī)則后,可以應(yīng)用一種特殊的結(jié)構(gòu)模式識(shí)別方法 句法模式識(shí)別,來(lái)檢查一個(gè)模式基元的序列是否遵守某種規(guī)則,即句法規(guī)則或語(yǔ)法。共五十七頁(yè)神經(jīng)網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是受人腦組織的生理學(xué)啟發(fā)而創(chuàng)立的。由一系列互相聯(lián)系的、相同的單元(神經(jīng)元)組成。相互間的聯(lián)系可以在不同的神經(jīng)元之間傳遞增強(qiáng)或抑制信號(hào)。增強(qiáng)或抑制是通過(guò)調(diào)

11、整神經(jīng)元相互間聯(lián)系的權(quán)重系數(shù)來(lái)(weight)實(shí)現(xiàn)。神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)監(jiān)督(jind)和非監(jiān)督(jind)學(xué)習(xí)條件下的分類。共五十七頁(yè)模式識(shí)別(m sh sh bi)系統(tǒng)模式識(shí)別系統(tǒng)(xtng)的基本構(gòu)成數(shù)據(jù)獲取特征提取和選擇預(yù)處理分類決策分類器設(shè)計(jì)共五十七頁(yè)模式識(shí)別(m sh sh bi)系統(tǒng)組成單元數(shù)據(jù)獲取:用計(jì)算機(jī)可以運(yùn)算的符號(hào)來(lái)表示所研究(ynji)的對(duì)象二維圖像:文字、指紋、地圖、照片等一維波形:腦電圖、心電圖、季節(jié)震動(dòng)波形等物理參量和邏輯值:體溫、化驗(yàn)數(shù)據(jù)、參量正常與否的描述預(yù)處理單元:去噪聲,提取有用信息,并對(duì)輸入測(cè)量?jī)x器或其它因素所造成的退化現(xiàn)象進(jìn)行復(fù)原共五十七頁(yè)模式識(shí)別(m s

12、h sh bi)系統(tǒng)組成單元特征提取和選擇:對(duì)原始數(shù)據(jù)進(jìn)行變換,得到最能反映分類本質(zhì)的特征測(cè)量空間:原始數(shù)據(jù)組成(z chn)的空間特征空間:分類識(shí)別賴以進(jìn)行的空間模式表示:維數(shù)較高的測(cè)量空間-維數(shù)較低的特征空間分類決策:在特征空間中用模式識(shí)別方法把被識(shí)別對(duì)象歸為某一類別基本做法:在樣本訓(xùn)練集基礎(chǔ)上確定某個(gè)判決規(guī)則,使得按這種規(guī)則對(duì)被識(shí)別對(duì)象進(jìn)行分類所造成的錯(cuò)誤識(shí)別率最小或引起的損失最小共五十七頁(yè)模式識(shí)別過(guò)程(guchng)實(shí)例在傳送帶上用(shn yn)光學(xué)傳感器件對(duì)魚(yú)按品種分類鱸魚(yú)(Seabass)品種鮭魚(yú)(Salmon)共五十七頁(yè)識(shí)別(shbi)過(guò)程數(shù)據(jù)獲?。杭茉O(shè)一個(gè)攝像機(jī),采集一些樣本

13、圖像(t xin),獲取樣本數(shù)據(jù)預(yù)處理:去噪聲,用一個(gè)分割操作把魚(yú)和魚(yú)之間以及魚(yú)和背景之間分開(kāi)共五十七頁(yè)識(shí)別(shbi)過(guò)程特征提取和選擇:對(duì)單個(gè)魚(yú)的信息進(jìn)行特征選擇,從而(cng r)通過(guò)測(cè)量某些特征來(lái)減少信息量長(zhǎng)度亮度寬度魚(yú)翅的數(shù)量和形狀嘴的位置,等等 分類決策:把特征送入決策分類器共五十七頁(yè)共五十七頁(yè)共五十七頁(yè)共五十七頁(yè)共五十七頁(yè)共五十七頁(yè)共五十七頁(yè)模式分類器的獲取(huq)和評(píng)測(cè)過(guò)程數(shù)據(jù)采集特征選取模型(mxng)選擇訓(xùn)練和測(cè)試計(jì)算結(jié)果和復(fù)雜度分析,反饋共五十七頁(yè)共五十七頁(yè)訓(xùn)練(xnlin)和測(cè)試訓(xùn)練集:是一個(gè)已知樣本集,在監(jiān)督學(xué)習(xí)方法中,用它來(lái)開(kāi)發(fā)出模式分類器。測(cè)試集:在設(shè)計(jì)(shj

14、)識(shí)別和分類系統(tǒng)時(shí)沒(méi)有用過(guò)的獨(dú)立樣本集。系統(tǒng)評(píng)價(jià)原則:為了更好地對(duì)模式識(shí)別系統(tǒng)性能進(jìn)行評(píng)價(jià),必須使用一組獨(dú)立于訓(xùn)練集的測(cè)試集對(duì)系統(tǒng)進(jìn)行測(cè)試。共五十七頁(yè)實(shí)例:統(tǒng)計(jì)(tngj)模式識(shí)別19名男女同學(xué)進(jìn)行(jnxng)體檢,測(cè)量了身高和體重,但事后發(fā)現(xiàn)其中有4人忘記填寫性別,試問(wèn)(在最小錯(cuò)誤的條件下)這4人是男是女?體檢數(shù)值如下:共五十七頁(yè)實(shí)例(shl):統(tǒng)計(jì)模式識(shí)別(續(xù))待識(shí)別的模式:性別(男或女)測(cè)量的特征(tzhng):身高和體重訓(xùn)練樣本:15名已知性別的樣本特征目標(biāo):希望借助于訓(xùn)練樣本的特征建立判別函數(shù)(即數(shù)學(xué)模型)共五十七頁(yè)實(shí)例:統(tǒng)計(jì)(tngj)模式識(shí)別(續(xù))由訓(xùn)練樣本得到(d do)的特

15、征空間分布圖共五十七頁(yè)實(shí)例(shl):統(tǒng)計(jì)模式識(shí)別(續(xù))從圖中訓(xùn)練樣本的分布情況,找出男、女兩類特征各自的聚類特點(diǎn),從而求取一個(gè)判別函數(shù)(直線或曲線(qxin))。只要給出待分類的模式特征的數(shù)值,看它在特征平面上落在判別函數(shù)的哪一側(cè),就可以判別是男還是女了。共五十七頁(yè)實(shí)例:句法(jf)模式識(shí)別問(wèn)題:如何利用對(duì)圖像的結(jié)構(gòu)信息描述,識(shí)別(shbi)如下所示圖片:共五十七頁(yè)實(shí)例(shl):句法模式識(shí)別(續(xù))將整個(gè)場(chǎng)景圖像結(jié)構(gòu)分解成一些比較簡(jiǎn)單的子圖像的組合;子圖像又用一些更為簡(jiǎn)單的基本圖像單元來(lái)表示,直至子圖像達(dá)到了我們認(rèn)為的最簡(jiǎn)單的圖像單元(基元);所有這些基元按一定的結(jié)構(gòu)關(guān)系來(lái)表示,利用多級(jí)樹(shù)結(jié)

16、構(gòu)對(duì)其進(jìn)行(jnxng)描述(這種描述可以采用形式語(yǔ)言理論)。共五十七頁(yè)實(shí)例:句法(jf)模式識(shí)別(續(xù))多級(jí)樹(shù)描述(mio sh)結(jié)構(gòu)共五十七頁(yè)實(shí)例:句法(jf)模式識(shí)別(續(xù))訓(xùn)練過(guò)程:用已知結(jié)構(gòu)信息的圖像作為訓(xùn)練樣本,先識(shí)別出基元(比如場(chǎng)景圖中的X、Y、Z等簡(jiǎn)單平面)和它們之間的連接關(guān)系(例如長(zhǎng)方體E是由X、Y和Z三個(gè)面拼接而成),并用字母符號(hào)代表之;然后用構(gòu)造句子的文法來(lái)描述生成(shn chn)這幅場(chǎng)景的過(guò)程,由此推斷出生成(shn chn)該場(chǎng)景的一種文法。共五十七頁(yè)實(shí)例(shl):句法模式識(shí)別(續(xù))識(shí)別過(guò)程:先對(duì)未知結(jié)構(gòu)信息的圖像進(jìn)行(jnxng)基元提取及其相互結(jié)構(gòu)關(guān)系的識(shí)別;然后

17、用訓(xùn)練過(guò)程獲得的文法做句法分析;如果能被已知結(jié)構(gòu)信息的文法分析出來(lái),則該幅未知圖像與訓(xùn)練樣本具有相同的結(jié)構(gòu)(識(shí)別成功),否則就不是這種結(jié)構(gòu)(識(shí)別失?。?。共五十七頁(yè)本門課程(kchng)的主要內(nèi)容第一章 概論第二章 聚類分析第三章 判別函數(shù)第四章 統(tǒng)計(jì)判別第五章特征選擇和提取第六章神經(jīng)網(wǎng)絡(luò)第七章句法模式識(shí)別第八章模糊(m hu)模式識(shí)別第九章模式識(shí)別應(yīng)用共五十七頁(yè)相關(guān)(xinggun)數(shù)學(xué)概念隨機(jī)向量及其分布隨機(jī)向量如果一個(gè)對(duì)象的特征觀察值為x1, x2, , xn,它可構(gòu)成一個(gè)n維的特征向量值x,即 x = (x1, x2, , xn)T 式中, x1, x2, , xn為特征向量x的各個(gè)分量

18、(fn ling)。一個(gè)特征可以看作n維空間中的向量或點(diǎn),此空間稱為模式的特征空間Rn。共五十七頁(yè)相關(guān)數(shù)學(xué)(shxu)概念隨機(jī)向量及其分布隨機(jī)向量在模式識(shí)別過(guò)程中,要對(duì)許多具體對(duì)象(duxing)進(jìn)行測(cè)量,以獲得許多次觀測(cè)值。每次觀測(cè)值不一定相同,所以對(duì)許多對(duì)象而言,各個(gè)特征分量都是隨機(jī)變量,即許多對(duì)象的特征向量在n維空間中呈隨機(jī)性分布,稱為隨機(jī)向量。共五十七頁(yè)相關(guān)數(shù)學(xué)(shxu)概念隨機(jī)(su j)向量及其分布隨機(jī)向量的參數(shù)數(shù)學(xué)期望和方差協(xié)方差矩陣?yán)呵箅S機(jī)變量的數(shù)學(xué)期望和協(xié)方差矩陣共五十七頁(yè)相關(guān)數(shù)學(xué)(shxu)概念正態(tài)分布一維正態(tài)密度(md)函數(shù)共五十七頁(yè)相關(guān)(xinggun)數(shù)學(xué)概念正態(tài)分布多維正態(tài)密度(md)函數(shù)共五十七頁(yè)小結(jié)(xioji)模式和模式識(shí)別的概念模式識(shí)別的發(fā)展簡(jiǎn)史和應(yīng)用模式識(shí)別的主要方法(fngf)模式識(shí)別的系統(tǒng)和實(shí)例幾個(gè)相關(guān)的數(shù)學(xué)概念共五十七頁(yè)內(nèi)容

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論