版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、 模模 式式 識識 別別 主講: 徐蔚然本門課的教學目的n模式識別的基本概念、原理和方法 n模式識別對不同領域都極為重要,所以必須了解和掌握模式識別技術n(目標)側重在應用模式識別技術 n(內(nèi)容)側重基本概念的講解,輔以必要的數(shù)學推導 n溫故而知新n對不同目的的同學提供不同層次知識教學要求n不同層次的理解和學習n模式識別是什么(基本概念和方法)n了解術語含義、了解模式識別系統(tǒng)基本結構、了解模式識別中關鍵問題n掌握具體的模式識別方法n理解各種算法原理n運用模式識別方法n解決實際問題n公式和物理含義n至少理解意義n理解含義的基礎上理解數(shù)學公式考察方法n課堂30%n作業(yè)30%n期末考試40%教材和參
2、考數(shù)目教材和參考數(shù)目n教材教材n模式識別(第第2版版) 清華大學出版社 邊肇祺n參考書目參考書目n模式識別(第第3版版) 清華大學出版社 張學工n模式識別導論模式識別導論 北京郵電大學出版社 盛立東nPattern Classification, Richard O. Duda, etc.nPattern Recognition, Sergios Theodoridis, etc.參考文獻總結n側重理解和領會n減少應試教育的影響n鼓勵自我實踐n智能自動客服系統(tǒng)n自動導購軟件n關于手機定時設置的一些操作n基于塞班手機平臺下的短信優(yōu)化處理軟件n手機監(jiān)控空調(diào)/熱水器停課通知n10月12日星期一的模式
3、識別課停課一次n上課時間另行通知n初步?jīng)Q定最后一周(考試前一周)補課一次 模模 式式 識識 別別 緒 論主講: 徐蔚然本章學習目的 n什么是模式識別?n模式識別有什么用?哪里可以應用?n機器自動學習的最基本原理是什么?本章重點 n模式識別的含義,模式的概念n模式的描述方法n模式識別系統(tǒng)的組成n模式識別利用訓練樣本設計分類器的原理(學習)本章難點 n模式的向量表示與結構表示n利用向量表示進行分類的基本原理n訓練和學習的概念、算法,分類器設計是如何利用訓練樣本數(shù)據(jù)提供的信息的n模式識別系統(tǒng)的組成,特征選擇與提取的含義和重要性n相似性的度量方法學習指南 n學習本章著重要了解幾個最基本的概念,即模式識
4、別就是機器自動識別與分類;n為了實現(xiàn)自動識別對所要識別事物要進行度量,以及用相應方法表示;n著重弄清特征向量是什么意思?n通過一些例題與習題了解其定義及用途,弄清分類的最基本方法,弄清為什么要用分界面來實現(xiàn)機器自動識別與分類。1.1 模式識別和模式的概念n模式識別n英文:Pattern Recognitionn機器識別,計算機識別,或機器自動識別 n本門課中的含義:n針對讓計算機來判斷事物而提出的 n用計算機實現(xiàn)人的模式識別能力日常生活中的模式識別n日常生活中的模式識別n陌生、但密切相關n語音、圖像、氣味n尋找教室、查找資料、醫(yī)生看病n見慣不驚日常生活中的模式識別n模式識別n針對讓計算機來判斷
5、事物而提出的 n該學科研究的內(nèi)容是使機器能做以前只能由人類才能做的事,具備人所具有的、對各種事物與現(xiàn)象進行分析、描述與判斷的部分能力。模式識別與認知心理學n模式識別與認知心理學n認知心理學n是二十世紀50年代中期在西方興起的一種心理學思潮,二十世紀70年代成為西方心理學的一個主要研究方向。它研究人的高級心理過程,主要是認識過程,如注意、知覺、表象、記憶、思維和語言等。n認知心理學和模式識別的相互作用 模式識別與認知心理學感覺知覺收集、轉換、分析、編碼,信息的輸入過程感覺器官感覺分析腦知覺的組織大腦將感覺組織成有意義的模式的過程感覺編碼知覺的習得知覺研究的一個中心課題就是模式識別模式識別與認知心
6、理學n知覺的一些特性: 選擇性模式識別與認知心理學n知覺的一些特性: 整體性接近性相似性連續(xù)性封閉性模式識別與認知心理學n知覺的一些特性: 理解性模式識別與認知心理學n知覺的一些特性:恒常性大小恒常性形狀恒常性顏色恒常性o選擇性o整體性知覺的特性o理解性o恒常性模式識別與認知心理學n錯覺n錯覺是錯誤的知覺,是在特定條件下產(chǎn)生的對客觀事物歪曲的知覺。Muller-Lyer illusion模式識別與認知心理學n目的和結論n認知是一個過程,需要大腦的參與n人的認知并不神秘,也符合一定的規(guī)律,也會產(chǎn)生錯誤n計算機模式識別過程可以參考認知過程n對認知過程的研究也需要借鑒計算機模式識別系統(tǒng)模式識別與其它
7、智能技術的關系n模式識別與其它智能技術的關系n人工智能n信息檢索n數(shù)據(jù)挖掘n圖像處理和計算機視覺機器與人類識別事物原理的比較 n人類:具有提取抽象概念的能力n分析事物的本質(zhì)n總結出規(guī)律n抽象成“概念”n機器:缺乏抽象概念的能力n最基本的方法是計算n要求人研究出好的方法,構造出好的系統(tǒng)機器與人類識別事物原理的比較n機器:辨別事物的最基本方法是計算 n計算機要分析的事物n計算機作為標準的 “模板”n相似程度計算 模式與模式類n模式與模式類n把所見到的事物稱為模式,而將它們的歸屬類別稱為模式類。 n樣本與模式(模式類)n所見的具體事物是樣本,而它們所屬的事物類別,代表這些事物的“概念”是模式 。n模
8、式與樣本在集合論中是子集與元素之間的關系 1.2 模式的描述方法n人類的方法n從不同事物所具有的不同屬性為出發(fā)點認識事物n模式識別中的方法n模式識別中,模式就是用它們所具有的特征特征(Feature) 描述的。n對一種模式與它們的樣本來說,將描述它們的所有特征用一特征集表示 :模式的描述方法n描述模式的兩種基本方法n一種是對事物的屬性進行度量,屬于定量的表示方法(向量表示法 )。n另一種則是對事務所包含的成分進行分析,稱為定性的描述(結構性描述方法)。 模式的描述方法n利用特征進行定量描述(向量表示法)n用各種尺度對事物進行度量 n常用的方法是將這些度量排成序n例如對水果進行分類 用水果的重量
9、,近似球體直徑表示水果:一只蘋果重0.3斤,直徑10厘米,則可表示成(0.3,10) (0.35,12)則可解釋成重量為0.35斤,直徑12厘米 模式的描述方法n利用特征進行定量描述(向量表示法)n特征空間中的一個樣本點圖像的向量表示方法數(shù)字圖像像素向量的運算是建立在 各個分量基礎上的 模式的描述方法n結構性描述方法n由事務的組成成分與相互關系進行描述。 n對一幅景色圖像中的房屋的描述n它有屋頂、墻、門窗等組成,各種成分之間又有相互關系,則墻在屋頂之下,門與窗都在墻上等。n常用的有串、樹、圖等 統(tǒng)計模式識別與結構模式識別n統(tǒng)計模式識別n基于特征向量的表示方法n結構模式識別n基于結構性描述方法1
10、.3 模式識別系統(tǒng)n模式識別系統(tǒng)n對樣本進行分類,執(zhí)行模式識別的計算機系統(tǒng)稱為模式識別系統(tǒng)n模式識別系統(tǒng)的基本構成n一般由數(shù)據(jù)獲取,預處理,特征提取選擇、分類決策及分類器設計五部分組成。 n圖數(shù)據(jù)獲取n模式識別系統(tǒng)的基本構成n用不同形式的傳感器構成,它實現(xiàn)信息的獲取與信息在不同媒體之間的轉換。n將光或聲音等非電信息轉化為電信息。n信息可以是二維的圖象如文字,圖象等;可以是一維的波形如聲波,心電圖,腦電圖;也可以是物理量與邏輯值。預處理包括AD,二值化,圖象的平滑,變換,增強,恢復,濾波等, 主要指圖象處理。 特征提取和特征選擇n將所獲取的原始量測數(shù)據(jù)轉換成能反映事物本質(zhì),并將其最有效分類的特征
11、表示n輸入:原始的量測數(shù)據(jù)(必要的預處理) n輸出:將原始量測數(shù)據(jù)轉換成有效方式表示的信息,從而使分類器能根據(jù)這些信息決定樣本的類別 特征提取選擇n測量空間n原始數(shù)據(jù)是由所使用的量測儀器或傳感器獲取的,這些數(shù)據(jù)組成的空間叫測量空間。 n特征空間 n待識別的樣本及模式都是用特征進行描述的,識別與訓練都是在特征空間中進行的。 n測量空間 特征空間特征提取選擇n將所獲取的原始量測數(shù)據(jù)轉換成能反映事物本質(zhì),并將其最有效分類的特征表示n例如,一幅64x64的圖象可以得到4096個數(shù)據(jù),這種在測量空間的原始數(shù)據(jù)通過變換獲得在特征空間最能反映分類本質(zhì)的特征。這就是特征提取和選擇的過程。特征提取選擇n數(shù)字識別
12、的例子 n特征向量表示法n優(yōu)點: 簡單n缺點:穩(wěn)定性差。這種表示與網(wǎng)格的尺寸有關,與字的筆劃粗細有關,更主要的是字在網(wǎng)格中的不同位置與轉向有關。n改進:特征提取選擇n數(shù)字識別的例子n結構(筆劃)表示法 n也就是將它分成一橫加上一斜杠表示。n優(yōu)點:沒有前種方法的缺點 n缺點 :提取這種結構信息也不是一件容易方便的事。 分類器設計與分類決策n模式識別系統(tǒng)工作的兩種方式n訓練方式和分類決策方式n訓練方式:將該特征空間劃分成由各類占據(jù)的子空間,確定相應的決策分界。分類器設計分類器設計與分類決策n分類決策方式:分類決策n用相應得決策分界對待分類樣本進行分類決策的過程。模式識別系統(tǒng): 汽車車牌識別n例:
13、汽車車牌識別n成功的車牌識別系統(tǒng)有著非常廣泛的應用前景,例如公路上的自動收費站,十字路口的違章車輛監(jiān)視等等。目前的車牌識別系統(tǒng)大都是按照以上的流程。這個流程又可以在整體上劃分為兩大部分車牌的提取和定位,以及字符識別部分。下面,我們將針對每一個模塊,具體說明車牌識別的過程。 模式識別系統(tǒng): 汽車車牌識別n總體框圖模式識別系統(tǒng): 汽車車牌識別n車牌定位模塊 n框圖描述n車牌定位模塊的目的:n是從整幅圖像中定位出車牌的精確位置。n利用信息模式識別系統(tǒng): 汽車車牌識別n字符識別 n框圖描述n正確車牌判斷n輸入:候選車牌區(qū)域n輸出:正確車牌的結果,去掉偽車牌區(qū)域n字符識別分兩部分n字符分割n字符識別模塊
14、n神經(jīng)元網(wǎng)絡,PCA,特征提取及匹配等,模板匹配和特征提取是比較常用的方法。1.4 有關模式識別的若干問題n學習n模式的緊致性n相似性度量一.學習n學習n人的學習能力n從學習過程中掌握很強的分辨事物能力 n機器的學習n機器也有個學習過程,訓練與學習的過程n機器訓練的實質(zhì):按照公式計算求解過程 n要使用一批包括各種類別的訓練樣本 n勾畫出各類事物在特征空間分布的規(guī)律性 n確定使用分類的具體數(shù)學公式及其參數(shù)學習n例:兩類訓練樣本近似圓形分布 n分類函數(shù)類型的確定:n使用什么類型的分類函數(shù)是人為決定的 學習n數(shù)學式中參數(shù)的確定n人能從錯誤中吸取教訓 n利用錯誤提供應糾正信息,糾正分類函數(shù)迭代過程,逐
15、漸收斂學習n模式識別中的學習與訓練分類器設計:求優(yōu)化解的過程n(計算求解過程)從訓練樣本提供的數(shù)據(jù)中找出某種數(shù)學式子的最優(yōu)解最優(yōu)解n(達到的效果)這個最優(yōu)解使分類器得到一組參數(shù),按這種參數(shù)設計的分類器使人們設計的某種準則達某種準則達到極值到極值。學習可見分類器參數(shù)的選擇或者學習過程得到的結果取決于設計者選擇什么樣的準則函數(shù)準則函數(shù)。直線邊界最小錯誤率準則:A最小風險準則:B學習和推廣能力n學習的目的(訓練的目的)n根據(jù)已知樣本,得出分類規(guī)律n根據(jù)分類規(guī)律,判斷未知樣本n推廣的能力(舉一反三)n影響推廣能力的因素n訓練樣本的多少n問題的復雜性n分類函數(shù)的選擇學習和推廣能力n兩種魚的分類nSalm
16、onnSea bass學習和推廣能力n特征1:長度特征學習和推廣能力n特征2:亮度特征學習和推廣能力n二維特征空間中的分布(直線分類函數(shù))分類模型簡單有分類錯誤未知樣本分類錯誤率接近于已知樣本學習和推廣能力n復雜曲線分類函數(shù)復雜的分類模型導致復雜的分類函數(shù)對訓練樣本實現(xiàn)理想分類對未知樣本容易錯誤分類推廣能力差學習和推廣能力n分類器設計要平衡各種因素決策邊界應該是分類器復雜度和訓練樣本集合之間的權衡對未知樣本分類最準確二.模式的緊致性n模式的緊致性n分類器設計難易程度與模式在特征空間的分布方式有密切關系 模式的緊致性n模式的緊致性n緊致性概念的說明模式的緊致性n緊致集具有下列性質(zhì)n(1)臨界點的
17、數(shù)量與總的點數(shù)相比很少。n(2)集合中任意兩個內(nèi)點可以用光滑線連接,在該連線上的點也屬于這個集合。n(3)每個內(nèi)點都有一個足夠大的鄰域,在該領域中只包含同一集合中的點。n對緊致性的理解n物體分布區(qū)域,不要混疊n物體的邊界不能過于復雜模式的緊致性n影響數(shù)據(jù)緊致的因素n數(shù)據(jù)本身 n如手寫體數(shù)字 n數(shù)據(jù)描述方法n印刷體數(shù)字的網(wǎng)格表示模式的緊致性n特征提取:改善數(shù)據(jù)緊致性n許多問題在量測空間表示時往往不滿足緊致性n通過一種變換,使它們具有了緊致性n模式識別系統(tǒng)設計的任務就是要尋找這樣一種變換三 相似性度量n相似與分類n樣本和模板的相似性比較n定義相似關系n給出相似關系的一般要求n集合論中的等價關系n自
18、反n對稱n可傳遞n相似關系不是等價關系相似性度量 1.兩個樣本xi ,xj之間的相似度量滿足以下要求: 應為非負值 樣本本身相似性度量應最大 度量應滿足對稱性 在滿足緊致性的條件下,相似性應該是點間距離的 單調(diào)函數(shù) 2. 用各種距離表示相似性: 相似性度量n歐幾里德距離n絕對值距離已知兩個樣本 xi=(xi1, xi2 , xi3,xin)T xj=(xj1, xj2 , xj3,xjn)TnkjkikijXXd12nkjkikijXXd1|相似性度量n明考夫斯基距離nkjkikqijXXqqd1|1)(其中當q=1時為絕對值距離, 當q=2時為歐氏距離相似性度量n 切比雪夫距離n 馬哈拉諾比
19、斯距離|max)(1jkiknkijXXdq趨向無窮大時明氏距離的極限情況1)(jijiTijXXXXMd其中xi ,xj為特征向量, 為協(xié)方差。使用的條件是樣 本符合正態(tài)分布相似性度量 夾角余弦nkjknkiknkjkikijXXXXC12121相似性度量例: x1 , x2 , x3的夾角如圖:因為x1 , x2 的夾角小,所以x1 , x2 最相似。x1x2x1x2x3即樣本間夾角小的為一類,具有相似性模式識別發(fā)展歷史n1929年 G. Tauschek發(fā)明閱讀機 ,能夠閱讀0-9的數(shù)字。n30年代 Fisher提出統(tǒng)計分類理論,奠定了統(tǒng)計模式識別的基礎。因此,在6070年代,統(tǒng)計模式識別發(fā)展很快,但由于被識別的模式愈來愈復雜,特征也愈多,就出現(xiàn)“維數(shù)災難”。但由于計算機運算速度的迅猛發(fā)展,這個問題得到一定克服。統(tǒng)計模式識別仍是模式識別的主要理論。模式識別發(fā)展歷史n50年代 Noam Chemsky 提出形式語言理論 美籍華人付京蓀 提出句法結構模式識別。n60年代 L.A.Zadeh提出了模糊集理論,模糊模式識別理論得到了較廣泛的應用。n80年代 Hopfield提出神經(jīng)元網(wǎng)絡模型理論。近些年人工神經(jīng)元網(wǎng)絡在模式識別和人工智能上得到較廣泛的應用。n90年代 小樣本學習理論,支持向量機也受到了很大的重視。關于模式識別的國內(nèi)、國際學術組織關于模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度會計師事務所與客戶保密服務合同3篇
- 2025版物流掛靠經(jīng)營合作協(xié)議書6篇
- 2025年家電產(chǎn)品研發(fā)與專利申請合作合同3篇
- 2025年學校體育場地設施設計與施工合同3篇
- 福建醫(yī)科大學《基礎生物化學》2023-2024學年第一學期期末試卷
- 福建信息職業(yè)技術學院《臨床醫(yī)學導論(含醫(yī)學史)》2023-2024學年第一學期期末試卷
- 2024年中國鍍金佛像市場調(diào)查研究報告
- 2024幼兒園特色課程開發(fā)與合作合同3篇
- 2024版委托加工技術創(chuàng)新保密合同3篇
- 2024年中國鋁制鉸鏈市場調(diào)查研究報告
- 榕江縣銻礦 礦業(yè)權出讓收益計算書
- 顱腦外科手術環(huán)境及手術配合
- 長期異地安置、居住就醫(yī)備案承諾書【模板】
- 盤查戰(zhàn)術教案
- GB/T 2652-2022金屬材料焊縫破壞性試驗熔化焊接頭焊縫金屬縱向拉伸試驗
- GB/T 1243-1997短節(jié)距傳動用精密滾子鏈和鏈輪
- 打起手鼓唱起歌二聲部改編簡譜
- 陜西西安電子科技大學招考聘用(同步測試)模擬卷和答案
- 父母教養(yǎng)方式與青少年學業(yè)自我效能的關系:自尊和學業(yè)自我概念的中介作用優(yōu)秀獲獎科研論文
- 高血壓危象(講課)課件
- 獅子王-中英文-劇本臺詞(全)
評論
0/150
提交評論