模式識別學(xué)習(xí)心得_第1頁
模式識別學(xué)習(xí)心得_第2頁
模式識別學(xué)習(xí)心得_第3頁
模式識別學(xué)習(xí)心得_第4頁
模式識別學(xué)習(xí)心得_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

模式識別學(xué)習(xí)心得第1頁,共16頁,2023年,2月20日,星期五模式識別定義模式識別(PatternRecognition)是指對表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進行處理和分析,以對事物或現(xiàn)象進行描述、辨認、分類和解釋的過程,是信息科學(xué)和人工智能的重要組成部分。模式識別又常稱作模式分類,從處理問題的性質(zhì)和解決問題的方法等角度,模式識別分為有監(jiān)督的分類(SupervisedClassification)和無監(jiān)督的分類(UnsupervisedClassification)兩種。二者的主要差別在于各實驗樣本所屬的類別是否預(yù)先已知。一般說來,有監(jiān)督的分類往往需要提供大量已知類別的樣本,但在實際問題中,這是存在一定困難的,因此研究無監(jiān)督的分類就變得十分有必要了。模式還可分成抽象的和具體的兩種形式。前者如意識、思想、議論等,屬于概念識別研究的范疇,是人工智能的另一研究分支。我們所指的模式識別主要是對語音波形、地震波、心電圖、腦電圖、圖片、照片、文字、符號、生物傳感器等對象的具體模式進行辨識和分類。第2頁,共16頁,2023年,2月20日,星期五模式識別的發(fā)展簡史1929年G.Tauschek發(fā)明閱讀機,能夠閱讀0-9的數(shù)字。30年代Fisher提出統(tǒng)計分類理論,奠定了統(tǒng)計模式識別的基礎(chǔ)。50年代NoamChemsky提出形式語言理論——傅京蓀提出句法/結(jié)構(gòu)模式識別。60年代L.A.Zadeh提出了模糊集理論,模糊模式識別方法得以發(fā)展和應(yīng)用80年代以Hopfield網(wǎng)、BP網(wǎng)為代表的神經(jīng)網(wǎng)絡(luò)模型導(dǎo)致人工神經(jīng)元網(wǎng)絡(luò)復(fù)活,并在模式識別得到較廣泛的應(yīng)用。90年代小樣本學(xué)習(xí)理論,支持向量機也受到了很大的重視。第3頁,共16頁,2023年,2月20日,星期五模式識別的方法和應(yīng)用模式識別的方法:統(tǒng)計模式識別句法模式識別模糊模式識別人工神經(jīng)網(wǎng)絡(luò)法人工智能方法模式識別的應(yīng)用文字識別語音識別指紋識別遙感醫(yī)學(xué)診斷

第4頁,共16頁,2023年,2月20日,星期五模式識別基本概念模式識別(PatternRecognition):確定一個樣本的類別屬性(模式類)的過程,即把某一樣本歸屬于多個類型中的某個類型。樣本(Sample):一個具體的研究(客觀)對象。如患者,某人寫的一個漢字,一幅圖片等。模式(Pattern):對客體(研究對象)特征的描述(定量的或結(jié)構(gòu)的描述),是取自客觀世界的某一樣本的測量值的集合(或綜合)。特征(Features):能描述模式特性的量(測量值)。在統(tǒng)計模式識別方法中,通常用一個矢量表示,稱之為特征矢量,記為模式類(Class):具有某些共同特性的模式的集合。第5頁,共16頁,2023年,2月20日,星期五模式識別系統(tǒng)一個典型的模式識別系統(tǒng)由下圖所示的結(jié)構(gòu)框圖組成,一般由數(shù)據(jù)獲取,預(yù)處理,特征提取選擇、分類決策及分類器設(shè)計五部分組成。分類器設(shè)計在訓(xùn)練過程中完成,利用樣本進行訓(xùn)練,確定分類器的具體參數(shù)。而分類決策在識別過程中起作用,對待識別的樣本進行分類決策。第6頁,共16頁,2023年,2月20日,星期五模式識別系統(tǒng)數(shù)據(jù)采集特征提取改進分類識別規(guī)則二次特征提取與選擇訓(xùn)練樣本改進采集提取方法改進特征提取與選擇制定改進分類識別規(guī)則人工干預(yù)正確率測試數(shù)據(jù)采集特征提取二次特征提取與選擇分類識別待識對象識別結(jié)果第7頁,共16頁,2023年,2月20日,星期五范例木板圖象512×512d=3長度紋理亮度

c=2松木\樺木維數(shù)無限有限/很大R有限d不大cd<<R<無限模式采集模式空間特征提取/選擇類型空間分類特征空間客觀世界待識別對象識別過程錯誤概率檢測制定分類的判決規(guī)則特征提取/選擇方法校正學(xué)習(xí)過程采集方法校正已知對象預(yù)處理模式識別過程第8頁,共16頁,2023年,2月20日,星期五特征矢量和特征空間特征矢量:

設(shè)一個研究對像的n個特征量測量值分別為X1,X2....Xn,我們將它們作為一個整體來考慮,讓它們構(gòu)成一個n維特征矢量特征空間:

各種不同取值的特征矢量的全體構(gòu)成了n維特征空間。第9頁,共16頁,2023年,2月20日,星期五隨機矢量的描述隨機矢量:在模式識別過程中,要對許多具體對象進行測量,以獲得許多次觀測值。每次觀測值不一定相同,所以對許多對象而言,各個特征分量都是隨機變量,即許多對象的特征向量在n維空間中呈隨機性分布,稱為隨機矢量。隨機矢量的分布函數(shù):設(shè)為隨機矢量,為確定性矢量。隨機矢量的聯(lián)合概率分布函數(shù)定義為:式中表示括號中事件同時發(fā)生的概率。

第10頁,共16頁,2023年,2月20日,星期五聚類分析

(ClusteringAnalysis)一、聚類分析的基本思想★相似的歸為一類?!锬J较嗨菩缘亩攘亢途垲愃惴ā?/p>

★無監(jiān)督分類(Unsupervised)。二、特征量的類型★物理量----(重量、長度、速度)★次序量----(等級、技能、學(xué)識)

★名義量----(性別、狀態(tài)、種類)三、方法的有效性

取決于分類算法和特征點分布情況的匹配。第11頁,共16頁,2023年,2月20日,星期五聚類過程遵循的基本步驟三、聚類準則(clusteringcriterion)

以蘊涵在數(shù)據(jù)集中類的類型為基礎(chǔ)二、近鄰測度(proximitymeasure)

定量測定兩特征如何“相似”或“不相似”一、特征選擇(featureselection)

盡可能多地包含任務(wù)關(guān)心的信息第12頁,共16頁,2023年,2月20日,星期五聚類過程遵循的基本步驟六、結(jié)果判定(interpretationoftheresults)

由專家用其他方法判定結(jié)果的正確性五、結(jié)果驗證(validationoftheresults)

常用逼近檢驗驗證聚類結(jié)果的正確性四、聚類算法(clusteringalgorithm)

按近鄰測度和聚類準則揭示數(shù)據(jù)集的聚類結(jié)構(gòu)第13頁,共16頁,2023年,2月20日,星期五聚類應(yīng)用的四個基本方向一、減少數(shù)據(jù)

許多時候,當數(shù)據(jù)量N很大時,會使數(shù)據(jù)處理變得很費力。因此可使用聚類分析的方法將數(shù)據(jù)分成幾組可判斷的聚類m(m<<N)來處理,每一個類可當作獨立實體來對待。從這個角度看,數(shù)據(jù)被壓縮了。二、假說生成

在這種情況下,為了推導(dǎo)出數(shù)據(jù)性質(zhì)的一些假說,對數(shù)據(jù)集進行聚類分析。因此,這里使用聚類作為建立假說的方法,然后用其他數(shù)據(jù)集驗證這些假說。三、假說檢驗

用聚類分析來驗證指定假說的有效性。四、基于分組的預(yù)測

對現(xiàn)有數(shù)據(jù)進行聚類分析,形成模式的特征,并用特征表示聚類,接下來,對于一個未知模式,就可以用前面的聚類來確定是哪一類?第14頁,共16頁,2023年,2月20日,星期五模式相似性測度用于描述各模式之間特征的相似程度

●距離測度測度基礎(chǔ):兩個矢量矢端的距離測度數(shù)值:兩矢量各相應(yīng)分量之差的函數(shù)。

●相似測度測度基礎(chǔ):以兩矢量的方向是否相近作為考慮的基礎(chǔ),矢量長度并不重要。

●匹配測度

當特征只有兩個狀態(tài)(0,1)時,常用匹配測度。

0表示無此特征1表示有此特征。故稱之為二值特征。第15頁,共16頁,2023年,2月20日,星期五聚類的算法

簡單聚類方法

針對具體問題確定相似性閾值,將模式到各聚類中心間的距離與閾值比較,當大于閾值時該模式就作為另一類的類心,小于閾值時按最小距

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論