版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
PAGE安徽建筑工業(yè)學(xué)院PAGEPAGE59安徽建筑工業(yè)學(xué)院畢業(yè)設(shè)計(jì)(論文)專業(yè)電氣工程及其自動(dòng)化班級(jí)學(xué)生姓名學(xué)號(hào)課題液壓機(jī)分類軟件的設(shè)計(jì)指導(dǎo)教師李丕銀2009年5月摘要模式識(shí)別中的聚類分析是研究物以類聚的一種方法。與成組技術(shù)一樣,聚類分析也是以對(duì)象的相似性分析為理論基礎(chǔ)和核心內(nèi)容。對(duì)于初步接處到液壓機(jī)的工程人員來說,由于時(shí)間和專業(yè)知識(shí)的限制,直接利用已知的知識(shí)對(duì)液壓機(jī)進(jìn)行選用是非常困難的,需要一款液壓機(jī)系統(tǒng)分類軟件來協(xié)助工程人員進(jìn)行選取。將模式識(shí)別方法應(yīng)用于機(jī)械產(chǎn)品的設(shè)計(jì)及制造中,可以充分利用以往的設(shè)計(jì)制造經(jīng)驗(yàn),獲取相關(guān)信息,解決現(xiàn)有的問題。本文就介紹是以相似學(xué)為理論依據(jù),運(yùn)用相似度量方法并結(jié)合模式識(shí)別思想,在VisualC++軟件環(huán)境下開發(fā)出的液壓機(jī)系統(tǒng)分類軟件。它利用VisualC++語言界面的設(shè)計(jì)功能,模式識(shí)別及相似性知識(shí)對(duì)液壓機(jī)的特征量進(jìn)行分析和歸類。結(jié)果證明該軟件可以取代人工選取,它不僅減少了準(zhǔn)確選取液壓機(jī)所須的時(shí)間,提高了準(zhǔn)確率,避免了不必要的損失,而且操作界面簡(jiǎn)單易懂,具有推廣的應(yīng)用價(jià)值。關(guān)鍵詞:液壓機(jī)模式識(shí)別相似性聚類分析AbstractInPatternRecognition,theclusteranalysisisamethodofstudythingsofonekindcometogether.LikeGroupTechnology,theclusteranalysistakestheobjectofcomparabilityanalysisasthetheoreticalbasisandthecorecontent.Forthenewhydraulicengineeringstaff,duetothelimitedtimeandpoorexpertise,itisverydifficulttoselectcorrecthydraulicmachineusingtheknownknowledge,sotheyneedthehydraulicsystemclassificationsoftwareforhelp.NowPatternrecognitionmethodisappliedtomechanicalproductdesignandmanufacturing,wecantakefulladvantageoftheexperienceindesignandmanufacture,acquiretherelevantinformationandsolvetheexistingproblems.ThispaperisaboutthehydraulicsystemclassificationsoftwareinVisualC++softwaredevelopmentenvironment.WemakeanalysisandclassificationforthecharacteristicsofhydraulicbyusingVisualC++languageinterfacedesignfeatures,patternrecognitionandknowledgeofthesimilarity.Theresultsshowthatartificialselectioncanbereplacedbythesoftware.Itcouldnotonlyreducetherequiredtime,increasetheaccuracyandavoidtheunnecessarylosswhenyouselectthehydraulicmachine,butalsothesoftwareisveryconvenientandeasytobepromoted.Keywords:hydraulicmachinePatternRecognitioncomparabilityclusteranalysis目錄1緒論 52液壓機(jī)分類軟件的總體設(shè)計(jì) 62.1總體設(shè)計(jì)原理 62.2設(shè)計(jì)任務(wù) 73液壓機(jī)的工作原理及基本參數(shù) 73.1液壓機(jī)的工作原理 73.2液壓機(jī)的基本參數(shù) 114相似性原理、度量及模式識(shí)別工程 134.1相似性原理 134.2相似性度量方法 144.2.1用歐氏距離系數(shù)法計(jì)算相似度 144.3模式識(shí)別工程 155運(yùn)用方差權(quán)重值進(jìn)行相似性計(jì)算 175.1歐氏距離系數(shù)法 175.2加權(quán)距離系數(shù)法的提出 185.3特征的選擇與提取問題 185.4液壓機(jī)特征壓縮問題 205.5加權(quán)距離系數(shù)法中權(quán)重值的確定 266液壓機(jī)的聚類分類與決策 276.1系統(tǒng)聚類法 276.1.1系統(tǒng)聚類法的步驟 276.1.2液壓機(jī)實(shí)例的聚類 286.2分類 316.2.1決策區(qū)域與決策函數(shù) 316.2.2最小加權(quán)距離分類器 337液壓機(jī)系統(tǒng)分類軟件 387.1VisualC++的優(yōu)點(diǎn) 387.2液壓機(jī)系統(tǒng)分類原理 397.3 液壓機(jī)系統(tǒng)分類軟件流程圖 397.4液壓機(jī)分類軟件的測(cè)試圖及部分源程序 418總結(jié)和展望 458.1本文工作總結(jié) 458.2課題展望 46參考文獻(xiàn) 47致謝 48附錄一英文科技文獻(xiàn)翻譯 49附錄二產(chǎn)品實(shí)例數(shù)據(jù)庫 56液壓機(jī)分類軟件設(shè)計(jì)1緒論1.1課題的來源事物間的相似性是普遍存在的,只是有著相似程度的差異。機(jī)械產(chǎn)品間的相似性更是廣泛存在,大量的機(jī)械系統(tǒng)、部件、零件之間都有著不同程度的相似性。對(duì)機(jī)械產(chǎn)品進(jìn)行相似性研究,獲取相似信息并對(duì)相似信息進(jìn)行分析與處理,對(duì)于改善制造業(yè)中的重復(fù)設(shè)計(jì)多、設(shè)計(jì)周期長(zhǎng)、產(chǎn)品相關(guān)的分類與決策分析受主觀因素影響等問題,有著重要的意義。1.2模式識(shí)別科學(xué)隨著建立智能自動(dòng)化系統(tǒng)的需要,模仿各種形式的對(duì)象識(shí)別能力的方法得到了發(fā)展,同時(shí)也帶動(dòng)了工業(yè)及其他領(lǐng)域技術(shù)的發(fā)展。在這些系統(tǒng)中,對(duì)象被表示成適當(dāng)?shù)男问剑员銓?duì)它們進(jìn)行處理,這種表示形式就稱為模式。需要注意模式指的不是事物本身,而是從事物獲得的信息。因此,模式往往表現(xiàn)為具有時(shí)間和空間分布的信息。人們?yōu)榱苏莆湛陀^事物,按事物相似的程度組成類別。模式識(shí)別的作用與目的就在于面對(duì)某一具體事物時(shí)將其正確地歸入某一類別。模式識(shí)別中的主要任務(wù)是分類和聚類。分類的目的是提出一個(gè)分類函數(shù)或分類模型(也常常稱作分類器),該模型能把數(shù)據(jù)庫中的數(shù)據(jù)映射到給定類別中的某一個(gè)。聚類是根據(jù)數(shù)據(jù)的不同特征,將其劃分為不同的數(shù)據(jù)類。它的目的是使得屬于同一類別的個(gè)體之間的距離盡可能的小,而不同類別上的個(gè)體間的距離盡可能的大?;诰嚯x的分類方法的思想是,以距離為尺度來衡量樣本與所謂“典型模式”之間的相似度,并將樣本分入與其相似度最大的模式類中,如最小距離分類器和k-近鄰法等。但是這些方法大都是以歐氏距離為尺度來計(jì)算相似度的,其不足之處是非常明顯的。將模式識(shí)別方法應(yīng)用于機(jī)械產(chǎn)品的設(shè)計(jì)及制造中,可以根據(jù)分類結(jié)果充分利用以往的設(shè)計(jì)制造經(jīng)驗(yàn),獲取相關(guān)信息。例如,我們可以根據(jù)設(shè)計(jì)任務(wù)的部分信息對(duì)其進(jìn)行分類,然后根據(jù)其所屬類別中樣本的信息推測(cè)(或設(shè)計(jì))該任務(wù)的未知信息,從而達(dá)到加快設(shè)計(jì)過程、減少重復(fù)設(shè)計(jì)的目的。同時(shí),正確的分類也可以為產(chǎn)品相關(guān)的決策提供理論依據(jù)??傊?,本項(xiàng)目的任務(wù)就是將相似度量方法與模式識(shí)別理論結(jié)合,從而客觀、高效地解決制造業(yè)中機(jī)械產(chǎn)品系統(tǒng)的分類與決策問題。2液壓機(jī)分類軟件的總體設(shè)計(jì)2.1總體設(shè)計(jì)原理本軟件是在VisualC++語言平臺(tái)上開發(fā)的,在設(shè)計(jì)中我們采用由結(jié)論向前推理的思維,確定自己要完成的工作與任務(wù)。首先是液壓機(jī)分類,它涉及到了“模式識(shí)別”,“模式識(shí)別”又涉及到聚類與分類,而分類又與特征的提取壓縮有關(guān),當(dāng)這些工作完成后,就可進(jìn)行軟件的編寫。具體步驟如下:1).指出傳統(tǒng)的相似度量方法的不足與缺陷,建立一種新的相似度量方法。提高相似度量的準(zhǔn)確性,從而為分類建立依據(jù)與基礎(chǔ)。2).在充分分析機(jī)械產(chǎn)品分類要求的基礎(chǔ)上建立分類的數(shù)學(xué)模型,建立分類的決策函數(shù),用主成份分析法進(jìn)行特征提取,簡(jiǎn)化計(jì)算的復(fù)雜度。運(yùn)用矩陣?yán)碚撨M(jìn)行計(jì)算,并用Matlab軟件進(jìn)行仿真與驗(yàn)算,從而得到可靠的分類結(jié)果。3).用SQLSERVER2000建立產(chǎn)品實(shí)例的數(shù)據(jù)庫,用VisualC++編寫產(chǎn)品分類的系統(tǒng)軟件。要求軟件能夠?qū)崿F(xiàn)實(shí)例檢索、自動(dòng)分類與決策、分類結(jié)果的輸出等功能。要求軟件具有自學(xué)習(xí)功能,能根據(jù)輸入實(shí)例的改變自動(dòng)修改分類決策函數(shù)的各項(xiàng)參數(shù),實(shí)現(xiàn)分類系統(tǒng)的自動(dòng)化、智能化運(yùn)行本軟件的功能是在給定的特征量下,自動(dòng)的分類,給出最優(yōu)解。本軟件具有如下功能:當(dāng)你輸入給定的參數(shù)后,它就會(huì)得出將要被選用液壓機(jī)類型。2.2設(shè)計(jì)任務(wù)1)提出一種在相似度量中確定系統(tǒng)各參數(shù)重要性的新方法,并在此基礎(chǔ)上建立相似度量方法。新提出的度量方法應(yīng)當(dāng)客觀可靠,復(fù)雜度較低,能夠勝任機(jī)械系統(tǒng)的模式分類任務(wù);2)以此相似度量方法為基礎(chǔ),與模式識(shí)別相結(jié)合,對(duì)現(xiàn)有的部分模式分類算法提出了改進(jìn)方法;3)建立了產(chǎn)品實(shí)例液壓機(jī)系統(tǒng)的數(shù)據(jù)庫;4)建立了一種新的機(jī)械產(chǎn)品系統(tǒng)的分類算法,設(shè)計(jì)了機(jī)械產(chǎn)品系統(tǒng)——液壓機(jī)系統(tǒng)分類的應(yīng)用軟件。3液壓機(jī)的工作原理及基本參數(shù)3.1液壓機(jī)的工作原理液壓機(jī)是一種以液體為工作介質(zhì),用來傳遞能量以實(shí)現(xiàn)各種工藝的機(jī)器。液壓機(jī)被廣泛應(yīng)用與機(jī)械工業(yè)的許多領(lǐng)域,如:鍛壓,鍛造,沖壓,擠壓,粉末制品等等。液壓機(jī)是根據(jù)帕斯卡原理制成,其工作原理如圖3-1所示。兩個(gè)充滿工作液體的具有柱塞的容腔,由管道相連接。當(dāng)小柱塞1上的作用力為F1,且其工作面積為A1時(shí),液壓的壓力為p=F1/A1p=F1/A1。根據(jù)帕斯卡原理,在密封的容器中,對(duì)于靜止均勻的液體,一點(diǎn)的壓力會(huì)大小不變地迅速傳遞到液體各點(diǎn),即此容器中液體的壓力在各點(diǎn)上都是相等的。因此,在大柱塞2上將產(chǎn)生向上的作用力F2,迫使工件3受力變形,且F2=F1*A2/A1,式中A2——大柱塞2的工作面積。如果p的數(shù)值足夠大,產(chǎn)生的作用力F2將會(huì)相當(dāng)?shù)拇蟆?/p>
圖3-1液壓機(jī)工作原理圖1-小柱塞2-大柱塞3-工件最常見的液壓機(jī)本體結(jié)構(gòu)型式如圖3—2所元,它由上橫梁3、下橫梁5、四個(gè)立柱4和十六個(gè)內(nèi)外螺母組成一個(gè)封閉框架,框架承受全部工作載荷。工作缸1固定在上橫梁3上,工作缸內(nèi)裝有工作柱塞2,與活動(dòng)橫梁6相連接。活動(dòng)橫梁以四根立柱為導(dǎo)向,在上、下橫梁之間往復(fù)運(yùn)動(dòng)?;顒?dòng)橫梁下面固定有上砧11,而下砧12則固定于下橫梁上的工作臺(tái)上。當(dāng)高壓液體進(jìn)入工作缸后,對(duì)柱塞產(chǎn)生很大的壓力,推動(dòng)柱塞、活動(dòng)橫梁及上砧向下運(yùn)動(dòng),使工件在上、下砧之間產(chǎn)生塑性變形。上橫梁的兩側(cè)還固定有回程缸7,當(dāng)高壓液體進(jìn)入回程缸時(shí),推動(dòng)回程柱塞8向上,通過頂部小橫梁9及拉桿10,帶動(dòng)活動(dòng)橫梁實(shí)現(xiàn)回程運(yùn)動(dòng)。此時(shí).工作缸應(yīng)通低壓。液壓機(jī)操縱系統(tǒng)的示意圖如圖3—3。液壓機(jī)的工作循環(huán)一般包括停止、充液行程、工作行程及回程,現(xiàn)分述如后。1).充液行程操縱手把由“停止”位置移到“充液行程”位置,分配器搖桿軸逆時(shí)針方向轉(zhuǎn)動(dòng)(左視),回程缸排水閥2打開,活動(dòng)橫梁靠自重下降,回程缸中液體排入充液罐或水泵站的水箱。此時(shí)工作缸內(nèi)液體壓力下降在工作缸和充液罐中液體壓力差的作用下,充液閥自動(dòng)打開,充液罐內(nèi)的低壓液體大量流入工作缸內(nèi),實(shí)現(xiàn)動(dòng)梁空程向下的充液行程。動(dòng)梁下行到上砧接觸工件時(shí),動(dòng)粱運(yùn)動(dòng)停止,工作缸和充液罐中液體壓力差消失,充液閥在彈簧作用下自動(dòng)關(guān)閉。為使充液行程平穩(wěn),在接近充液行程終點(diǎn)時(shí),減速,以減少撞擊與振動(dòng)。2)。工作行程充液行程結(jié)束后,充液閥應(yīng)完全關(guān)閉,回程缸仍通低壓。操縱手把被移到“工作行程”位置,搖桿軸繼續(xù)作逆時(shí)針轉(zhuǎn)動(dòng),工作缸進(jìn)水閥3打開,高壓液體經(jīng)充液閥腔進(jìn)入工作缸作用于栓塞上,并通過動(dòng)梁對(duì)工件進(jìn)行壓力加工。此時(shí),回程缸排水閥2繼續(xù)打開排掖。3).回程工作行程結(jié)束后,操縱手把被反向移到“回程”位置,搖桿軸反向作順時(shí)針方向轉(zhuǎn)動(dòng),工作缸進(jìn)水閥3先關(guān)閉,然后工作缸排水閥4打開,卸掉工作缸和管道中高壓液體的壓力接著回程缸進(jìn)水閥1打開,使回程缸和充液閥接力器通高壓液體,強(qiáng)迫打開充液閥。動(dòng)梁在回程缸高壓液體作用下向上運(yùn)動(dòng),迫使工作缸中大量液體排入充液罐或低壓緩沖器。4).停止(懸空)將操縱手把移到“停止”位置,工作缸徘水閥4繼續(xù)打開,工作缸通低壓,而此時(shí)回程缸進(jìn)水閥l和排水閥2都關(guān)閉,液體被封閉在回程缸內(nèi),故動(dòng)梁可停在操作空間的任意位置。3.2液壓機(jī)的基本參數(shù)基本參數(shù)是液壓機(jī)的基本技術(shù)數(shù)據(jù),是根據(jù)掖壓機(jī)的工藝用途及結(jié)構(gòu)類型來確定的.反映了液壓機(jī)工作能力及特點(diǎn),也基本上定下了液壓機(jī)的輪廓尺寸及本體總重,為了使產(chǎn)品系列化、通用化和標(biāo)準(zhǔn)化,以盡可能少的規(guī)格和尺寸·來充分滿足多種多樣的工藝要求從而大大簡(jiǎn)化設(shè)計(jì)工作及制造工藝,有利于組織專業(yè)化生產(chǎn),降低成本,提高質(zhì)量和便于修配,應(yīng)盡可能制訂出各種液壓機(jī)基本參數(shù)的標(biāo)準(zhǔn)系列。確定基本參數(shù)時(shí),應(yīng)以在此液壓機(jī)上進(jìn)行的主要工藝要求為依據(jù),現(xiàn)以三梁四柱式液壓機(jī)為例,介紹液壓機(jī)的基本參數(shù):1).公稱壓力(公稱噸位)及其分級(jí)公稱壓力一般是液壓機(jī)的主參數(shù),它反映了液壓機(jī)的主要工作能力c公稱壓力為液壓機(jī)名義上能發(fā)出的最大力量在數(shù)值上等于工作液體壓力和工作柱塞總工作面積的乘積(取整數(shù))。為了充分利用設(shè)備,節(jié)約高壓液體并滿足工藝要求,一般大中型液壓機(jī)將公稱壓力分為兩級(jí)或三級(jí)。泵直接傳動(dòng)的液壓機(jī)不需從結(jié)構(gòu)上進(jìn)行壓力分級(jí)。2).最大凈空距(開口高度)H最大凈空距H是指活動(dòng)橫粱停在上限位置時(shí)從工作臺(tái)上表面到活動(dòng)橫梁下表面的距離。最大凈空距反映液壓機(jī)在高度方向上工作空間的大小,它應(yīng)根據(jù)模具(工具)及相應(yīng)墊板的高度,工作行程大小以及放入坯料、取出工件所需空間大小等工藝因素來確定。最大凈空距對(duì)液壓機(jī)的總高、立柱長(zhǎng)度、液壓機(jī)穩(wěn)定性以及安裝廠房高度都有很大影響。因此既要盡可能滿足工藝要求,又要盡量減小壓機(jī)高度。3).最大行程h最大行程h指活動(dòng)橫粱位于上限位置時(shí)活動(dòng)橫梁的立柱導(dǎo)套下平面到立柱限程套上平面的距離,也即活動(dòng)橫梁能移動(dòng)的最大距離。最大行程應(yīng)根據(jù)工件成形過程中所要求的最大工作行程來確定,回程缸及其柱塞的長(zhǎng)度以及整個(gè)機(jī)架的高度。4).立柱中心距LXB在四柱式液壓執(zhí)中,立柱寬邊中心距和窄邊中心距分別為L(zhǎng)和B。立柱中心距反映液壓機(jī)平面尺寸上工作空間的大小。立柱寬邊中心距應(yīng)根據(jù)工件及模具(工具)的寬度來確定,立掛窄邊中心距應(yīng)考慮更換及放入各種工具、涂抹潤(rùn)滑劑、觀察工藝過程等操作上的要求立柱中心距對(duì)三個(gè)橫梁的平面尺寸和重量均有直接影響,對(duì)液壓機(jī)的使用性能及本體結(jié)構(gòu)尺寸有著密切關(guān)系。5).回程力計(jì)算回程所需的力量需要考慮活動(dòng)部分的重量、回程時(shí)工藝上所需的力量(如拔模力、提升剁刀等)、工作缸排液阻力、各缸密封處的摩擦力以及動(dòng)梁導(dǎo)套處的摩擦力等。6).允許最大偏心距在液壓機(jī)工作時(shí),不可避免地要承受偏心載荷。偏心載荷在液壓機(jī)的寬邊與窄邊都會(huì)發(fā)生。最大允許偏心距是指工件變形阻力接近公稱壓力時(shí)所能允許的最大偏心值。在結(jié)構(gòu)設(shè)計(jì)計(jì)算時(shí),必須考慮此偏心位。7).活動(dòng)橫梁運(yùn)動(dòng)速度活動(dòng)橫梁運(yùn)動(dòng)速度分為工作行程速度及空程(充液及回程)速度兩種。應(yīng)根據(jù)不同的工藝要求來確定工作行程速度,它的變化范圍很大。鍛造液壓機(jī)要求工作速度較高,可達(dá)50一150mm/s,而在有些工藝中,液壓機(jī)工作速度甚至低于1mm/s。空程速度一般較高,以提高生產(chǎn)率。但如速度太快,會(huì)在停止或換向時(shí)引起水擊及振動(dòng).工作行程及空程的速度直接影響泵站供液量的計(jì)算。8).移動(dòng)工作臺(tái)尺寸及行程在鍛造、模鍛及沖壓液壓機(jī)中往往設(shè)置移動(dòng)工作臺(tái)。工作臺(tái)的尺寸(長(zhǎng)x寬)取決于模具(工具)的平面尺寸及工藝過程的安排,工作臺(tái)移動(dòng)的行程則和更換模具(工具)及工藝操作方式有關(guān),移動(dòng)工作臺(tái)的尺寸及行程也是反映液壓機(jī)工作能力的參數(shù)。4相似性原理度量及模式識(shí)別工程4.1相似性原理相似性本質(zhì)是系統(tǒng)間客觀特性的相似性。由于系統(tǒng)中屬性和特征的相似性,因此相似性不依賴于人們的感性認(rèn)識(shí)而存在。在科學(xué)研究和工程實(shí)踐中,不僅要用語言描述事物間客觀存在特性相似,而且要通過對(duì)系統(tǒng)的共有特性及特征值的差別,認(rèn)識(shí)相似性,分析度量相似性。相似性程度大小的數(shù)值用相似性表示,記為Q。相似與相同和相異的量化關(guān)系,如圖4-1所示。Q=00<Q<1Q=1相異相似相同圖4-1相同,相似,相異的量化關(guān)系假設(shè)有兩個(gè)系統(tǒng)A和B,那么得結(jié)果如下:(1)當(dāng)Q=1時(shí),表明系統(tǒng)A和系統(tǒng)B相同,這是相似的特例。指明了系統(tǒng)間組成要素?cái)?shù)量相同,要素的特性全相等。(2)當(dāng)0<Q<1時(shí),表明系統(tǒng)A相似于系統(tǒng)B,相似度數(shù)值大小,指明相似系統(tǒng)間的相似水平。這一情況指明,不同類型或不同層次系統(tǒng)間組成要素及特性存在差別。(3)當(dāng)Q=0時(shí),表明系統(tǒng)A和系統(tǒng)B相異。作為相似性的特例,指明系統(tǒng)之間不存在任何相似特性。在自然界的現(xiàn)實(shí)情況中,系統(tǒng)間全同或全異并不多見。普遍現(xiàn)象是系統(tǒng)間存在一些相似特性。這些相似特性是一些相似程度不等的相似要素共同作用顯示出的整體特性。因此,從系統(tǒng)組成要素?cái)?shù)量和特性、系統(tǒng)間相似要素多少及各要素相似程度大小來考察相似系統(tǒng)的相似度是可行的。4.2相似性度量方法4.2.1用歐氏距離系數(shù)法計(jì)算相似度假定有兩系統(tǒng)S1和S2,現(xiàn)研究其n=2個(gè)特征屬性,畫一對(duì)直角坐標(biāo)(如圖1),橫坐標(biāo)X1表示特征屬性1,縱坐標(biāo)X2表示特征屬性2。對(duì)所研究的兩個(gè)特征屬性而言,兩系統(tǒng)恒等時(shí),則其位置將重迭,其間距離為零。其間差異越大,則其距離越大。也就是說,距離被視為相似性之余。S1.d. S20圖4.2兩系統(tǒng)間的距離系數(shù)當(dāng)我們要研究n=3個(gè)特征屬性時(shí),必須在圖4.2上加上第三坐標(biāo),這樣就建立了一個(gè)三維模型。事實(shí)上,可以在數(shù)學(xué)上證明[20]:常規(guī)三維空間的幾何定理在歐幾里德超空間中,能擴(kuò)展到n維。也就是說,可以對(duì)S1、S2兩系統(tǒng)間的n項(xiàng)特征屬性建立一個(gè)n維模型,并在此n維超空間中計(jì)算S1、S2間的距離為[20]d12=(4.1)這就是傳統(tǒng)的歐幾里德距離系數(shù)(Euclidean),可以用這種距離度量的非增函數(shù)計(jì)算相似度。這種方法方便、直觀,但是也存在明顯的缺陷與不足,如距離的大小與單位有關(guān)、沒有考慮各特征屬性的重要性問題等。這些將在第五章中詳細(xì)論述并討論改進(jìn)方案。4.3模式識(shí)別工程目前,主要有兩種基本的模式識(shí)別方法,即統(tǒng)計(jì)模式識(shí)別方法和結(jié)構(gòu)(句法)模式識(shí)別方法,與之相應(yīng)的模式識(shí)別系統(tǒng)都由兩個(gè)過程所組成,即設(shè)計(jì)和實(shí)現(xiàn)。設(shè)計(jì)是指用一定數(shù)量的樣本(叫做訓(xùn)練集或?qū)W習(xí)集)進(jìn)行分類器的設(shè)計(jì)。實(shí)現(xiàn)是指用所設(shè)計(jì)的分類器對(duì)待識(shí)別的樣本進(jìn)行分類決策。本課題主要討論統(tǒng)計(jì)模式識(shí)別方法?;诮y(tǒng)計(jì)方法的模式識(shí)別系統(tǒng)主要由4個(gè)部分組成:數(shù)據(jù)獲取,預(yù)處理,特征提取和選擇,分類決策,如圖.4.3所示。 訓(xùn)練過程 分類器設(shè)計(jì)信息獲取預(yù)處理特征提取和選擇 分類決策圖4.3模式識(shí)別系統(tǒng)的基本構(gòu)成下面對(duì)這幾個(gè)部分作些簡(jiǎn)單說明。數(shù)據(jù)獲取為了使計(jì)算機(jī)能夠?qū)Ω鞣N現(xiàn)象進(jìn)行分類識(shí)別,要用計(jì)算機(jī)可以運(yùn)算的符號(hào)來表示所研究的對(duì)象。通常作為對(duì)象的信息有下列3種類型,即1)一維波形如機(jī)械振動(dòng)波等。2)二維圖象如文字、指紋、照片等。3)物理參量和邏輯值前者如機(jī)械系統(tǒng)中的物理數(shù)據(jù)、幾何尺寸等;后者如對(duì)某參量存在與否或正常與否的描述。通過測(cè)量、采樣和量化,可以用矩陣或向量表示一維波形和二維圖象。這就是數(shù)據(jù)獲取的過程。2.預(yù)處理預(yù)處理的目的是消除噪聲(干擾信息),加強(qiáng)有用的信息,并對(duì)輸入測(cè)量?jī)x器或其他因素所造成的誤差進(jìn)行修正。3.特征提取和選擇由圖象或波形所獲得的數(shù)據(jù)量是相當(dāng)大的。為了有效地實(shí)現(xiàn)分類識(shí)別,就要對(duì)原始數(shù)據(jù)進(jìn)行交換,得到最能反映分類本質(zhì)的特征。這就是特征提取和選擇的過程。一般我們把原始數(shù)據(jù)組成的空間叫測(cè)量空間,把分類識(shí)別賴以進(jìn)行的空間叫特征空間,通過變換,可把在維數(shù)較高的測(cè)量空間中表示的模式變?yōu)樵诰S數(shù)較低的特征空間中表示的模式。在特征空間中的一個(gè)模式通常也叫做一個(gè)樣本,它往往表示為一個(gè)向量,即特征空間中的一個(gè)點(diǎn)。4.分類決策分類決策就是在特征空間中用統(tǒng)計(jì)方法把被識(shí)別對(duì)象歸為某一類別?;咀鞣ㄊ窃跇颖居?xùn)練集基礎(chǔ)上確定某個(gè)判決規(guī)則,使按這種判決規(guī)則對(duì)被識(shí)別對(duì)象進(jìn)行分類所造成的誤差識(shí)別率或引起的損失最小。5運(yùn)用方差權(quán)重值進(jìn)行相似性計(jì)算5.1歐氏距離系數(shù)法假定有兩系統(tǒng)S1和S2,現(xiàn)研究其n=2個(gè)特征屬性,畫一對(duì)直角坐標(biāo)(如圖5.1),橫坐標(biāo)X1表示特征屬性1,縱坐標(biāo)X2表示特征屬性2。對(duì)所研究的兩個(gè)特征屬性而言,兩系統(tǒng)恒等時(shí),則其位置將重迭,其間距離為零。其間差異越大,則其距離越大。也就是說,距離被視為相似性之余[20]。S1.d. S20圖5.1兩系統(tǒng)間的距離系數(shù)當(dāng)我們要研究n=3個(gè)特征屬性時(shí),必須在圖5.1上加上第三坐標(biāo),這樣就建立了一個(gè)三維模型。事實(shí)上,可以在數(shù)學(xué)上證明[20]:常規(guī)三維空間的幾何定理在歐幾里德超空間中,能擴(kuò)展到n維。也就是說,可以對(duì)S1、S2兩系統(tǒng)間的n項(xiàng)特征屬性建立一個(gè)n維模型,并在此n維超空間中計(jì)算S1、S2間的距離為[20]d12=(5.1)這就是傳統(tǒng)的歐幾里德距離系數(shù)(Euclidean),可以用這種距離度量的非增函數(shù)計(jì)算相似度。這種方法方便、直觀,但是也存在明顯的缺陷與不足,如距離的大小與單位有關(guān)、沒有考慮各特征屬性的重要性問題等。5.2加權(quán)距離系數(shù)法的提出下面就對(duì)傳統(tǒng)歐氏距離系數(shù)法提出改進(jìn)方法,先如前面所述根據(jù)S1和S2兩系統(tǒng)間的n項(xiàng)特征屬性建立n維歐氏空間,重新定義S1、S2間的距離為[7]d12==(5.2)其中βi為第i個(gè)特征屬性在相似度量中的權(quán)重系數(shù),且滿足。與(5.1)式相比,可以發(fā)現(xiàn)(5.2)式最重要的不同在于各平方項(xiàng)不再平權(quán)為,而是根據(jù)各特征屬性的重要性確定各自的權(quán)重系數(shù),因此可以將(5.2)式稱為加權(quán)距離系數(shù)法(WeightedDistanceCoefficientMethod)。5.3特征的選擇與提取問題歐氏空間中各樣本的每一維都是該樣本的一個(gè)特征。顯然這些特征的選擇是很重要的,它強(qiáng)烈地影響到相似度量的復(fù)雜程度和準(zhǔn)確性,事實(shí)上,它對(duì)模式分類系統(tǒng)的設(shè)計(jì)也起著至關(guān)重要的作用。因此,特征選擇是相似度量和模式分類中的一個(gè)關(guān)鍵問題。由于在很多實(shí)際問題中常常不容易找到那些最重要的特征,或條件限制不能對(duì)它們進(jìn)行測(cè)量,這就使特征選擇和提取的任務(wù)復(fù)雜化而成為相似度量和構(gòu)造模式分類系統(tǒng)最困難的任務(wù)之一。特征選擇和提取的基本任務(wù)是如何從許多特征中找到那些最有效的特征,也就是如何把高維特征空間壓縮到低維特征空間的問題。先對(duì)幾個(gè)有關(guān)概念加以統(tǒng)一說明[6]。特征形成根據(jù)待研究的對(duì)象產(chǎn)生出一組基本特征,它可以是計(jì)算出來的,也可以是儀表或傳感器測(cè)量出來的,這樣產(chǎn)生出來的特征叫原始特征。特征提取原始特征的數(shù)量可能很大,或者說樣本是處于一個(gè)高維空間中,通過映射(或變換)的方法可以用低維空間來表示樣本,這個(gè)過程叫特征提取。映射后的特征叫二次特征,它們是原始特征的某種組合(通常是線性組合)。所謂特征提取在廣義上就是指一種變換。若Y是測(cè)量空間,X是特征空間,則變換A:Y→X就叫做特征提取器。特征選擇從一組特征中挑選出一些最有效的特征以達(dá)到降低特征空間維數(shù)的目的,這個(gè)過程叫特征選擇。有時(shí)特征提取和選擇并不是截然分開的。例如,可以先將原始特征空間映射到維數(shù)較低的空間,在這個(gè)空間中再進(jìn)行選擇以進(jìn)一步降低維數(shù)。也可以先經(jīng)過選擇去掉那些沒有明顯相似和分類信息的特征,再進(jìn)行映射以降低維數(shù)。5.4用主成份分析法進(jìn)行特征選擇(特征壓縮)特征選擇的問題之所以復(fù)雜,往往因?yàn)榫S數(shù)較高,即有關(guān)的變量(指標(biāo))太多,而且一般地各變量之間都存在一定的相關(guān)關(guān)系。因此自然想到,能否從這多個(gè)指標(biāo)中構(gòu)造出幾個(gè)綜合指標(biāo),而這較少的綜合指標(biāo)即綜合反映原來較多指標(biāo)的信息,相互之間又盡可能不含重復(fù)信息?這就是主成份分析的內(nèi)容。5.4.1主成份的求法設(shè)總體x=(x1,x2,…,xn)T,n≥2,E(x)=μ,D(x)=V≥0?,F(xiàn)在尋求新的綜合指標(biāo)。這里的想法是:找出x各分量的一個(gè)線性組合y1,為使盡可能多地反映變化的情況,就要使y1具有最大的方差。繼而找出x各分量的第二個(gè)線性組合y2,為使y2和y1相互之間盡可能不含重復(fù)信息,又能盡可能多地反映x的信息,就要使y2在與y1不相關(guān)的條件下具有最大的方差,如此繼續(xù)下去,直至x的信息基本提取完畢為止。這些新的綜合指標(biāo)y1,y2等就稱為x的主成份[31]??梢詺w納出求x的主成份的步驟(詳細(xì)歸納過程可參見參考文獻(xiàn)[31]):求x的協(xié)方差陣V的特征根,記為λ1≥λ2≥…≥λk≥0,λk+1=…λn=0。求λj對(duì)應(yīng)的單位特征向量vj,j=1,…k。(因?yàn)閷?duì)稱陣,故不同特征根對(duì)應(yīng)的特征向量必正交)。取yj=vjTx即為x的第j個(gè)主成份,j=1,…k??梢宰C明,D(x1)+…+D(xn)=D(y1)+…+D(yn)。此式表明x的“總方差”等于y的“總方差”,其中y1具有最大的方差λ1,y2次之具有方差λ2,…,yk具有最小的方差λk,為此表明了主成份yi的方差λi在全部方差中的比值,可以視為第i個(gè)主成份的貢獻(xiàn)度。這個(gè)值越大,表明yi綜合反映x的能力越強(qiáng),反之則弱。稱為前m個(gè)主成份(m≤k)的累計(jì)貢獻(xiàn)度。其中tr(V)表示V的跡。在實(shí)用中常略去那些貢獻(xiàn)度小的主成份。一般說來,若前m個(gè)主成份的累計(jì)貢獻(xiàn)度已超過90%就夠了,即意味著只需取這m個(gè)主成份就足夠了。在實(shí)際問題中,所研究的總體的均值μ、協(xié)方差陣V大都是未知的,這時(shí)可以求出樣本均值、樣本協(xié)方差來取代總體的均值、協(xié)方差陣,不過為方便起見,本課題仍以μ、V來表示。5.4.2液壓機(jī)特征壓縮問題下面就用主成份分析法來解決液壓機(jī)的特征壓縮問題?,F(xiàn)給出m=6個(gè)產(chǎn)品實(shí)例,研究其n=6項(xiàng)特征屬性,具體參數(shù)值如表5.1所示。這里需要說明的是,液壓機(jī)系統(tǒng)其實(shí)有很多特征屬性,現(xiàn)在對(duì)液壓機(jī)系統(tǒng)進(jìn)行特征壓縮是為了對(duì)它們進(jìn)行相似度量和分類,因此我們根據(jù)經(jīng)驗(yàn)選擇了6項(xiàng)與液壓機(jī)分類密切相關(guān)的特征屬性進(jìn)行研究,這其實(shí)是一個(gè)特征初步選擇的過程。表5.1液壓機(jī)實(shí)例特征屬性表產(chǎn)品實(shí)例公稱壓力(KN)緩沖缸有=1,無=0液壓缸快降速度(mm/s)液壓缸壓制速度(mm/s)工作臺(tái)長(zhǎng)度(mm)工作臺(tái)寬度(mm)實(shí)例120000806600400實(shí)例2315011258800600實(shí)例34000090101000640實(shí)例4400019571400800實(shí)例563001135121200800實(shí)例68000112014160012001)特征屬性值的標(biāo)準(zhǔn)化本章第一節(jié)就指出,傳統(tǒng)的距離的大小與單位有關(guān),當(dāng)單位改變時(shí),距離也隨之改變,這顯然是需要改進(jìn)的。另一方面,主成份分析法考慮的是各特征間的相關(guān)性,一個(gè)絕對(duì)值很大的特征屬性并不一定比一個(gè)值較小的特征屬性重要。為了解決這兩個(gè)問題,將特征屬性值的標(biāo)準(zhǔn)化是必不可少的準(zhǔn)備工作,這一過程可以用矩陣形式表示如下:200008066004003150112588006004000090101000640令A(yù)=40001957140080063001135121200800800011201416001200令B=diag(8000,1,135,14,1600,1200),其中“diag()”表示以括號(hào)中的元素為對(duì)角線元素的對(duì)角陣。令C=A·B-1,得0.250000.59260.42860.37500.33330.39371.00000.92590.57140.50000.50000.500000.66670.71430.62500.5333C=0.50001.00000.70370.50000.87500.66670.78751.00001.00000.85710.75000.66671.00001.00000.88891.00001.00001.0000即可將各特征屬性值標(biāo)準(zhǔn)化。2)求C的協(xié)方差陣V使用Matlab軟件可以求得協(xié)方差陣0.07510.07880.02840.05720.05450.05790.07880.26670.06670.04290.07500.0733V=0.02840.06670.02670.02300.01440.01890.05720.04290.02300.04850.03480.04070.05450.07500.01440.03480.05470.04960.05790.07330.01890.04070.04960.0506V的特征方程為0.0751-λ0.07880.02840.05720.05450.05790.07880.2667-λ0.06670.04290.07500.07330.02840.06670.0267-λ0.02300.01440.0189=00.05720.04290.02300.0485-λ0.03480.04070.05450.07500.01440.03480.0547-λ0.04960.05790.07330.01890.04070.04960.0506-λ3)求單位特征向量矩陣V和特征值對(duì)角矩陣D在Matlab軟件[32]的命令窗口輸入指令>>[V,D]=eig(cov(c))并執(zhí)行,得單位特征向量矩陣V為(注意:此矩陣所用符號(hào)V為軟件系統(tǒng)所規(guī)定,無法更改,因此要與上文中的協(xié)方差陣V區(qū)別使用。指令中用eig(cov(c))而不是eig(V)也是因?yàn)槿绱耍?.07890.7679-0.1273-0.15590.48560.3575-0.22650.05830.05510.0272-0.59600.7657V=0.6829-0.2839-0.2366-0.5906-0.06750.2091-0.5884-0.43150.0047-0.44460.46340.23490.1190-0.3125-0.59340.60040.28780.30440.3402-0.20630.75670.26080.32690.3070得特征值對(duì)角矩陣D為D=diag(0,0.0007,0.0016,0.0256,0.1003,0.3940),故特征根為λ1=0.3940,λ2=0.1003,λ3=0.0256,λ4=0.0016,λ5=0.0007由于因此只需取前3個(gè)主成份就足夠了。前3個(gè)特征根各自對(duì)應(yīng)的單位化特征向量為v1=(0.3575,0.7657,0.2091,0.2349,0.3044,0.3070)Tv2=(0.4856,-0.5960,-0.0675,0.4634,0.2878,0.3269)Tv3=(-0.1559,0.0272,-0.5906,-0.4446,0.6004,0.2608)T據(jù)此得到三個(gè)樣本主成份的表達(dá)式為:y1=0.3575x1+0.7657x2+0.2091x3+0.2349x4+0.3044x5+0.3070x6y2=0.4856x1-0.5960x2-0.0675x3+0.4634x4+0.2878x5+0.3269x6y3=-0.1559x1+0.0272x2-0.5906x3-0.4446x4+0.6004x5+0.2608x6主成份表達(dá)式的意義應(yīng)用主成份分析法,要求對(duì)樣本主成份y1,…yk,的實(shí)際意義能作出分析,通常要結(jié)合具體問題和專業(yè)知識(shí)才能給出合理的解釋?,F(xiàn)在來解釋上述液壓機(jī)實(shí)例中前三個(gè)主成份的意義。為了直觀起見,將液壓機(jī)的特征屬性列于表5.2。表5.2液壓機(jī)的特征屬性分量表公稱壓力(KN)緩沖缸有=1,無=0液壓缸快降速度(mm/s)液壓缸壓制速度(mm/s)工作臺(tái)長(zhǎng)度(mm)工作臺(tái)寬度(mm)x1x2x3x4x5x6從y1的表達(dá)式看出,y1是六個(gè)變量的加權(quán)和,當(dāng)一臺(tái)液壓機(jī)的y1數(shù)值較大時(shí),可以推斷或有緩沖缸或速度較快或機(jī)身較大,或同時(shí)滿足兩個(gè)或三個(gè)條件,很可能是性能較好的用于薄板拉伸的液壓機(jī),故y1是反映機(jī)器綜合性能的指標(biāo)。再注意y2的表達(dá)式中x3的系數(shù)較?。?0.0675),故不考慮,另外5個(gè)系數(shù)為4正(x1,x4,x5,x6)1負(fù)(x2),當(dāng)一臺(tái)液壓機(jī)的y2數(shù)值較大時(shí),表明x1,x4,x5,x6大而x2?。ê芸赡転?)。因此很可能是機(jī)身較大、壓制速度較快但沒有緩沖缸的液壓機(jī),故y2是反映機(jī)器快速?zèng)_壓能力的指標(biāo)。再看y3的表達(dá)式中x2的系數(shù)較小(0.0272),故不考慮,另外5個(gè)系數(shù)為2正(x5,x6)3負(fù)(x1,x3,x4),當(dāng)一臺(tái)液壓機(jī)的y3數(shù)值較大時(shí),表明x5,x6大而x1,x3,x4小,可能是工作臺(tái)很大、壓制速度較慢的液壓機(jī),故y3是反映機(jī)器拉伸大型工件(如車身覆蓋件)能力的指標(biāo)。5)主成份分析的結(jié)論由于能夠合理地解釋上述液壓機(jī)實(shí)例中前三個(gè)主成份的實(shí)際意義,因此對(duì)該實(shí)例運(yùn)用主成份分析法是可行的,因此在相似度量和模式分類中只需選擇前三個(gè)主成份,并把這三個(gè)主成份看作液壓機(jī)的新的特征屬性,從而達(dá)到降低特征空間維數(shù)的目的,這其實(shí)是一個(gè)特征壓縮的過程,特征壓縮后的液壓機(jī)特征屬性如表5.3所示。表5.3特征壓縮后的液壓機(jī)實(shí)例特征屬性表產(chǎn)品實(shí)例綜合指標(biāo)y1沖壓能力指標(biāo)y2大型工件拉伸能力指標(biāo)y3實(shí)例10.53040.4969-0.2674實(shí)例21.54000.1048-0.4045實(shí)例30.83990.8830-0.2749實(shí)例41.68010.30080.0106實(shí)例51.89060.5499-0.4431實(shí)例62.15540.9077-0.2371事實(shí)上,這樣處理后的結(jié)果并不僅僅降低了問題的復(fù)雜性,由于這些主成份具有實(shí)際意義,所以在實(shí)際設(shè)計(jì)生產(chǎn)的決策與分析中也可以參考這些指標(biāo)。例如可以根據(jù)綜合指標(biāo)y1來確定液壓機(jī)的價(jià)格;當(dāng)客戶需要一臺(tái)用于沖壓工藝的液壓機(jī)時(shí),他可以根據(jù)沖壓能力指標(biāo)y2來選擇實(shí)例6,如果考慮價(jià)格因素(根據(jù)綜合指標(biāo)y1來判斷),可以選擇實(shí)例3,在性能接近的前提下,大大地降低價(jià)格,提高性價(jià)比。另外,可以預(yù)先為每個(gè)指標(biāo)設(shè)定一個(gè)閾值,如果實(shí)際指標(biāo)值超過這個(gè)閾值,則認(rèn)為該液壓機(jī)可以用于此指標(biāo)相對(duì)應(yīng)的工藝。5.5加權(quán)距離系數(shù)法中權(quán)重值的確定在前面幾節(jié)中重點(diǎn)討論了特征的選擇與提取的問題,并應(yīng)用主成份分析法降低特征空間維數(shù),然而這并不意味著經(jīng)壓縮后的特征在相似度量和模式分類中具有相同的重要性。事實(shí)上,主成份分析法舍棄了那些相關(guān)的、重復(fù)的信息,降低了問題的復(fù)雜性,但這種方法并沒有揭示原始特征的重要性問題,而那些保留下來的主成份仍然需要進(jìn)一步確定各自的重要性。在相似學(xué)中較多地采用層次分析法確定各特征屬性的重要性,這符合系統(tǒng)相似度量方法的特點(diǎn)。另外,在其它領(lǐng)域諸如知識(shí)發(fā)現(xiàn)[8]、人工智能[9]等領(lǐng)域,還經(jīng)常用模糊數(shù)學(xué)[34-37]、粗集理論[38]、實(shí)驗(yàn)方法或利用專家集體智慧評(píng)判等方法[2]來確定特征屬性的重要性。實(shí)際上這是一個(gè)很復(fù)雜而且重要的問題,可以有多種方法,下面提出一種新的解決方法。假設(shè)現(xiàn)有m個(gè)樣本,樣本間有n個(gè)相關(guān)的特征屬性,xij為第i個(gè)樣本的第j項(xiàng)特征屬性值,A為特征屬性值矩陣。令xj=,記B=diag(x1,x2,…,xn),令X=A·B-1即可將各特征屬性值標(biāo)準(zhǔn)化,且有0≤Xij≤1,Xij為第i個(gè)樣本的第j項(xiàng)標(biāo)準(zhǔn)特征屬性值。記Sj2為第j項(xiàng)特征屬性值在所有樣本上的方差,βj為第j項(xiàng)特征屬性的權(quán)重值?,F(xiàn)在的問題就是要確定βj的值。在兩個(gè)對(duì)象間進(jìn)行相似度量時(shí),應(yīng)根據(jù)各特征屬性的方差大小來確定各自的重要性并賦予不同的權(quán)重值,方差越大則應(yīng)賦予越大的權(quán)重值;反之亦然。說到這里我們給出確定權(quán)重值的公式。對(duì)于一個(gè)有m個(gè)樣本的總體,樣本間有n個(gè)相關(guān)的特征屬性,記Sj2為第j項(xiàng)特征屬性值在所有樣本上的方差,βj為第j項(xiàng)特征屬性的權(quán)重值,令(5.3)顯然,我們可以稱βj為方差權(quán)重值(VarianceWeight)。此權(quán)重值確定方法是基于人的判斷而得出啟發(fā)的,看上去可能有人為因素的影響,不過事實(shí)并非如此。首先我們應(yīng)該看到,人具有很強(qiáng)的相似判斷和模式分類的能力,現(xiàn)階段的計(jì)算機(jī)技術(shù)根本無法全部模擬實(shí)現(xiàn),因此并不代表有人的參與就影響此方法的客觀性,在人工智能和知識(shí)發(fā)現(xiàn)等領(lǐng)域,很多成果就是在借鑒了人的思維活動(dòng)的基礎(chǔ)上取得的。再者,此方法最終使用方差這一客觀標(biāo)準(zhǔn)來確定權(quán)重值,事實(shí)上比其它方法具有更良好的客觀性。6液壓機(jī)的聚類分類與決策6.1系統(tǒng)聚類法系統(tǒng)聚類法是目前使用最多的方法,現(xiàn)在用距離這個(gè)聚類統(tǒng)計(jì)量來說明該方法的基本思想。在前面的章節(jié)中,我們已經(jīng)論述了在相似度量中加權(quán)距離相對(duì)于傳統(tǒng)歐氏距離的優(yōu)越性,因此本課題采用基于加權(quán)距離的聚類分析。6.1.1系統(tǒng)聚類法的步驟(1)每個(gè)樣本作一類,計(jì)算樣本間加權(quán)距離dij,得距離矩陣0d12d13…d1n 0d23…d2n= …………… 0dn-1,n 0因?yàn)闉閷?duì)稱陣,所以只需寫出上三角部分(以下同)。(2)在各元素中找出除對(duì)角線元素外最小者(除對(duì)角線元素外),即找到距離最近的兩類,合并這距離最近的兩類為一新類,稱為第n+1類,并取消剛合并的那兩類,這樣得到n-1類。(3)選擇類間距離計(jì)算公式計(jì)算新類與剩余各類的距離,原剩余類間距離不變,得距離矩陣。(4)在中找出最小者(零除外),將相應(yīng)的距離最近的兩類合并為新類,稱為第n+2類,并取消剛合并的那兩類,這樣得到n-2類。重復(fù)步驟3和4,直到剩下的類的個(gè)數(shù)為1為止。(5)畫出聚類圖。(6)決定類的個(gè)數(shù)和類。一般說來,在按一種選定的方法完成系統(tǒng)聚類并畫出聚類圖之后,究竟將樣本分成幾類為宜,并無一成不變的規(guī)則,需要運(yùn)用專業(yè)知識(shí),并綜合其他方面的信息靈活確定?,F(xiàn)在常用閾值法來確定分類數(shù)目。這種方法就是選定一個(gè)數(shù)作為某個(gè)分類的臨界值,當(dāng)類之間的距離大于給定的臨界值時(shí),以后的并類不再進(jìn)行。此臨界值稱為閾值。6.1.2液壓機(jī)實(shí)例的聚類現(xiàn)在用系統(tǒng)聚類法對(duì)第五章表5.1中的6個(gè)液壓機(jī)實(shí)例進(jìn)行聚類分析。1).運(yùn)用最長(zhǎng)距離法進(jìn)行聚類計(jì)算6個(gè)液壓機(jī)實(shí)例間的加權(quán)距離得 00.72440.16510.74330.77580.84261 00.72010.15090.19740.34722= 00.72310.72970.76953 00.17080.26844 00.163656 12 34 5 6中最小的數(shù)(零除外)是0.1509,它是類2和4間的距離,因此合并成新類7={2,4},類數(shù)由6變?yōu)?。這5類中,原來4類間的距離不變,新類7與原來4類間的距離按最長(zhǎng)距離計(jì)算。得d17=D2(1,7)=max{d12,d14}=max{0.7244,0.7433}=0.7433同理得d37=D2(3,7)=max{d23,d34}=0.7231d57=D2(5,7)=max{d25,d45}=0.1974d67=D2(6,7)=max{d26,d46}=0.3472這樣便得5類間的距離矩陣 0 0.1651 0.7758 0.8426 0.7473 1 0 0.7297 0.7695 0.7231 3= 0 0.1636 0.1974 5 0 0.3472 6 0 7 1 3 5 6 7中最小的數(shù)(零除外)是0.1636,它是類5和6間的距離,因此合并成新類8={5,6},類數(shù)由5變?yōu)?。這4類中,原來3類間的距離不變,新類8與原來3類間的距離按最長(zhǎng)距離計(jì)算。得d18=D2(1,8)=max{d15,d16}=0.8426d38=D2(3,8)=max{d35,d36}=0.7695d78=D2(7,8)=max{d57,d67}=0.3472得4類間的距離矩陣 0 0.1651 0.7473 0.8426 1 0 0.7231 0.7695 3= 0 0.3472 7 0 8 1 3 7 8中最小的數(shù)(零除外)是0.1651,它是類1和3間距離,因此合并成新類9={1,3},類似計(jì)算得d79=D2(7,9)=max{d17,d37}=0.7473d89=D2(8,9)=max{d18,d38}=0.8426 0 0.3472 0.7473 7= 0 0.8426 897 8 9 中最小的數(shù)(零除外)是0.1651,它是類1和3間距離,因此合并成新類10={7,8},因此有d9,10=D2(9,10)=max{d79,d89}=0.8426 0 0.8426 9= 0 1010最后將9、10并成一大類。整個(gè)聚類過程結(jié)束。將上述聚類過程畫成聚類圖如圖6.1所示。圖6.1最長(zhǎng)距離系統(tǒng)聚類法如果取閾值為0.6,則6個(gè)實(shí)例應(yīng)聚為2類:{2,4,5,6}和{1,3},如果閾值取為0.3,則6個(gè)實(shí)例應(yīng)聚為3類:{2,4},{5,6}和{1,3}。6.2分類在生產(chǎn)、科研和日常生活中經(jīng)常遇到需要根據(jù)事物的各種特性來判別其類別的問題,簡(jiǎn)稱分類問題。分類的目的是提出一個(gè)分類函數(shù)或分類模型(也常常稱作分類器),該模型能把數(shù)據(jù)庫中的數(shù)據(jù)映射到給定類別中的某一個(gè)。分類和回歸有類似之處,它們都可以用于預(yù)測(cè)。預(yù)測(cè)的目的是從歷史數(shù)據(jù)記錄中自動(dòng)推導(dǎo)出對(duì)給定數(shù)據(jù)的推廣描述,從而對(duì)未來數(shù)據(jù)進(jìn)行預(yù)測(cè)。和回歸方法不同的是,分類的輸出是離散的類別值,而回歸的輸出則是連續(xù)數(shù)值。要構(gòu)造一個(gè)分類模型,需要有一個(gè)訓(xùn)練樣本數(shù)據(jù)集作為輸入。訓(xùn)練集由一組數(shù)據(jù)記錄構(gòu)成,每個(gè)數(shù)據(jù)記錄是一個(gè)由有關(guān)特征屬性值組成的特征向量。此外,訓(xùn)練樣本還有一個(gè)類別標(biāo)記。例如,在前面聚為兩類的6個(gè)液壓機(jī)實(shí)例就可以作為一個(gè)訓(xùn)練集,其中的每個(gè)實(shí)例就是一個(gè)訓(xùn)練樣本,樣本的具體形式可以寫為:(x1,x2,…,x6;ωi),其中xj表示特征屬性值,ωi(i=1,2)表示類別。6.2.1決策區(qū)域與決策函數(shù)在分類問題中,樣本是用特征空間Rd中的特征向量表示的。分類的主要任務(wù)是按各個(gè)類別將特征空間劃分為對(duì)應(yīng)的區(qū)域,這些區(qū)域被稱為決策區(qū)域[5]。如果一個(gè)特征向量落入某個(gè)決策區(qū)域中,那么其對(duì)應(yīng)的樣本就被劃分到相應(yīng)的類中。假設(shè)現(xiàn)在有兩類樣本ω1和ω2,它們是用二維特征向量(x1,x2)表示,如圖6.2所示。每類樣本用一個(gè)向量x=[x1,x2]T∈R2表示。在圖6.2中我們用“O”表示第一類樣本ω1,用“”表示第二類樣本ω2,代表分布邊界的橢圓,也稱為類別界限。 w g>0 ω1 H:g=0 g<0 ω2 圖6.2用二維特征表示的兩類樣本[5]圖6.2中用二維特征向量表示樣本,對(duì)于超過三維的情況,我們無法用圖形表示出來,但是可以想象出類似于該圖的模型。我們可以給出兩類情況下線性判別函數(shù)的表達(dá)式 g(x)=wTx+w0 (6.1)式中x是d維特征向量,w稱為權(quán)向量,分別表示為 x=[x1,x2,…,xd]T, w=[w1,w2,…,wd]T,w0是個(gè)常數(shù),稱為閾值權(quán)。對(duì)于兩類問題的分類模型可以采用下面的決策規(guī)則:令 g(x)=g1(x)–g2(x)如果 g(x)>0,則決策x∈ω1 g(x)<0,則決策x∈ω2 g(x)=0,則可將x任意分到某一類方程g(x)=0定義了一個(gè)決策面,它把歸類于ω1的點(diǎn)與歸類于ω2的點(diǎn)分割開來,這里g(x)是線性函數(shù),因此這個(gè)決策面是超平面。w是決策面H的法向量,它指向g(x)>0的決策域,也稱此區(qū)域中的所有x在H的正側(cè),g(x)<0區(qū)域中的所有x在H的負(fù)側(cè)。6.2.2最小加權(quán)距離分類器對(duì)于上述液壓機(jī)分成兩類的問題,可以設(shè)計(jì)一個(gè)最小加權(quán)距離分類器來解決。我們可以將兩類的均值點(diǎn)作為各類的“典型模式”,將待識(shí)別樣本劃分到距離它最近的那個(gè)“典型模式”所代表的類別中去。這是因?yàn)榫嚯x最近即意味著相似度最大的緣故。由于在前面的章節(jié)中,我們已經(jīng)指出用加權(quán)距離進(jìn)行相似度量相對(duì)于傳統(tǒng)歐氏距離更加準(zhǔn)確,因此這里距離采用加權(quán)距離來度量。這也正是稱該方法為最小加權(quán)距離(minimumweighteddistance)分類方法的原因所在。最小加權(quán)距離分類器并不僅限用于解決兩類問題,對(duì)于多類問題也是只需找到距離它最近的“典型模式”即可判別。該分類器可以用如圖6.3的結(jié)構(gòu)表示,其中x是輸入特征向量,它將被分配到c個(gè)類別中的某一個(gè)ωk(k=1,…,c)中,這些類由各自的典型模式mk表示。m1 m2 選取 x . 最小值 類別 . mc . 圖6.3最小加權(quán)距離分類器系統(tǒng)圖下面我們來分析一下最小加權(quán)距離分類器及其決策面的幾何性質(zhì)。對(duì)于任意的d維特征向量x、任意的類別ωk(k=1,…,c)中,這些類由各自的典型模式mk表示。任意特征向量x和一個(gè)典型模式mk之間的加權(quán)距離的平方可以用下面的公式描述:(x)=‖x-mk‖2=(x-mk)TB(x-mk)=xTBx-mkTBx-xTBmk+mkTBmk (6.2)其中B=diag(β1,β2,…,βd),β1,β2,…,βd為各特征屬性的方差權(quán)重值,確定方法可參見第五章?,F(xiàn)在要選擇使得(x)最小化的類ωk,因此將(6.2)式改寫為:(x)=-2(mkTBx-0.5mkTBmk)+xTBx (6.2a(∵B為對(duì)角陣,∴xTBmk=mkTBx)如果這里類別數(shù)c=2,那么類之間對(duì)應(yīng)的決策邊界為: (x)=(x) (6.3)聯(lián)立(6.2a)與(6m1TBx-0.5m1TBm1=m2TBx-0.5m2TB(m1-m2)TBx=0.5(m1TBm1-m2TBm2) =0.5(m1TBm1-m2TBm1+m1TBm2-m2TBm2) (∵m2TBm1=m1TBm2) =0.5(m1-m2)TB(m1+m2) (m1-m2)TB[x-0.5(m1+m2)]=0[B(m1-m2)]T[x-0.5(m1+m2)]=0最后我們得到一個(gè)關(guān)于x的線性等式,它表示了一個(gè)垂直于B(m1-m2)并且通過樣本均值點(diǎn)的中心點(diǎn)0.5(m1+m2)的超平面,這就是劃分ω1和ω2的加權(quán)距離線性判別。由式(6.2)可以看出,對(duì)于加權(quán)距離尺度而言,等距離面是以各類樣本均值點(diǎn)為中心的一系列超橢球體。圖6.4表示的是樣本空間為二維、類別數(shù)為2時(shí)的情況,圖中的6個(gè)橢圓周分別代表了到各自均值點(diǎn)的6個(gè)等距離面。直線H是到兩個(gè)類均值點(diǎn)等距離點(diǎn)的集合。對(duì)于多類的情況,最小加權(quán)距離分類是分段線性的。它由個(gè)超平面段組成,每一個(gè)是其中某兩個(gè)類的邊界。圖6.4加權(quán)距離下的等距離面對(duì)于表6.1的未知樣本x的分類問題,我們只需算出它到兩類均值點(diǎn)(典型模式)的加權(quán)距離就可以將它歸類,未知樣本x與兩個(gè)典型模式的特征屬性值列于表6.2中。表6.1 分類對(duì)象特征屬性值表公稱壓力(KN)緩沖缸有=1,無=0液壓缸快降速度(mm/s)液壓缸壓制速度(mm/s)工作臺(tái)長(zhǎng)度(mm)工作臺(tái)寬度(mm)分類對(duì)象x5000010081200900表6.2分類對(duì)象與典型模式特征屬性表公稱壓力(KN)緩沖缸有=1,無=0液壓缸快降速度(mm/s)液壓缸壓制速度(mm/s)工作臺(tái)長(zhǎng)度(mm)工作臺(tái)寬度(mm)分類對(duì)象x5000010081200900典型模式153631119101250850典型模式230000858800520這里B=diag(0.14,0.51,0.05,0.09,0.11,0.10),將未知樣本x和均值點(diǎn)的特征屬性值標(biāo)準(zhǔn)化后代入(6.2),得(x)=0.7168, (x)=0.1621(x)<(x),因此將未知樣本x分入類ω2中,即采用“四柱型”結(jié)構(gòu)。將訓(xùn)練集中的6個(gè)樣本用上述分類器分類,回代結(jié)果全部判對(duì)。當(dāng)然,僅僅保證在訓(xùn)練集上的正確率是不夠的,使用一組獨(dú)立的樣本進(jìn)行測(cè)試是必不可少的[43],因此,下面就建立一個(gè)如表6.3所示的測(cè)試集來對(duì)最小加權(quán)距離分類器進(jìn)行測(cè)試。表6.3測(cè)試集樣本公稱壓力(KN)緩沖缸有=1,無=0液壓缸快降速度(mm/s)液壓缸壓制速度(mm/s)工作臺(tái)長(zhǎng)度(mm)工作臺(tái)寬度(mm)實(shí)際類別樣本120001907640400ω1樣本220000889800640ω2樣本3315018510800600ω1樣本431500958800600ω2樣本53150110081000800ω1樣本640001959800600ω1樣本740000877800600ω2樣本85000010081200900ω1樣本963000847800640ω2樣1樣本11800011001216001400ω1樣本12800011251416001200ω1該測(cè)試集是從某機(jī)床廠的兩個(gè)系列液壓機(jī)中挑選而得,其中類ω1對(duì)應(yīng)“框架型”為27系列,類ω2對(duì)應(yīng)“四柱型”為32系列,將它們的實(shí)際類別(系列)標(biāo)志也列于表中,以便于和分類結(jié)果進(jìn)行對(duì)比。用最小加權(quán)距離分類器對(duì)此12個(gè)樣本進(jìn)行分類,其中11個(gè)樣本的分類結(jié)果與實(shí)際類別一致,正確率達(dá)到了91.7%。這個(gè)結(jié)果是比較理想的7液壓機(jī)系統(tǒng)分類軟件前面幾章說到了液壓機(jī)的相關(guān)知識(shí),提出了相似性度量的一種新方法,并結(jié)合模式識(shí)別等知識(shí)為液壓機(jī)系統(tǒng)分類軟件的編寫提供了理論基礎(chǔ),本章將介紹如何用VisualC++語言來編寫液壓機(jī)系統(tǒng)分類軟件。7.1VisualC++的優(yōu)點(diǎn)1)簡(jiǎn)單性VisualC++中提供了MFC類庫、ATL模板類以及AppWizard、ClassWizard等一系列的Wizard工具用于幫助用戶快速的建立自己的應(yīng)用程序,大大簡(jiǎn)化了應(yīng)用程序的設(shè)計(jì)。使用這些技術(shù),可以使開發(fā)者編寫很少的代碼或不需編寫代碼就可以開發(fā)一個(gè)數(shù)據(jù)庫應(yīng)用程序。2)靈活性VisualC++提供的開發(fā)環(huán)境可以使開發(fā)者根據(jù)自己的需要設(shè)計(jì)應(yīng)用程序的界面和功能,而且,VisualC++提供了豐富的類庫和方法,可以使開發(fā)者根據(jù)自己的應(yīng)用特點(diǎn)進(jìn)行選擇。3)訪問速度快為了解決ODBC開發(fā)的數(shù)據(jù)庫應(yīng)用程序訪問數(shù)據(jù)庫的速度慢的問題,VisualC++提供了新的訪問技術(shù)——OLEDB和ADO,OLEDB和ADO都是基于COM接口的技術(shù),使用這種技術(shù)可以直接對(duì)數(shù)據(jù)庫的驅(qū)動(dòng)程序進(jìn)行訪問,這大大提供了訪問速度。4)可擴(kuò)展性VisualC++提供了OLE技術(shù)和ActiveX技術(shù),這種技術(shù)可以增強(qiáng)應(yīng)用程序的能力。使用OLE技術(shù)和ActiveX技術(shù)可以使開發(fā)者利用VisualC++中提供的各種組件、控件以及第三方開發(fā)者提供的組件來創(chuàng)建自己的程序,從而實(shí)現(xiàn)應(yīng)用程序的組件化。使用這種技術(shù)可以使應(yīng)用程序具有良好的可擴(kuò)展性。5)訪問不同種類數(shù)據(jù)源傳統(tǒng)的ODBC技術(shù)只能訪問關(guān)系型數(shù)據(jù)庫,在VisualC++中,提供了OLEDB訪問技術(shù),不僅可以訪問關(guān)系型數(shù)據(jù)庫,還可以訪問非關(guān)系型數(shù)據(jù)庫。MicrosoftVisualC++.NET2003提供動(dòng)態(tài)開發(fā)環(huán)境,以便使用C++開發(fā)語言創(chuàng)建基于MicrosoftWindows和基于MicrosoftNET的應(yīng)用程序、動(dòng)態(tài)Web應(yīng)用程序和XMLWebservicesVisualC++NET包括具有工業(yè)標(biāo)準(zhǔn)的活動(dòng)模板庫(ATL)和Microsoft基礎(chǔ)類庫(MFC)、高級(jí)語言擴(kuò)展以及強(qiáng)大的集成開發(fā)環(huán)境(IDE)功能,這些功能使開發(fā)人員能夠高效地編輯和調(diào)試源代碼。它為開發(fā)者提供面向?qū)ο蟮目煽空Z言,可以生成功能強(qiáng)大同時(shí)注重性能的應(yīng)用程序。通過高級(jí)模板功能、低級(jí)別平臺(tái)訪問和優(yōu)化編譯器,VisualC++.NET可提供生成健壯的應(yīng)用程序和組件的出眾功能。該產(chǎn)品使開發(fā)人員能夠生成各種解決方案,包括Web應(yīng)用程序、智能客戶端基于MicrosoftWindows的應(yīng)用程序和用于瘦客戶端與智能客戶端移動(dòng)設(shè)備的解決方案。C++是世界上最流行的系統(tǒng)級(jí)語言,并且VisualC++.NET2003為開發(fā)人員提供了生成軟件的世界級(jí)。7.2液壓機(jī)系統(tǒng)分類原理本軟件我們采用最小加權(quán)距離分類的思想,我們可以將兩類的均值點(diǎn)作為各類的“典型模式”,將待識(shí)別的樣本劃分到距離它最近的那個(gè)“典型模式”所代表的類別中去。這是因?yàn)榫嚯x最近即意味著相似性最大的緣故。最小加權(quán)距離分類器并不僅限用于解決兩類問題,對(duì)于多類問題也是只需找到距離它最近的“典型模式”即可判別。液壓機(jī)系統(tǒng)分類軟件流程圖如圖7—1所示,這就是液壓機(jī)系統(tǒng)分類軟件的整個(gè)流程圖。圖7—1程序流程圖7.4液壓機(jī)分類軟件的測(cè)試圖及部分源程序圖7—2操作界面圖本操作界面的內(nèi)容是液壓機(jī)分類軟件的一個(gè)測(cè)試結(jié)果,如圖7-2所示。當(dāng)輸入液壓機(jī)系統(tǒng)的6個(gè)特征值時(shí),該軟件會(huì)自動(dòng)得出分類結(jié)果,在前一章已對(duì)其進(jìn)行了測(cè)試,準(zhǔn)確率非常高。由于篇幅的限制,不可能將所有程序都寫下來,因此只附上部分原程序。附:部分源程序//#include<vcl.h>#pragmahdrstop#include"Unit1.h"#include<iostream.h>intmax(inta,intb){returna>b?a:b;}intmax(inta,intb,intc){returnmax(a,max(b,c));}//#pragmapackage(smart_init)#pragmaresource"*.dfm"TForm1*Form1;//__fastcallTForm1::TForm1(TComponent*Owner):TForm(Owner){}//void__fastcallTForm1::Button1Click(TObject*Sender){constc1=14,c2=14,c3=42,c4=9,c5=11,c6=10,pa1=5363,pb1=1,pc1=119,pd1=10,pe1=1250,pf1=850,pa2=3000,pb2=0,pc2=65,pd2=8,pe2=800,pf2=520;Doublepa,pb,pc,pd,pe,pf,pamax,pbmax,pcmax,pdmax,pemax,pfmax;floatda
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度車輛租賃與環(huán)保檢測(cè)服務(wù)合同7篇
- 2025版智慧社區(qū)供水工程安裝與智能化服務(wù)合同3篇
- 2025版星巴克加盟店突發(fā)事件應(yīng)急處理合同3篇
- 2025合同樣例小產(chǎn)權(quán)購房合同范本
- 2025年度博物館展覽插畫制作服務(wù)合同4篇
- 2025版時(shí)尚服裝設(shè)計(jì)合同補(bǔ)充協(xié)議3篇
- 2025國際計(jì)算機(jī)軟件許可合同書樣書
- 二零二五年度農(nóng)家樂民宿運(yùn)營管理承包協(xié)議3篇
- 2025年度船舶租賃合同(含船舶操作培訓(xùn)與認(rèn)證服務(wù))2篇
- 二零二五年度車輛貸款居間服務(wù)合同A新能源補(bǔ)貼版4篇
- 第1課 隋朝統(tǒng)一與滅亡 課件(26張)2024-2025學(xué)年部編版七年級(jí)歷史下冊(cè)
- 2025-2030年中國糖醇市場(chǎng)運(yùn)行狀況及投資前景趨勢(shì)分析報(bào)告
- 冬日暖陽健康守護(hù)
- 水處理藥劑采購項(xiàng)目技術(shù)方案(技術(shù)方案)
- 2024級(jí)高一上期期中測(cè)試數(shù)學(xué)試題含答案
- 盾構(gòu)標(biāo)準(zhǔn)化施工手冊(cè)
- 天然氣脫硫完整版本
- 山東省2024-2025學(xué)年高三上學(xué)期新高考聯(lián)合質(zhì)量測(cè)評(píng)10月聯(lián)考英語試題
- 不間斷電源UPS知識(shí)培訓(xùn)
- 三年級(jí)除法豎式300道題及答案
- 人教版八級(jí)物理下冊(cè)知識(shí)點(diǎn)結(jié)
評(píng)論
0/150
提交評(píng)論