版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
(1)數(shù)據(jù)清理首先是處理空缺值,如:要分析某市場的銷售和顧客數(shù)據(jù),但顧客的income項沒有記錄,如何處理這類問題:①忽略元組,忽略整條記錄;②人工填寫空缺值,根據(jù)其它資料手工填寫;③使用一個全局常量填充空缺值,使所有income項記錄都以一個常量(如:2000)填充;④使用屬性的平均值填充空缺值,取得其它記錄中該屬性的平均值進(jìn)行填充;⑤使用與給定元組屬同一類的所有樣本的平均值,與上面相類似;⑥使用最可能的值填充空缺值,與上面相類似,然后是處理噪聲數(shù)據(jù);⑦分箱:通過考察周圍的值來平滑存儲數(shù)據(jù)的值,有兩種方法:按箱平均值平滑,箱中每一個值被箱中的平均值替換;按箱邊界平滑,箱中的最大和最小值被視為箱邊界,箱中的每一個值被最近的邊界值替換;⑧計算機和人工檢查結(jié)合:即手工處理,最后是處理不一致數(shù)據(jù),主要方法是參照其它資料,如紙上記錄,人工的加以更正。(2)數(shù)據(jù)集成即由多個數(shù)據(jù)存儲合并數(shù)據(jù)。(3)數(shù)據(jù)變換將數(shù)據(jù)轉(zhuǎn)換成適用于數(shù)據(jù)挖掘的形式。(4)數(shù)據(jù)歸約數(shù)據(jù)挖掘時往往數(shù)據(jù)量非常大,在少量數(shù)據(jù)上進(jìn)行挖掘分析需要很長的時間,數(shù)據(jù)歸約技術(shù)可以用來得到數(shù)據(jù)集的歸約表示,它小得多,但仍然接近于保持原數(shù)據(jù)的完整性,并且結(jié)果與歸約前的結(jié)果相同或幾乎相同。數(shù)據(jù)預(yù)處理是目前數(shù)據(jù)挖掘一個熱門的研究方面,畢竟這是由數(shù)據(jù)預(yù)處理的產(chǎn)生背景所決定的——現(xiàn)實世界中的數(shù)據(jù)幾乎都是臟數(shù)據(jù)。數(shù)據(jù)的清理隸屬度定義:美國加利福尼亞大學(xué)控制論教授扎得()經(jīng)過多年的研究,終于在1965年首先發(fā)表了題為《模糊集》的論文。指出:若對論域(研究的范圍)U中的任一元素x,都有一個數(shù)A(x)∈[0,1]與之對應(yīng),則稱A為U上的模糊集,A(x)稱為x對A的隸屬度。當(dāng)x在U中變動時,A(x)就是一個函數(shù),稱為A的隸屬函數(shù)。隸屬度A(x)越接近于1,表示x屬于A的程度越高,A(x)越接近于0表示x屬于A的程度越低。用取值于區(qū)間[0,1]的隸屬函數(shù)A(x)表征x屬于A的程度高低,這樣描述模糊性問題比起經(jīng)典集合論更為合理。隸屬度屬于模糊評價函數(shù)里的概念:模糊綜合評價是對受多種因素影響的事物做出全面評價的一種十分有效的多因素決策方法,其特點是評價結(jié)果不是絕對地肯定或否定,而是以一個模糊集合來表示。圖6.1圖6.2B的隸屬度函數(shù)圖6.3圖6.4D的隸屬度函數(shù)圖6.5E的隸屬度函數(shù)圖6.6圖6.7H的隸屬度函數(shù)圖6.8輸出的隸屬度函數(shù)模糊規(guī)則是對專家的理論知識與實踐經(jīng)驗的總結(jié)。本文中有389個輸入、輸出,理想情況應(yīng)當(dāng)編寫389條規(guī)則,但由于規(guī)則重復(fù)的概率比較高,故應(yīng)當(dāng)抽樣選取一部分編寫規(guī)則,這里抽取了80個點作為參照點。在RulesEditor窗口中輸入控制規(guī)則。例如:if(Ais小)and(Bis中)and(Dis小)and(Eis大)and(Gis小)and(His中)then(輸出is大)這樣得到了10條模糊規(guī)則,具體如圖6.9所示:圖6.9模糊規(guī)則模糊決策一般采用Mamdani’s(min-max)決策法。解模糊有重心法、等分法、最大隸屬度平均法等5種可供選擇,在此采用重心法(centroid)。如此設(shè)計的模糊控制器的輸出與輸入的關(guān)系曲面圖如圖6.10所示。顯然模糊控制是一種非線性控制。圖6.10模糊模型輸入輸出曲面圖這樣即可得到系統(tǒng)的的模糊模型如圖6.11所示:圖6.11模糊模型至此模糊建模工作完成。在模糊邏輯工具箱中能方便地修改輸入輸出的論域、模糊子集、隸屬度函數(shù)、模糊規(guī)則、模糊決策方法及解模糊方案。由于定義隸屬度函數(shù)及設(shè)計模糊規(guī)則的自由程度比較高,并沒有特定的設(shè)計方法,只能依靠經(jīng)驗。因此,建立的模型可能仍有改進(jìn)余地,因此需要對模型加以驗證和改進(jìn)。MATLAB提供的SIMULINK是一個用來對動態(tài)系統(tǒng)進(jìn)行建模、仿真和分析的軟件包,它支持連續(xù)、離散及兩者混合的線性和非線性系統(tǒng)。SIMULINK包含多個子模型庫,每個子模型庫中又包含多個功能模塊。利用鼠標(biāo)可直觀地“畫”出系統(tǒng)模型,然后直接進(jìn)行仿真。仿真時可選擇各種數(shù)值算法、仿真步長等重要參數(shù),并可用模擬示波器將仿真動態(tài)結(jié)果予以顯示,直觀高效。如果對建模得出的結(jié)果不滿意,可以調(diào)整模糊規(guī)則和隸屬度函數(shù)。SIMLINK仿真接線圖如圖6.12所示:圖6.12SIMULIK接線圖ABCDE輸出GH-1.944111.906959-1.684882.221399-2.27662-1.64829-0.345110.167172衷心的感謝能在百忙之中參加本人論文答辯的各位老師,謝謝你們的批評和指正!本文是在浦鐵成老師的悉心指導(dǎo)和幫助下完成的。在論文的寫作過程中,浦老師對論文主題的確立、結(jié)構(gòu)的搭建、寫作方法、寫作規(guī)范等方方面面提出了詳盡、中肯的意見和指導(dǎo),這些對于論文的完成是不
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025陜西建筑安全員知識題庫及答案
- 2025年重慶市安全員-B證(項目經(jīng)理)考試題庫
- 2025年江西省建筑安全員《A證》考試題庫
- 【大學(xué)課件】工程倫理
- 【大學(xué)課件】工程建設(shè)監(jiān)理概論
- 《答謝中書書》課件1
- 物業(yè)客服培訓(xùn)課件
- 單位管理制度展示選集人員管理十篇
- 2025年中國航空貨物運輸保險行業(yè)市場發(fā)展現(xiàn)狀及投資方向研究報告
- 單位管理制度收錄大合集【職員管理篇】
- 2025年中國社會科學(xué)院外國文學(xué)研究所專業(yè)技術(shù)人員招聘3人歷年高頻重點提升(共500題)附帶答案詳解
- 《高血壓治療新進(jìn)展》課件
- 小紅書營銷師(初級)認(rèn)證理論知識考試題及答案
- 貴州省部分學(xué)校2024-2025學(xué)年高三年級上冊10月聯(lián)考 化學(xué)試卷
- 2023-2024學(xué)年貴州省貴陽外國語實驗中學(xué)八年級(上)期末數(shù)學(xué)試卷(含答案)
- 2024年新能源汽車概論考試題庫
- 2024年醫(yī)師定期考核臨床類人文醫(yī)學(xué)知識考試題庫及答案(共280題)
- 2024年公司年終工作會議講話稿(4篇)
- 供應(yīng)商年終總結(jié)
- 2024員工心理健康培訓(xùn)
- 2024年二級建造師繼續(xù)教育考核題及答案
評論
0/150
提交評論