版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
2019年6月23感謝你的觀看1高級人工智能第十三章
知識發(fā)現(xiàn)
(二)
xxx
中國科學(xué)院計算技術(shù)所2019年6月23感謝你的觀看1高級人工智能第十三章2019年6月23感謝你的觀看2主要內(nèi)容研究背景MSMiner體系結(jié)構(gòu)元數(shù)據(jù)數(shù)據(jù)倉庫平臺數(shù)據(jù)采掘集成工具2019年6月23感謝你的觀看2主要內(nèi)容研究背景2019年6月23感謝你的觀看3典型的知識發(fā)現(xiàn)系統(tǒng)SAS公司的SASEnterpriseMinerIBM公司的IntelligentMinerSolution公司的Clementine加拿大SimonFraserUniv.的DBMiner中科院計算技術(shù)研究所的MSMiner等2019年6月23感謝你的觀看3典型的知識發(fā)現(xiàn)系統(tǒng)SAS公司2019年6月23感謝你的觀看4
知識發(fā)現(xiàn)工具SASSAS公司的SASEnterpriseMiner是一種通用的數(shù)據(jù)挖掘工具。通過收集分析各種統(tǒng)計資料和客戶購買模式,SASEnterpriseMiner可以幫助您發(fā)現(xiàn)業(yè)務(wù)的趨勢,解釋已知的事實,預(yù)測未來的結(jié)果,并識別出完成任務(wù)所需的關(guān)鍵因素,以實現(xiàn)增加收入、降低成本。2019年6月23感謝你的觀看4知識發(fā)現(xiàn)工具SASS2019年6月23感謝你的觀看5
知識發(fā)現(xiàn)工具SASSASEnterpriseMiner提供"抽樣-探索-轉(zhuǎn)換-建模-評估"(SEMMA)的處理流程。數(shù)據(jù)挖掘算法有:
·聚類分析,SOM/KOHONEN神經(jīng)網(wǎng)絡(luò)分類算法
·關(guān)聯(lián)模式/序列模式分析
·多元回歸模型
·決策樹模型(C45,CHAID,CART)
·神經(jīng)網(wǎng)絡(luò)模型(MLP,RBF)
·SAS/STAT,SAS/ETS等模塊提供的統(tǒng)計分析模型和時間序列分析模型也可嵌入其中。2019年6月23感謝你的觀看5知識發(fā)現(xiàn)工具SASSAS2019年6月23感謝你的觀看6
知識發(fā)現(xiàn)工具IntelligentMiner
IBM公司的IntelligentMiner具有典型數(shù)據(jù)集自動生成、關(guān)聯(lián)發(fā)現(xiàn)、序列規(guī)律發(fā)現(xiàn)、概念性分類和可視化顯示等功能。它可以自動實現(xiàn)數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)發(fā)掘和結(jié)果顯示。若有必要,對結(jié)果數(shù)據(jù)集還可以重復(fù)這一過程,直至得到滿意結(jié)果為止。2019年6月23感謝你的觀看6知識發(fā)現(xiàn)工具Intelli2019年6月23感謝你的觀看7
知識發(fā)現(xiàn)工具ClementineSolution公司的Clementine提供了一個可視化的快速建立模型的環(huán)境。它由數(shù)據(jù)獲?。―ataAccess)、探查(Investigate)、整理(Manipulation)、建模(Modeling)和報告(Reporting)等部分組成。都使用一些有效、易用的按鈕表示,用戶只需用鼠標(biāo)將這些組件連接起來建立一個數(shù)據(jù)流,可視化的界面使得數(shù)據(jù)挖掘更加直觀交互,從而可以將用戶的商業(yè)知識在每一步中更好的利用。2019年6月23感謝你的觀看7知識發(fā)現(xiàn)工具Clement2019年6月23感謝你的觀看8數(shù)據(jù)挖掘工具:公用系統(tǒng)
MLC++MatlabWeka2019年6月23感謝你的觀看8數(shù)據(jù)挖掘工具:公用系統(tǒng) 2019年6月23感謝你的觀看9
知識發(fā)現(xiàn)工具M(jìn)SMiner
中科院計算技術(shù)研究所智能信息處理開放實驗室開發(fā)的MSMiner是一種多策略知識發(fā)現(xiàn)平臺,能夠提供快捷有效的數(shù)據(jù)挖掘解決方案,提供多種知識發(fā)現(xiàn)方法。MSMiner具有下列特點(diǎn):
.基于數(shù)據(jù)倉庫和新型的元數(shù)據(jù)管理按照主題創(chuàng)建數(shù)據(jù)倉庫,并通過元數(shù)據(jù)進(jìn)行管理和維護(hù)。
.數(shù)據(jù)的抽取、轉(zhuǎn)換、裝載等預(yù)處理方便,支持OLAP查詢。
2019年6月23感謝你的觀看9知識發(fā)現(xiàn)工具M(jìn)SMiner2019年6月23感謝你的觀看10MSMiner的特點(diǎn)提供決策樹、支持向量機(jī)、粗糙集、模糊聚類、基于范例推理、統(tǒng)計方法、神經(jīng)計算等多種數(shù)據(jù)挖掘算法,支持特征抽取、分類、聚類、預(yù)測、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、統(tǒng)計分析等數(shù)據(jù)挖掘功能,并支持高層次的決策分析功能。實現(xiàn)了可視化的任務(wù)編輯環(huán)境,以及功能強(qiáng)大的任務(wù)處理引擎,能夠快捷有效地實現(xiàn)各種數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)挖掘任務(wù)。
可擴(kuò)展性好。轉(zhuǎn)換規(guī)則和挖掘算法是封裝的、模塊化的,系統(tǒng)提供了一個開放的、靈活通用的接口,使用戶能夠加入新的規(guī)則和算法。
容易進(jìn)行二次開發(fā)。
2019年6月23感謝你的觀看10MSMiner的特點(diǎn)提供決2019年6月23感謝你的觀看11數(shù)據(jù)倉庫:特征面向主題集成性穩(wěn)定性隨時間變化2019年6月23感謝你的觀看11數(shù)據(jù)倉庫:特征2019年6月23感謝你的觀看12數(shù)據(jù)倉庫:OLAPROLAP:RelationalOLAPMOLAP:MultidimensionalOLAPHOLAP:HybridOLAP2019年6月23感謝你的觀看12數(shù)據(jù)倉庫:OLAP2019年6月23感謝你的觀看13數(shù)據(jù)挖掘和數(shù)據(jù)倉庫的結(jié)合數(shù)據(jù)倉庫為數(shù)據(jù)挖掘提供經(jīng)良好處理的數(shù)據(jù)源數(shù)據(jù)挖掘為數(shù)據(jù)倉庫提供深層數(shù)據(jù)分析手段2019年6月23感謝你的觀看13數(shù)據(jù)挖掘和數(shù)據(jù)倉庫的結(jié)合2019年6月23感謝你的觀看14MSMiner體系結(jié)構(gòu)設(shè)計目標(biāo):
提供快捷有效的數(shù)據(jù)挖掘解決方案。設(shè)計要求:開放性可擴(kuò)展性效率易用性2019年6月23感謝你的觀看14MSMiner體系結(jié)構(gòu)設(shè)計2019年6月23感謝你的觀看15MSMiner體系結(jié)構(gòu)MSMiner體系結(jié)構(gòu)示意圖客戶端服務(wù)器端元數(shù)據(jù)模塊執(zhí)行數(shù)據(jù)采掘任務(wù)編輯數(shù)據(jù)采掘任務(wù)數(shù)據(jù)采掘集成工具數(shù)據(jù)抽取和集成主題組織OLAP可視化數(shù)據(jù)倉庫管理器數(shù)據(jù)倉庫OLEDBforODBC2019年6月23感謝你的觀看15MSMiner體系結(jié)構(gòu)MS2019年6月23感謝你的觀看16元數(shù)據(jù)的內(nèi)容關(guān)于外部數(shù)據(jù)源的關(guān)于內(nèi)部數(shù)據(jù)的(包括數(shù)據(jù)庫、表、字段的信息)關(guān)于數(shù)據(jù)倉庫的(包括事實表、維表、立方以及其它的中間表)關(guān)于用戶信息的數(shù)據(jù)采掘算法(包括算法的參數(shù)信息)關(guān)于采掘任務(wù)的(包括采掘步驟、每個步驟的所用的參數(shù))2019年6月23感謝你的觀看16元數(shù)據(jù)的內(nèi)容關(guān)于外部數(shù)據(jù)源2019年6月23感謝你的觀看17元數(shù)據(jù):元數(shù)據(jù)庫2019年6月23感謝你的觀看17元數(shù)據(jù):元數(shù)據(jù)庫2019年6月23感謝你的觀看18元數(shù)據(jù):元數(shù)據(jù)對象模型設(shè)計思路一致性完備性易維護(hù)性2019年6月23感謝你的觀看18元數(shù)據(jù):元數(shù)據(jù)對象模型設(shè)計2019年6月23感謝你的觀看19元數(shù)據(jù)是層次的嵌套的封裝的互相聯(lián)系的采用面向?qū)ο蟮姆椒ü灿?0多個類元數(shù)據(jù)的結(jié)構(gòu)2019年6月23感謝你的觀看19元數(shù)據(jù)是元數(shù)據(jù)的結(jié)構(gòu)2019年6月23感謝你的觀看20數(shù)據(jù)倉庫平臺:結(jié)構(gòu)MSMiner數(shù)據(jù)倉庫結(jié)構(gòu)示意圖外部數(shù)據(jù)數(shù)據(jù)倉庫元數(shù)據(jù)數(shù)據(jù)抽取、清洗、聚集、轉(zhuǎn)換主題2主題1主題nOLAP及可視化工具數(shù)據(jù)采掘集成工具...2019年6月23感謝你的觀看20數(shù)據(jù)倉庫平臺:結(jié)構(gòu)MSMi2019年6月23感謝你的觀看21數(shù)據(jù)倉庫平臺:數(shù)據(jù)抽取和集成數(shù)據(jù)的簡單抽取和集成數(shù)據(jù)的復(fù)雜處理面向數(shù)據(jù)挖掘的數(shù)據(jù)預(yù)處理2019年6月23感謝你的觀看21數(shù)據(jù)倉庫平臺:數(shù)據(jù)抽取和集2019年6月23感謝你的觀看22數(shù)據(jù)抽取和集成:MSETL
MSETL系統(tǒng)作為MSMiner數(shù)據(jù)挖掘平臺的一個重要組成部分,主要完成從業(yè)務(wù)數(shù)據(jù)源到分析數(shù)據(jù)源的轉(zhuǎn)換功能。具體包括從異質(zhì)業(yè)務(wù)數(shù)據(jù)源中抽取需要的數(shù)據(jù),對這些數(shù)據(jù)進(jìn)行多種預(yù)處理,把經(jīng)過處理后的數(shù)據(jù)裝載入指定數(shù)據(jù)倉庫/數(shù)據(jù)庫2019年6月23感謝你的觀看22數(shù)據(jù)抽取和集成:MSE2019年6月23感謝你的觀看23數(shù)據(jù)抽取和集成:MSETL
用戶界面(ETL轉(zhuǎn)換函數(shù)和ETL任務(wù))邏輯處理元數(shù)據(jù)管理數(shù)據(jù)庫服務(wù)器2019年6月23感謝你的觀看23數(shù)據(jù)抽取和集成:MSE2019年6月23感謝你的觀看24數(shù)據(jù)抽取和集成:MSETL支持多種數(shù)據(jù)源和目的數(shù)據(jù)庫良好的可擴(kuò)充性高效率的調(diào)度執(zhí)行功能增量更新功能2019年6月23感謝你的觀看24數(shù)據(jù)抽取和集成:MSE2019年6月23感謝你的觀看25數(shù)據(jù)抽取和集成:MSETL2019年6月23感謝你的觀看25數(shù)據(jù)抽取和集成:MSE2019年6月23感謝你的觀看26數(shù)據(jù)抽取和集成:MSETL2019年6月23感謝你的觀看26數(shù)據(jù)抽取和集成:MSE2019年6月23感謝你的觀看27數(shù)據(jù)倉庫平臺:數(shù)據(jù)倉庫建模產(chǎn)品號產(chǎn)品名稱產(chǎn)品目錄產(chǎn)品維表訂單號訂貨日期訂貨維表客戶號客戶名稱客戶地址客戶維表產(chǎn)品號客戶號訂單號時間標(biāo)識地區(qū)名稱產(chǎn)品數(shù)量總價事實表時間標(biāo)識月季度年時間維表地區(qū)名稱省別地區(qū)維表星型模型2019年6月23感謝你的觀看27數(shù)據(jù)倉庫平臺:數(shù)據(jù)倉庫建模2019年6月23感謝你的觀看28OLAPMOLAP,ROLAP,HOLAPOLAP的操作Slice(切片)Dice(切塊)Rollup(上卷)Drilldown(下鉆)Pivot(旋轉(zhuǎn))OLAP方案
采用了自主開發(fā)的OLAPServer2019年6月23感謝你的觀看28OLAPMOLAP,RO2019年6月23感謝你的觀看29數(shù)據(jù)立方體2019年6月23感謝你的觀看29數(shù)據(jù)立方體2019年6月23感謝你的觀看30數(shù)據(jù)倉庫平臺:OLAP的實現(xiàn)2019年6月23感謝你的觀看30數(shù)據(jù)倉庫平臺:OLAP的實2019年6月23感謝你的觀看31數(shù)據(jù)挖掘集成工具:結(jié)構(gòu)數(shù)據(jù)挖掘集成工具結(jié)構(gòu)示意圖數(shù)據(jù)倉庫平臺任務(wù)編輯任務(wù)規(guī)劃和執(zhí)行算法庫算法管理元數(shù)據(jù)任務(wù)模型庫、算法描述2019年6月23感謝你的觀看31數(shù)據(jù)挖掘集成工具:結(jié)構(gòu)數(shù)據(jù)2019年6月23感謝你的觀看32數(shù)據(jù)挖掘集成工具:數(shù)據(jù)挖掘任務(wù)模型Step1Step2Step4Step3Step5DMTask=(V,R)V={x|x∈StepObjects}R={<x,y>|P(x,y)∧x,y∈V}2019年6月23感謝你的觀看32數(shù)據(jù)挖掘集成工具:數(shù)據(jù)挖掘2019年6月23感謝你的觀看33數(shù)據(jù)挖掘集成工具:數(shù)據(jù)挖掘任務(wù)模型步驟對象BNF語法定義:<StepObject>::=<Attribute_List>;<Method_List><Attribute_List>::= [<Attribute>|<Attribute>;<Attribute_List>]<Attribute>::=<Name>,<Value><Method_List>::=[<Method>|<Method>;<Method_List>]<Method>::=<Name>,<Script><Name>::=[<char>|<string>]<Value>::=[<char>|<string>|<integer>|<float>]<Script>::=<DML_Sentence>*2019年6月23感謝你的觀看33數(shù)據(jù)挖掘集成工具:數(shù)據(jù)挖掘2019年6月23感謝你的觀看34數(shù)據(jù)挖掘集成工具:編輯任務(wù)模型任務(wù)向?qū)?019年6月23感謝你的觀看34數(shù)據(jù)挖掘集成工具:編輯任務(wù)2019年6月23感謝你的觀看35數(shù)據(jù)挖掘集成工具:編輯任務(wù)模型任務(wù)編輯圖板2019年6月23感謝你的觀看35數(shù)據(jù)挖掘集成工具:編輯任務(wù)2019年6月23感謝你的觀看36數(shù)據(jù)挖掘集成工具:處理任務(wù)模型人機(jī)界面主控模塊規(guī)劃器解釋器緩存函數(shù)庫黑板任務(wù)模型庫數(shù)據(jù)采掘任務(wù)處理引擎的結(jié)構(gòu)2019年6月23感謝你的觀看36數(shù)據(jù)挖掘集成工具:處理任務(wù)2019年6月23感謝你的觀看37數(shù)據(jù)挖掘集成工具:處理任務(wù)模型任務(wù)規(guī)劃和解釋執(zhí)行S1S3S2S4S5S1-S2-S3-S4-S52019年6月23感謝你的觀看37數(shù)據(jù)挖掘集成工具:處理任務(wù)2019年6月23感謝你的觀看38數(shù)據(jù)挖掘集成工具:DML語言DML函數(shù)人機(jī)交互和控制臺輸入/輸出數(shù)值計算字符串處理圖形、圖表展示文件操作數(shù)據(jù)庫訪問網(wǎng)絡(luò)通訊對象訪問消息處理和流程控制黑板操作外部功能調(diào)用其它輔助功能2019年6月23感謝你的觀看38數(shù)據(jù)挖掘集成工具:DML語2019年6月23感謝你的觀看39數(shù)據(jù)挖掘集成工具:內(nèi)嵌決策樹SOM神經(jīng)網(wǎng)絡(luò)粗糙集關(guān)聯(lián)規(guī)則
2019年6月23感謝你的觀看39數(shù)據(jù)挖掘集成工具:內(nèi)嵌2019年6月23感謝你的觀看40決策樹2019年6月23感謝你的觀看40決策樹2019年6月23感謝你的觀看41知識約簡知識約簡——在保持知識庫的分類或決策能力不變的條件下,刪除其中不相關(guān)或不重要知識冗余知識——資源的浪費(fèi);干擾人們作出正確而簡潔的決策RoughSet——把那些無法確認(rèn)的個體都?xì)w屬于邊界線區(qū)域,而這種邊界線區(qū)域被定義為上近似集和下近似集之差集(Z.Pawlak)
知識約簡是粗糙集的核心內(nèi)容之一
2019年6月23感謝你的觀看41知識約簡知識約簡——在保持2019年6月23感謝你的觀看42RoughSet約簡2019年6月23感謝你的觀看42RoughSet約簡2019年6月23感謝你的觀看43數(shù)據(jù)挖掘集成工具:外聯(lián)BP神經(jīng)網(wǎng)絡(luò)統(tǒng)計分析模糊聚類超曲面分類SVM貝葉斯網(wǎng)絡(luò)基于范例推理(CBR)隱馬爾科夫模型(HMM)2019年6月23感謝你的觀看43數(shù)據(jù)挖掘集成工具:外聯(lián)2019年6月23感謝你的觀看44BP用于預(yù)測2019年6月23感謝你的觀看44BP用于預(yù)測2019年6月23感謝你的觀看45統(tǒng)計工具線性回歸模型
——一元線性回歸、多元線性回歸、逐步回歸
非線性回歸模型——二次曲線、三次曲線、指數(shù)曲線、冪指數(shù)曲線、生產(chǎn)函數(shù)等模型
確定型時間序列模型——指數(shù)平滑法、趨勢移動平均法(水平趨勢、線性趨勢和二次曲線趨勢)、成長曲線模型(Compertz曲線、Logistic曲線和修正指數(shù)曲線)、季節(jié)指數(shù)法隨機(jī)型時間序列模型(自回歸-移動平均模型ARMA)相關(guān)分析
2019年
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版電子商務(wù)客戶關(guān)系管理系統(tǒng)集成合同3篇
- 二零二五年環(huán)保設(shè)施工程設(shè)計合同補(bǔ)充協(xié)議3篇
- 二零二五版中藥材撫育承包合作合同3篇
- 二零二五年綠色環(huán)保外架爬架租賃與施工合同3篇
- 二零二五年教育資源共享與銷售合同樣本3篇
- 二零二五版房地產(chǎn)項目土地二級開發(fā)與銷售合同協(xié)議書3篇
- 二零二五版企業(yè)內(nèi)部股權(quán)交易及管理服務(wù)合同2篇
- 二零二五年酒店集團(tuán)年度客戶關(guān)系管理合作合同范本2篇
- 二零二五年船舶開荒保潔與設(shè)備維護(hù)合同范本3篇
- 二零二五版廢棄物處理廠環(huán)境監(jiān)測與治理服務(wù)合同3篇
- 建筑保溫隔熱構(gòu)造
- 智慧財務(wù)綜合實訓(xùn)
- 安徽省合肥市2021-2022學(xué)年七年級上學(xué)期期末數(shù)學(xué)試題(含答案)3
- 教育專家報告合集:年度得到:沈祖蕓全球教育報告(2023-2024)
- 肝臟腫瘤護(hù)理查房
- 護(hù)士工作壓力管理護(hù)理工作中的壓力應(yīng)對策略
- 2023年日語考試:大學(xué)日語六級真題模擬匯編(共479題)
- 皮帶拆除安全技術(shù)措施
- ISO9001(2015版)質(zhì)量體系標(biāo)準(zhǔn)講解
- 《培訓(xùn)資料緊固》課件
- 黑龍江省政府采購評標(biāo)專家考試題
評論
0/150
提交評論