版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、1234數(shù)據(jù)挖掘數(shù)據(jù)挖掘567891011121314151617OLA管管理理人人員員或或執(zhí)執(zhí)行行人人員員能能夠夠從從多多種種角角度度對(duì)對(duì)從從原原始始數(shù)數(shù)據(jù)據(jù)中中轉(zhuǎn)轉(zhuǎn)化化出出來(lái)來(lái)的、的、能能夠夠真真正正為為用用戶戶所所理理解解的、的、并并真真實(shí)實(shí)反反映映企企業(yè)業(yè)維維特特性性的的信信息息進(jìn)進(jìn)行行快快速、速、一一致、致、交交互互地地存存取,取,從從而而獲獲得得對(duì)對(duì)數(shù)數(shù)據(jù)據(jù)的的更更深深入入了了解解的的一一類類軟軟件件技技術(shù)。術(shù)。( (O OL LA AP P委委員員會(huì)會(huì)的的定定義義) )nO OL LA AP P的的目目標(biāo)標(biāo)是是滿滿足足決決策策支支持持或或多多維維環(huán)環(huán)境境特特定定的的查查詢?cè)兒秃蛨?bào)
2、報(bào)表表需需求,求,它它的的技技術(shù)術(shù)核核心心是是“維維”這這個(gè)個(gè)概概念,念,因因此此O OL LA AP P也也可可以以說(shuō)說(shuō)是是多多維維數(shù)數(shù)據(jù)據(jù)分分析析工工具具的的集集合。合。18決策支決策支持系統(tǒng)持系統(tǒng)OLAP數(shù)據(jù)挖掘數(shù)據(jù)挖掘數(shù)數(shù) 據(jù)據(jù) 倉(cāng)倉(cāng) 庫(kù)庫(kù)數(shù)數(shù) 據(jù)據(jù) 庫(kù)庫(kù)各種信息系統(tǒng)各種信息系統(tǒng)各種管理系統(tǒng)各種管理系統(tǒng)搜索、抽取搜索、抽取過(guò)濾過(guò)濾萬(wàn)維網(wǎng)萬(wàn)維網(wǎng)信息發(fā)布信息發(fā)布信息檢索信息檢索ACRMCRM1920(B) DataInformation(A) Knowledge(Arrangement)(Transmit)Knowledge transmitted by character, sign,
3、voice, etc.(B) Data arranged to be useful for decision makingINFORMATION(Recognition)(C) Knowledge(C) Recognition memorized personally or socially(D) Judgment or a system of judgment which has objective validityKNOWLEDGE(D) Knowledge(Judgment)(D) Knowledge(Judgment)What is the energy to bring such t
4、ransformation?(E) Computers ability to judge things automatically (F) Peoples ability to understand and learn thingsINTELLIGENCEInformation ScienceManagement ScienceKnowledge Science+Information, Knowledge, and Intelligence21A theory of organizational knowledge creation, which suggests that new know
5、ledge is created by the interaction between explicit and tacit knowledge through the spiral of Socialization, Externalization, Combination, and Internalization. Shared mental modelsor technical skills1Metaphors, analogies, concepts, hypotheses, or models2Linkingexplicitknowledge3Learning by doing4I.
6、 Nonaka and H. Takeuchi The Knowledge-Creating Company. How Japanese Companies Create the Dynamics of Innovation. Oxford University Press, 1995.GroupexplicitknowledgeIndividual explicitknowledgeIndividualtacitknowledgeGrouptacitknowledgeCombinationInternalizationSocializationExternalizationKey Facto
7、r in Establishing the SchoolProf. Nonaka22232425銀行銀行 17%17%生物生物/ /基因基因 8%8%E E商務(wù)商務(wù)/Web 15%/Web 15%欺詐檢測(cè)欺詐檢測(cè) 8%8%保險(xiǎn)保險(xiǎn) 6%6%投資投資/ /股票股票 4%4%藥品藥品 5%5%零售業(yè)零售業(yè) 6%6%科學(xué)數(shù)據(jù)科學(xué)數(shù)據(jù) 8%8%電信電信 11%11%其他其他 11%11%2627應(yīng)應(yīng)用用領(lǐng)領(lǐng)域域情情況況(200828數(shù)數(shù)據(jù)據(jù)挖挖掘掘軟軟件件(May229數(shù)數(shù)據(jù)據(jù)挖挖掘掘軟軟件件2012年年R以以30.303132數(shù)數(shù)據(jù)據(jù)挖挖掘掘任任務(wù)務(wù)類類型型(Decs3334數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù)清
8、理與數(shù)據(jù)集成數(shù)據(jù)清理與數(shù)據(jù)集成過(guò)濾過(guò)濾 數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)數(shù)據(jù)挖掘數(shù)據(jù)挖掘方法庫(kù)方法庫(kù)其它數(shù)據(jù)源其它數(shù)據(jù)源知識(shí)庫(kù)知識(shí)庫(kù)World-WideWebOther InfoRepositories35各行業(yè)電子商務(wù)網(wǎng)站各行業(yè)電子商務(wù)網(wǎng)站算算法法層層商商業(yè)業(yè)邏邏輯輯層層行行業(yè)業(yè)應(yīng)應(yīng)用用層層商業(yè)應(yīng)用商業(yè)應(yīng)用商業(yè)模型商業(yè)模型挖掘算法挖掘算法CRM產(chǎn)品推薦產(chǎn)品推薦客戶細(xì)分客戶細(xì)分客戶流失客戶流失客戶利潤(rùn)客戶利潤(rùn)客戶響應(yīng)客戶響應(yīng)關(guān)聯(lián)規(guī)則、序列模式、分類、聚集、神經(jīng)元網(wǎng)絡(luò)、偏差分析關(guān)聯(lián)規(guī)則、序列模式、分類、聚集、神經(jīng)元網(wǎng)絡(luò)、偏差分析WEB挖掘挖掘網(wǎng)站結(jié)構(gòu)優(yōu)化網(wǎng)站結(jié)構(gòu)優(yōu)化網(wǎng)頁(yè)推薦網(wǎng)頁(yè)推薦商品推薦商品推薦?;蛲诰蚧蛲诰?/p>
9、基因表達(dá)路徑分析基因表達(dá)路徑分析基因表達(dá)相似性分析基因表達(dá)相似性分析基因表達(dá)共發(fā)生分析基因表達(dá)共發(fā)生分析。銀行銀行電信電信零售零售保險(xiǎn)保險(xiǎn)制藥制藥生物信息生物信息科學(xué)研究科學(xué)研究。相關(guān)行業(yè)相關(guān)行業(yè)361. 業(yè)務(wù)分析Data SourceData Source 2. 數(shù)據(jù)收集與整理3 數(shù)據(jù)分析與處理4. 財(cái)務(wù)指標(biāo)展示6.數(shù)據(jù)挖掘結(jié)果的解釋和展示7. 系統(tǒng)建設(shè)8. 嘗試應(yīng)用5. 數(shù)據(jù)挖掘建模3738394041 KDD 過(guò)程可分為三個(gè)階段:數(shù)數(shù)據(jù)據(jù)準(zhǔn)準(zhǔn)備備(data preparation) 、數(shù)數(shù)據(jù)據(jù)挖挖掘掘,以及結(jié)果的解解釋釋評(píng)評(píng)價(jià)價(jià)(interpretation and evaluation
10、) ,如圖所示。 可視化用戶界面 數(shù)據(jù)庫(kù) 目標(biāo)數(shù)據(jù) 預(yù)處理好的數(shù)據(jù) 轉(zhuǎn)換后數(shù)據(jù) 挖掘出的知識(shí) 有用的知識(shí) 選擇/抽樣 預(yù)處理 數(shù)據(jù)轉(zhuǎn)換 數(shù)據(jù)挖掘 解釋評(píng)價(jià)4243Data CleaningData IntegrationDatabasesData WarehouseTask-relevant DataSelectionData MiningPattern Evaluation4445 46474849505152CRIS5354CRISn nt)t)發(fā)發(fā)布布挖挖掘掘結(jié)結(jié)果果(獲獲得得知知識(shí)識(shí)的)的)評(píng)評(píng)估估決決定定實(shí)實(shí)施施計(jì)計(jì)劃劃Crisp-DM 1.0CRISP-DM 2.0 SIG WOR
11、KSHOP ANNOUNCEDCHICAGO, SEPTEMBER 26, 2006 55565758Data Mining / Analytic Software Tools 534 voters (May 2007) 5960代代特征特征數(shù)據(jù)挖掘算法數(shù)據(jù)挖掘算法集成集成分布計(jì)算分布計(jì)算模型模型數(shù)據(jù)模型數(shù)據(jù)模型第一第一代代作為一個(gè)獨(dú)作為一個(gè)獨(dú)立的應(yīng)用立的應(yīng)用支持一個(gè)或者支持一個(gè)或者多個(gè)算法多個(gè)算法 獨(dú)立的系統(tǒng)獨(dú)立的系統(tǒng)單個(gè)機(jī)器單個(gè)機(jī)器向量數(shù)據(jù)向量數(shù)據(jù)第二第二代代和數(shù)據(jù)庫(kù)以和數(shù)據(jù)庫(kù)以及數(shù)據(jù)倉(cāng)庫(kù)及數(shù)據(jù)倉(cāng)庫(kù)集成集成多個(gè)算法:能多個(gè)算法:能夠挖掘一次不夠挖掘一次不能放進(jìn)內(nèi)存的能放進(jìn)內(nèi)存的數(shù)據(jù)數(shù)據(jù)數(shù)據(jù)
12、管理系數(shù)據(jù)管理系統(tǒng),包括數(shù)統(tǒng),包括數(shù)據(jù)庫(kù)和數(shù)據(jù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)倉(cāng)庫(kù)同質(zhì)、局同質(zhì)、局部區(qū)域的部區(qū)域的計(jì)算機(jī)群計(jì)算機(jī)群集集有些系統(tǒng)支持有些系統(tǒng)支持對(duì)象對(duì)象, ,文本和文本和連續(xù)的媒體數(shù)連續(xù)的媒體數(shù)據(jù)據(jù)第三第三代代和預(yù)測(cè)模型和預(yù)測(cè)模型系統(tǒng)集成系統(tǒng)集成 多個(gè)算法多個(gè)算法數(shù)據(jù)管理和數(shù)據(jù)管理和預(yù)測(cè)模型系預(yù)測(cè)模型系統(tǒng)統(tǒng)intranet/extranet網(wǎng)網(wǎng)絡(luò)計(jì)算絡(luò)計(jì)算支持半結(jié)構(gòu)化支持半結(jié)構(gòu)化數(shù)據(jù)和數(shù)據(jù)和webweb數(shù)數(shù)據(jù)據(jù)第四第四代代和移動(dòng)數(shù)據(jù)和移動(dòng)數(shù)據(jù)/ /各種計(jì)算設(shè)各種計(jì)算設(shè)備的數(shù)據(jù)聯(lián)備的數(shù)據(jù)聯(lián)合合 多個(gè)算法多個(gè)算法數(shù)據(jù)管理、數(shù)據(jù)管理、預(yù)測(cè)模型、預(yù)測(cè)模型、移動(dòng)系統(tǒng)移動(dòng)系統(tǒng)移動(dòng)和各移動(dòng)和各種計(jì)算設(shè)種計(jì)算設(shè)備
13、備普遍存在的計(jì)普遍存在的計(jì)算模型算模型 Robert Grossman的觀點(diǎn)的觀點(diǎn) (National Center for Data Mining, University of Illinois at Chicago)61n特點(diǎn)特點(diǎn)支持一個(gè)或少數(shù)幾個(gè)數(shù)據(jù)挖掘算法支持一個(gè)或少數(shù)幾個(gè)數(shù)據(jù)挖掘算法 挖掘向量數(shù)據(jù)(挖掘向量數(shù)據(jù)(vector-valued datavector-valued data) 數(shù)據(jù)一般一次性調(diào)進(jìn)內(nèi)存進(jìn)行處理數(shù)據(jù)一般一次性調(diào)進(jìn)內(nèi)存進(jìn)行處理 典型的系統(tǒng)如典型的系統(tǒng)如Salford SystemsSalford Systems公司早期的公司早期的CARTCART系系統(tǒng)統(tǒng)(www.
14、salford-) (www.salford-) n缺陷缺陷如果數(shù)據(jù)足夠大,并且頻繁的變化,這就需要利用如果數(shù)據(jù)足夠大,并且頻繁的變化,這就需要利用數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)技術(shù)進(jìn)行管理,第一代系統(tǒng)顯數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)技術(shù)進(jìn)行管理,第一代系統(tǒng)顯然不能滿足需求。然不能滿足需求。62 CBACBA新加坡國(guó)立大學(xué)基于關(guān)聯(lián)規(guī)則的分類算法,能從關(guān)新加坡國(guó)立大學(xué)基于關(guān)聯(lián)規(guī)則的分類算法,能從關(guān)系數(shù)據(jù)或者交易數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則,使用關(guān)聯(lián)規(guī)則進(jìn)行系數(shù)據(jù)或者交易數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則,使用關(guān)聯(lián)規(guī)則進(jìn)行分類和預(yù)測(cè)分類和預(yù)測(cè)63n特點(diǎn)特點(diǎn)與數(shù)據(jù)庫(kù)管理系統(tǒng)(與數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMSDBMS)集成)集成 支持?jǐn)?shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù),和它們具
15、有高性能的接口,具支持?jǐn)?shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù),和它們具有高性能的接口,具有高的可擴(kuò)展性有高的可擴(kuò)展性 能夠挖掘大數(shù)據(jù)集、以及更復(fù)雜的數(shù)據(jù)集能夠挖掘大數(shù)據(jù)集、以及更復(fù)雜的數(shù)據(jù)集 通過(guò)支持?jǐn)?shù)據(jù)挖掘模式(通過(guò)支持?jǐn)?shù)據(jù)挖掘模式(data mining schemadata mining schema)和數(shù)據(jù))和數(shù)據(jù)挖掘查詢語(yǔ)言增加系統(tǒng)的靈活性挖掘查詢語(yǔ)言增加系統(tǒng)的靈活性 典型的系統(tǒng)如典型的系統(tǒng)如DBMinerDBMiner,能通過(guò),能通過(guò)DMQLDMQL挖掘語(yǔ)言進(jìn)行挖掘挖掘語(yǔ)言進(jìn)行挖掘操作操作n缺陷缺陷只注重模型的生成,如何和預(yù)言模型系統(tǒng)集成導(dǎo)致了第只注重模型的生成,如何和預(yù)言模型系統(tǒng)集成導(dǎo)致了第三代數(shù)據(jù)挖
16、掘系統(tǒng)的開(kāi)發(fā)三代數(shù)據(jù)挖掘系統(tǒng)的開(kāi)發(fā)646566n特點(diǎn)特點(diǎn)和預(yù)言模型系統(tǒng)之間能夠無(wú)縫的集成,使得由數(shù)據(jù)挖掘和預(yù)言模型系統(tǒng)之間能夠無(wú)縫的集成,使得由數(shù)據(jù)挖掘軟件產(chǎn)生的模型的變化能夠及時(shí)反映到預(yù)言模型系統(tǒng)中軟件產(chǎn)生的模型的變化能夠及時(shí)反映到預(yù)言模型系統(tǒng)中 由數(shù)據(jù)挖掘軟件產(chǎn)生的預(yù)言模型能夠自動(dòng)地被操作型系由數(shù)據(jù)挖掘軟件產(chǎn)生的預(yù)言模型能夠自動(dòng)地被操作型系統(tǒng)吸收,從而與操作型系統(tǒng)中的預(yù)言模型相聯(lián)合提供決統(tǒng)吸收,從而與操作型系統(tǒng)中的預(yù)言模型相聯(lián)合提供決策支持的功能策支持的功能 能夠挖掘網(wǎng)絡(luò)環(huán)境下(能夠挖掘網(wǎng)絡(luò)環(huán)境下(Internet/ExtranetInternet/Extranet)的分布式)的分布式和高
17、度異質(zhì)的數(shù)據(jù),并且能夠有效地和操作型系統(tǒng)集成和高度異質(zhì)的數(shù)據(jù),并且能夠有效地和操作型系統(tǒng)集成n缺陷缺陷不能支持移動(dòng)環(huán)境不能支持移動(dòng)環(huán)境6768n特點(diǎn)特點(diǎn)目前移動(dòng)計(jì)算越發(fā)顯得重要,將數(shù)據(jù)挖掘和移動(dòng)計(jì)算相目前移動(dòng)計(jì)算越發(fā)顯得重要,將數(shù)據(jù)挖掘和移動(dòng)計(jì)算相結(jié)合是當(dāng)前的一個(gè)研究領(lǐng)域。結(jié)合是當(dāng)前的一個(gè)研究領(lǐng)域。 第四代軟件能夠挖掘嵌入式系統(tǒng)、移動(dòng)系統(tǒng)、和普遍存第四代軟件能夠挖掘嵌入式系統(tǒng)、移動(dòng)系統(tǒng)、和普遍存在(在(ubiquitousubiquitous)計(jì)算設(shè)備產(chǎn)生的各種類型的數(shù)據(jù))計(jì)算設(shè)備產(chǎn)生的各種類型的數(shù)據(jù) 第四代數(shù)據(jù)挖掘原型或商業(yè)系統(tǒng)剛剛起步,第四代數(shù)據(jù)挖掘原型或商業(yè)系統(tǒng)剛剛起步,PKDD2001
18、PKDD2001上上KarguptaKargupta發(fā)表了一篇在移動(dòng)環(huán)境下挖掘決策樹(shù)的論文,發(fā)表了一篇在移動(dòng)環(huán)境下挖掘決策樹(shù)的論文,KarguptaKargupta是馬里蘭巴爾的摩州立大學(xué)(是馬里蘭巴爾的摩州立大學(xué)(University of University of Maryland Baltimore CountyMaryland Baltimore County)正在研制的)正在研制的CAREERCAREER數(shù)據(jù)數(shù)據(jù)挖掘項(xiàng)目的負(fù)責(zé)人,該項(xiàng)目研究期限是挖掘項(xiàng)目的負(fù)責(zé)人,該項(xiàng)目研究期限是20012001年年4 4月到月到20062006年年4 4月,目的是開(kāi)發(fā)挖掘分布式和異質(zhì)數(shù)據(jù)月,目的是
19、開(kāi)發(fā)挖掘分布式和異質(zhì)數(shù)據(jù)(UbiquitousUbiquitous設(shè)備)的第四代數(shù)據(jù)挖掘系統(tǒng)。設(shè)備)的第四代數(shù)據(jù)挖掘系統(tǒng)。 69第一代系統(tǒng)與第二代相比因?yàn)椴痪哂泻蛿?shù)據(jù)管理系統(tǒng)之間第一代系統(tǒng)與第二代相比因?yàn)椴痪哂泻蛿?shù)據(jù)管理系統(tǒng)之間有效的接口,所以在數(shù)據(jù)預(yù)處理方面有一定缺陷有效的接口,所以在數(shù)據(jù)預(yù)處理方面有一定缺陷 第三、四代系統(tǒng)強(qiáng)調(diào)預(yù)言模型的使用和在操作型環(huán)境的部第三、四代系統(tǒng)強(qiáng)調(diào)預(yù)言模型的使用和在操作型環(huán)境的部署署 第二代系統(tǒng)提供數(shù)據(jù)管理系統(tǒng)和數(shù)據(jù)挖掘系統(tǒng)之間的有效第二代系統(tǒng)提供數(shù)據(jù)管理系統(tǒng)和數(shù)據(jù)挖掘系統(tǒng)之間的有效接口接口 第三代系統(tǒng)另外還提供數(shù)據(jù)挖掘系統(tǒng)和預(yù)言模型系統(tǒng)之間第三代系統(tǒng)另外還提供
20、數(shù)據(jù)挖掘系統(tǒng)和預(yù)言模型系統(tǒng)之間的有效的接口的有效的接口 目前,隨著新的挖掘算法的研究和開(kāi)發(fā),第一代數(shù)據(jù)挖掘目前,隨著新的挖掘算法的研究和開(kāi)發(fā),第一代數(shù)據(jù)挖掘系統(tǒng)仍然會(huì)出現(xiàn),第二代系統(tǒng)是商業(yè)軟件的主流,部分第系統(tǒng)仍然會(huì)出現(xiàn),第二代系統(tǒng)是商業(yè)軟件的主流,部分第二代系統(tǒng)開(kāi)發(fā)商開(kāi)始研制相應(yīng)的第三代數(shù)據(jù)挖掘系統(tǒng),比二代系統(tǒng)開(kāi)發(fā)商開(kāi)始研制相應(yīng)的第三代數(shù)據(jù)挖掘系統(tǒng),比如如 IBM Intelligent Score ServiceIBM Intelligent Score Service。第四代數(shù)據(jù)挖掘。第四代數(shù)據(jù)挖掘原型或商業(yè)系統(tǒng)剛剛起步。原型或商業(yè)系統(tǒng)剛剛起步。70n獨(dú)立的數(shù)據(jù)挖掘軟件獨(dú)立的數(shù)據(jù)挖掘軟件
21、n橫向的數(shù)據(jù)挖掘工具集橫向的數(shù)據(jù)挖掘工具集n縱向的數(shù)據(jù)挖掘解決方案縱向的數(shù)據(jù)挖掘解決方案Gregory Piatetsky-Shapiro的觀點(diǎn)的觀點(diǎn)(the President of KDnuggets )71n特點(diǎn)特點(diǎn)獨(dú)立的數(shù)據(jù)挖掘軟件對(duì)應(yīng)第一代系統(tǒng),出現(xiàn)在數(shù)據(jù)獨(dú)立的數(shù)據(jù)挖掘軟件對(duì)應(yīng)第一代系統(tǒng),出現(xiàn)在數(shù)據(jù)挖掘技術(shù)發(fā)展早期,研究人員開(kāi)發(fā)出一種新型的數(shù)挖掘技術(shù)發(fā)展早期,研究人員開(kāi)發(fā)出一種新型的數(shù)據(jù)挖掘算法,就形成一個(gè)軟件。據(jù)挖掘算法,就形成一個(gè)軟件。這類軟件要求用戶對(duì)具體的算法和數(shù)據(jù)挖掘技術(shù)有這類軟件要求用戶對(duì)具體的算法和數(shù)據(jù)挖掘技術(shù)有相當(dāng)?shù)牧私猓€要負(fù)責(zé)大量的數(shù)據(jù)預(yù)處理工作。比相當(dāng)?shù)牧私?,還
22、要負(fù)責(zé)大量的數(shù)據(jù)預(yù)處理工作。比如如C4.5C4.5決策樹(shù)決策樹(shù),平行坐標(biāo)可視化(平行坐標(biāo)可視化(parallel-parallel-coordinate visualizationcoordinate visualization)。)。72n發(fā)展原因發(fā)展原因隨著數(shù)據(jù)挖掘應(yīng)用的發(fā)展,人們逐漸認(rèn)識(shí)到數(shù)據(jù)挖掘軟隨著數(shù)據(jù)挖掘應(yīng)用的發(fā)展,人們逐漸認(rèn)識(shí)到數(shù)據(jù)挖掘軟件需要和以下三個(gè)方面緊密結(jié)合:件需要和以下三個(gè)方面緊密結(jié)合:1 1)數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng))數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù);庫(kù);2 2)多種類型的數(shù)據(jù)挖掘算法;)多種類型的數(shù)據(jù)挖掘算法;3 3)數(shù)據(jù)清洗、轉(zhuǎn)換)數(shù)據(jù)清洗、轉(zhuǎn)換等預(yù)處理工作。等預(yù)處理工作。隨著數(shù)據(jù)量的增加
23、,需要利用數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)技術(shù)隨著數(shù)據(jù)量的增加,需要利用數(shù)據(jù)庫(kù)或者數(shù)據(jù)倉(cāng)庫(kù)技術(shù)進(jìn)行管理,所以數(shù)據(jù)挖掘系統(tǒng)與數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)結(jié)合進(jìn)行管理,所以數(shù)據(jù)挖掘系統(tǒng)與數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)結(jié)合是自然的發(fā)展。是自然的發(fā)展。 現(xiàn)實(shí)領(lǐng)域的問(wèn)題是多種多樣的,一種或少數(shù)數(shù)據(jù)挖掘算現(xiàn)實(shí)領(lǐng)域的問(wèn)題是多種多樣的,一種或少數(shù)數(shù)據(jù)挖掘算法難以解決法難以解決 挖掘的數(shù)據(jù)通常不符合算法的要求,需要有數(shù)據(jù)清洗、挖掘的數(shù)據(jù)通常不符合算法的要求,需要有數(shù)據(jù)清洗、轉(zhuǎn)換等數(shù)據(jù)預(yù)處理的配合,才能得出有價(jià)值的模型轉(zhuǎn)換等數(shù)據(jù)預(yù)處理的配合,才能得出有價(jià)值的模型73n發(fā)展過(guò)程發(fā)展過(guò)程隨著這些需求的出現(xiàn),隨著這些需求的出現(xiàn),19951995年左右軟件開(kāi)發(fā)
24、商開(kāi)年左右軟件開(kāi)發(fā)商開(kāi)始提供稱之為始提供稱之為“工具集工具集”的數(shù)據(jù)挖掘軟件的數(shù)據(jù)挖掘軟件n特點(diǎn)特點(diǎn)此類工具集的特點(diǎn)是提供多種數(shù)據(jù)挖掘算法此類工具集的特點(diǎn)是提供多種數(shù)據(jù)挖掘算法 包括數(shù)據(jù)的轉(zhuǎn)換和可視化包括數(shù)據(jù)的轉(zhuǎn)換和可視化 由于此類工具并非面向特定的應(yīng)用,是通用的算法由于此類工具并非面向特定的應(yīng)用,是通用的算法集合,可以稱之為橫向的數(shù)據(jù)挖掘工具集合,可以稱之為橫向的數(shù)據(jù)挖掘工具(Horizontal Data Mining ToolsHorizontal Data Mining Tools) 由于此類工具并非面向特定的應(yīng)用,是通用的算法由于此類工具并非面向特定的應(yīng)用,是通用的算法集合,所以稱之
25、為橫向的數(shù)據(jù)挖掘工具集合,所以稱之為橫向的數(shù)據(jù)挖掘工具典型的橫向工具有典型的橫向工具有IBM Intelligent MinerIBM Intelligent Miner、SPSSSPSS的的ClementineClementine、SASSAS的的Enterprise MinerEnterprise Miner、SGISGI的的MineSetMineSet、Oracle DarwinOracle Darwin等等 74IBM Intelligent MinerSPSS的的ClementineSAS的的Enterprise MinerSGI的的MineSetOracle Darwin75n發(fā)展原因發(fā)展原因隨著橫向的數(shù)據(jù)挖掘工具的使用日漸廣泛,人們也隨著橫向的數(shù)據(jù)挖掘工具的使用日漸廣泛,人們也發(fā)現(xiàn)這
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 合伙投資合同樣本
- 廣告制作發(fā)布合同
- 健康養(yǎng)生運(yùn)動(dòng)訓(xùn)練合同
- 銷售員工的試用期工作總結(jié)
- 最簡(jiǎn)單的食品采購(gòu)合同范本(33篇)
- 建筑工程施工合同15篇
- 行政班子工作心得體會(huì)簡(jiǎn)短模板
- 2024年充換電站合作協(xié)議書(shū)
- 蛋糕店服務(wù)員勞動(dòng)合同(3篇)
- 有關(guān)消防應(yīng)急演練總結(jié)(30篇)
- 執(zhí)行實(shí)務(wù)一百問(wèn)
- 成人癌性疼痛護(hù)理-中華護(hù)理學(xué)會(huì)團(tuán)體標(biāo)準(zhǔn)2019
- 吊籃作業(yè)安全措施
- 《思想道德與法治》2021版第四章
- 找出劃線部分讀音不同的單詞
- 產(chǎn)品銷售培訓(xùn)心得
- 精神分裂癥的規(guī)范化治療講課課件
- 二年級(jí)下冊(cè)道德與法治教案-3.2節(jié)約糧食北師大版
- 急診剖宮產(chǎn)分級(jí)
- C++面試題、c++面試題
- 曾國(guó)藩為人識(shí)人及用人
評(píng)論
0/150
提交評(píng)論