數(shù)據(jù)挖掘與數(shù)據(jù)分析論文_第1頁(yè)
數(shù)據(jù)挖掘與數(shù)據(jù)分析論文_第2頁(yè)
數(shù)據(jù)挖掘與數(shù)據(jù)分析論文_第3頁(yè)
數(shù)據(jù)挖掘與數(shù)據(jù)分析論文_第4頁(yè)
數(shù)據(jù)挖掘與數(shù)據(jù)分析論文_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(**大學(xué)經(jīng)管學(xué)院**班河北石家莊摘要:數(shù)據(jù)挖掘能為決策者提供重要的,極有價(jià)值的信息或知識(shí),越來(lái)越多的大中型公司開(kāi)始運(yùn)用數(shù)據(jù)挖掘來(lái)分析公司的數(shù)據(jù)來(lái)輔助決策支持,市場(chǎng)方略制訂等。本文重要從技GeneraldescriptionofDataminingtechnologyand ManagementandInformationSystemL082classesShijiazhuang050000)Pickto:dataminingcanprovideimportantdecisionmakers,extremelyvaluableinformationorknowledge,moreandmorelargeandmedium-sizedenterprisestartedusingdataminingtoanalyzecompanydatatoassistdecisionsupport,marketstrategyformulation,etc.ThisarticlemainlyfromthetechnologyandapplicationofdataminingintwoaspectsofsyntheticallyexpoundedandKeywords:datamining;Associationrules;Classificationandforecast;Datawarehouse;Decisionsupportsystem能夠廣泛使用,并且迫切需要將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識(shí)。獲取的信息和知識(shí)能夠廣泛用于多個(gè)應(yīng)用,涉及商務(wù)管理,生產(chǎn)控制,市場(chǎng)分析,工程設(shè)計(jì)和科學(xué)探索等。公司存在大量數(shù)據(jù),且迫切需要將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識(shí)。獲取的信息和知識(shí)能夠廣泛用于多個(gè)應(yīng)用,涉及商務(wù)管理,生產(chǎn)控制,市場(chǎng)分析,工程設(shè)計(jì)和科學(xué)探索(1)人工智能、模式識(shí)別和機(jī)器學(xué)習(xí)的搜索算法、建模技術(shù)和學(xué)習(xí)理論。數(shù)據(jù)挖掘也快速地接納了來(lái)自其它領(lǐng)域需要是發(fā)明之母。數(shù)據(jù)采集和和存儲(chǔ)技術(shù)的進(jìn)步造成龐大的數(shù)據(jù)庫(kù)日益增多,并的思想,這些領(lǐng)域涉及最優(yōu)化、進(jìn)化計(jì)算、信息論、信號(hào)解決、可視化和信索引和查詢解決支持。源于高性能(并行)計(jì)算的技術(shù)在解決海量數(shù)據(jù)集方面經(jīng)常是重要數(shù)據(jù)挖掘是從大量的數(shù)據(jù)中提取隱含在其中的,人們事先不懂得的,但又是潛在的有用數(shù)據(jù)挖掘能為決策者提供重要的,極有價(jià)值的信息或知識(shí),越來(lái)越多的大中型公司開(kāi)始運(yùn)用數(shù)據(jù)挖掘來(lái)分析公司的數(shù)據(jù)來(lái)輔助決策從而提高競(jìng)爭(zhēng)力.數(shù)據(jù)挖掘系統(tǒng)運(yùn)用的技術(shù)越多,得出的成果精確性就越高。因素很簡(jiǎn)樸,對(duì)于某一種重要的數(shù)據(jù)挖掘技術(shù)有:關(guān)聯(lián)規(guī)則是應(yīng)用最為廣泛的一種數(shù)據(jù)挖掘辦法,重要目的是為了發(fā)現(xiàn)數(shù)據(jù)中的有關(guān)聯(lián)這種關(guān)聯(lián)發(fā)現(xiàn)能夠協(xié)助零售商制訂營(yíng)銷方略.30%~40%的人同時(shí)也為自己買某些數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)可分為簡(jiǎn)樸關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫(kù)中隱藏的關(guān)聯(lián)網(wǎng)。有時(shí)并不懂得數(shù)據(jù)庫(kù)中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使懂得也是不擬定的,因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)大量數(shù)據(jù)中項(xiàng)集之間有趣的關(guān)聯(lián)或有關(guān)聯(lián)系。grwal193集間的關(guān)聯(lián)規(guī)則問(wèn)題,后來(lái)諸多的研究人員對(duì)關(guān)聯(lián)規(guī)則的挖掘問(wèn)題進(jìn)行了大量的研究。他們的工作涉及對(duì)原有的算法進(jìn)行優(yōu)化,如引入隨機(jī)采樣、并行的思想等,以提高算法挖掘近來(lái)幾年已被業(yè)界所廣泛研究。關(guān)聯(lián)規(guī)則研究有下列三種趨勢(shì):3神經(jīng)網(wǎng)絡(luò)辦法是在模擬生物神經(jīng)系統(tǒng)的構(gòu)造和功效而建立起來(lái)的,現(xiàn)在,已經(jīng)出現(xiàn)了多個(gè)網(wǎng)絡(luò)模型和學(xué)習(xí)算法,重要用于分類,優(yōu)化,模式識(shí)別,預(yù)測(cè)和控制等領(lǐng)域。在數(shù)據(jù)挖掘領(lǐng)域,重要采用前向神經(jīng)網(wǎng)絡(luò)提取分類規(guī)則?;谏窠?jīng)網(wǎng)絡(luò)的數(shù)據(jù)分類普通含有較小產(chǎn)生初始群體,計(jì)算個(gè)體的適應(yīng)度,再進(jìn)行染色體的復(fù)制,交叉,變異等操作,重復(fù)這個(gè)過(guò)程,直到找到最佳或較佳個(gè)體為止。在數(shù)據(jù)挖掘中,往往把數(shù)據(jù)挖掘任務(wù)體現(xiàn)為一種搜索問(wèn)題,使用遺傳算法的強(qiáng)大搜索能力找到最優(yōu)解??梢暬夹g(shù)就是為人們參加知識(shí)挖掘的過(guò)程提供方便,采用某些較直觀的辦法協(xié)助理解數(shù)據(jù)庫(kù)中的數(shù)據(jù)和挖掘后產(chǎn)生的規(guī)則??梢暬诰蚣夹g(shù)涉及:①數(shù)據(jù)可視化由于先進(jìn)的科學(xué)儀器和觀察儀器的使用,在科學(xué)和工程中產(chǎn)生了大量的數(shù)據(jù),這為數(shù)據(jù)挖掘在科學(xué)研究中的應(yīng)用發(fā)明了條件. 在衛(wèi)生保健業(yè)上數(shù)據(jù)挖掘業(yè)得到了廣泛的應(yīng)用,以電子格式儲(chǔ)存病人的統(tǒng)計(jì),以及醫(yī)學(xué)信息系統(tǒng)的發(fā)展產(chǎn)生了大量能夠在線運(yùn)用的臨床數(shù)據(jù),用數(shù)據(jù)挖掘的辦法從這些數(shù)據(jù)中提取出來(lái)的規(guī)律和信息能夠輔助醫(yī)生做出決策.目的是擬定發(fā)現(xiàn)任務(wù)的操作對(duì)象,即目的數(shù)據(jù),它是根據(jù)顧客的需要從原始數(shù)據(jù)中抽取的一組數(shù)據(jù). 重要目的是消減數(shù)據(jù)維數(shù),即從初始特性中找出真正有用的特性,以減少數(shù)據(jù)挖掘時(shí)的系統(tǒng)開(kāi)銷。首先要明確挖掘的任務(wù)和目的,如數(shù)據(jù)總結(jié),分類,聚類,關(guān)聯(lián)規(guī)則發(fā)現(xiàn),或序列模式發(fā)現(xiàn)等,擬定任務(wù)后就要決定采用什么樣的算法.另外,如果KDD是面對(duì)顧客的,可能要對(duì)發(fā)現(xiàn)的模式進(jìn)行可視化,或轉(zhuǎn)換為顧客易懂關(guān)聯(lián)分析(association聚類分析分類預(yù)測(cè)時(shí)序模式(time-series偏差分析王建會(huì);王建會(huì);王洪偉;申展;胡運(yùn)發(fā); 一種實(shí)用高效的文本分類算法[J].計(jì)算機(jī)研究與發(fā)展01期秦進(jìn);陳笑蓉;汪維家;陸汝占 文本分類中的特性抽取[J].計(jì)算機(jī)應(yīng)用02趙晨 過(guò)程控制中的數(shù)據(jù)挖掘技術(shù)研究及其智能控制方略探討[D].

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論