數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究_第1頁
數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究_第2頁
數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究_第3頁
數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、    數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究    劉芬摘 要:數(shù)據(jù)挖掘?qū)W科的出現(xiàn),是對計(jì)算機(jī)領(lǐng)域的補(bǔ)充,在計(jì)算機(jī)領(lǐng)域的發(fā)展下發(fā)展迅速,引起了國內(nèi)的重視,并在國家的大力促進(jìn)下不斷發(fā)展,取得了階段性的成就,但是發(fā)展現(xiàn)狀仍然不容樂觀,本篇文章將針對數(shù)據(jù)挖掘的定義以及國內(nèi)的現(xiàn)狀進(jìn)行分析,并對其發(fā)展趨勢進(jìn)行預(yù)測,目的在于加快我國的數(shù)據(jù)挖掘技術(shù)研究進(jìn)程。關(guān)鍵詞:數(shù)據(jù)挖掘;中國;現(xiàn)狀;發(fā)展doi:10.16640/ki.37-1222/t.2018.17.1100 引言隨著計(jì)算機(jī)的發(fā)展與數(shù)據(jù)量的增加,其對于數(shù)據(jù)的處理技術(shù)如生成、收集、儲存數(shù)據(jù)等的水平要求越來越高,因此新型

2、的數(shù)據(jù)挖掘技術(shù)的出現(xiàn)是必然趨勢,替代了傳統(tǒng)落后的數(shù)據(jù)處理技術(shù)。我國對于數(shù)據(jù)挖掘技術(shù)的研究已經(jīng)取得矚目的效果,但是應(yīng)用程度不高,提高數(shù)據(jù)挖掘技術(shù)的實(shí)際應(yīng)用成為了主要的問題,需要采取必要措施加快數(shù)據(jù)挖掘技術(shù)應(yīng)用進(jìn)程。1 數(shù)據(jù)挖掘的定義數(shù)據(jù)挖掘(dm)是一個新興的學(xué)科,學(xué)名叫做數(shù)據(jù)庫中發(fā)現(xiàn)知識(kdd),其出現(xiàn)在20世紀(jì)90年代,并在這三十年間發(fā)展迅速,它的主要工作領(lǐng)域?yàn)閿?shù)據(jù)庫系統(tǒng)以及數(shù)據(jù)庫應(yīng)用領(lǐng)域,其作用在于能夠從應(yīng)用數(shù)據(jù)中提取隱藏的關(guān)鍵信息與知識,應(yīng)用數(shù)據(jù)的范圍廣泛,不管是不完整的數(shù)據(jù),還是受干擾的數(shù)據(jù),數(shù)據(jù)挖掘技術(shù)都能夠通過對其數(shù)據(jù)的轉(zhuǎn)換分析或者模塊化處理進(jìn)行識別與篩選,并提取和處理其中的有用

3、信息。數(shù)據(jù)挖掘的目的在于通過對數(shù)據(jù)中信息的處理,篩選關(guān)鍵數(shù)據(jù),發(fā)現(xiàn)被忽略的數(shù)據(jù),從而尋找數(shù)據(jù)中的規(guī)律,為決策者提供合理科學(xué)的數(shù)據(jù)分析報(bào)告,幫助其作出最優(yōu)化的決策。數(shù)據(jù)挖掘技術(shù)學(xué)科的本質(zhì)在于加深對數(shù)據(jù)的使用層次,挖掘數(shù)據(jù)的內(nèi)在含義并進(jìn)行抽象化的概括,改變了以往數(shù)據(jù)只能簡單查詢的低級層次。數(shù)據(jù)挖掘具有先知性、實(shí)用性以及科學(xué)性的特點(diǎn),同時數(shù)據(jù)挖掘的發(fā)展依賴于數(shù)據(jù)庫、人工智能統(tǒng)計(jì)學(xué)等計(jì)算機(jī)學(xué)科的快速發(fā)展,因此吸引了一大批專業(yè)人才加入到其的研發(fā)過程中,加快了其的研究發(fā)展進(jìn)程。2 數(shù)據(jù)挖掘在中國的現(xiàn)狀分析2.1 研究現(xiàn)狀分析我國開展數(shù)據(jù)挖掘技術(shù)的研究在1993年,中科院合肥分院成為首個被自然科學(xué)基金支持進(jìn)

4、行數(shù)據(jù)挖掘技術(shù)研究,從此以后,我國掀開了研究數(shù)據(jù)挖掘研究的序幕,主要研究機(jī)構(gòu)與人員主要是相關(guān)專業(yè)的大學(xué)教授以及一些數(shù)據(jù)處理研究機(jī)構(gòu)。近年來,我國對數(shù)據(jù)挖掘的研究工作高度重視,通過中國自然科學(xué)基金等對其進(jìn)行資金支持,同時,政府創(chuàng)立“九五”計(jì)劃以及 “863” 計(jì)劃對其提供政策支持。數(shù)據(jù)挖掘的研究引起了我國相關(guān)專業(yè)的人才的廣泛關(guān)注,并在全國范圍內(nèi)掀起了研究數(shù)據(jù)挖掘知識技術(shù)的理論與實(shí)際應(yīng)用的熱潮,其中包括高等學(xué)府與科研機(jī)構(gòu)。例如:對于數(shù)據(jù)挖掘技術(shù)的算法計(jì)算與改造研究是復(fù)旦大學(xué)與華中理工大學(xué)等高校的研究方向,非結(jié)構(gòu)化數(shù)據(jù)知識的網(wǎng)頁數(shù)據(jù)挖掘技術(shù)是南京大學(xué)的主要研究方向,而科研機(jī)構(gòu)如北京系統(tǒng)工程研究院來說

5、,其主要研究方向是數(shù)據(jù)挖掘技術(shù)在模糊信息中的實(shí)際應(yīng)用。2.2 應(yīng)用現(xiàn)狀分析在我國,能夠真正應(yīng)用數(shù)據(jù)挖掘技術(shù)并取得成就的公司包括是廣州華工明天科技有限公司以及菲奈特-融通企業(yè),其中廣州華工明天科技有限公司主要進(jìn)行多功能數(shù)據(jù)挖掘設(shè)備的研發(fā),而菲奈特-融通企業(yè)依賴于數(shù)據(jù)挖掘軟件的發(fā)展進(jìn)行其商業(yè)智能套件的研發(fā)。2.3 研究成果分析近年來,由于國家的大力扶植與資金支持,我國數(shù)據(jù)挖掘技術(shù)研究取得了重要性的成果,在亞太數(shù)據(jù)挖掘的國際會議中,由南京大學(xué)周志華帶隊(duì)的數(shù)據(jù)挖掘技術(shù)研究小組表現(xiàn)突出,同時參與數(shù)據(jù)挖掘編程大賽并奪得桂冠;同樣在了亞太數(shù)據(jù)挖掘國際會議上,中國香港大學(xué)的電子商業(yè)科技研究院的黃哲學(xué)教授的論文

6、獲得亞太數(shù)據(jù)挖掘國際會議論文大獎。2.4 國內(nèi)外對比國內(nèi)外的數(shù)據(jù)挖掘技術(shù)研究的進(jìn)程具有很大的差距,不僅表現(xiàn)在相關(guān)理論的研究上,更在于對數(shù)據(jù)挖掘技術(shù)的實(shí)際應(yīng)用的方面。與國外的數(shù)據(jù)挖掘技術(shù)研究進(jìn)程相比,我國的研究起步晚,仍然處于發(fā)展的初級階段,并且還沒有成熟的理論與技術(shù)應(yīng)用成果,目前的主要研究方向是對于數(shù)據(jù)的初級處理如模糊化處理,技術(shù)尚不成熟。國外關(guān)于數(shù)據(jù)挖掘技術(shù)的軟件研發(fā)發(fā)展已經(jīng)取得矚目的成就,而國內(nèi)的軟件研發(fā)尚不成熟,研究的重心在于高等學(xué)府的人才,同時都是屬于政府資助項(xiàng)目,可能導(dǎo)致其成果要求較低,從而阻塞了研發(fā)的步伐。3 數(shù)據(jù)挖掘在我國的未來發(fā)展3.1 研究方向展望近年來,隨著計(jì)算機(jī)科學(xué)領(lǐng)域的

7、快速發(fā)展,數(shù)據(jù)挖掘技術(shù)作為一種新興的學(xué)科,其研究熱度正在逐漸升溫,研究的水平也在逐步提高,同時由于國家政府的政策支持與資金支持,越來越多的數(shù)據(jù)專業(yè)研究者被吸引加入其中。在數(shù)據(jù)挖掘技術(shù)未來的研究過程中,其主要方向應(yīng)包括以下幾點(diǎn):(1)參照于sql語言的標(biāo)準(zhǔn)化的研究成果,對數(shù)據(jù)挖掘技術(shù)進(jìn)行形式化的描述,即發(fā)現(xiàn)數(shù)據(jù)語言。(2)為實(shí)現(xiàn)關(guān)于數(shù)據(jù)額挖掘技術(shù)人機(jī)交互工作的順利開展,應(yīng)滿足用戶對知識發(fā)現(xiàn)過程的可視化進(jìn)程。(3)研究在計(jì)算機(jī)領(lǐng)域的數(shù)據(jù)挖掘技術(shù)的發(fā)展,可以通過數(shù)據(jù)挖掘服務(wù)器的有效配合的方式實(shí)現(xiàn)。3.2 面臨的問題(1)挖掘方法與人機(jī)交互問題。我國數(shù)據(jù)挖掘技術(shù)的發(fā)展受限制于挖掘方法,不管是知識類型的

8、限制,還是維度上的限制,都是影響其發(fā)展的重要因素。(2)性能問題。能夠有效的解決數(shù)據(jù)挖掘技術(shù)算法中的問題是解決其性能問題的關(guān)鍵,應(yīng)對其有效性、可伸縮性等問題進(jìn)行研究,保證其算法能夠滿足用戶的性能要求。(3)數(shù)據(jù)類型多樣性問題。對于算法復(fù)雜的,多維度的數(shù)據(jù)類型,現(xiàn)有的研究水平很難去解決此類問題,同時對于多跨度的全球化信息技術(shù)的挖掘水平仍然落后。4 結(jié)束語數(shù)據(jù)挖掘技術(shù)作為新興的數(shù)據(jù)應(yīng)用工具,能夠有效的加強(qiáng)對數(shù)據(jù)的處理程度,但是由于我國研發(fā)起步晚,導(dǎo)致我國的發(fā)展水平落后與國外水平。近年來,國家對數(shù)據(jù)挖掘技術(shù)的政策與資金支持,掀起了研究的熱潮。我國應(yīng)重視數(shù)據(jù)挖掘算法研究以及其實(shí)際應(yīng)用,不斷地發(fā)展數(shù)據(jù)挖掘

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論