大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù).docx_第1頁
大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù).docx_第2頁
大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù).docx_第3頁
大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù).docx_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘技術(shù)【摘要】隨著大數(shù)據(jù)時(shí)代的到來,在大數(shù)據(jù)觀念不斷提出的今天,加強(qiáng)數(shù)據(jù)大數(shù)據(jù)挖掘及時(shí)的應(yīng)用已成為大勢所趨。那么在這一過程中,我們必須掌握大數(shù)據(jù)與數(shù)據(jù)挖掘的內(nèi)涵,并對數(shù)據(jù)挖掘技術(shù)進(jìn)行分析,從而明確大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域,促進(jìn)各項(xiàng)數(shù)據(jù)的處理,提高大數(shù)據(jù)處理能力?!娟P(guān)鍵詞】大數(shù)據(jù)時(shí)代;數(shù)據(jù)挖掘技術(shù);應(yīng)用大數(shù)據(jù)時(shí)代下的數(shù)據(jù)處理技術(shù)要求更高,所以要想確保數(shù)據(jù)處理成效得到提升,就必須切實(shí)加強(qiáng)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,才能更好地促進(jìn)數(shù)據(jù)處理職能的轉(zhuǎn)變,提高數(shù)據(jù)處理效率,以下就大數(shù)據(jù)時(shí)代下的數(shù)據(jù)挖掘技術(shù)做出如下分析。1.大數(shù)據(jù)與數(shù)據(jù)挖掘的內(nèi)涵分析近年來,隨著云計(jì)算和物聯(lián)網(wǎng)概念的提出,信息技術(shù)得到了前所未有的發(fā)展,而大數(shù)據(jù)則是在此基礎(chǔ)上對現(xiàn)代信息技術(shù)革命的又一次顛覆,所以大數(shù)據(jù)技術(shù)主要是從多種巨量的數(shù)據(jù)中快速的挖掘和獲取有價(jià)值的信息技術(shù),因而在云時(shí)代的今天,大數(shù)據(jù)技術(shù)已經(jīng)被我們所關(guān)注,所以數(shù)據(jù)挖掘技術(shù)成為最為關(guān)鍵的技術(shù)。尤其是在當(dāng)前在日常信息關(guān)聯(lián)和處理中越來越離不開數(shù)據(jù)挖掘技術(shù)和信息技術(shù)的支持。大數(shù)據(jù),而主要是對全球的數(shù)據(jù)量較大的一個(gè)概括,且每年的數(shù)據(jù)增長速度較快。而數(shù)據(jù)挖掘,主要是從多種模糊而又隨機(jī)、大量而又復(fù)雜且不規(guī)則的數(shù)據(jù)中,獲得有用的信息知識,從數(shù)據(jù)庫中抽絲剝繭、轉(zhuǎn)換分析,從而掌握其潛在價(jià)值與規(guī)律1。2.大數(shù)據(jù)時(shí)代下數(shù)據(jù)挖掘技術(shù)的核心-分析方法數(shù)據(jù)挖掘的過程實(shí)際就是對數(shù)據(jù)進(jìn)行分析和處理,所以其核心就在于數(shù)據(jù)的分析方法。要想確保分析方法的科學(xué)性,就必須確保所采用算法的科學(xué)性和可靠性,獲取數(shù)據(jù)潛在規(guī)律,并采取多元化的分析方法促進(jìn)問題的解決和優(yōu)化。以下就幾種常見的數(shù)據(jù)分析方法做出簡要的說明。一是歸類法,主要是將沒有指向和不確定且抽象的數(shù)據(jù)信息予以集中,并對集中后的數(shù)據(jù)實(shí)施分類整理和編輯處理,從而確保所形成的數(shù)據(jù)源具有特征一致、表現(xiàn)相同的特點(diǎn),從而為加強(qiáng)對其的研究提供便利。所以這一分析方法能有效的滿足各種數(shù)據(jù)信息處理。二是關(guān)聯(lián)法,由于不同數(shù)據(jù)間存在的關(guān)聯(lián)性較為隱蔽,采取人力往往難以找出其信息特征,所以需要預(yù)先結(jié)合信息關(guān)聯(lián)的表現(xiàn),對數(shù)據(jù)關(guān)聯(lián)管理方案進(jìn)行制定,從而完成基于某種目的的前提下對信息進(jìn)行處理,所以其主要是在一些信息處理要求高和任務(wù)較為復(fù)雜的信息處理工作之中。三是特征法,由于數(shù)據(jù)資源的應(yīng)用范圍較廣,所以需要對其特征進(jìn)行挖掘。也就是采用某一種技術(shù),將具有相同特征的數(shù)據(jù)進(jìn)行集中。例如采用人工神經(jīng)網(wǎng)絡(luò)技術(shù)時(shí),主要是對大批量復(fù)雜的數(shù)據(jù)分析,對非常復(fù)雜的模式進(jìn)行抽取或者對其趨勢進(jìn)行分析。而采取遺傳算法,則主要是對其他評估算法的適合度進(jìn)行評估,并結(jié)合生物進(jìn)化的原理,對信息數(shù)據(jù)的成長過程進(jìn)行虛擬和假設(shè),從而組建出半虛擬、半真實(shí)的信息資源。再如可視化技術(shù)則是為數(shù)據(jù)挖掘提供輔助,采取多種方式對數(shù)據(jù)的挖掘進(jìn)行指導(dǎo)和表達(dá)3。3.大數(shù)據(jù)時(shí)代數(shù)據(jù)挖掘技術(shù)要點(diǎn)的分析3.1數(shù)據(jù)挖掘技術(shù)流程分析在數(shù)據(jù)挖掘過程中,其技術(shù)流程主要是以下幾點(diǎn):首先做好數(shù)據(jù)準(zhǔn)備工作,主要是在挖掘數(shù)據(jù)之前,就需要對目標(biāo)數(shù)據(jù)進(jìn)行準(zhǔn)確的定位,在尋找和挖掘數(shù)據(jù)之前,必須知道自身所需的數(shù)據(jù)類型,才能避免數(shù)據(jù)挖掘的盲目性,在數(shù)據(jù)準(zhǔn)備時(shí),應(yīng)根據(jù)系統(tǒng)的提示進(jìn)行操作,在數(shù)據(jù)庫中輸入檢索條件和目標(biāo),對數(shù)據(jù)信息資源進(jìn)行分類和清理,以及編輯和預(yù)處理。其次是在數(shù)據(jù)挖掘過程中,由于目標(biāo)數(shù)據(jù)信息已經(jīng)被預(yù)處理,所以就需要在挖掘處理過程中將其高效正確的應(yīng)用到管理機(jī)制之中,因而數(shù)據(jù)挖掘的過程十分重要,所以必須加強(qiáng)對其的處理。例如在數(shù)據(jù)挖掘中,我們可以結(jié)合數(shù)據(jù)挖掘目標(biāo)要求,針對性的選取科學(xué)而又合適的計(jì)算和分析方法,對數(shù)據(jù)信息特征與應(yīng)用價(jià)值等進(jìn)行尋找和歸納。當(dāng)然,也可以結(jié)合程序應(yīng)用的需要,對數(shù)據(jù)區(qū)域進(jìn)行固定,并在固定的數(shù)據(jù)區(qū)域內(nèi)分類的挖掘數(shù)據(jù),從而得到更具深度和內(nèi)涵以及價(jià)值的數(shù)據(jù)信息資源,并就挖掘到的數(shù)據(jù)結(jié)果進(jìn)行分析和解釋,從結(jié)果中將具有使用價(jià)值和意義的規(guī)律進(jìn)行提取,并還原成便于理解的數(shù)據(jù)語言。最后是切實(shí)加強(qiáng)管理和計(jì)算等專業(yè)知識的應(yīng)用,將數(shù)據(jù)挖掘技術(shù)實(shí)施中進(jìn)行的總結(jié)和提取所獲得的數(shù)據(jù)信息與評估結(jié)果在現(xiàn)實(shí)之中應(yīng)用,從而對某個(gè)思想、決策是否正確和科學(xué)進(jìn)行判斷,最終體現(xiàn)出數(shù)據(jù)挖掘及時(shí)的應(yīng)用價(jià)值。3.2挖掘后的數(shù)據(jù)信息資源分析若僅僅是通過環(huán)境和背景實(shí)現(xiàn)數(shù)據(jù)挖掘技術(shù)的升級轉(zhuǎn)型,那么其在合理性和科學(xué)性方面勢必會存在一定的欠缺,所以在形成網(wǎng)絡(luò)信息化的環(huán)境時(shí),我們應(yīng)綜合考慮社會經(jīng)濟(jì)的發(fā)展以及科技和文化因素帶來的影響,以及其在未來發(fā)展中的變化趨勢,這樣才能更好地促進(jìn)數(shù)據(jù)挖掘技術(shù)職能的轉(zhuǎn)變,促進(jìn)其最大化的滿足其應(yīng)用成效的發(fā)揮,也能有效的促進(jìn)其職能作用的發(fā)揮。這主要是因?yàn)閿?shù)據(jù)信息資源在挖掘后,其自身的職能作用將變得更加豐富,所以在信息技術(shù)環(huán)節(jié)下的數(shù)據(jù)挖掘技術(shù)隨著限定條件的變化,而將數(shù)據(jù)挖掘信息應(yīng)用于技術(shù)管理和決策管理之中,從而更好地彰顯企業(yè)在經(jīng)濟(jì)活動中的物質(zhì)性質(zhì)與價(jià)值變化趨勢,并結(jié)合數(shù)據(jù)變化特點(diǎn)和具體的表現(xiàn)規(guī)律,從而將數(shù)據(jù)信息的基本要素、質(zhì)量特點(diǎn)、管理要求等展示出來,所以其表現(xiàn)的形式十分豐富。因而在數(shù)據(jù)挖掘之后的信息在職能范圍和表現(xiàn)形式方式均得到了豐富和拓展,而這也在一定程度上體現(xiàn)了網(wǎng)絡(luò)擬定目標(biāo)服務(wù)具有較強(qiáng)的完整性,且屬于特殊的個(gè)體物品,同時(shí)也是對傳統(tǒng)數(shù)據(jù)挖掘技術(shù)的創(chuàng)新和發(fā)展,從而更好地滿足當(dāng)前大數(shù)據(jù)時(shí)代對信息進(jìn)行數(shù)據(jù)化的處理,并對不同種類業(yè)務(wù)進(jìn)行整合和優(yōu)化,從而促進(jìn)數(shù)據(jù)挖掘技術(shù)服務(wù)的一體化水平。3.3大數(shù)據(jù)背景下的數(shù)據(jù)挖掘技術(shù)應(yīng)注重信息失真的控制數(shù)據(jù)挖掘技術(shù)的信息主要是源于大數(shù)據(jù)和社會,所以在當(dāng)前數(shù)據(jù)挖掘技術(shù)需求不斷加大的今天,為了更好地促進(jìn)所挖掘數(shù)據(jù)信息的真實(shí)性,促進(jìn)其個(gè)性化職能的發(fā)揮,必須在大數(shù)據(jù)背景下注重信息失真的控制,切實(shí)做好數(shù)據(jù)挖掘技術(shù)管理的各項(xiàng)工作。這就需要考慮如何確保數(shù)據(jù)挖掘技術(shù)在大數(shù)據(jù)背景下的職能得到有效的發(fā)揮,盡可能地促進(jìn)數(shù)據(jù)挖掘技術(shù)信息資源的升級和轉(zhuǎn)型,以大數(shù)據(jù)背景為載體,促進(jìn)整個(gè)業(yè)務(wù)和技術(shù)操作流程的一體化,從而更好地將所有數(shù)據(jù)資源的消耗和變化以及管理的科學(xué)性和有效性,這樣我們就能及時(shí)的找到資源的消耗源頭,從而更好地對數(shù)據(jù)資源的消耗效益進(jìn)行評價(jià),最終促進(jìn)業(yè)務(wù)流程的優(yōu)化,并結(jié)合大數(shù)據(jù)背景對數(shù)據(jù)挖掘技術(shù)的職能進(jìn)行拓展,促進(jìn)其外部信息與內(nèi)部信息的合作,對數(shù)據(jù)挖掘技術(shù)信息的職能進(jìn)行有效的控制,才能更好地促進(jìn)信息失真的控制。4.數(shù)據(jù)挖掘技術(shù)在不同行業(yè)中的應(yīng)用4.1市場營銷行業(yè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用在數(shù)據(jù)挖掘技術(shù)方面應(yīng)用最多的行業(yè)就屬于市場營銷行業(yè)了,這主要是因?yàn)閿?shù)據(jù)挖掘能有效的解析消費(fèi)者的消費(fèi)行為和消費(fèi)習(xí)慣,從而利用其將銷售方式改進(jìn)和優(yōu)化,最終促進(jìn)產(chǎn)品銷量的提升。與此同時(shí),通過對購物消費(fèi)行為的分析,掌握客戶的忠誠度和消費(fèi)意識等,從而針對性的改變營銷策略,同時(shí)還能找到更多潛在的客戶。4.2制造業(yè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用在制造業(yè)中加強(qiáng)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,其目的就在于對產(chǎn)品質(zhì)量進(jìn)行檢驗(yàn)。具體的做法就是對所制造產(chǎn)品的數(shù)據(jù)進(jìn)行研究,從而找出其存在的規(guī)則,并對其生產(chǎn)流程進(jìn)行分析之后,對其生產(chǎn)的過程進(jìn)行分析,從而更好地對生產(chǎn)質(zhì)量的影響因素進(jìn)行分析,并促進(jìn)其效率的提升,最終提高企業(yè)的經(jīng)濟(jì)效益。具體而言,主要就是對各種生產(chǎn)數(shù)據(jù)進(jìn)行篩選,從而得出有用的數(shù)據(jù)和知識,再采取決策樹算法進(jìn)行統(tǒng)計(jì)決策,并從中選取正確決策,從而更好地對產(chǎn)品在市場中的流行程度,決定企業(yè)生產(chǎn)和轉(zhuǎn)型的方向。4.3教育行業(yè)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用教育行業(yè)中加強(qiáng)數(shù)據(jù)挖掘技術(shù)的應(yīng)用,主要是為了更好地對學(xué)習(xí)情況、教學(xué)評估和心里動向等數(shù)據(jù)進(jìn)行分類和篩選,從而為學(xué)校的教學(xué)改革提供參考和支持。比如為了更好地對教學(xué)質(zhì)量進(jìn)行評估,就需要對教學(xué)質(zhì)量有關(guān)項(xiàng)目進(jìn)行整合與存儲,從而更好地促進(jìn)其對教學(xué)質(zhì)量的評估,而這一過程中,就需要采取數(shù)據(jù)挖掘技術(shù)對有關(guān)教學(xué)項(xiàng)目中的數(shù)據(jù)進(jìn)行挖掘和處理,促進(jìn)其應(yīng)用成效的提升3。5.結(jié)語綜上所述,在大數(shù)據(jù)背景下,數(shù)據(jù)挖掘技術(shù)已經(jīng)在各行各業(yè)中得到了廣泛的應(yīng)用,所以為了更好地滿足應(yīng)用的需要,我們必須切實(shí)加強(qiáng)對其特點(diǎn)的分析,并

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論