數據挖掘簡介_第1頁
數據挖掘簡介_第2頁
數據挖掘簡介_第3頁
數據挖掘簡介_第4頁
數據挖掘簡介_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據挖掘簡介2知識目標數據挖掘分類和方法數據挖掘的對象01能力目標了解決策樹方法掌握模糊集方法知道數據挖掘的對象02學習目標3學習任務數據挖掘的對象數據挖掘的任務數據挖掘的流程數據挖掘的方法4目錄01數據挖掘概述02數據挖掘分類03數據挖掘技術5數據挖掘是近年來伴隨數據庫系統(tǒng)的大量建立和萬維網的廣泛應用而發(fā)展起來的一門技術。數據挖掘是交叉性學科,它是數據庫技術、機器學習、統(tǒng)計學、人工智能、可視化分析、模式識別等多門學科的融合,如下圖所示。數據挖掘概述6數據挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的實際數據中,提取隱含其內的、人們實現(xiàn)所不知的,但又是有潛在價值的信息和知識的過程。幾點說明如下。數據挖掘概述1.數據挖掘涉及數據融合、數據分析和決策支持等內容。2.數據源必須是真實的、大量的、含有噪聲的、用戶感興趣的數據。73.發(fā)現(xiàn)的知識要可接受、可理解、可運用,并不要求發(fā)現(xiàn)放之四海而皆準的知識,僅支持特定的問題。數據是知識的源泉,將概念、規(guī)則、模式、規(guī)律和約束等視為知識,這就好像從礦石中采礦或淘金一樣,從數據中獲取知識。4.原始數據可以是結構化數據,如關系型數據庫中的數據等,也可以是非結構化數據,如文本、圖形和圖像等,還可以是半結構化數據,如網頁等。挖掘知識的方法可以是數學的方法,也可以是非數學的方法;可以是演繹的方法,也可以是歸納的方法。數據挖掘概述85.挖掘的知識具有應用的價值,可以用于信息管理、查詢優(yōu)化、決策支持和過程控制等,還可以用于數據自身的維護。6.數據挖掘是一門交叉學科,將人們對數據的應用從低層次的簡單查詢,提升到從數據中挖掘知識,提供決策支持。7.在需求推動下,不同領域的研究者,尤其是數據庫技術、人工智能技術、數理統(tǒng)計、可視化技術、并行計算等方面的知識融合后,形成新的研究熱點。數據挖掘概述9(1)直接數據挖掘(2)間接數據挖掘數據挖掘分類數據挖掘可以分為兩類:直接數據挖掘和間接數據挖掘。10數據挖掘技術是數據挖掘方法的集合,數據挖掘方法眾多。根據挖掘任務可將數據挖掘技術分為預測模型發(fā)現(xiàn)、聚類分析、分類與回歸、關聯(lián)分析、序列模式發(fā)現(xiàn)、依賴關系或依賴模型發(fā)現(xiàn)、異常和趨勢發(fā)現(xiàn)、離群點檢測等。根據挖掘對象可分為關系數據庫、面向對象數據庫、空間數據庫、時態(tài)數據庫、文本數據源、多媒體數據庫、異質數據庫、遺產數據庫以及環(huán)球網Web。根據挖掘方法可分為機器學習方法、統(tǒng)計方法、神經網絡方法和數據庫方法。數據挖掘相關技術11統(tǒng)計學的抽樣、估計和假設檢驗。人工智能、模式識別和機器學習的搜索算法、建模技術和學習理論。最優(yōu)化、進化計算、信息論、信號處理、可視化和信息檢索。數據挖掘相關技術數據挖掘應用了來自其他一些領域的思

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論