數(shù)據(jù)挖掘技術(shù)教學(xué)大綱_第1頁(yè)
數(shù)據(jù)挖掘技術(shù)教學(xué)大綱_第2頁(yè)
數(shù)據(jù)挖掘技術(shù)教學(xué)大綱_第3頁(yè)
數(shù)據(jù)挖掘技術(shù)教學(xué)大綱_第4頁(yè)
數(shù)據(jù)挖掘技術(shù)教學(xué)大綱_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)挖掘技術(shù)課程教學(xué)大綱、課程基本信息課程名稱(中文)數(shù)據(jù)挖掘技術(shù)課程代碼課程名稱(英文)DataMining課程類別口通識(shí)教育課專業(yè)教育課口實(shí)踐教育課口創(chuàng)新創(chuàng)業(yè)課口其他課程學(xué)時(shí)40學(xué)時(shí)課程學(xué)分2.5學(xué)分適用專業(yè)物聯(lián)網(wǎng)工程專業(yè)(本科)開(kāi)課學(xué)期第7學(xué)期先修課程概率與統(tǒng)計(jì),數(shù)據(jù)庫(kù)原理續(xù)修課程課程簡(jiǎn)介數(shù)據(jù)挖掘是計(jì)算機(jī)工程學(xué)院開(kāi)設(shè)的一門重要的專業(yè)課程。本課程主要講授數(shù)據(jù)挖掘的基本概念,原理、方法和技術(shù),具體包括:數(shù)據(jù)的預(yù)處理、分類預(yù)測(cè)、關(guān)聯(lián)挖掘,聚類分析等內(nèi)容。通過(guò)學(xué)習(xí),使學(xué)生理解數(shù)據(jù)挖掘的基本流程,掌握數(shù)據(jù)挖掘的基本理論和技術(shù),熟悉數(shù)據(jù)挖掘成果的表達(dá);掌握數(shù)據(jù)挖掘的基本方法,能熟練地應(yīng)用數(shù)據(jù)挖掘技術(shù)

2、對(duì)現(xiàn)實(shí)數(shù)據(jù)進(jìn)行有效的分析,能夠結(jié)合Clementine軟件從大量統(tǒng)計(jì)數(shù)據(jù)中獲取有價(jià)值的信息。二、課程教育目標(biāo)(一)總體目標(biāo)數(shù)據(jù)挖掘是高級(jí)數(shù)據(jù)處理和分析技術(shù)。通過(guò)本課程學(xué)習(xí),使學(xué)生了解數(shù)據(jù)挖掘這種現(xiàn)代數(shù)據(jù)分析和知識(shí)挖掘方法的思想與技術(shù),了解數(shù)據(jù)挖掘的基本理論,掌握重要的數(shù)據(jù)挖掘方法,掌握如何利用Clementine實(shí)現(xiàn)數(shù)據(jù)分析和挖掘,并使學(xué)生具有進(jìn)一步學(xué)習(xí)的基本與能力。(二)具體目標(biāo)1 .能夠?qū)?、輸出各種類型的數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行簡(jiǎn)單描述統(tǒng)計(jì)2 .能夠編寫建立線性回歸模型、非純性回歸模型、編寫回歸模型的程序,并能夠通過(guò)程序檢驗(yàn)?zāi)P? .能夠?qū)?shù)據(jù)進(jìn)行聚類分析、分類分析、關(guān)聯(lián)分析、能夠?qū)ξ谋緮?shù)據(jù)進(jìn)

3、行數(shù)據(jù)挖掘三、課程學(xué)時(shí)分配課程章節(jié)課程內(nèi)容理論學(xué)時(shí)實(shí)踐學(xué)時(shí)第一章數(shù)據(jù)挖掘和Clementine2弟早Clementine數(shù)據(jù)管理2第三章Clementine數(shù)據(jù)的基本分析26第四章關(guān)聯(lián)規(guī)則挖掘26第五章分類與預(yù)測(cè)46第八章聚類分析46合計(jì)-1624四、課程內(nèi)容第一章數(shù)據(jù)挖掘和Clementine使用概述【教學(xué)內(nèi)容】1 .1數(shù)據(jù)挖掘的產(chǎn)生背景2 .數(shù)據(jù)挖掘產(chǎn)生的背景3 .數(shù)據(jù)挖掘的發(fā)展4 .數(shù)據(jù)挖掘概述5 .2什么是數(shù)據(jù)挖掘6 .數(shù)據(jù)挖掘概念7 .數(shù)據(jù)挖掘分類8 .數(shù)據(jù)挖掘體系結(jié)構(gòu)9 .3Clementine軟件概述1. Clementine的配置2. Clementine操作基礎(chǔ)【學(xué)習(xí)目標(biāo)】本

4、章作為緒論,其目的是讓學(xué)生對(duì)數(shù)據(jù)挖掘技術(shù)有一個(gè)總體的認(rèn)識(shí)。因此,主要內(nèi)容是對(duì)數(shù)據(jù)挖掘技術(shù)的概念、產(chǎn)生背景、發(fā)展趨勢(shì)以及應(yīng)用等進(jìn)行提煉和概括,并熟悉Clementine軟件的使用環(huán)境。要求學(xué)生掌握以下內(nèi)容:1 .數(shù)據(jù)挖掘的發(fā)展2 .數(shù)據(jù)挖掘基本知識(shí)3 .數(shù)據(jù)挖掘功能4 .數(shù)據(jù)挖掘應(yīng)用5 .數(shù)據(jù)挖掘的熱點(diǎn)問(wèn)題6 .熟悉Clementine軟件【重點(diǎn)、難點(diǎn)】1 .重點(diǎn):(1)數(shù)據(jù)挖掘概念(2)數(shù)據(jù)挖掘分類2 .難點(diǎn):Clementine操作基礎(chǔ)【教學(xué)方法】1 .通過(guò)多媒體課件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,豐富學(xué)生課程與教學(xué)的基本知識(shí)結(jié)構(gòu),培養(yǎng)學(xué)生的職業(yè)規(guī)范;2 .通過(guò)案例分析,強(qiáng)調(diào)理論與

5、實(shí)踐相結(jié)合,促進(jìn)學(xué)生知識(shí)整合,培養(yǎng)學(xué)生的反思能力。第二章Clementine數(shù)據(jù)管理【教學(xué)內(nèi)容】2.1 數(shù)據(jù)源節(jié)點(diǎn)(Sources)1 .從開(kāi)放數(shù)據(jù)庫(kù)中導(dǎo)入數(shù)據(jù)2 .從文本文件中讀取數(shù)據(jù)3,導(dǎo)入Excel格式的數(shù)據(jù)4 .用戶手動(dòng)創(chuàng)建數(shù)據(jù)5 .2記錄選項(xiàng)節(jié)點(diǎn)(RecordOps)1 .選擇節(jié)點(diǎn)2,對(duì)數(shù)據(jù)的抽樣3 .修正數(shù)據(jù)集中的不均勻性4 .統(tǒng)計(jì)匯總5,對(duì)節(jié)點(diǎn)數(shù)據(jù)的排序6,區(qū)分節(jié)點(diǎn)來(lái)清除重復(fù)記錄2.3字段選項(xiàng)節(jié)點(diǎn)1,變量說(shuō)明2,變量值的重新計(jì)算3,變量類別值的調(diào)整4,生成新變量5,變量值的離散化處理6.生成樣本集分割變量【學(xué)習(xí)目標(biāo)】本章中的數(shù)據(jù)管理主要是指數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理部分。對(duì)數(shù)據(jù)進(jìn)行預(yù)

6、處理,不但可以節(jié)約大量的空間和時(shí)間而且得到的挖掘結(jié)果能更好地起到?jīng)Q策和預(yù)測(cè)作用。數(shù)據(jù)預(yù)處理一般包括:數(shù)據(jù)清理,數(shù)據(jù)集成,數(shù)據(jù)變換,數(shù)據(jù)歸約等方法。要求學(xué)生掌握本章講授的所有數(shù)據(jù)管理技術(shù)?!局攸c(diǎn)、難點(diǎn)】(1)數(shù)據(jù)源節(jié)點(diǎn)(2)記錄選項(xiàng)節(jié)點(diǎn)(3)字段選項(xiàng)節(jié)點(diǎn)2.難點(diǎn):無(wú)【教學(xué)方法】1,通過(guò)多媒體課件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,豐富學(xué)生課程與教學(xué)的基本知識(shí)結(jié)構(gòu),培養(yǎng)學(xué)生的職業(yè)規(guī)范;2.通過(guò)案例分析,強(qiáng)調(diào)理論與實(shí)踐相結(jié)合,促進(jìn)學(xué)生知識(shí)整合,培養(yǎng)學(xué)生的反思能力。第三章Clementine數(shù)據(jù)的基本描述分析【教學(xué)內(nèi)容】3.1 數(shù)據(jù)質(zhì)量探索1 .數(shù)據(jù)的基本描述與質(zhì)量探索2 .離群點(diǎn)和極端值的修正

7、3,缺失值的替補(bǔ)4,數(shù)據(jù)質(zhì)量管理的其他功能3.2 數(shù)據(jù)基本描述分析1,計(jì)算基本描述統(tǒng)計(jì)量2,繪制散點(diǎn)圖3.3 兩分類變量相關(guān)性的研究1,兩分類變量相關(guān)性的圖形分析2,兩分類變量相關(guān)性的數(shù)值分析3.5變量重要性分析【學(xué)習(xí)目標(biāo)】基本描述分析是數(shù)據(jù)分析的基礎(chǔ),通常對(duì)數(shù)值型變量進(jìn)行描述分析,涉及數(shù)據(jù)的集中趨勢(shì)和離散程度。描述集中趨勢(shì)的描述性統(tǒng)計(jì)量一般有均值、中位數(shù)和眾數(shù);描述離散程度的描述性統(tǒng)計(jì)量一般有方差、標(biāo)準(zhǔn)差和極差。要求學(xué)生掌握Clementine數(shù)據(jù)的基本分析方法。【重點(diǎn)、難點(diǎn)】1 .重點(diǎn):(1)數(shù)據(jù)質(zhì)量探索(2)數(shù)據(jù)基本描述分析2 .難點(diǎn):兩分類變量相關(guān)性的研究【教學(xué)方法】1 .通過(guò)多媒體課

8、件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,豐富學(xué)生課程與教學(xué)的基本知識(shí)結(jié)構(gòu),培養(yǎng)學(xué)生的職業(yè)規(guī)范;2 .通過(guò)案例分析,強(qiáng)調(diào)理論與實(shí)踐相結(jié)合,促進(jìn)學(xué)生知識(shí)整合,培養(yǎng)學(xué)生的反思能力。第四章關(guān)聯(lián)規(guī)則挖掘【教學(xué)內(nèi)容】4.1 關(guān)聯(lián)規(guī)則概述1 .基本概念2 .關(guān)聯(lián)規(guī)則表示3 .關(guān)聯(lián)規(guī)則挖掘算法簡(jiǎn)介4.2 Apriori算法1. Apriori算法生成頻繁項(xiàng)集的過(guò)程2. Apriori算法從頻繁項(xiàng)集產(chǎn)生關(guān)聯(lián)規(guī)則4.3 在Clementine中應(yīng)用Apriori算法4.4 序列模式挖掘1 .序列與序列模式2 .Apriori算法3 .在Clementine中應(yīng)用序列模式挖掘【學(xué)習(xí)目標(biāo)】關(guān)聯(lián)規(guī)則是形如X-Y的蘊(yùn)

9、涵式,其中,X和Y分別稱為關(guān)聯(lián)規(guī)則的先導(dǎo)和后繼。其中,關(guān)聯(lián)規(guī)則XCY,存在支持度和信任度。本章對(duì)關(guān)聯(lián)規(guī)則挖掘中的概念、方法、算法進(jìn)行全面的分析和講解。由于關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘技術(shù)中研究最早、成果最多、相對(duì)比較成熟的分支,因此本章重點(diǎn)在于一些經(jīng)典理論和算法、熱點(diǎn)問(wèn)題的介紹。要求學(xué)生掌握以下內(nèi)容:1 .關(guān)聯(lián)規(guī)則相關(guān)概念2 .Apriori算法3 .在Clementine中應(yīng)用Apriori算法【重點(diǎn)、難點(diǎn)】4 .重點(diǎn):(1)關(guān)聯(lián)規(guī)則相關(guān)概念(2)Apriori算法2.難點(diǎn):序列模式挖掘【教學(xué)方法】1 .通過(guò)多媒體課件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,豐富學(xué)生課程與教學(xué)的基本知識(shí)結(jié)構(gòu),培養(yǎng)

10、學(xué)生的職業(yè)規(guī)范;2 .通過(guò)案例分析,強(qiáng)調(diào)理論與實(shí)踐相結(jié)合,促進(jìn)學(xué)生知識(shí)整合,培養(yǎng)學(xué)生的反思能力。第五章分類與預(yù)測(cè)【教學(xué)內(nèi)容】5.1分類與決策樹(shù)概述1 .分類和預(yù)測(cè)數(shù)據(jù)分析形式介紹2 .決策樹(shù)概述3 .2ID3、C4.5與C5.0算法及應(yīng)用1 .信息嫡計(jì)算2 .決策樹(shù)歸納策略3 .ID3算法及缺點(diǎn)4 .C4.5算法5 .C5.0算法及優(yōu)點(diǎn)6 .在Clementine中應(yīng)用C5.07 .3二項(xiàng)Logistic回歸分析8 .4二項(xiàng)Logistic回歸分析應(yīng)用【學(xué)習(xí)目標(biāo)】分類是指把數(shù)據(jù)樣本映射到一個(gè)事先定義的類中的學(xué)習(xí)過(guò)程,即給定一組輸入的屬性向量及其對(duì)應(yīng)的類,用基于歸納的學(xué)習(xí)算法得出分類。預(yù)測(cè)可以涉

11、及數(shù)據(jù)值預(yù)測(cè)和類標(biāo)記預(yù)測(cè),但預(yù)測(cè)通常指值預(yù)測(cè)。兩者的區(qū)別是,分類是用來(lái)預(yù)測(cè)數(shù)據(jù)對(duì)象的類標(biāo)記,而預(yù)測(cè)則是估計(jì)某些空缺或未知值。分類與預(yù)測(cè)在數(shù)據(jù)挖掘中是一項(xiàng)非常重要的方面,本章對(duì)分類與預(yù)測(cè)的基本概念與步驟、經(jīng)典的方法以及有關(guān)的問(wèn)題進(jìn)行了闡述。要求學(xué)生掌握以下內(nèi)容:分類和預(yù)測(cè)數(shù)據(jù)分析形式1. ID3算法2. C4.5算法3. Logistic回歸分析【重點(diǎn)、難點(diǎn)】(1) 點(diǎn):(1)決策樹(shù)概述(2) ID3算法(3) C4.5算法2.難點(diǎn):Logistic回歸分析【教學(xué)方法】豐富學(xué)生培養(yǎng)學(xué)生的1 .通過(guò)多媒體課件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,課程與教學(xué)的基本知識(shí)結(jié)構(gòu),培養(yǎng)學(xué)生的職業(yè)規(guī)范;2

12、 .通過(guò)案例分析,強(qiáng)調(diào)理論與實(shí)踐相結(jié)合,促進(jìn)學(xué)生知識(shí)整合,反思能力。第六章聚類分析【教學(xué)內(nèi)容】6.1 聚類分析的一般問(wèn)題1 .聚類分析介紹2 .聚類分析應(yīng)用領(lǐng)域3 .聚類分析原理4 .主要聚類方法分類6.2 Clementine的k-means聚類及應(yīng)用1. k-means算法2. k-means算法的優(yōu)缺點(diǎn)3. 在Clementine中應(yīng)用k-means6.3 Clementine的兩步聚類及應(yīng)用1 .兩步聚類算法2 .Clementine的兩步聚類應(yīng)用【學(xué)習(xí)目標(biāo)】聚類是將數(shù)據(jù)分類到不同的類或者簇的過(guò)程,所以同一個(gè)簇中的對(duì)象有很大的相似性,而不同簇間的對(duì)象有很大的相異性。聚類分析是一種探索性

13、的分析,在分類的過(guò)程中,人們不必事先給出一個(gè)分類的標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā),自動(dòng)進(jìn)行分類。聚類能夠作為一個(gè)獨(dú)立的工具獲得數(shù)據(jù)的分布狀況,觀察每一簇?cái)?shù)據(jù)的特征,集中對(duì)特定的聚簇集合作進(jìn)一步地分析。聚類分析還可以作為其他算法(如分類和定性歸納算法)的預(yù)處理步驟。聚類是數(shù)據(jù)挖掘技術(shù)中一個(gè)重要組成部分,內(nèi)容很多,因此要求學(xué)生掌握聚類分析原理、基本方法和主要算法?!局攸c(diǎn)、難點(diǎn)】2.重點(diǎn):(1)聚類分析原理(2)主要聚類方法分類2.難點(diǎn):Clementine操作基礎(chǔ)【教學(xué)方法】1 .通過(guò)多媒體課件和傳統(tǒng)教學(xué)相結(jié)合,闡明課程與教學(xué)基本原理,豐富學(xué)生課程與教學(xué)的基本知識(shí)結(jié)構(gòu),培養(yǎng)學(xué)生的職業(yè)規(guī)范;2 .

14、通過(guò)案例分析,強(qiáng)調(diào)理論與實(shí)踐相結(jié)合,促進(jìn)學(xué)生知識(shí)整合,培養(yǎng)學(xué)生的反思能力。五、考核方式及成績(jī)?cè)u(píng)定1 .考核方式:課程考核方式分為過(guò)程考核(平時(shí)考核)和課終考核(期末考核)。過(guò)程考核(平時(shí)考核)方式包括課堂表現(xiàn)、平時(shí)作業(yè)、階段性測(cè)試、調(diào)研報(bào)告等;課終考核(期末考核)采用考查。2 .總成績(jī)?cè)u(píng)定:總成績(jī)=過(guò)程成績(jī)(平時(shí)成績(jī))*50%碑終成績(jī)(期末成績(jī))*50%(其中過(guò)程成績(jī)的占比由課程組根據(jù)課程實(shí)際提出并報(bào)二級(jí)學(xué)院決定)3 .過(guò)程成績(jī)(平時(shí)成績(jī))評(píng)定:(1)課堂表現(xiàn)(5%):學(xué)生主動(dòng)參與課堂練習(xí)、討論,創(chuàng)造性地提出問(wèn)題的能力;(2)作業(yè)完成情況(10%):學(xué)生平時(shí)作業(yè)提交次數(shù)及完成質(zhì)量;(3)階段性測(cè)驗(yàn)(10%):學(xué)生在平時(shí)測(cè)試、測(cè)驗(yàn)中掌握課程的情況;(4)研究報(bào)告(10%:學(xué)生收集資料能力,研究設(shè)計(jì)能力,解決實(shí)際問(wèn)題能力和合作研究能力;(5)實(shí)踐教學(xué)(10%);(6)考勤(5%)。4 .期末考試:期末考試主要考察對(duì)基本概念、操作程序和具體方法的理解與運(yùn)用等。六、建議教材和主要參考書目(一)建議教材基于Clementine的數(shù)據(jù)挖掘,薛薇陳歡歌

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論