版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》教學(xué)大綱課程名稱:數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)課程編號:2161英文名稱:DataMiningandMachineLearning學(xué)時(shí):56學(xué)時(shí) 學(xué)分:3.5學(xué)分開課學(xué)期:第5學(xué)期適用專業(yè):數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)課程類別:理論課課程性質(zhì):專業(yè)核心課先修課程:概率論基礎(chǔ)、數(shù)理統(tǒng)計(jì)、Python程序設(shè)計(jì)、數(shù)據(jù)采集與清洗、數(shù)據(jù)結(jié)構(gòu)一、課程的性質(zhì)及任務(wù)《數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)》課程是數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)學(xué)生的專業(yè)核心課,通過本課程的學(xué)習(xí),培養(yǎng)學(xué)生的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的理論分析與應(yīng)用實(shí)踐的綜合能力,使學(xué)生掌握數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的一般原理和處理方法,能使用機(jī)器學(xué)習(xí)理論解決數(shù)據(jù)挖掘相關(guān)的問題。依據(jù)河北工程大學(xué)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)培養(yǎng)計(jì)劃,本課程需要培養(yǎng)學(xué)生的能力是:能夠?qū)?shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)相關(guān)知識(shí)用于大數(shù)據(jù)工程問題的解決方案(畢業(yè)要求指標(biāo)1.4)掌握大數(shù)據(jù)工程設(shè)計(jì)和相關(guān)產(chǎn)品開發(fā)全周期、全流程的基本設(shè)計(jì)/開發(fā)方法和技術(shù),了解影響目標(biāo)和技術(shù)方案的各種因素(畢業(yè)要求指標(biāo)3.1)在大數(shù)據(jù)系統(tǒng)設(shè)計(jì)和開發(fā)中能夠綜合考慮社會(huì)、健康、安全、法律、文化及環(huán)境等制約因素(畢業(yè)要求指標(biāo)3.4)具備使用大數(shù)據(jù)平臺(tái)以及軟件對復(fù)雜工程問題進(jìn)行仿真的能力,理解其使用要求、運(yùn)用范圍和局限性(畢業(yè)要求指標(biāo)5.3)二、課程目標(biāo)與要求2.1課程目標(biāo)1.
數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)課程教學(xué)大綱PAGE16PAGE1762.2課程目標(biāo)與畢業(yè)要求對應(yīng)關(guān)系畢業(yè)要求二級指標(biāo)畢業(yè)要求1234●●1.4能夠?qū)?shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)相關(guān)知識(shí)用于大數(shù)據(jù)工程問題的解決方案1.具有扎實(shí)的數(shù)學(xué)與自然科學(xué)知識(shí)和工程基礎(chǔ),系統(tǒng)地掌握數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)領(lǐng)域的基本理論、基礎(chǔ)知識(shí),并綜合運(yùn)用所學(xué)知識(shí)解決復(fù)雜工程問題?!?.1掌握大數(shù)據(jù)工程設(shè)計(jì)和相關(guān)產(chǎn)品開發(fā)全周期、全流程的基本設(shè)計(jì)/開發(fā)方法和技術(shù),了解影響目標(biāo)和技術(shù)方案的各種因素3.能夠設(shè)計(jì)出大數(shù)據(jù)應(yīng)用領(lǐng)域的復(fù)雜工程問題的解決方案,具有數(shù)據(jù)采集、處理、分析、挖掘的能力,并能夠在設(shè)計(jì)環(huán)節(jié)中體現(xiàn)創(chuàng)新意識(shí),考慮社會(huì)、健康、安全、法律、文化以及環(huán)境等多維度協(xié)同發(fā)展因素?!?.4在大數(shù)據(jù)系統(tǒng)設(shè)計(jì)和開發(fā)中能夠綜合考慮社會(huì)、健康、安全、法律、文化及環(huán)境等制約因素●5.3具備使用大數(shù)據(jù)平臺(tái)以及軟件對復(fù)雜工程問題進(jìn)行仿真的能力,理解其使用要求、運(yùn)用范圍和局限性5.能夠針對大數(shù)據(jù)應(yīng)用領(lǐng)域的復(fù)雜工程問題,開發(fā)、選擇與使用恰當(dāng)?shù)募夹g(shù)、資源、現(xiàn)代信息技術(shù)工具,包括對大數(shù)據(jù)應(yīng)用領(lǐng)域的復(fù)雜工程問題的預(yù)測與仿真,并能夠理解其局限性。2.3課程目標(biāo)與培養(yǎng)環(huán)節(jié)對應(yīng)矩陣序號課程目標(biāo)理論教學(xué)課內(nèi)實(shí)驗(yàn)課后作業(yè)1掌握數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的相關(guān)概念,數(shù)據(jù)預(yù)處理常用方法。HL2掌握分類技術(shù)、關(guān)聯(lián)規(guī)則、聚類技術(shù)等基本理論以及操作應(yīng)用;HML3具備一定的專業(yè)技術(shù)研究能力,能夠采用數(shù)據(jù)挖掘技術(shù)對大數(shù)據(jù)分析的復(fù)雜工程問題進(jìn)行研究,能夠設(shè)計(jì)相關(guān)實(shí)驗(yàn),對實(shí)驗(yàn)結(jié)果進(jìn)行分析與數(shù)據(jù)處理,通過信息綜合等方法獲得有效結(jié)論。HM4能夠?qū)Υ髷?shù)據(jù)分析的復(fù)雜工程問題進(jìn)行識(shí)別、表達(dá)和分析,得出有效結(jié)論;并能夠通過大數(shù)據(jù)技術(shù)分析實(shí)際復(fù)雜工程問題,針對數(shù)據(jù)挖掘系統(tǒng)建立模型,并編寫程序。在設(shè)計(jì)過程中能夠體現(xiàn)創(chuàng)新意識(shí),能夠綜合考慮社會(huì)、健康、安全、法律、文化以及環(huán)境等因素。HL注:H表示該能力的在此環(huán)節(jié)重點(diǎn)培養(yǎng);M表示該能力在此環(huán)節(jié)有應(yīng)用要求;L表示該能力在此環(huán)節(jié)有所涉及。應(yīng)用多元統(tǒng)計(jì)分析課程教學(xué)大綱PAGE2PAGE1922.4目標(biāo)達(dá)成度的評價(jià)課程目標(biāo)1主要通過理論教學(xué)環(huán)節(jié)進(jìn)行培養(yǎng),在課內(nèi)實(shí)驗(yàn)有所涉及。主要通過課堂測試和期末考試中概念性、原理性題目進(jìn)行考核。目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評價(jià)。課程目標(biāo)2主要通過理論教學(xué)環(huán)節(jié)進(jìn)行培養(yǎng),在課內(nèi)實(shí)驗(yàn)有應(yīng)用要求,課后作業(yè)有所涉及。主要通過課堂測試,課后作業(yè)和期末考試中各種數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)算法類題目進(jìn)行考核,在實(shí)驗(yàn)中體現(xiàn)為能熟悉掌握分類、聚類和關(guān)聯(lián)各種算法應(yīng)用。目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評價(jià)。課程目標(biāo)3主要通過課內(nèi)實(shí)驗(yàn)進(jìn)行培養(yǎng),在課后作業(yè)有應(yīng)用要求。主要通過布置大數(shù)據(jù)行業(yè)領(lǐng)域的應(yīng)用案例題目進(jìn)行考核,在實(shí)驗(yàn)報(bào)告中體現(xiàn)為能給出符合要求的大數(shù)據(jù)分析結(jié)論。在課后作業(yè)中體現(xiàn)為基于大數(shù)據(jù)分析技術(shù),綜合運(yùn)用各種數(shù)據(jù)挖掘算法的能力;目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評價(jià)。課程目標(biāo)4主要通過課內(nèi)實(shí)驗(yàn)培養(yǎng),在課后作業(yè)中有所涉及。在課后作業(yè)中體現(xiàn)為能夠按照要求完成各項(xiàng)任務(wù)要求;在實(shí)驗(yàn)報(bào)告中要對數(shù)據(jù)案例進(jìn)行描述、對大數(shù)據(jù)分析結(jié)論進(jìn)行評價(jià)。目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評價(jià)。三、教學(xué)方法及手段理論教學(xué)以課堂講授為主,上機(jī)實(shí)驗(yàn)為輔并結(jié)合課堂討論、案例分析、師生互動(dòng)等教學(xué)方法展開教學(xué);理論教學(xué)強(qiáng)調(diào)將各種數(shù)據(jù)挖掘技術(shù)、機(jī)器學(xué)習(xí)算法與實(shí)際項(xiàng)目案例的實(shí)際情況緊密聯(lián)系,面向知識(shí)的實(shí)際應(yīng)用;理論教學(xué)注重本課程與數(shù)據(jù)采集與清洗、數(shù)據(jù)結(jié)構(gòu)等先修課程的聯(lián)系;本課程教材力求內(nèi)容新穎,采用多樣化的方式進(jìn)行教學(xué),讓學(xué)生在理論與實(shí)踐相結(jié)合的基礎(chǔ)上,對課程所要求的實(shí)際操作能力有進(jìn)一步的提高。充分利用多媒體等現(xiàn)代化教學(xué)手段,整體優(yōu)化教學(xué)過程和教學(xué)內(nèi)容,調(diào)動(dòng)學(xué)生學(xué)習(xí)積極性;布置實(shí)際操作任務(wù)給學(xué)生上機(jī)操作并及時(shí)指導(dǎo)。課程強(qiáng)調(diào)學(xué)生的自主學(xué)習(xí),強(qiáng)調(diào)通過自學(xué)的方式消化、吸收課程的龐大知識(shí)量,并在此基礎(chǔ)上舉一反三、靈活應(yīng)用。四、課程的基本內(nèi)容與教學(xué)要求第一章數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)概述[教學(xué)目的與要求]:理解和掌握數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的基本概念、數(shù)據(jù)挖掘過程、數(shù)據(jù)挖掘的主要任務(wù)以及數(shù)據(jù)挖掘使用的主要技術(shù)。了解數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的應(yīng)用和面臨的問題。對數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)能夠解決的問題和解決問題思路有清晰的認(rèn)識(shí)。[本章主要內(nèi)容]:1.1什么是數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)1.2數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的過程1.3數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的任務(wù)1.4數(shù)據(jù)挖掘系統(tǒng)的分類[本章重點(diǎn)]:數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的相關(guān)概念。數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的過程。數(shù)據(jù)挖掘系統(tǒng)的分類。[本章難點(diǎn)]:數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的任務(wù)第二章數(shù)據(jù)[教學(xué)目的與要求]:理解和掌握數(shù)據(jù)對象和屬性類型,數(shù)據(jù)的基本統(tǒng)計(jì)描述。掌握數(shù)據(jù)預(yù)處理基本方法,了解度量數(shù)據(jù)相似性和相異性的方法。[本章主要內(nèi)容]:2.1數(shù)據(jù)類型2.2數(shù)據(jù)質(zhì)量2.3數(shù)據(jù)預(yù)處理方法2.4相似性和相異性的度量[本章重點(diǎn)]:1.數(shù)據(jù)的屬性與類型2.數(shù)據(jù)測量和數(shù)據(jù)收集3.數(shù)據(jù)聚集4.數(shù)據(jù)抽樣5.數(shù)據(jù)維歸約6.特征子集選擇7.特征創(chuàng)建8.變量變換[本章難點(diǎn)]:1.數(shù)據(jù)離散化和二元化2.數(shù)據(jù)對象之間的相似度和相異度第三章分類:基本概念、決策樹與模型評估[教學(xué)目的與要求]:了解分類及預(yù)測的基本思想、概念和意義,掌握決策樹的構(gòu)造原理、建模步驟。理解模型的過分?jǐn)M合,掌握評估分類器的性能和比較分類器的方法[本章主要內(nèi)容]:3.1決策樹原理和歸納問題3.2模型過分?jǐn)M合3.3評估分類器性能3.4比較分類器的方法[本章重點(diǎn)]:1.決策樹工作原理2.建立決策樹步驟3.決策樹屬性測試條件方法4.選擇最佳劃分屬性5.決策樹歸納算法6.噪聲導(dǎo)致的過分?jǐn)M合7.缺乏代表性樣本導(dǎo)致的過分?jǐn)M合8.處理過分?jǐn)M合9評估分類器性能的保持方法和隨機(jī)二次抽樣[本章難點(diǎn)]:交叉驗(yàn)證方法自助法比較分類器的方法第四章分類:其他技術(shù)[教學(xué)目的與要求]:了解基于規(guī)則的分類器。掌握最近鄰分類器算法和貝葉斯分類器原理和方法。了解人工神經(jīng)網(wǎng)絡(luò)方法和支持向量機(jī)原理。[本章主要內(nèi)容]:4.1基于規(guī)則的分類器4.2最近鄰分類器算法4.3貝葉斯分類器4.4人工神經(jīng)網(wǎng)絡(luò)方法4.5支持向量機(jī)[本章重點(diǎn)]:基于規(guī)則的分類器的工作原理規(guī)則提取的直接和間接方法最近鄰分類器算法樸素貝葉斯感知器最大邊緣超平面[本章難點(diǎn)]:1.貝葉斯信息網(wǎng)絡(luò)2.多層人工神經(jīng)網(wǎng)絡(luò)3.線性支持向量機(jī)。第五章關(guān)聯(lián)分析:基本概念和算法[教學(xué)目的與要求]:了解關(guān)聯(lián)規(guī)則的基本思想、概念和意義。掌握頻繁項(xiàng)集產(chǎn)生、規(guī)則產(chǎn)生原理。掌握頻繁項(xiàng)集緊湊表示。了解FP增長算法。[本章主要內(nèi)容]:5.1.頻繁項(xiàng)集產(chǎn)生5.2.規(guī)則產(chǎn)生原理5.3.頻繁項(xiàng)集緊湊表示5.4.FP增長算法[本章重點(diǎn)]:1.先驗(yàn)原理2.Apriori算法3.極大頻繁項(xiàng)集4.閉頻繁項(xiàng)集5.FP樹表示方法[本章難點(diǎn)]:1.基于Apriori算法的規(guī)則產(chǎn)生2.FP增長算法的頻繁項(xiàng)集產(chǎn)生第六章關(guān)聯(lián)分析:高級概念[教學(xué)目的與要求]:了解分類屬性的關(guān)聯(lián)規(guī)則。掌握連續(xù)屬性的關(guān)聯(lián)規(guī)則產(chǎn)生。了解概念分層結(jié)構(gòu)的關(guān)聯(lián)規(guī)則產(chǎn)生。掌握利用序列模式的關(guān)聯(lián)規(guī)則產(chǎn)生。[本章主要內(nèi)容]:6.1處理分類屬性6.2處理連續(xù)屬性6.3處理概念分層屬性6.4序列模式的關(guān)聯(lián)規(guī)則[本章重點(diǎn)]:1.分類屬性的關(guān)聯(lián)分析2.基于離散化方法的關(guān)聯(lián)3.非離散化方法的關(guān)聯(lián)4.序列模式出現(xiàn)的前提[本章難點(diǎn)]:1.基于統(tǒng)計(jì)學(xué)方法的關(guān)聯(lián)2.時(shí)限約束下的關(guān)聯(lián)規(guī)則第七章聚類分析:基本概念和算法[教學(xué)目的與要求]:了解聚類概念、聚類類型和簇類型。掌握K-Means聚類、層次聚類、基于密度的聚類和其他常用方法。掌握利用sklearn實(shí)現(xiàn)聚類的方法。[本章主要內(nèi)容]:7.1聚類概念、聚類類型和簇類型7.2K均值方法7.3凝聚層次聚類方法7.4DBSCAN聚類方法[本章重點(diǎn)]:1.聚類分析相關(guān)概念2.聚類類型3.簇類型4.K均值聚類方法5.二分K均值聚類方法6.凝聚層次聚類算法7.[本章難點(diǎn)]:簇鄰近度的Lance-Williams公式DBSCAN算法第八章離群點(diǎn)檢測[教學(xué)目的與要求]:了解離群點(diǎn)的概念與檢測方法。掌握sklearn中的異常值檢測方法。[本章主要內(nèi)容]:8.1異常檢測方法原理8.2異常檢測統(tǒng)計(jì)方法8.3基于鄰近度的離群點(diǎn)檢測8.4基于密度的離群點(diǎn)檢測[本章重點(diǎn)]:1.異常的成因2.異常檢測方法原理3.檢測一元正態(tài)分布中的離群點(diǎn)4.多元正態(tài)分布中的離群點(diǎn)[本章重點(diǎn)]:1.基于鄰近度的離群點(diǎn)檢測2基于密度的離群點(diǎn)檢測第九章數(shù)據(jù)挖掘案例[教學(xué)目的與要求]:掌握數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)的分析與實(shí)現(xiàn)。掌握利用Python進(jìn)行綜合數(shù)據(jù)分析。[本章主要內(nèi)容]:9.1金融數(shù)據(jù)案例的應(yīng)用分析9.2醫(yī)療數(shù)據(jù)案例的應(yīng)用分析9.3.旅游數(shù)據(jù)案例的應(yīng)用分析[本章重點(diǎn)]:1.案例數(shù)據(jù)的分析技術(shù)2.Python程序的綜合運(yùn)用[本章難點(diǎn)]:數(shù)據(jù)分析結(jié)論的總結(jié)和解釋五、課內(nèi)實(shí)驗(yàn)5.1本課程實(shí)驗(yàn)教學(xué)的地位和作用數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)實(shí)驗(yàn)是鞏固和擴(kuò)展課程理論知識(shí)的必要環(huán)節(jié)。理解數(shù)據(jù)挖掘技術(shù)和機(jī)器學(xué)習(xí)算法的基本原理,掌握各種數(shù)據(jù)分析方法。認(rèn)識(shí)數(shù)據(jù)挖掘在數(shù)據(jù)科學(xué)中的地位和作用。能根據(jù)要求編譯Python語言,能根據(jù)要求編寫相應(yīng)的代碼程序完成調(diào)試與測試,分析數(shù)據(jù),得出分析結(jié)論。通過實(shí)驗(yàn)提高學(xué)生解決實(shí)際復(fù)雜大數(shù)據(jù)的分析能力,鍛煉學(xué)生分析、調(diào)試程序、、設(shè)計(jì)實(shí)現(xiàn)數(shù)據(jù)分析算法以及撰寫實(shí)驗(yàn)報(bào)告的能力。5.2教學(xué)基本要求通過實(shí)驗(yàn)預(yù)習(xí)及設(shè)計(jì),理解數(shù)據(jù)挖掘技術(shù)和機(jī)器學(xué)習(xí)算法的基本原理,可利用Python軟件完成相關(guān)數(shù)據(jù)分析,為實(shí)驗(yàn)的順利開展奠定了基礎(chǔ)。根據(jù)要求動(dòng)手編寫程序,利用Python語言構(gòu)建數(shù)據(jù)分析模型,能根據(jù)要求編寫相應(yīng)的代碼程序完成調(diào)試與測試,分析數(shù)據(jù),得出分析結(jié)論熟悉常用各種數(shù)據(jù)分析算法的編程能力;學(xué)會(huì)使用Python語言,測試調(diào)整參數(shù),排除運(yùn)行故障。正確處理實(shí)驗(yàn)數(shù)據(jù),分析內(nèi)在規(guī)律,掌握處理實(shí)驗(yàn)結(jié)果的能力。結(jié)合實(shí)際應(yīng)用,認(rèn)識(shí)數(shù)據(jù)挖掘在數(shù)據(jù)科學(xué)中的地位和作用。5.3實(shí)驗(yàn)內(nèi)容及要求大綱基本內(nèi)容包括六個(gè)實(shí)驗(yàn)項(xiàng)目,在16個(gè)學(xué)時(shí)內(nèi)完成。實(shí)驗(yàn)一數(shù)據(jù)預(yù)處理本實(shí)驗(yàn)為操作性實(shí)驗(yàn)。通過實(shí)驗(yàn)操作,讓學(xué)生學(xué)習(xí)數(shù)據(jù)預(yù)處理的工作原理,鍛煉學(xué)生編程、分析、調(diào)試參數(shù)的能力,進(jìn)而掌握數(shù)據(jù)預(yù)處理能力。培養(yǎng)學(xué)生具有分析數(shù)據(jù)與排除運(yùn)行故障和分析實(shí)驗(yàn)結(jié)果的能力。要求學(xué)生課前預(yù)習(xí)實(shí)驗(yàn)指導(dǎo)書,根據(jù)實(shí)驗(yàn)指導(dǎo)書提供的背景知識(shí)并參考課程所用教材完成數(shù)據(jù)分析,實(shí)現(xiàn)相應(yīng)參數(shù)的理論計(jì)算。鼓勵(lì)學(xué)生用Python軟件完成數(shù)據(jù)處理,得到預(yù)期結(jié)果。指導(dǎo)教師應(yīng)概述實(shí)驗(yàn)原理、方法及操作使用等內(nèi)容,并對典型問題作針對性指導(dǎo),以及監(jiān)督實(shí)驗(yàn)室安全運(yùn)轉(zhuǎn)。具體實(shí)驗(yàn)步驟和結(jié)果分析、處理由學(xué)生獨(dú)立完成。實(shí)驗(yàn)內(nèi)容要求如下:課前預(yù)習(xí)內(nèi)容:各種數(shù)據(jù)預(yù)處理方法原理。Python語言結(jié)構(gòu)。數(shù)據(jù)的描述性統(tǒng)計(jì)分析。要求:描述性統(tǒng)計(jì)分析是一種統(tǒng)計(jì)分析方法,用以概括數(shù)據(jù)的整體情況,即數(shù)據(jù)的基本特征,以發(fā)現(xiàn)內(nèi)在規(guī)律,注意包括數(shù)據(jù)的集中性趨勢分析、數(shù)據(jù)離散程度分析、頻數(shù)分布分析等,統(tǒng)計(jì)指標(biāo)有計(jì)數(shù)、均值、標(biāo)準(zhǔn)差、最大值、最小值和分位數(shù)等,正確使用pandas模塊,使用describe函數(shù)進(jìn)行描述性分析,要求至少得到5項(xiàng)統(tǒng)計(jì)指標(biāo)。數(shù)據(jù)預(yù)處理方法。要求:數(shù)據(jù)預(yù)處理技術(shù)包括數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)變換、缺失值處理和降維等方法,正確使用sklearn模塊,使用MinMaxScaler函數(shù)、scale函數(shù)、Normalizer函數(shù)標(biāo)準(zhǔn)化數(shù)據(jù),使用Binarizer函數(shù)二元化數(shù)據(jù)、Imputer函數(shù)填補(bǔ)缺失值,學(xué)會(huì)PCA降維方法,要求至少完成5項(xiàng)操作。實(shí)驗(yàn)二分類模型本實(shí)驗(yàn)為操作性實(shí)驗(yàn)。通過實(shí)驗(yàn)操作理解分類算法的工作原理,使學(xué)生進(jìn)一步掌握各種分類算法的基本思想,學(xué)會(huì)構(gòu)建分類模型。鍛煉學(xué)生編程、分析、測試程序以及處理實(shí)驗(yàn)結(jié)果的能力。要求學(xué)生課前預(yù)習(xí)實(shí)驗(yàn)指導(dǎo)書,掌握分類模型的原理和特點(diǎn)。鼓勵(lì)學(xué)生用Python軟件實(shí)現(xiàn)分類結(jié)果,對實(shí)驗(yàn)過程及結(jié)果有所預(yù)期。指導(dǎo)教師應(yīng)概述實(shí)驗(yàn)的原理、方法及編程等內(nèi)容,并對典型問題作針對性指導(dǎo),以及監(jiān)督實(shí)驗(yàn)室安全運(yùn)轉(zhuǎn)。具體實(shí)驗(yàn)步驟和結(jié)果分析、處理由學(xué)生獨(dú)立完成。實(shí)驗(yàn)內(nèi)容要求如下:課前預(yù)習(xí)內(nèi)容:分類模型的基礎(chǔ)知識(shí)。決策樹構(gòu)建原理。KNN模型原理。貝葉斯分類器原理。支持向量機(jī)原理決策樹和KNN分類實(shí)驗(yàn),要求:通過對訓(xùn)練樣本的學(xué)習(xí),建立分類規(guī)則,并依據(jù)分類規(guī)則,對新樣本數(shù)據(jù)進(jìn)行分類預(yù)測,正確使用sklearn模塊,使用train_test_split函數(shù)劃分?jǐn)?shù)據(jù)集,利用DecisionTreeClassifier函數(shù)、KNeighborsClassifier函數(shù)完成分類,要求至少完成2項(xiàng)分類操作。貝葉斯分類器和支持向量機(jī)分類實(shí)驗(yàn),要求:通過數(shù)據(jù)分析,利用概率大小實(shí)現(xiàn)分類預(yù)測,正確使用sklearn模塊中的BernoulliNB函數(shù)、MultinomialNB函數(shù)完成分類;或使用構(gòu)建超平面,正確使用sklearn模塊中的SVC函數(shù)完成分類。要去至少完成2項(xiàng)分類操作實(shí)驗(yàn)三關(guān)聯(lián)規(guī)則本實(shí)驗(yàn)為操作性實(shí)驗(yàn)。通過實(shí)驗(yàn)操作理解關(guān)聯(lián)規(guī)則的基本原理,使學(xué)生進(jìn)一步掌握各種關(guān)聯(lián)算法的基本思想,學(xué)會(huì)尋找關(guān)聯(lián)規(guī)則。鍛煉學(xué)生編程、分析、測試程序以及處理實(shí)驗(yàn)結(jié)果的能力。要求學(xué)生課前預(yù)習(xí)實(shí)驗(yàn)指導(dǎo)書,掌握關(guān)聯(lián)規(guī)則產(chǎn)生方法。鼓勵(lì)學(xué)生用Python軟件實(shí)現(xiàn)關(guān)聯(lián)結(jié)果,對實(shí)驗(yàn)過程及結(jié)果有所預(yù)期。指導(dǎo)教師應(yīng)概述實(shí)驗(yàn)的原理、方法及編程等內(nèi)容,并對典型問題作針對性指導(dǎo),以及監(jiān)督實(shí)驗(yàn)室安全運(yùn)轉(zhuǎn)。具體實(shí)驗(yàn)步驟和結(jié)果分析、處理由學(xué)生獨(dú)立完成。實(shí)驗(yàn)內(nèi)容要求如下:課前預(yù)習(xí)內(nèi)容:頻繁項(xiàng)集的基礎(chǔ)知識(shí)。關(guān)聯(lián)規(guī)則產(chǎn)生基本原理。支持度和置信度。關(guān)聯(lián)規(guī)則產(chǎn)生實(shí)驗(yàn),要求:通過對樣本數(shù)據(jù)分析,利用篩選技術(shù),找出數(shù)據(jù)集中的頻繁項(xiàng)集,正確使用apyori模塊,使用apriori函數(shù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,尋找符合最小支持度閾值和最小置信度閾值的關(guān)聯(lián)規(guī)則,要求完成1項(xiàng)關(guān)聯(lián)規(guī)則產(chǎn)生操作。實(shí)驗(yàn)四聚類算法本實(shí)驗(yàn)為操作性實(shí)驗(yàn)。通過實(shí)驗(yàn)操作理解聚類算法的基本原理,使學(xué)生進(jìn)一步掌握各種聚類算法的基本思想,學(xué)會(huì)實(shí)現(xiàn)聚類結(jié)果。鍛煉學(xué)生編程、分析、測試程序以及處理實(shí)驗(yàn)結(jié)果的能力。要求學(xué)生課前預(yù)習(xí)實(shí)驗(yàn)指導(dǎo)書,掌握聚類算法技術(shù)。鼓勵(lì)學(xué)生用Python軟件實(shí)現(xiàn)聚類結(jié)果,對實(shí)驗(yàn)過程及結(jié)果有所預(yù)期。指導(dǎo)教師應(yīng)概述實(shí)驗(yàn)的原理、方法及編程等內(nèi)容,并對典型問題作針對性指導(dǎo),以及監(jiān)督實(shí)驗(yàn)室安全運(yùn)轉(zhuǎn)。具體實(shí)驗(yàn)步驟和結(jié)果分析、處理由學(xué)生獨(dú)立完成。實(shí)驗(yàn)內(nèi)容要求如下:課前預(yù)習(xí)內(nèi)容:聚類的基礎(chǔ)思想。K均值核心思想。層次聚類原理DBSCAN聚類2.K均值、層次聚類、DASCAN聚類,要求:通過對樣本數(shù)據(jù)分析,正確使用sklearn模塊,使用kmeans函數(shù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,尋找符合最小支持度閾值和最小置信度閾值的關(guān)聯(lián)規(guī)則,要求完成1項(xiàng)關(guān)聯(lián)規(guī)則產(chǎn)生操作。實(shí)驗(yàn)五異常檢測本實(shí)驗(yàn)為操作性實(shí)驗(yàn)。通過實(shí)驗(yàn)操作理解異常檢測的基本原理,使學(xué)生進(jìn)一步掌握各種異常檢測算法的基本思想,學(xué)會(huì)尋找離群點(diǎn)。鍛煉學(xué)生編程、分析、測試程序以及處理實(shí)驗(yàn)結(jié)果的能力。要求學(xué)生課前預(yù)習(xí)實(shí)驗(yàn)指導(dǎo)書,掌握異常檢測技術(shù)。鼓勵(lì)學(xué)生用Python軟件實(shí)現(xiàn)結(jié)果,對實(shí)驗(yàn)過程及結(jié)果有所預(yù)期。指導(dǎo)教師應(yīng)概述實(shí)驗(yàn)的原理、方法及編程等內(nèi)容,并對典型問題作針對性指導(dǎo),以及監(jiān)督實(shí)驗(yàn)室安全運(yùn)轉(zhuǎn)。具體實(shí)驗(yàn)步驟和結(jié)果分析、處理由學(xué)生獨(dú)立完成。實(shí)驗(yàn)內(nèi)容要求如下:課前預(yù)習(xí)內(nèi)容:離群點(diǎn)檢測基本原理?;诮y(tǒng)計(jì)模型的離群點(diǎn)檢測。基于聚類的離群點(diǎn)檢測2.基于統(tǒng)計(jì)模型或聚類的離群點(diǎn)檢測,要求:通過估計(jì)概率分布的參數(shù)來建立一個(gè)數(shù)據(jù)類型,如果一個(gè)數(shù)據(jù)對象不能很好地與該模型擬合,即如果它很可能不服從該分布,則它是一個(gè)離群點(diǎn)?;蛘邅G棄遠(yuǎn)離其他簇的小簇為離群點(diǎn)。通過對樣本數(shù)據(jù)分析,正確使用sklearn模塊,使用kmeans函數(shù)進(jìn)行聚類,聚類所有對象,評估對象屬于簇的程度,如果刪除一個(gè)對象導(dǎo)致該目標(biāo)的顯著改進(jìn),可將此對象視為離群點(diǎn),要求完成1項(xiàng)離群點(diǎn)檢測技術(shù)操作。實(shí)驗(yàn)六綜合訓(xùn)練本實(shí)驗(yàn)為操作性實(shí)驗(yàn)。通過實(shí)驗(yàn)操作理解數(shù)據(jù)挖掘各種技術(shù)的基本原理,使學(xué)生進(jìn)一步掌握各種機(jī)器學(xué)習(xí)算法的基本思想,鍛煉學(xué)生編程、分析、測試程序以及處理實(shí)驗(yàn)結(jié)果的能力。要求學(xué)生課前預(yù)習(xí)實(shí)驗(yàn)指導(dǎo)書,鼓勵(lì)學(xué)生用Python軟件實(shí)現(xiàn)結(jié)果,對實(shí)驗(yàn)過程及結(jié)果有所預(yù)期。指導(dǎo)教師應(yīng)概述實(shí)驗(yàn)的原理、方法及編程等內(nèi)容,并對典型問題作針對性指導(dǎo),以及監(jiān)督實(shí)驗(yàn)室安全運(yùn)轉(zhuǎn)。具體實(shí)驗(yàn)步驟和結(jié)果分析、處理由學(xué)生獨(dú)立完成。實(shí)驗(yàn)內(nèi)容要求如下:課前預(yù)習(xí)內(nèi)容:數(shù)據(jù)挖掘各種算法。金融大數(shù)據(jù)相關(guān)知識(shí)。水利大數(shù)據(jù)的相關(guān)知識(shí)2.金融大數(shù)據(jù)、水利大數(shù)據(jù)的綜合應(yīng)用,要求:通過數(shù)據(jù)收集、數(shù)據(jù)爬蟲等方法收集金融、水利等領(lǐng)域的數(shù)據(jù)集,先進(jìn)行數(shù)據(jù)探索分析,對各個(gè)屬性進(jìn)行描述性統(tǒng)計(jì)分析,使用pearson相關(guān)系數(shù)方法,考察各屬性的相關(guān)程度,并使用Lasso回歸方法進(jìn)行特性選擇,消除特征之間的多重共線性問題,并利用SVR、決策樹等方法構(gòu)建模型,并給出相應(yīng)評價(jià),要求至少完成1項(xiàng)實(shí)際行業(yè)數(shù)據(jù)分析操作。5.4教學(xué)文件及教學(xué)形式教學(xué)文件:《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》、《Python數(shù)據(jù)挖掘?qū)崙?zhàn)》。教學(xué)形式主要包括:預(yù)習(xí)、課堂指導(dǎo)與實(shí)驗(yàn)操作、撰寫實(shí)驗(yàn)報(bào)告。實(shí)驗(yàn)報(bào)告學(xué)生自擬。實(shí)驗(yàn)報(bào)告包括:實(shí)驗(yàn)?zāi)康摹⒕幊陶Z言,描述方法原理,詳細(xì)敘述編程步驟,要有完整的數(shù)據(jù)和編程、圖表表示的實(shí)驗(yàn)結(jié)果,以理論聯(lián)系實(shí)際為出發(fā)點(diǎn),調(diào)整參數(shù)并分析與實(shí)際數(shù)據(jù)之間的誤差,總結(jié)實(shí)驗(yàn)中出現(xiàn)的問題及解決方法。5.5實(shí)驗(yàn)項(xiàng)目及學(xué)時(shí)分配序號實(shí)驗(yàn)項(xiàng)目實(shí)驗(yàn)學(xué)時(shí)實(shí)驗(yàn)類型實(shí)驗(yàn)類別實(shí)驗(yàn)性質(zhì)1數(shù)據(jù)預(yù)處理2定量性專業(yè)必修2分類模型4定量性專業(yè)必修3關(guān)聯(lián)規(guī)則2定量性專業(yè)必修4聚類算法2定量性專業(yè)必修5異常檢測2定量性專業(yè)必修6綜合訓(xùn)練4定量性專業(yè)必修5.6本課程實(shí)驗(yàn)用到的場地和儀器大數(shù)據(jù)實(shí)驗(yàn)中心機(jī)房、多功能多媒體設(shè)備、智慧黑板。六、課程學(xué)時(shí)分配教學(xué)課次教學(xué)內(nèi)容教學(xué)環(huán)節(jié)與計(jì)劃時(shí)數(shù)教學(xué)環(huán)節(jié)計(jì)劃時(shí)數(shù)1數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)概述理論課22數(shù)據(jù)類型、數(shù)據(jù)質(zhì)量理論課23數(shù)據(jù)預(yù)處理方法理論課24相似性和相異性的度量理論課25決策樹原理和歸納問題理論課26模型過分?jǐn)M合理論課27評估分類器性能、比較分類器的方法理論課28基于規(guī)則的分類器、最近鄰分類器算法理論課29貝葉斯分類器理論課210人工神經(jīng)網(wǎng)絡(luò)方法理論課211支持向量機(jī)理論課212頻繁項(xiàng)集、規(guī)則產(chǎn)生原理、頻繁項(xiàng)集緊湊表示理論課213FP增長算法理論課214處理分類屬性、連續(xù)屬性、概念分層屬性理論課215序列模式的關(guān)聯(lián)規(guī)則理論課216聚類概念、聚類類型和簇類型、K均值方法理論課217凝聚層次聚類方法理論課218DBSCAN聚類方法理論課219異常檢測統(tǒng)計(jì)方法:基于鄰近度的離群點(diǎn)檢測和基于密度的離群點(diǎn)檢測理論課220金融、醫(yī)療、旅游數(shù)據(jù)案例的綜合應(yīng)用分析理論課221實(shí)驗(yàn)1數(shù)據(jù)預(yù)處理實(shí)驗(yàn)課222實(shí)驗(yàn)2分類模型:決策樹和KNN分類實(shí)驗(yàn)實(shí)驗(yàn)課223實(shí)驗(yàn)3分類模型:貝葉斯分類器和支持向量機(jī)實(shí)驗(yàn)課224實(shí)驗(yàn)4關(guān)聯(lián)規(guī)則實(shí)驗(yàn)課225實(shí)驗(yàn)5聚類算法實(shí)驗(yàn)課226實(shí)驗(yàn)6異常檢測實(shí)驗(yàn)課227實(shí)驗(yàn)7金融和經(jīng)濟(jì)大數(shù)據(jù)實(shí)踐實(shí)驗(yàn)課228實(shí)驗(yàn)8旅游和醫(yī)療大數(shù)據(jù)實(shí)踐實(shí)驗(yàn)課2注:實(shí)驗(yàn)課由任課教師負(fù)責(zé)協(xié)調(diào)安排時(shí)間。七、課程考核與成績評定7.1考核方式考核環(huán)節(jié)包括課程學(xué)習(xí)過程考核和期末考試,其中課程過程考核占總成績的30%,分別由課堂表現(xiàn)、課后作業(yè)、實(shí)驗(yàn)情況進(jìn)行評定;期末考試成績占總成績的70%。各環(huán)節(jié)的比重如下。考核環(huán)節(jié)比重合計(jì)過程考核(平時(shí)成績)課堂表現(xiàn)10%30%作業(yè)10%實(shí)驗(yàn)10%期末成績期末測試70%70%總計(jì)100%100%7.2考核內(nèi)容及要求本課程為考試課??己藘?nèi)容及分值分配如下??己朔绞娇己藘?nèi)容分值課程目標(biāo)總分值期末考試70%數(shù)據(jù)挖掘任務(wù)2~4目標(biāo)1100分?jǐn)?shù)據(jù)預(yù)處理5~10目標(biāo)1、7決策樹的最佳屬性選擇問題10~15目標(biāo)2、7KNN分類器5~8目標(biāo)2、7貝葉斯分類器10~15目標(biāo)2、7人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)5~10目標(biāo)2、7關(guān)聯(lián)規(guī)則產(chǎn)生10~15目標(biāo)3、6聚類算法10~15目標(biāo)4、6異常檢測算法2~5目標(biāo)5、6過程考核30%課堂表現(xiàn)課堂測試、出勤情況10目標(biāo)1、2、3、4、5、6、710分課后作業(yè)作業(yè)完成情況10目標(biāo)2、3、4、6、7、810分實(shí)驗(yàn)實(shí)驗(yàn)出勤、實(shí)驗(yàn)表現(xiàn)及實(shí)驗(yàn)報(bào)告10目標(biāo)1、2、3、4、5、6、7、810分7.3成績評定1.課堂表現(xiàn)課堂表現(xiàn)總分10分,由課堂測試與課堂出勤情況評定。其中,課堂測試滿分6分,以客觀題(填空、選擇、判斷)為主,每學(xué)期隨堂測試15~20次,每次測試1~2道題目,每答錯(cuò)一道題目扣0.5分(直到扣滿6分為止);課堂出勤滿分4分,缺勤一次扣1分,遲到或請假扣0.5分。2.課后作業(yè)課后作業(yè)總分10分,由作業(yè)完成情況評定。每學(xué)期布置作業(yè)5次,每次作業(yè)占2分,評分標(biāo)準(zhǔn)如下;評分標(biāo)準(zhǔn)分值標(biāo)準(zhǔn)描述課后作業(yè)3能夠按時(shí)認(rèn)真完成作業(yè)、作業(yè)態(tài)度認(rèn)真、書寫清楚、分析計(jì)算正確。2能夠按時(shí)完成作業(yè)、作業(yè)態(tài)度較好、書寫較清楚、分析計(jì)算基本正確1能夠按時(shí)完成作業(yè)、作業(yè)態(tài)度一般、書寫不清楚、分析計(jì)算錯(cuò)誤較多0不交作業(yè)或作業(yè)態(tài)度不認(rèn)真、抄襲他人作業(yè)3.實(shí)驗(yàn)成績實(shí)驗(yàn)成績占所學(xué)課程的10%,即10分。根據(jù)學(xué)生的實(shí)驗(yàn)表現(xiàn)及實(shí)驗(yàn)報(bào)告結(jié)果,進(jìn)行綜合評定。具體評分標(biāo)準(zhǔn)如下表所示。評分標(biāo)準(zhǔn)分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 故宮博物館藏寶物的故事解讀
- 《接觸網(wǎng)施工》課件 2.2.1 基坑開挖
- 2024年新政策背景下EHS法律法規(guī)培訓(xùn)的挑戰(zhàn)與機(jī)遇
- 2023年溫州市殘疾人職業(yè)技能大賽-動(dòng)畫繪制員項(xiàng)目技術(shù)文件
- 2024年eepo培訓(xùn)心得體會(huì)與思考
- 2024版TBC軟件學(xué)習(xí)手冊:入門與精通
- 2023年安全工程師《安全生產(chǎn)法及法律》題庫版
- 2024年《條據(jù)》公開課教案:培育新世代技能
- 中級保育員測試題(附答案)
- 2024年教學(xué)革新:《長恨歌》課件的新體驗(yàn)
- 螺紋一螺紋基礎(chǔ)知識(shí)
- 超星爾雅學(xué)習(xí)通《海上絲綢之路》章節(jié)測試附答案
- DB42T169-2022巖土工程勘察規(guī)程
- 房顫合并心力衰竭的治療課件
- 《建筑制圖基礎(chǔ)實(shí)訓(xùn)》畫圖大作業(yè)布置
- 優(yōu)質(zhì)《春天的色彩》課件
- DB4101-T 25.2-2021物業(yè)服務(wù)規(guī)范 第2部分:住宅-(高清現(xiàn)行)
- 我們的家園-公開課獲獎(jiǎng)?wù)n件
- 濕式電除塵器安裝施工方案(推薦文檔)
- 中藥的發(fā)展及研究思路課件
- 總承包項(xiàng)目部安全風(fēng)險(xiǎn)分級管控管理辦法
評論
0/150
提交評論