版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
《大數(shù)據(jù)分析與挖掘》教學(xué)大綱一、課程基本信息課程名稱大數(shù)據(jù)分析與挖掘BigDataAnalysisAndMining課程編碼SCC320511030開課院部理學(xué)院課程團(tuán)隊(duì)數(shù)據(jù)科學(xué)團(tuán)隊(duì)學(xué)分3.0課內(nèi)學(xué)時(shí)52講授40實(shí)驗(yàn)0上機(jī)12實(shí)踐0課外學(xué)時(shí)52適用專業(yè)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)授課語言中文先修課程數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論、Python語言與實(shí)訓(xùn)課程簡介(必修)大數(shù)據(jù)分析與挖掘的主要任務(wù)是從大量數(shù)據(jù)中發(fā)現(xiàn)潛在有用的知識和數(shù)據(jù)模式,是統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、機(jī)器學(xué)習(xí)等多門學(xué)科的交叉學(xué)科。本課程是數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)必修課,信息與計(jì)算科學(xué)專業(yè)選修課,將系統(tǒng)介紹大數(shù)據(jù)分析與數(shù)據(jù)挖掘的基本概念和經(jīng)典方法,主要內(nèi)容包括:數(shù)據(jù)預(yù)處理、線性模型、決策樹、聚類分析、核方法等。通過本課程的學(xué)習(xí),學(xué)生能掌握大數(shù)據(jù)分析與數(shù)據(jù)挖掘的基本算法及其原理,具備分析和建立大數(shù)據(jù)模型的能力,完成基本的數(shù)據(jù)挖掘任務(wù)。Dataminingisaprocessofdiscoveringpotentiallyusefulknowledgeanddatapatternsfromalargeamountofdata.Itisacrossdisciplinewhichcombinesstatistics,computerscience,machinelearningandsoon.ThiscourseisacompulsorycourseforthemajorofDataScienceandBigDataTechnologyandthespecialtyforthemajorofInformationandComputingScience.Itwillintroducethebasicconceptsandclassicalalgorithmsofdatamining.Themaincontentsinclude:dataprocessing,linearmodel,extendedlinearmodel,decisiontree,ensemblelearning,datastreamlearning.Throughthelearningofthiscourse,studentswouldmasterthebasicalgorithmsofdataminingandthecorrespondingprinciples,andcanusedataminingsoftwaretocompletetheapplicationtasks.負(fù)責(zé)人大綱執(zhí)筆人審核人二、課程目標(biāo)序號代號課程目標(biāo)OBE畢業(yè)要求指標(biāo)點(diǎn)任務(wù)自選1M1目標(biāo)1:掌握常用的數(shù)據(jù)挖掘建模方法,能夠量化分析自然科學(xué)與社會科學(xué)中的實(shí)際問題,具備建立和分析大數(shù)據(jù)模型的能力。是4.22M2目標(biāo)2:掌握大數(shù)據(jù)分析的基本方法,建立數(shù)據(jù)思維和較強(qiáng)的數(shù)據(jù)分析與處理能力,并能用相關(guān)數(shù)據(jù)分析方法處理實(shí)際數(shù)據(jù)集。是3.13M3目標(biāo)3:具備良好的表達(dá)和溝通能力,就大數(shù)據(jù)技術(shù)領(lǐng)域的具體問題進(jìn)行有效的溝通和交流,清楚地闡述專業(yè)觀點(diǎn)。是6.24M4目標(biāo)4:能保障課程正常秩序否三、課程內(nèi)容序號章節(jié)號標(biāo)題課程內(nèi)容/重難點(diǎn)支撐課程目標(biāo)課內(nèi)學(xué)時(shí)教學(xué)方式課外學(xué)時(shí)課外環(huán)節(jié)1第一章第一章大數(shù)據(jù)分析與挖掘概述數(shù)據(jù)挖掘內(nèi)涵和基本特征、數(shù)據(jù)清洗/////21.11.1數(shù)據(jù)分析與挖掘簡介數(shù)據(jù)挖掘任務(wù)類型M1,M2,M32講授/討論2自學(xué)31.21.2數(shù)據(jù)預(yù)處理聚焦;抽樣;維歸約;特征創(chuàng)建;變量變換M1,M2,M32講授2自學(xué)/作業(yè)4第二章第二章關(guān)聯(lián)分析關(guān)聯(lián)規(guī)則的定義、關(guān)聯(lián)規(guī)則算法、關(guān)聯(lián)評估////52.12.1關(guān)聯(lián)分析基本概念頻繁項(xiàng)集;先驗(yàn)原理M1,M2,M32講授2自學(xué)/作業(yè)62.22.2Apriori算法支持度計(jì)數(shù);計(jì)算繁雜度;頻繁項(xiàng)集的緊湊表示M1,M2,M32講授2自學(xué)/作業(yè)72.32.3案例:超市購物籃分析超市購物籃分析M1,M2,M32講授2作業(yè)8上機(jī)1上機(jī)上機(jī)M1,M22上機(jī)/實(shí)驗(yàn)2作業(yè)9第三章第三章分類分析樸素貝葉斯分類模型,支持向量機(jī)分類模型,邏輯回歸,k近鄰分類/////103.13.1貝葉斯分類模型貝葉斯原理,樸素貝葉斯假設(shè)M1,M2,M32講授2自學(xué)/作業(yè)113.23.2感知機(jī)模型感知機(jī),多層神經(jīng)網(wǎng)絡(luò)M1,M2,M32講授2自學(xué)/作業(yè)123.33.3支持向量機(jī)分類模型線性SVM;非線性SVM;結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理M1,M2,M31講授1自學(xué)/作業(yè)133.43.4k近鄰分類k近鄰算法,參數(shù)選取M1,M2,M31講授1自學(xué)/作業(yè)14上機(jī)2上機(jī)上機(jī)M1,M22上機(jī)/實(shí)驗(yàn)2自學(xué)/作業(yè)153.53.5決策樹分類決策樹基本算法;屬性測試條件M1,M2,M32講授2自學(xué)/作業(yè)163.63.6集成學(xué)習(xí)組合方法的基本原理;bagging;boostingM1,M2,M32講授2自學(xué)/作業(yè)173.73.7案例:手寫字識別、垃圾郵件過濾手寫字識別、垃圾郵件過濾M1,M2,M32講授2自學(xué)/作業(yè)18上機(jī)3上機(jī)上機(jī)M1,M22上機(jī)/實(shí)驗(yàn)2作業(yè)19第四章第四章回歸分析線性回歸模型,嶺回歸模型,LASSO模型,非線性回歸模型/////204.14.1回歸模型簡介線性回歸模型;嶺回歸模型;LASSO模型;模型改M1,M2,M32講授2自學(xué)/作業(yè)214.24.2非線性回歸模型核學(xué)習(xí)M1,M2,M32講授2自學(xué)/作業(yè)224.34.3案例:財(cái)政收入影響因素分析及預(yù)測案例:財(cái)政收入影響因素分析及預(yù)測M1,M2,M32講授2自學(xué)/作業(yè)23上機(jī)4上機(jī)上機(jī)M1,M2,M32上機(jī)/實(shí)驗(yàn)2作業(yè)24第五章第五章聚類分析與異常檢測相似性度量、k均值聚類、EM算法/////255.15.1k均值聚類k均值聚類算法;二分K均值M1,M2,M32講授2自學(xué)/作業(yè)265.25.2高維數(shù)據(jù)聚類高維數(shù)據(jù)降維M1,M2,M32講授2自學(xué)/作業(yè)275.35.3異常檢測基于統(tǒng)計(jì)的異常檢測;基于鄰近度的方法;基于聚類的方法M1,M2,M32講授2自學(xué)/作業(yè)285.45.4案例:客戶價(jià)值分析案例:客戶價(jià)值分析M1,M2,M32講授2自學(xué)/作業(yè)29上機(jī)5上機(jī)上機(jī)M1,M22上機(jī)/實(shí)驗(yàn)2作業(yè)30第六章第六章數(shù)據(jù)流挖掘數(shù)據(jù)流在線分類算法、數(shù)據(jù)流在線聚類算法/////316.16.1數(shù)據(jù)流分類數(shù)據(jù)流的概念;數(shù)據(jù)流分類算法;RegretboundM1,M2,M32講授2自學(xué)/作業(yè)326.26.2數(shù)據(jù)流聚類分析數(shù)據(jù)流聚類算法M1,M2,M32講授2自學(xué)/作業(yè)33上機(jī)6上機(jī)上機(jī)M1,M22上機(jī)/實(shí)驗(yàn)2課程大作業(yè)四、考核方式序號考核環(huán)節(jié)操作細(xì)節(jié)總評占比1平時(shí)作業(yè)1.每周布置至少2道題目,平均每次課1道題以上。2.成績采用百分制,根據(jù)作業(yè)完成準(zhǔn)確性、是否按時(shí)上交、是否獨(dú)立完成評分。20%2平時(shí)表現(xiàn)1.課堂表現(xiàn)。2.考勤。3.能保障課程正常秩序。15%3課程實(shí)踐報(bào)告1.本課程要求學(xué)生獨(dú)立或小組合作的形式,采用指定編程語言,完成指定數(shù)據(jù)集的數(shù)據(jù)預(yù)處理、數(shù)據(jù)建模、分析和評估任務(wù);2.根據(jù)實(shí)踐報(bào)告質(zhì)量和學(xué)生所完成的工作進(jìn)行評分。40%4上機(jī)作業(yè)1.按要求按時(shí)完成上機(jī)題目2.根據(jù)上機(jī)作業(yè)完成質(zhì)量、是否按時(shí)上交進(jìn)行評分25%五、評分細(xì)則序號課程目標(biāo)考核環(huán)節(jié)大致占比評分等級1M1平時(shí)作業(yè)30%D作業(yè)抄襲,未能按時(shí)完成,缺交作業(yè)C獨(dú)立思考、按時(shí)完成,格式比較合理、70%的作業(yè)評價(jià)為A,A+B獨(dú)立思考、按時(shí)完成,步驟比較完整、80%的作業(yè)評價(jià)為A,A+A獨(dú)立思考、按時(shí)完成,解題思路清晰、格式合理、90%的作業(yè)評價(jià)為A,A+2M1平時(shí)表現(xiàn)20%D不參與課堂互動,不能保障課堂正常秩序C較少參與課堂互動,不能保障課堂正常秩序B精神狀態(tài)良好,問題回答較好,能夠保障課堂正常秩序A積極回答問題,精神狀態(tài)飽滿,能夠保障課堂正常秩序3M1課程實(shí)踐報(bào)告50%D未完成數(shù)據(jù)處理和模型建立、分析任務(wù)C數(shù)據(jù)處理和模型建立、分析時(shí)存在一定缺陷B基本完成數(shù)據(jù)處理、模型建立、分析和評估任務(wù)A高質(zhì)量完成數(shù)據(jù)處理、模型建立、分析和評估任務(wù)。4M2平時(shí)作業(yè)10%D作業(yè)抄襲,未能按時(shí)完成,缺交作業(yè)C獨(dú)立思考、按時(shí)完成,格式比較合理、70%的作業(yè)評價(jià)為A,A+B獨(dú)立思考、按時(shí)完成,步驟比較完整、80%的作業(yè)評價(jià)為A,A+A獨(dú)立思考、按時(shí)完成,解題思路清晰、格式合理、90%的作業(yè)評價(jià)為A,A+5M2平時(shí)表現(xiàn)15%D不參與課堂互動,不能保障課堂正常秩序C較少參與課堂互動,不能保障課堂正常秩序B精神狀態(tài)良好,問題回答較好,能夠保障課堂正常秩序A積極回答問題,精神狀態(tài)飽滿,能夠保障課堂正常秩序6M2上機(jī)作業(yè)35%A作業(yè)及時(shí)完成,能夠完成基本數(shù)據(jù)分析任務(wù),完成部分選作題,有自己的見解B作業(yè)及時(shí)完成,能夠完成基本數(shù)據(jù)分析任務(wù)C部分完成基本數(shù)據(jù)分析任務(wù),方法或模型選擇存在一定缺陷7M2課程實(shí)踐報(bào)告40%D未完成數(shù)據(jù)處理和模型建立、分析任務(wù)C數(shù)據(jù)處理和模型建立、分析時(shí)存在一定缺陷B基本完成數(shù)據(jù)處理、模型建立、分析和評估任務(wù)A高質(zhì)量完成數(shù)據(jù)處理、模型建立、分析和評估任務(wù)8M3平時(shí)作業(yè)20%D作業(yè)抄襲,未能按時(shí)完成,缺交作業(yè)C獨(dú)立思考、按時(shí)完成,格式比較合理、70%的作業(yè)評價(jià)為A,A+B獨(dú)立思考、按時(shí)完成,步驟比較完整、80%的作業(yè)評價(jià)為A,A+A獨(dú)立思考、按時(shí)完成,解題思路清晰、格式合理、90%的作業(yè)評價(jià)為A,A+9M3平時(shí)表現(xiàn)40%D不參與課堂互動,不能保障課堂正常秩序C較少參與課堂互動,不能保障課堂正常秩序B精神狀態(tài)良好,問題回答較好,能夠保障課堂正常秩序A積極回答問題,精神狀態(tài)飽滿,能夠保障課堂正常秩序10M3課程實(shí)踐報(bào)告40%D未完成數(shù)據(jù)處理和模型建立、分析任務(wù)C數(shù)據(jù)處理和模型建立、分析時(shí)存在一定缺陷B基本完成數(shù)據(jù)處理、模型建立、分析和評估任務(wù)A高質(zhì)量完成數(shù)據(jù)處理、模型建立、分析和評估任務(wù)11M4平時(shí)表現(xiàn)100%D不參與課堂互動,不能保障課堂正常秩序C較少參與課堂互動,不能保障課堂正常秩序B精神狀態(tài)良好,問題回答較好,能夠保
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 湖北省2023-2024學(xué)年普通高中學(xué)業(yè)水平合格性考試仿真模擬卷英語試卷
- 中國車座墊行業(yè)市場調(diào)查研究及投資前景預(yù)測報(bào)告
- 四年級數(shù)學(xué)(四則混合運(yùn)算)計(jì)算題專項(xiàng)練習(xí)與答案
- 桁架式電動升降雷達(dá)塔 7米高透波玻璃鋼避雷針 玻璃纖維照明燈桿
- 餐飲知識類培訓(xùn)課件圖片
- 年產(chǎn)80萬套制動鼓輪轂提質(zhì)升級項(xiàng)目可行性研究報(bào)告模板-立項(xiàng)備案
- 樹立正確職業(yè)心態(tài)
- 車床數(shù)控知識培訓(xùn)課件
- 生成式人工智能的教育應(yīng)用與展望-以ChatGPT 系統(tǒng)為例
- 臨床類風(fēng)濕關(guān)節(jié)炎疾病概述、臨床表現(xiàn)、治療原則、要護(hù)理問題、相關(guān)因素、護(hù)理重點(diǎn)及健康指導(dǎo)
- 代縣雁門光伏升壓站~寧遠(yuǎn)220kV線路工程環(huán)評報(bào)告
- 承諾函(支付寶)
- 危險(xiǎn)化學(xué)品目錄2023
- FZ/T 81024-2022機(jī)織披風(fēng)
- GB/T 24123-2009電容器用金屬化薄膜
- 艾滋病梅毒乙肝實(shí)驗(yàn)室檢測
- 國鐵橋梁人行道支架制作及安裝施工要點(diǎn)課件
- 領(lǐng)導(dǎo)科學(xué)全套精講課件
- 粵教版地理七年級下冊全冊課件
- 小學(xué)科學(xué)蘇教版六年級上冊全冊精華知識點(diǎn)(2022新版)
- 萎縮性胃炎共識解讀
評論
0/150
提交評論