版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《應(yīng)用多元統(tǒng)計(jì)分析》教學(xué)大綱課程名稱(chēng):應(yīng)用多元統(tǒng)計(jì)分析課程編號(hào):F094092621英文名稱(chēng):Appliedmultivariatestatisticalanalysis學(xué)時(shí):48學(xué)時(shí) 學(xué)分:3學(xué)分開(kāi)課學(xué)期:第5學(xué)期適用專(zhuān)業(yè):數(shù)據(jù)科學(xué)與大數(shù)據(jù)專(zhuān)業(yè)課程類(lèi)別:理論課課程性質(zhì):專(zhuān)業(yè)核心課先修課程:高等數(shù)學(xué)、線性代數(shù)、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論、數(shù)據(jù)采集與清洗、Python程序設(shè)計(jì)、概率論基礎(chǔ)、數(shù)理統(tǒng)計(jì)一、課程的性質(zhì)及任務(wù)《應(yīng)用多元統(tǒng)計(jì)分析》課程是數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專(zhuān)業(yè)學(xué)生的一門(mén)專(zhuān)業(yè)核心課,是培養(yǎng)大數(shù)據(jù)科學(xué)技術(shù)人才整體知識(shí)結(jié)構(gòu)的重要組成部分。通過(guò)本課程的學(xué)習(xí),使學(xué)生能夠了解多元統(tǒng)計(jì)分析在數(shù)據(jù)分析結(jié)構(gòu)中的地位與作用;了解常見(jiàn)的數(shù)據(jù)類(lèi)型;了解常見(jiàn)的數(shù)據(jù)分布與統(tǒng)計(jì)檢驗(yàn)方法;能夠理解多元正態(tài)分布中均值向量、協(xié)方差矩陣的意義,并掌握參數(shù)估計(jì)的計(jì)算方法;能夠理解有監(jiān)督學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí)的區(qū)別;能夠應(yīng)用線性降維方法對(duì)多指標(biāo)數(shù)據(jù)進(jìn)行降維,并進(jìn)行后續(xù)的分類(lèi)、評(píng)價(jià)等分析;能夠應(yīng)用對(duì)應(yīng)分析方法對(duì)調(diào)查數(shù)據(jù)中的產(chǎn)品作定位分析、客戶(hù)畫(huà)像分析等;能夠應(yīng)用回歸分析對(duì)影響因素重要性作分析,對(duì)研究問(wèn)題的未來(lái)趨勢(shì)作預(yù)測(cè)并為決策提供理論依據(jù);具備綜合應(yīng)用多元統(tǒng)計(jì)分析中的分類(lèi)方法、降維方法、相關(guān)方法等分析、解決各種多指標(biāo)數(shù)據(jù)問(wèn)題的能力。依據(jù)河北工程大學(xué)數(shù)據(jù)科學(xué)與大數(shù)據(jù)專(zhuān)業(yè)培養(yǎng)計(jì)劃,本課程需要培養(yǎng)學(xué)生的能力是:能夠基于數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)原理,通過(guò)文獻(xiàn)研究或相關(guān)方法,調(diào)研和分析大數(shù)據(jù)應(yīng)用領(lǐng)域復(fù)雜工程問(wèn)題的解決方案(畢業(yè)要求指標(biāo)4-1)能夠主動(dòng)與其他學(xué)科背景的成員合作開(kāi)展工作(畢業(yè)要求指標(biāo)9-2)能及時(shí)跟蹤大數(shù)據(jù)及相關(guān)行業(yè)發(fā)展?fàn)顩r,并就當(dāng)前的熱點(diǎn)問(wèn)題發(fā)表自己的見(jiàn)解(畢業(yè)要求指標(biāo)10-1)具有良好的表達(dá)能力和專(zhuān)業(yè)的描述方式,能夠與業(yè)界同行及社會(huì)公眾進(jìn)行準(zhǔn)確、高效的溝通和交流(畢業(yè)要求指標(biāo)10-2)能夠在大數(shù)據(jù)工程實(shí)踐和研究活動(dòng)中根據(jù)需要撰寫(xiě)工作報(bào)告、設(shè)計(jì)文檔,以及口頭匯報(bào)、演講、談判等(畢業(yè)要求指標(biāo)10-4)二、課程目標(biāo)與要求2.1課程目標(biāo)培養(yǎng)學(xué)生正確的人生觀、價(jià)值觀,厚置學(xué)生愛(ài)國(guó)情懷。能理解數(shù)據(jù)類(lèi)型,理解數(shù)據(jù)分布形態(tài)。能理解多元正態(tài)分布中總體參數(shù)的定義、幾何意義、計(jì)算方法。能理解統(tǒng)計(jì)檢驗(yàn)的思想,掌握統(tǒng)計(jì)檢驗(yàn)的方法。掌握常用的多元統(tǒng)計(jì)分析方法的基本理論和實(shí)現(xiàn)方法,能夠利用所學(xué)的統(tǒng)計(jì)分析方法分析實(shí)際經(jīng)濟(jì)社會(huì)、工程管理等領(lǐng)域案例,為其就業(yè)與繼續(xù)深造打下必要而有用的基礎(chǔ)。突出專(zhuān)業(yè)能力培養(yǎng)要求,使學(xué)生熟練掌握多元統(tǒng)計(jì)分析的常用方法,使學(xué)生具備一定的分析數(shù)據(jù),處理數(shù)據(jù)和分析寫(xiě)作能力,為今后從事數(shù)據(jù)分析相關(guān)的工作打下良好的專(zhuān)業(yè)基礎(chǔ)。提升學(xué)生的數(shù)據(jù)分析的科學(xué)素養(yǎng),培養(yǎng)學(xué)生實(shí)事求是、科學(xué)創(chuàng)新、團(tuán)結(jié)協(xié)作及吃苦耐勞的精神,奠定學(xué)生從事統(tǒng)計(jì)相關(guān)專(zhuān)業(yè)可持續(xù)發(fā)展的基礎(chǔ)。提升學(xué)生實(shí)際動(dòng)手能力,培養(yǎng)學(xué)生分析問(wèn)題,解決問(wèn)題,算法設(shè)計(jì),科學(xué)創(chuàng)新精神,適應(yīng)大數(shù)據(jù)時(shí)代和數(shù)字經(jīng)濟(jì)時(shí)代對(duì)人才的需求。
應(yīng)用多元統(tǒng)計(jì)分析課程教學(xué)大綱PAGE16PAGE152.2課程目標(biāo)與畢業(yè)要求對(duì)應(yīng)關(guān)系課程目標(biāo)畢業(yè)要求二級(jí)指標(biāo)畢業(yè)要求12345678●●●●4-2能夠針對(duì)智能信息系統(tǒng)設(shè)計(jì)、大數(shù)據(jù)技術(shù)應(yīng)用等大數(shù)據(jù)應(yīng)用領(lǐng)域的復(fù)雜工程問(wèn)題設(shè)計(jì)實(shí)驗(yàn)方案、構(gòu)建實(shí)驗(yàn)系統(tǒng)和測(cè)試平臺(tái)、獲得實(shí)驗(yàn)結(jié)果4.工程技術(shù)研究能力:能夠基于數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)原理并采用科學(xué)方法對(duì)大數(shù)據(jù)應(yīng)用領(lǐng)域的復(fù)雜工程問(wèn)題進(jìn)行研究,包括設(shè)計(jì)實(shí)驗(yàn)、分析與解釋數(shù)據(jù)、并通過(guò)信息綜合得到合理有效的結(jié)論。●●9-2能夠主動(dòng)與其他學(xué)科背景的成員合作開(kāi)展工作9.個(gè)人和團(tuán)隊(duì):具有健康的體魄和良好的綜合素質(zhì),能夠正確理解多學(xué)科背景下團(tuán)隊(duì)中個(gè)體、團(tuán)隊(duì)成員以及負(fù)責(zé)人的角色,并承擔(dān)其責(zé)任與義務(wù)●10-1能及時(shí)跟蹤大數(shù)據(jù)及相關(guān)行業(yè)發(fā)展?fàn)顩r,并就當(dāng)前的熱點(diǎn)問(wèn)題發(fā)表自己的見(jiàn)解10.溝通與交流:具有溝通的能力、方法和技巧,能夠就大數(shù)據(jù)應(yīng)用領(lǐng)域的復(fù)雜工程問(wèn)題與業(yè)界同行及社會(huì)公眾進(jìn)行有效溝通和交流,包括撰寫(xiě)報(bào)告及設(shè)計(jì)文稿,清晰表達(dá)和答辯;并具備一定的國(guó)際視野,能夠在跨文化背景下進(jìn)行溝通和交流?!瘛瘛?0-2具有良好的表達(dá)能力和專(zhuān)業(yè)的描述方式,能夠與業(yè)界同行及社會(huì)公眾進(jìn)行準(zhǔn)確、高效的溝通和交流●10-4能夠在大數(shù)據(jù)工程實(shí)踐和研究活動(dòng)中根據(jù)需要撰寫(xiě)工作報(bào)告、設(shè)計(jì)文檔,以及口頭匯報(bào)、演講、談判等2.3課程目標(biāo)與培養(yǎng)環(huán)節(jié)對(duì)應(yīng)矩陣序號(hào)課程目標(biāo)理論教學(xué)課內(nèi)實(shí)驗(yàn)課后作業(yè)1培養(yǎng)學(xué)生正確的人生觀、價(jià)值觀,厚置學(xué)生愛(ài)國(guó)情懷。H2能理解數(shù)據(jù)類(lèi)型,理解數(shù)據(jù)分布形態(tài)。HL3能理解多元正態(tài)分布中總體參數(shù)的定義、幾何意義、計(jì)算方法。HL4能理解統(tǒng)計(jì)檢驗(yàn)的思想,掌握統(tǒng)計(jì)檢驗(yàn)的方法。HL5掌握常用的多元統(tǒng)計(jì)分析方法的基本理論和實(shí)現(xiàn)方法,能夠利用所學(xué)的統(tǒng)計(jì)分析方法分析實(shí)際經(jīng)濟(jì)社會(huì)、工程管理等領(lǐng)域案例,為其就業(yè)與繼續(xù)深造打下必要而有用的基礎(chǔ)。HML6突出專(zhuān)業(yè)能力培養(yǎng)要求,使學(xué)生熟練掌握多元統(tǒng)計(jì)分析的常用方法,使學(xué)生具備一定的分析數(shù)據(jù),處理數(shù)據(jù)和分析寫(xiě)作能力,為今后從事數(shù)據(jù)分析相關(guān)的工作打下良好的專(zhuān)業(yè)基礎(chǔ)。HMM7提升學(xué)生的數(shù)據(jù)分析科學(xué)素養(yǎng),培養(yǎng)學(xué)生實(shí)事求是、科學(xué)創(chuàng)新、團(tuán)結(jié)協(xié)作及吃苦耐勞的精神,奠定學(xué)生從事統(tǒng)計(jì)相關(guān)專(zhuān)業(yè)可持續(xù)發(fā)展的基礎(chǔ)。HMM8提升學(xué)生實(shí)際動(dòng)手能力,培養(yǎng)學(xué)生分析問(wèn)題,解決問(wèn)題,算法設(shè)計(jì),科學(xué)創(chuàng)新精神,適應(yīng)大數(shù)據(jù)時(shí)代和數(shù)字經(jīng)濟(jì)時(shí)代對(duì)人才的需求。HHL注:H表示該能力的在此環(huán)節(jié)重點(diǎn)培養(yǎng);M表示該能力在此環(huán)節(jié)有應(yīng)用要求;L表示該能力在此環(huán)節(jié)有所涉及。分布式存儲(chǔ)與計(jì)算課程教學(xué)大綱PAGE2PAGE12.4目標(biāo)達(dá)成度的評(píng)價(jià)課程目標(biāo)1主要通過(guò)教師的言傳身教,在學(xué)生日常行為中有所涉及。主要通過(guò)課堂討論、課后交流、實(shí)驗(yàn)報(bào)告的進(jìn)行考核。目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評(píng)價(jià)。課程目標(biāo)2、3、4、5主要通過(guò)理論教學(xué)環(huán)節(jié)進(jìn)行培養(yǎng),在課后作業(yè)中有所涉及。主要通過(guò)課堂測(cè)試、課后作業(yè)和期末考試中概念性、原理性題目進(jìn)行考核。目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評(píng)價(jià)。課程目標(biāo)6主要通過(guò)理論教學(xué)環(huán)節(jié)、課后作業(yè)進(jìn)行培養(yǎng),在課后作業(yè)和課內(nèi)實(shí)驗(yàn)中有應(yīng)用要求。主要通過(guò)課堂測(cè)試,課后作業(yè)和期末考試中對(duì)多元數(shù)據(jù)分析原理、思想、數(shù)學(xué)模型、算法設(shè)計(jì)等進(jìn)行考核,在實(shí)驗(yàn)中體現(xiàn)為能根據(jù)實(shí)驗(yàn)?zāi)康膶?duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行綜合分析。目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評(píng)價(jià)。課程目標(biāo)7主要通過(guò)理論教學(xué)環(huán)節(jié)進(jìn)行培養(yǎng),在課后作業(yè)和課內(nèi)實(shí)驗(yàn)中有應(yīng)用要求。主要通過(guò)課堂測(cè)試、課后作業(yè)中參數(shù)計(jì)算、性質(zhì)分析等題目進(jìn)行考核,在實(shí)驗(yàn)報(bào)告中體現(xiàn)為能給出符合要求的數(shù)值化結(jié)果、圖形化表示等。目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評(píng)價(jià)。課程目標(biāo)8主要通過(guò)課內(nèi)實(shí)驗(yàn)培養(yǎng),在課后作業(yè)中有所涉及。在課后作業(yè)中體現(xiàn)為能夠按照要求完成算法設(shè)計(jì);在實(shí)驗(yàn)報(bào)告中要對(duì)實(shí)驗(yàn)過(guò)程進(jìn)行描述、對(duì)實(shí)驗(yàn)數(shù)據(jù)的處理與解釋、對(duì)實(shí)驗(yàn)結(jié)果的評(píng)價(jià)結(jié)論。目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評(píng)價(jià)。三、教學(xué)方法及手段理論教學(xué)以課堂講授為主,面向基礎(chǔ)知識(shí)的準(zhǔn)確、扎實(shí)掌握,突出對(duì)原理的分析、對(duì)方法的總結(jié)以及理論體系的完整建立;理論教學(xué)強(qiáng)調(diào)將各種數(shù)據(jù)分析方法與工程管理中的實(shí)際情況緊密聯(lián)系,面向知識(shí)的實(shí)際應(yīng)用;理論教學(xué)注重本課程與線性代數(shù)、數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)導(dǎo)論、數(shù)據(jù)采集與清洗、Python程序設(shè)計(jì)、概率論基礎(chǔ)、數(shù)理統(tǒng)計(jì)等先修課程的聯(lián)系,以工程管理中的數(shù)據(jù)問(wèn)題作為本課程知識(shí)的應(yīng)用背景,結(jié)合多元數(shù)據(jù)分析原理的相關(guān)理論解釋本課程的有關(guān)概念和原理,基于數(shù)據(jù)分析的基礎(chǔ)知識(shí)掌握多元數(shù)據(jù)分析、算法設(shè)計(jì)與實(shí)驗(yàn)設(shè)計(jì)。理論教學(xué)與課內(nèi)練習(xí)相結(jié)合,進(jìn)行多元數(shù)據(jù)分析的應(yīng)用與訓(xùn)練。課程強(qiáng)調(diào)學(xué)生的自主學(xué)習(xí),強(qiáng)調(diào)通過(guò)自學(xué)的方式消化、吸收課程的龐大知識(shí)量,并在此基礎(chǔ)上舉一反三。四、課程的基本內(nèi)容與教學(xué)要求第1章緒論[教學(xué)目的與要求]:了解多元統(tǒng)計(jì)學(xué)的發(fā)展過(guò)程和現(xiàn)狀,了解多元統(tǒng)計(jì)分析的學(xué)習(xí)內(nèi)容及應(yīng)用背景,掌握常見(jiàn)的數(shù)據(jù)類(lèi)型及其分類(lèi)依據(jù),掌握常見(jiàn)的數(shù)據(jù)預(yù)處理方法,掌握矩陣特征值、特征向量的計(jì)算方法及其幾何意義。[本章主要內(nèi)容]:1.1多元統(tǒng)計(jì)學(xué)(支撐課程目標(biāo)1)1.2數(shù)據(jù)預(yù)處理(支撐課程目標(biāo)2)1.3矩陣譜理論(支撐課程目標(biāo)1)[本章重點(diǎn)]:數(shù)據(jù)類(lèi)型及分類(lèi)依據(jù)。數(shù)據(jù)預(yù)處理方法。矩陣特征值、特征向量。[本章難點(diǎn)]:數(shù)據(jù)類(lèi)型的分類(lèi)及轉(zhuǎn)化。第2章多元正態(tài)分布[教學(xué)目的與要求]:了解數(shù)據(jù)分布類(lèi)型及其意義,掌握多元正態(tài)分布的概念、參數(shù)性質(zhì)、參數(shù)幾何意義、參數(shù)的估計(jì)方法。[本章主要內(nèi)容]:2.1正態(tài)分布(支撐課程目標(biāo)3)2.2總體參數(shù)性質(zhì)(支撐課程目標(biāo)3)2.3參數(shù)估計(jì)(支撐課程目標(biāo)3)[本章重點(diǎn)]:多指標(biāo)問(wèn)題、統(tǒng)計(jì)向量。多元數(shù)據(jù)分布類(lèi)型。多元正態(tài)分布定義。均值向量、協(xié)方差、協(xié)方差矩陣、相關(guān)系數(shù)。獨(dú)立性與相關(guān)性??傮w均值、總體方差、相關(guān)矩陣的性質(zhì)及計(jì)算??傮w參數(shù)估計(jì)。協(xié)方差、相關(guān)系數(shù)的幾何意義與應(yīng)用。多元數(shù)據(jù)預(yù)處理方法。[本章難點(diǎn)]:協(xié)方差的計(jì)算與幾何意義。相關(guān)系數(shù)的計(jì)算與幾何意義。相關(guān)與獨(dú)立的關(guān)系。第3章分布與檢驗(yàn)[教學(xué)目的與要求]:了解常見(jiàn)的統(tǒng)計(jì)量分布類(lèi)型,掌握假設(shè)檢驗(yàn)的思想和方法,掌握均值向量的假設(shè)檢驗(yàn)思想和方法,掌握協(xié)方差矩陣的假設(shè)檢驗(yàn)思想和方法,掌握常見(jiàn)統(tǒng)計(jì)檢驗(yàn)方法,能夠根據(jù)數(shù)據(jù)類(lèi)型選擇檢驗(yàn)方法。[本章主要內(nèi)容]:3.1抽樣分布(支撐課程目標(biāo)4)3.2均值向量的檢驗(yàn)(支撐課程目標(biāo)4)3.3協(xié)方差矩陣的檢驗(yàn)(支撐課程目標(biāo)4)3.4統(tǒng)計(jì)檢驗(yàn)(支撐課程目標(biāo)4)[本章重點(diǎn)]:統(tǒng)計(jì)量的分布。假設(shè)檢驗(yàn)的思想。假設(shè)檢驗(yàn)的步驟。假設(shè)檢驗(yàn)的解讀。均值向量檢驗(yàn)。協(xié)方差矩陣檢驗(yàn)。統(tǒng)計(jì)檢驗(yàn)。[本章難點(diǎn)]:統(tǒng)計(jì)分布。統(tǒng)計(jì)檢驗(yàn)。第4章聚類(lèi)分析[教學(xué)目的與要求]:了解聚類(lèi)分析的思想、原理、背景及應(yīng)用領(lǐng)域,了解聚類(lèi)分析的研究目的和分析方法,掌握樣品距離和指標(biāo)距離的判定方法及異同點(diǎn),掌握歐式距離與馬氏距離的異同,掌握5種類(lèi)間距的定義,掌握樹(shù)狀圖與冰柱圖的含義,掌握系統(tǒng)聚類(lèi)法、K-均值聚類(lèi)法的原理與方法。[本章主要內(nèi)容]:4.1聚類(lèi)分析(支撐課程目標(biāo)1、5)4.2距離和相似性度量(支撐課程目標(biāo)5、6、7)4.3系統(tǒng)聚類(lèi)法(支撐課程目標(biāo)5、6、7、8)4.4K-均值聚類(lèi)法(支撐課程目標(biāo)5、6、7、8)[本章重點(diǎn)]:距離和相似度。歐氏距離與馬氏距離。Pearson相關(guān)、Spearman相關(guān)、Kendall相關(guān)。樹(shù)狀圖和冰柱圖。五種類(lèi)間距。六種聚類(lèi)法。系統(tǒng)聚類(lèi)法。K-均值聚類(lèi)法。[本章難點(diǎn)]:樣品距離和類(lèi)間距離。距離和相似性。系統(tǒng)聚類(lèi)。第5章判別分析[教學(xué)目的與要求]:了解有監(jiān)督學(xué)習(xí)與無(wú)監(jiān)督學(xué)習(xí),了解有監(jiān)督判別與無(wú)監(jiān)督判別,了解常用的判別分析方法,了解常見(jiàn)的機(jī)器學(xué)習(xí)算法,掌握距離判別法、貝葉斯判別法、Fisher判別法、線性判別法。[本章主要內(nèi)容]:5.1距離判別(支撐課程目標(biāo)5、6、7、8)5.2貝葉斯判別(支撐課程目標(biāo)5、6、7、8)5.3Fisher判別(支撐課程目標(biāo)5、6、7、8)5.4線性判別(支撐課程目標(biāo)5、6、7、8)[本章重點(diǎn)]:監(jiān)督判別與無(wú)監(jiān)督判別。距離判別。Bayes最大后驗(yàn)準(zhǔn)則。Bayes最小誤判準(zhǔn)則。Fisher判別。線性判別。[本章難點(diǎn)]:Bayes最大后驗(yàn)準(zhǔn)則。Bayes最小誤判準(zhǔn)則。Fisher判別。第6章主成份分析[教學(xué)目的與要求]:了解主成份分析的思想、數(shù)學(xué)原理,掌握由協(xié)方差矩陣、相關(guān)矩陣求主成份的數(shù)學(xué)模型,掌握主成份分析的性質(zhì),掌握主成份評(píng)價(jià)的方法。[本章主要內(nèi)容]:6.1主成份模型(支撐課程目標(biāo)5、6、7、8)6.2主成份性質(zhì)(支撐課程目標(biāo)5、6、7、8)6.3主成份評(píng)價(jià)(支撐課程目標(biāo)5、6、7、8)[本章重點(diǎn)]:主成份分析思想。主成份分析數(shù)學(xué)原理。主成份分析數(shù)學(xué)模型。主成份分析性質(zhì)。主成份評(píng)價(jià)。[本章難點(diǎn)]:數(shù)學(xué)原理。數(shù)學(xué)模型。性質(zhì)及應(yīng)用。第7章因子分析[教學(xué)目的與要求]:了解因子分析的思想、數(shù)學(xué)原理,掌握因子分析的數(shù)學(xué)模型,掌握因子分析的性質(zhì),掌握因子評(píng)價(jià)的方法。[本章主要內(nèi)容]:6.1因子分析模型(支撐課程目標(biāo)5、6、7、8)6.2因子分析步驟(支撐課程目標(biāo)5、6、7、8)[本章重點(diǎn)]:1.因子分析與主成份分析異同。2.因子分析數(shù)學(xué)原理。3.因子分析數(shù)學(xué)模型。4.影響分析性質(zhì)。5.因子評(píng)價(jià)。[本章難點(diǎn)]:1.數(shù)學(xué)原理。2.數(shù)學(xué)模型。3.性質(zhì)及應(yīng)用。五、課內(nèi)實(shí)驗(yàn)5.1本課程實(shí)驗(yàn)教學(xué)的地位和作用多元統(tǒng)計(jì)實(shí)驗(yàn)是鞏固和擴(kuò)展課程理論知識(shí)的必要環(huán)節(jié)。理解統(tǒng)計(jì)數(shù)據(jù)指標(biāo)類(lèi)型。掌握統(tǒng)計(jì)數(shù)據(jù)預(yù)處理方法。能夠應(yīng)用Python函數(shù)庫(kù)或者編程分析統(tǒng)計(jì)數(shù)據(jù)。能根據(jù)實(shí)驗(yàn)?zāi)康膶?duì)實(shí)驗(yàn)數(shù)據(jù)作聚類(lèi)分析、判別分析、主成份分析、因子分析。通過(guò)實(shí)驗(yàn)提高學(xué)生應(yīng)用多元統(tǒng)計(jì)分析方法解決統(tǒng)計(jì)數(shù)據(jù)分析問(wèn)題的能力,鍛煉學(xué)生分析問(wèn)題、解決問(wèn)題、實(shí)驗(yàn)設(shè)計(jì)、程序設(shè)計(jì)以及撰寫(xiě)實(shí)驗(yàn)報(bào)告的能力。5.2教學(xué)基本要求通過(guò)實(shí)驗(yàn)預(yù)習(xí)及設(shè)計(jì),理解多元統(tǒng)計(jì)數(shù)據(jù)分析的基本原理和一般實(shí)驗(yàn)設(shè)計(jì)準(zhǔn)則,能夠熟練應(yīng)用Python軟件,為實(shí)驗(yàn)的順利開(kāi)展奠定基礎(chǔ)。根據(jù)聚類(lèi)分析、判別分析、主成份分析、因子分析的原理和數(shù)學(xué)模型,調(diào)用Python函數(shù)或編程處理多元統(tǒng)計(jì)數(shù)據(jù)的分類(lèi)、降維、評(píng)價(jià)等問(wèn)題,能夠根據(jù)實(shí)驗(yàn)?zāi)康姆治鰧?shí)驗(yàn)結(jié)果,并根據(jù)實(shí)驗(yàn)結(jié)果撰寫(xiě)實(shí)驗(yàn)報(bào)告。5.3實(shí)驗(yàn)內(nèi)容及要求大綱基本內(nèi)容包括四個(gè)實(shí)驗(yàn)項(xiàng)目,在16個(gè)學(xué)時(shí)內(nèi)完成。實(shí)驗(yàn)一聚類(lèi)分析通過(guò)實(shí)驗(yàn)讓學(xué)生掌握系統(tǒng)聚類(lèi)、K-均值聚類(lèi)的實(shí)驗(yàn)過(guò)程,實(shí)驗(yàn)結(jié)果的解讀,實(shí)驗(yàn)?zāi)康牡姆治觯瑢?shí)驗(yàn)報(bào)告的撰寫(xiě)。培養(yǎng)學(xué)生分析數(shù)據(jù)、處理數(shù)據(jù)、解讀數(shù)據(jù)的能力。要求學(xué)生課前預(yù)習(xí)實(shí)驗(yàn)指導(dǎo)書(shū),根據(jù)實(shí)驗(yàn)指導(dǎo)書(shū)提供的數(shù)據(jù)背景知識(shí)并參考課程所用教材完成實(shí)驗(yàn)過(guò)程模擬,實(shí)現(xiàn)相應(yīng)理論知識(shí)的理解。指導(dǎo)教師為學(xué)生提供實(shí)驗(yàn)數(shù)據(jù),具體實(shí)驗(yàn)步驟和結(jié)果分析、處理由學(xué)生獨(dú)立完成。實(shí)驗(yàn)內(nèi)容要求如下:課前預(yù)習(xí)內(nèi)容:系統(tǒng)聚類(lèi)的原理與步驟。樹(shù)狀圖與冰柱圖的意義。K-均值聚類(lèi)的步驟。類(lèi)的判別方法。實(shí)驗(yàn)內(nèi)容:根據(jù)提供的實(shí)驗(yàn)數(shù)據(jù),應(yīng)用Python軟件,通過(guò)調(diào)用函數(shù)或編程應(yīng)用系統(tǒng)聚類(lèi)和K-均值聚類(lèi)方法實(shí)現(xiàn)對(duì)樣品數(shù)據(jù)的分類(lèi),通過(guò)冰柱圖、樹(shù)狀圖解讀分類(lèi)過(guò)程,根據(jù)研究目的選擇分類(lèi)數(shù),實(shí)現(xiàn)對(duì)實(shí)驗(yàn)數(shù)據(jù)的分類(lèi)。實(shí)驗(yàn)要求:能夠熟練使用Python軟件,能夠理解實(shí)驗(yàn)?zāi)康?、讀懂實(shí)驗(yàn)數(shù)據(jù),能夠?qū)?shí)驗(yàn)結(jié)果可視化,通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的解讀,實(shí)現(xiàn)對(duì)樣品數(shù)據(jù)的分類(lèi),并根據(jù)實(shí)驗(yàn)?zāi)康?、?shí)驗(yàn)要求撰寫(xiě)實(shí)驗(yàn)報(bào)告。實(shí)驗(yàn)二判別分析通過(guò)實(shí)驗(yàn)讓學(xué)生掌握距離判別、貝葉斯判別、Fisher判別、線性判別的實(shí)驗(yàn)過(guò)程,實(shí)驗(yàn)結(jié)果的解讀,實(shí)驗(yàn)?zāi)康牡姆治?,?shí)驗(yàn)報(bào)告的撰寫(xiě)。培養(yǎng)學(xué)生分析數(shù)據(jù)、處理數(shù)據(jù)、解讀數(shù)據(jù)的能力。要求學(xué)生課前預(yù)習(xí)實(shí)驗(yàn)指導(dǎo)書(shū),根據(jù)實(shí)驗(yàn)指導(dǎo)書(shū)提供的數(shù)據(jù)背景知識(shí)并參考課程所用教材完成實(shí)驗(yàn)過(guò)程模擬,實(shí)現(xiàn)相應(yīng)理論知識(shí)的理解。指導(dǎo)教師為學(xué)生提供實(shí)驗(yàn)數(shù)據(jù),具體實(shí)驗(yàn)步驟和結(jié)果分析、處理由學(xué)生獨(dú)立完成。實(shí)驗(yàn)內(nèi)容要求如下:課前預(yù)習(xí)內(nèi)容:判別分析的思想。距離判別的實(shí)現(xiàn)過(guò)程。貝葉斯最大后驗(yàn)準(zhǔn)則和最小誤判準(zhǔn)則。Fisher判別準(zhǔn)則線性判別準(zhǔn)則。實(shí)驗(yàn)內(nèi)容:根據(jù)提供的實(shí)驗(yàn)數(shù)據(jù),應(yīng)用Python軟件,通過(guò)調(diào)用函數(shù)或編程應(yīng)用距離判別、貝葉斯判別、Fisher判別、線性判別方法實(shí)現(xiàn)對(duì)樣品數(shù)據(jù)的分類(lèi),根據(jù)研究目的實(shí)驗(yàn)對(duì)樣品數(shù)據(jù)的分類(lèi)。實(shí)驗(yàn)要求:能夠熟練使用Python軟件,能夠理解實(shí)驗(yàn)?zāi)康摹⒆x懂實(shí)驗(yàn)數(shù)據(jù),能夠?qū)?shí)驗(yàn)結(jié)果可視化,通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的解讀,實(shí)現(xiàn)對(duì)樣品數(shù)據(jù)的分類(lèi),并根據(jù)實(shí)驗(yàn)?zāi)康?、?shí)驗(yàn)要求撰寫(xiě)實(shí)驗(yàn)報(bào)告。實(shí)驗(yàn)三主成份分析通過(guò)實(shí)驗(yàn)讓學(xué)生掌握主成份降維、主成份評(píng)價(jià)的實(shí)驗(yàn)過(guò)程,實(shí)驗(yàn)結(jié)果的解讀,實(shí)驗(yàn)?zāi)康牡姆治?,?shí)驗(yàn)報(bào)告的撰寫(xiě)。培養(yǎng)學(xué)生分析數(shù)據(jù)、處理數(shù)據(jù)、解讀數(shù)據(jù)的能力。要求學(xué)生課前預(yù)習(xí)實(shí)驗(yàn)指導(dǎo)書(shū),根據(jù)實(shí)驗(yàn)指導(dǎo)書(shū)提供的數(shù)據(jù)背景知識(shí)并參考課程所用教材完成實(shí)驗(yàn)過(guò)程模擬,實(shí)現(xiàn)相應(yīng)理論知識(shí)的理解。指導(dǎo)教師為學(xué)生提供實(shí)驗(yàn)數(shù)據(jù),具體實(shí)驗(yàn)步驟和結(jié)果分析、處理由學(xué)生獨(dú)立完成。實(shí)驗(yàn)內(nèi)容要求如下:課前預(yù)習(xí)內(nèi)容:主成份分析的原理與步驟。碎石圖意義。方差表的意義。成分矩陣。實(shí)驗(yàn)內(nèi)容:根據(jù)提供的實(shí)驗(yàn)數(shù)據(jù),應(yīng)用Python軟件,通過(guò)調(diào)用函數(shù)或編程應(yīng)用主成份降維、主成份評(píng)價(jià)方法實(shí)現(xiàn)對(duì)指標(biāo)數(shù)據(jù)的降維,對(duì)樣品數(shù)據(jù)的排序,通過(guò)碎石圖、方差表、成分矩陣解讀,實(shí)現(xiàn)對(duì)數(shù)據(jù)降維與評(píng)價(jià)的目的。實(shí)驗(yàn)要求:能夠熟練使用Python軟件,能夠理解實(shí)驗(yàn)?zāi)康?、讀懂實(shí)驗(yàn)數(shù)據(jù),能夠?qū)?shí)驗(yàn)結(jié)果可視化,通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的解讀,實(shí)現(xiàn)數(shù)據(jù)降維與評(píng)價(jià),并根據(jù)實(shí)驗(yàn)?zāi)康?、?shí)驗(yàn)要求撰寫(xiě)實(shí)驗(yàn)報(bào)告。實(shí)驗(yàn)四因子分析通過(guò)實(shí)驗(yàn)讓學(xué)生掌握因子分析、因子評(píng)價(jià)的實(shí)驗(yàn)過(guò)程,實(shí)驗(yàn)結(jié)果的解讀,實(shí)驗(yàn)?zāi)康牡姆治觯瑢?shí)驗(yàn)報(bào)告的撰寫(xiě)。培養(yǎng)學(xué)生分析數(shù)據(jù)、處理數(shù)據(jù)、解讀數(shù)據(jù)的能力。要求學(xué)生課前預(yù)習(xí)實(shí)驗(yàn)指導(dǎo)書(shū),根據(jù)實(shí)驗(yàn)指導(dǎo)書(shū)提供的數(shù)據(jù)背景知識(shí)并參考課程所用教材完成實(shí)驗(yàn)過(guò)程模擬,實(shí)現(xiàn)相應(yīng)理論知識(shí)的理解。指導(dǎo)教師為學(xué)生提供實(shí)驗(yàn)數(shù)據(jù),具體實(shí)驗(yàn)步驟和結(jié)果分析、處理由學(xué)生獨(dú)立完成。實(shí)驗(yàn)內(nèi)容要求如下:課前預(yù)習(xí)內(nèi)容:因子分析的原理與步驟。因子載荷意義。成分矩陣。旋轉(zhuǎn)成分矩陣。實(shí)驗(yàn)內(nèi)容:根據(jù)提供的實(shí)驗(yàn)數(shù)據(jù),應(yīng)用Python軟件,通過(guò)調(diào)用函數(shù)或編程應(yīng)用因子降維、因子評(píng)價(jià)方法實(shí)現(xiàn)對(duì)指標(biāo)數(shù)據(jù)的降維,對(duì)樣品數(shù)據(jù)的排序,通過(guò)碎石圖、方差表、成分矩陣、旋轉(zhuǎn)成分矩陣解讀,實(shí)現(xiàn)對(duì)數(shù)據(jù)降維與評(píng)價(jià)的目的。實(shí)驗(yàn)要求:能夠熟練使用Python軟件,能夠理解實(shí)驗(yàn)?zāi)康?、讀懂實(shí)驗(yàn)數(shù)據(jù),能夠?qū)?shí)驗(yàn)結(jié)果可視化,通過(guò)對(duì)實(shí)驗(yàn)結(jié)果的解讀,實(shí)現(xiàn)數(shù)據(jù)降維與評(píng)價(jià),并根據(jù)實(shí)驗(yàn)?zāi)康摹?shí)驗(yàn)要求撰寫(xiě)實(shí)驗(yàn)報(bào)告。5.4教學(xué)文件及教學(xué)形式教學(xué)文件:自編《多元統(tǒng)計(jì)分析實(shí)驗(yàn)指導(dǎo)書(shū)》。教學(xué)形式主要包括:預(yù)習(xí)、課堂指導(dǎo)與實(shí)驗(yàn)操作、撰寫(xiě)實(shí)驗(yàn)報(bào)告。實(shí)驗(yàn)報(bào)告學(xué)生自擬。實(shí)驗(yàn)報(bào)告包括:實(shí)驗(yàn)名稱(chēng)、實(shí)驗(yàn)?zāi)康募耙?、?shí)驗(yàn)描述及實(shí)驗(yàn)過(guò)程、實(shí)驗(yàn)結(jié)果及解釋、總結(jié)及評(píng)價(jià),要有完整的實(shí)驗(yàn)數(shù)據(jù)、實(shí)驗(yàn)過(guò)程、實(shí)驗(yàn)結(jié)果、算法程序,用圖表表示的實(shí)驗(yàn)結(jié)果,以理論聯(lián)系實(shí)際為出發(fā)點(diǎn),解讀實(shí)驗(yàn)結(jié)果,總結(jié)實(shí)驗(yàn)中出現(xiàn)的問(wèn)題及解決方法。5.5實(shí)驗(yàn)項(xiàng)目及學(xué)時(shí)分配序號(hào)實(shí)驗(yàn)項(xiàng)目實(shí)驗(yàn)學(xué)時(shí)實(shí)驗(yàn)類(lèi)型實(shí)驗(yàn)類(lèi)別實(shí)驗(yàn)性質(zhì)1系統(tǒng)聚類(lèi)2驗(yàn)證專(zhuān)業(yè)必修2K-均值聚類(lèi)2驗(yàn)證專(zhuān)業(yè)必修3距離判別、2驗(yàn)證專(zhuān)業(yè)必修4Fisher判別2驗(yàn)證專(zhuān)業(yè)必修5貝葉斯判別2驗(yàn)證專(zhuān)業(yè)必修6主成份分析2驗(yàn)證專(zhuān)業(yè)必修7因子分析2驗(yàn)證專(zhuān)業(yè)必修8綜合評(píng)價(jià)2驗(yàn)證專(zhuān)業(yè)必修5.6本課程實(shí)驗(yàn)用到的儀器設(shè)備及儀表電腦、Python軟件。六、課程學(xué)時(shí)分配教學(xué)課次教學(xué)內(nèi)容教學(xué)環(huán)節(jié)與計(jì)劃時(shí)數(shù)教學(xué)環(huán)節(jié)計(jì)劃時(shí)數(shù)1緒論理論課22正態(tài)分布理論課23總體參數(shù)理論課24參數(shù)估計(jì)理論課25抽樣分布理論課26均值向量檢驗(yàn)、協(xié)方差檢驗(yàn)理論課27統(tǒng)計(jì)檢驗(yàn)理論課28聚類(lèi)分析、距離和相似性度量理論課29系統(tǒng)聚類(lèi)理論課210K-均值聚類(lèi)理論課211距離判別、貝葉斯判別理論課212Fisher判別、線性判別理論課213主成份模型理論課214主成份性質(zhì)與評(píng)價(jià)理論課215因子分析模型理論課216因子分析步驟理論課217實(shí)驗(yàn)一聚類(lèi)分析實(shí)驗(yàn)課418實(shí)驗(yàn)二判別分析實(shí)驗(yàn)課419實(shí)驗(yàn)三主成份分析實(shí)驗(yàn)課420實(shí)驗(yàn)四因子分析實(shí)驗(yàn)課4七、課程考核與成績(jī)?cè)u(píng)定7.1考核方式考核環(huán)節(jié)包括課程學(xué)習(xí)過(guò)程考核和期末考試,其中課程過(guò)程考核占總成績(jī)的40%,分別由課堂表現(xiàn)、課后作業(yè)、實(shí)驗(yàn)情況進(jìn)行評(píng)定;期末考試成績(jī)占總成績(jī)的60%。各環(huán)節(jié)的比重如下??己谁h(huán)節(jié)比重合計(jì)過(guò)程考核(平時(shí)成績(jī))課堂表現(xiàn)10%50%作業(yè)10%實(shí)驗(yàn)30%期末成績(jī)期末測(cè)試50%50%總計(jì)100%100%7.2考核內(nèi)容及要求本課程為考試課??己藘?nèi)容及分值分配如下??己朔绞娇己藘?nèi)容分值課程目標(biāo)總分值期末考試50%數(shù)據(jù)類(lèi)型與數(shù)據(jù)預(yù)處理2~4目標(biāo)2100分聚類(lèi)分析的思想2~5目標(biāo)1判別分析的思想5~15目標(biāo)1主成份分析的思想5~15目標(biāo)1因子分析的思想5~10目標(biāo)1信均值向量、協(xié)方差矩陣的計(jì)算10~20目標(biāo)2、3、4、5聚類(lèi)、判別的性質(zhì)5~15目標(biāo)5、6、7、8主成份與因子的性質(zhì)15~30目標(biāo)5、6、7、8過(guò)程考核50%課堂表現(xiàn)課堂測(cè)試、出勤情況10目標(biāo)1、2、3、4、5、6、7、810分課后作業(yè)作業(yè)完成情況10目標(biāo)2、3、4、6、7、810分實(shí)驗(yàn)實(shí)驗(yàn)出勤、算法設(shè)計(jì)及實(shí)驗(yàn)報(bào)告30目標(biāo)5、6、7、8100分7.3成績(jī)?cè)u(píng)定1.課堂表現(xiàn)課堂表現(xiàn)總分10分,由課堂測(cè)試與課堂出勤情況評(píng)定。其中,課堂測(cè)試滿分5分,以客觀題(填空、選擇、判斷)為主,每學(xué)期隨堂測(cè)試10~20次,每次測(cè)試1~2道題目,每答錯(cuò)一道題目扣0.5分(直到扣滿5分為止);課堂出勤滿分5分,缺勤一次扣1分,遲到或請(qǐng)假扣0.5分。2.課后作業(yè)課后作業(yè)總分10分,由作業(yè)完成情況評(píng)定。每學(xué)期布置作業(yè)5次,每次作業(yè)占2分,評(píng)分標(biāo)準(zhǔn)如下;評(píng)分標(biāo)準(zhǔn)分值標(biāo)準(zhǔn)描述課后作業(yè)2能夠按時(shí)認(rèn)真完成作業(yè)、作業(yè)態(tài)度認(rèn)真、書(shū)寫(xiě)清楚、分析計(jì)算正確。1.5能夠按時(shí)完成作業(yè)、作業(yè)態(tài)度較好、書(shū)寫(xiě)清楚、分析計(jì)算基本正確1能夠按時(shí)完成作業(yè)、作業(yè)態(tài)度一般、書(shū)寫(xiě)清楚、分析計(jì)算錯(cuò)誤較多0.5能夠按時(shí)完成作業(yè)、作業(yè)態(tài)度一般、書(shū)寫(xiě)不清楚、分析計(jì)算錯(cuò)誤較多0不交作業(yè)或作業(yè)態(tài)度不認(rèn)真、抄襲他人作業(yè)3.實(shí)驗(yàn)成績(jī)實(shí)驗(yàn)成績(jī)占所學(xué)課程的30%,即30分。根據(jù)學(xué)生的實(shí)驗(yàn)表現(xiàn)及實(shí)驗(yàn)報(bào)告結(jié)果,進(jìn)行綜合評(píng)定。具體評(píng)分標(biāo)準(zhǔn)如下表所示。評(píng)分標(biāo)準(zhǔn)分值標(biāo)準(zhǔn)描述實(shí)驗(yàn)表現(xiàn)(10)10無(wú)遲到、早退現(xiàn)象,態(tài)度端正,積極回答問(wèn)題。8無(wú)遲到、早退現(xiàn)象,實(shí)驗(yàn)過(guò)程相對(duì)認(rèn)真,但不積極回答問(wèn)題。6無(wú)遲到、早退現(xiàn)象,實(shí)驗(yàn)過(guò)程不認(rèn)真。4有遲到、早退現(xiàn)象,實(shí)驗(yàn)過(guò)程不認(rèn)真。2有遲到、早退現(xiàn)象,實(shí)驗(yàn)過(guò)程不動(dòng)手,渾水摸魚(yú)0曠課實(shí)驗(yàn)報(bào)告(20)10有完整正確的實(shí)驗(yàn)原理圖,實(shí)驗(yàn)過(guò)程敘述內(nèi)容完整,正確的實(shí)驗(yàn)數(shù)據(jù),圖表清晰合理,結(jié)論正確,書(shū)寫(xiě)認(rèn)真。15有實(shí)驗(yàn)原理圖,實(shí)驗(yàn)過(guò)程敘述內(nèi)容較完整,正確的實(shí)驗(yàn)數(shù)據(jù),圖表清晰較合理,結(jié)論正確,書(shū)寫(xiě)較認(rèn)真。10實(shí)驗(yàn)過(guò)程敘述內(nèi)容較完整,實(shí)驗(yàn)數(shù)據(jù)略有錯(cuò)誤,圖表不夠清晰,結(jié)論不準(zhǔn)確,書(shū)寫(xiě)不夠認(rèn)真。5實(shí)驗(yàn)過(guò)程敘述內(nèi)容較完整,實(shí)驗(yàn)數(shù)據(jù)有錯(cuò)誤,沒(méi)有圖表,無(wú)結(jié)論分析,書(shū)寫(xiě)不夠認(rèn)真。0沒(méi)有提交實(shí)驗(yàn)報(bào)告。4.期末考試采用閉卷考試形式進(jìn)行,期末成績(jī)?yōu)榘俜种疲?jì)入總成績(jī)時(shí)乘以50%,由教務(wù)處安排考試流程,考試內(nèi)容須覆蓋支撐全部畢業(yè)要求指標(biāo)的授課內(nèi)容,考試完成后在綜合教務(wù)系統(tǒng)中按照設(shè)定的占比系數(shù)錄入成績(jī)。八、課程評(píng)價(jià)與持續(xù)改進(jìn)8.1課程評(píng)價(jià)課程評(píng)價(jià)周期定為每1年評(píng)價(jià)一次。設(shè)置達(dá)成情況目標(biāo)值,采用成績(jī)分析法進(jìn)行評(píng)價(jià)。課程達(dá)成評(píng)價(jià)根據(jù)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專(zhuān)業(yè)課程達(dá)成評(píng)價(jià)方法進(jìn)行計(jì)算,評(píng)價(jià)結(jié)果用于持續(xù)改進(jìn)。統(tǒng)計(jì)系負(fù)責(zé)人組織教師實(shí)施課程評(píng)價(jià),制定持續(xù)改進(jìn)措施,監(jiān)督持續(xù)改進(jìn)過(guò)程。課程負(fù)責(zé)人負(fù)責(zé)撰寫(xiě)課程考核總結(jié)報(bào)告,實(shí)施課程評(píng)價(jià)持續(xù)改進(jìn)。8.2持續(xù)改進(jìn)1)日常教學(xué):根據(jù)學(xué)生學(xué)習(xí)情況,教師采取座談會(huì)、與學(xué)生單獨(dú)交流,及時(shí)調(diào)整教學(xué)方法、進(jìn)度,做出教學(xué)改進(jìn)。2)實(shí)驗(yàn)室實(shí)驗(yàn):根據(jù)學(xué)生實(shí)驗(yàn)室實(shí)驗(yàn)及實(shí)驗(yàn)報(bào)告情況,對(duì)學(xué)生理解多元統(tǒng)計(jì)知識(shí)進(jìn)行分析,及時(shí)調(diào)整教學(xué)方法和內(nèi)容,提出改進(jìn)措施。3)課堂質(zhì)疑或短時(shí)間交流討論:對(duì)課堂質(zhì)疑或討論的效果進(jìn)行分析,提出課程持續(xù)改進(jìn)意見(jiàn),用于本課持續(xù)改進(jìn)。4)期末試卷分析總結(jié):根據(jù)課程目標(biāo),實(shí)現(xiàn)課程達(dá)成評(píng)價(jià),撰寫(xiě)課程總結(jié)報(bào)告,提出課程持續(xù)改進(jìn)意見(jiàn),用于本課程持續(xù)改進(jìn)。九、課程教材及主要參考書(shū)[教材]應(yīng)用多元統(tǒng)計(jì)分析(第4版).朱建平.北京:科學(xué)出版社,2021[主要參考書(shū)]1.多元統(tǒng)計(jì)分析(第五版).何曉群.北京:中國(guó)人民大學(xué)出版社,20202.WolfgangKarlH?rdle,AppliedMultivariateStatisticalAnalysis(ThirdEdition),Springer,2011.3.GarethJames,.AnIntroductiontoStatisticalLearningwithApplicationsinR,Springer,2017.
《分布式存儲(chǔ)與計(jì)算》教學(xué)大綱課程名稱(chēng):分布式存儲(chǔ)與計(jì)算課程編號(hào):F062092172英文名稱(chēng):DistributedStorageandComputing學(xué)時(shí):48學(xué)時(shí) 學(xué)分:3學(xué)分開(kāi)課學(xué)期:第5學(xué)期適用專(zhuān)業(yè):數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專(zhuān)業(yè)課程類(lèi)別:理論課+上機(jī)課課程性質(zhì):專(zhuān)業(yè)方向拓展課先修課程:Java程序設(shè)計(jì)、數(shù)據(jù)庫(kù)系統(tǒng)概論、操作系統(tǒng)一、課程的性質(zhì)及任務(wù)《分布式存儲(chǔ)與計(jì)算》課程是數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專(zhuān)業(yè)一門(mén)重要的專(zhuān)業(yè)方向拓展課,是一門(mén)分布式數(shù)據(jù)管理領(lǐng)城的前沿專(zhuān)業(yè)課程。課程包括三大部分,第一部分大數(shù)據(jù)基礎(chǔ),第二部分大數(shù)據(jù)存儲(chǔ)與管理,第三部分大數(shù)據(jù)處理與分析,具體內(nèi)容包含大數(shù)據(jù)概述、大數(shù)據(jù)處理框架Hadoop、分布式文件系統(tǒng)HDFS、分布式數(shù)據(jù)庫(kù)HBase、NoSQL數(shù)據(jù)庫(kù)、MapReduce模型、數(shù)據(jù)倉(cāng)庫(kù)Hive編程實(shí)踐、Spark生態(tài)系統(tǒng)與編程實(shí)踐、流計(jì)算等。通過(guò)本課程的學(xué)習(xí),使學(xué)生掌握大數(shù)據(jù)的體系架構(gòu)、關(guān)鍵技術(shù)以及應(yīng)用場(chǎng)景;培養(yǎng)大數(shù)據(jù)思維,能夠利用大數(shù)據(jù)工具去發(fā)現(xiàn)問(wèn)題解決問(wèn)題;了解大數(shù)據(jù)管理的硬件和軟件、系統(tǒng)體系結(jié)構(gòu)、新的編程范式,以及并行分布式計(jì)算技術(shù)最新研究進(jìn)展;結(jié)合大數(shù)據(jù)具體案例,培養(yǎng)動(dòng)手能力,創(chuàng)新能力,為今后深入學(xué)習(xí)大數(shù)據(jù)技術(shù)奠定基礎(chǔ),指明方向。依據(jù)河北工程大學(xué)數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專(zhuān)業(yè)培養(yǎng)計(jì)劃,本課程需要培養(yǎng)學(xué)生的能力是:能夠針對(duì)智能信息系統(tǒng)設(shè)計(jì)、大數(shù)據(jù)技術(shù)應(yīng)用等大數(shù)據(jù)應(yīng)用領(lǐng)域的復(fù)雜工程問(wèn)題設(shè)計(jì)實(shí)驗(yàn)方案、構(gòu)建實(shí)驗(yàn)系統(tǒng)和測(cè)試平臺(tái)、獲得實(shí)驗(yàn)結(jié)果(畢業(yè)要求指標(biāo)4.2)掌握基本的大數(shù)據(jù)開(kāi)發(fā)環(huán)境的配置和應(yīng)用,熟練掌握軟件開(kāi)發(fā)語(yǔ)言(如Python、Java語(yǔ)言等),并能夠運(yùn)用集成開(kāi)發(fā)環(huán)境進(jìn)行復(fù)雜程序設(shè)計(jì)(畢業(yè)要求指標(biāo)5.1)具備使用大數(shù)據(jù)平臺(tái)以及軟件對(duì)復(fù)雜工程問(wèn)題進(jìn)行仿真的能力,理解其使用要求、運(yùn)用范圍和局限性。(畢業(yè)要求指標(biāo)5.3)二、課程目標(biāo)與要求2.1課程目標(biāo)使學(xué)生掌握大數(shù)據(jù)的基本概念,包括Hadoop,HDFS,MapReduce等框架的概念和原理。理解大數(shù)據(jù)的原理架構(gòu),了解大數(shù)據(jù)的應(yīng)用以及大數(shù)據(jù)與其他新興技術(shù)之間的關(guān)系,逐漸形成大數(shù)據(jù)的思維,為今后解決復(fù)雜大數(shù)據(jù)問(wèn)題提供支持。使學(xué)生熟練掌握各種大數(shù)據(jù)存儲(chǔ)與分析工具,并能夠具備根據(jù)不同的數(shù)據(jù)分析需求選擇合適的存儲(chǔ)框架和數(shù)據(jù)分析框架的能力,了解不同框架的適用場(chǎng)景和局限性,提升學(xué)生對(duì)分布式存儲(chǔ)技術(shù)的實(shí)際操作能力及動(dòng)手能力。使學(xué)生了解大數(shù)據(jù)領(lǐng)域的相關(guān)技術(shù)標(biāo)準(zhǔn)和法律法規(guī),能夠了解大數(shù)據(jù)技術(shù)的發(fā)展對(duì)人類(lèi)社會(huì)的影響。數(shù)理學(xué)院本科課程教學(xué)大綱PAGE16PAGE152.2課程目標(biāo)與畢業(yè)要求對(duì)應(yīng)關(guān)系課程目標(biāo)畢業(yè)要求二級(jí)指標(biāo)畢業(yè)要求123●●能夠針對(duì)智能信息系統(tǒng)設(shè)計(jì)、大數(shù)據(jù)技術(shù)應(yīng)用等大數(shù)據(jù)應(yīng)用領(lǐng)域的復(fù)雜工程問(wèn)題設(shè)計(jì)實(shí)驗(yàn)方案、構(gòu)建實(shí)驗(yàn)系統(tǒng)和測(cè)試平臺(tái)、獲得實(shí)驗(yàn)結(jié)果。4.能夠基于數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)原理并采用科學(xué)方法對(duì)大數(shù)據(jù)應(yīng)用領(lǐng)域的復(fù)雜工程問(wèn)題進(jìn)行研究,包括設(shè)計(jì)實(shí)驗(yàn)、分析與解釋數(shù)據(jù)、并通過(guò)信息綜合得到合理有效的結(jié)論?!裾莆栈镜拇髷?shù)據(jù)開(kāi)發(fā)環(huán)境的配置和應(yīng)用,熟練掌握軟件開(kāi)發(fā)語(yǔ)言(如Python、Java語(yǔ)言等),并能夠運(yùn)用集成開(kāi)發(fā)環(huán)境進(jìn)行復(fù)雜程序設(shè)計(jì)。5.能夠針對(duì)大數(shù)據(jù)應(yīng)用領(lǐng)域的復(fù)雜工程問(wèn)題,開(kāi)發(fā)、選擇與使用恰當(dāng)?shù)募夹g(shù)、資源、現(xiàn)代信息技術(shù)工具,包括對(duì)大數(shù)據(jù)應(yīng)用領(lǐng)域的復(fù)雜工程問(wèn)題的預(yù)測(cè)與仿真,并能夠理解其局限性。●具備使用大數(shù)據(jù)平臺(tái)以及軟件對(duì)復(fù)雜工程問(wèn)題進(jìn)行仿真的能力,理解其使用要求、運(yùn)用范圍和局限性。2.3課程目標(biāo)與培養(yǎng)環(huán)節(jié)對(duì)應(yīng)矩陣序號(hào)課程目標(biāo)理論教學(xué)課內(nèi)實(shí)驗(yàn)課后作業(yè)1使學(xué)生掌握大數(shù)據(jù)的基本概念,包括Hadoop、HDFS、MapReduce等框架的概念和原理。理解大數(shù)據(jù)的原理架構(gòu),了解大數(shù)據(jù)的應(yīng)用以及大數(shù)據(jù)與其他新興技術(shù)之間的關(guān)系,逐漸形成大數(shù)據(jù)的思維,為今后解決復(fù)雜大數(shù)據(jù)問(wèn)題提供支持。HL2使學(xué)生熟練掌握各種大數(shù)據(jù)存儲(chǔ)與分析工具,并能夠具備根據(jù)不同的數(shù)據(jù)分析需求選擇合適的存儲(chǔ)框架和數(shù)據(jù)分析框架的能力,了解不同框架的適用場(chǎng)景和局限性,提升學(xué)生對(duì)分布式存儲(chǔ)技術(shù)的實(shí)際操作能力及動(dòng)手能力。HMH3使學(xué)生了解大數(shù)據(jù)領(lǐng)域的相關(guān)技術(shù)標(biāo)準(zhǔn)和法律法規(guī),能夠了解大數(shù)據(jù)技術(shù)的發(fā)展對(duì)人類(lèi)社會(huì)的影響。ML注:H表示該能力的在此環(huán)節(jié)重點(diǎn)培養(yǎng);M表示該能力在此環(huán)節(jié)有應(yīng)用要求;L表示該能力在此環(huán)節(jié)有所涉及。數(shù)據(jù)可視化課程教學(xué)大綱PAGE2PAGE12.4目標(biāo)達(dá)成度的評(píng)價(jià)課程目標(biāo)1主要通過(guò)理論教學(xué)環(huán)節(jié)進(jìn)行培養(yǎng),在課內(nèi)實(shí)驗(yàn)有所涉及。主要通過(guò)課堂測(cè)試和期末大作業(yè)進(jìn)行考核。目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評(píng)價(jià)。課程目標(biāo)2主要通過(guò)理論教學(xué)和課后作業(yè)環(huán)節(jié)進(jìn)行培養(yǎng),在課內(nèi)實(shí)驗(yàn)有應(yīng)用要求。主要通過(guò)課堂測(cè)試,課后作業(yè)和期末大作業(yè)中大數(shù)據(jù)存儲(chǔ)和分析框架的基本概念和工作原理題目進(jìn)行考核,在實(shí)驗(yàn)中能夠按要求完成分布式存儲(chǔ)與計(jì)算的實(shí)驗(yàn)報(bào)告,數(shù)據(jù)準(zhǔn)確無(wú)誤,結(jié)論完整,有完整的實(shí)驗(yàn)推理步驟。目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評(píng)價(jià)。課程目標(biāo)3主要通過(guò)課內(nèi)實(shí)驗(yàn)環(huán)節(jié)進(jìn)行培養(yǎng),在課后作業(yè)中有應(yīng)用要求。主要通過(guò)實(shí)驗(yàn)內(nèi)容檢驗(yàn)學(xué)生掌握大數(shù)據(jù)關(guān)鍵技術(shù)的概念和原理,掌握Hadoop的部署和基本操作。課后作業(yè)中,考核學(xué)生掌握分布式數(shù)據(jù)庫(kù)HBase、數(shù)據(jù)倉(cāng)庫(kù)Hive等分布式并行框架的原理與應(yīng)用。目標(biāo)達(dá)成綜合以上內(nèi)容進(jìn)行評(píng)價(jià)。三、教學(xué)方法及手段理論教學(xué)以課堂講授為主,上機(jī)實(shí)驗(yàn)為輔并結(jié)合課堂討論、案例分析、師生互動(dòng)等教學(xué)方法展開(kāi)教學(xué);理論教學(xué)強(qiáng)調(diào)將大數(shù)據(jù)關(guān)鍵技術(shù)的概念和原理與實(shí)際項(xiàng)目案例的實(shí)際情況緊密聯(lián)系,面向知識(shí)的實(shí)際應(yīng)用;理論教學(xué)注重本課程與Java程序設(shè)計(jì)、數(shù)據(jù)結(jié)構(gòu)等先修課程的聯(lián)系;本課程教材力求內(nèi)容新穎,采用多樣化的方式進(jìn)行教學(xué),讓學(xué)生在理論與實(shí)踐相結(jié)合的基礎(chǔ)上,對(duì)課程所要求的實(shí)際操作能力有進(jìn)一步的提高;充分利用多媒體等現(xiàn)代化教學(xué)手段,整體優(yōu)化教學(xué)過(guò)程和教學(xué)內(nèi)容,調(diào)動(dòng)學(xué)生學(xué)習(xí)積極性;布置實(shí)際操作任務(wù)給學(xué)生上機(jī)操作并及時(shí)指導(dǎo);課程強(qiáng)調(diào)學(xué)生的自主學(xué)習(xí),強(qiáng)調(diào)通過(guò)自學(xué)的方式消化、吸收課程的龐大知識(shí)量,并在此基礎(chǔ)上舉一反三、靈活應(yīng)用。四、課程的基本內(nèi)容與教學(xué)要求第一章大數(shù)據(jù)技術(shù)概述[教學(xué)目的與要求]:了解大數(shù)據(jù)基本概念,基礎(chǔ)架構(gòu),及相關(guān)技術(shù)和應(yīng)用。[本章主要內(nèi)容]:1.1大數(shù)據(jù)的含義;1.2數(shù)據(jù)處理平臺(tái)的基礎(chǔ)架構(gòu);1.3大數(shù)據(jù)處理的存儲(chǔ);1.4大數(shù)據(jù)處理的計(jì)算模式;1.5大數(shù)據(jù)處理系統(tǒng)的容錯(cuò)性;1.6大數(shù)據(jù)處理的云計(jì)算變革。[本章重點(diǎn)]:大數(shù)據(jù)的概念、基礎(chǔ)架構(gòu)、現(xiàn)狀及發(fā)展,大數(shù)據(jù)的應(yīng)用前景。[本章難點(diǎn)]:大數(shù)據(jù)的基礎(chǔ)架構(gòu)。第二章基于Hadoop的大數(shù)據(jù)處理架構(gòu)[教學(xué)目的與要求]:了解Hadoop基本概念,基礎(chǔ)架構(gòu),以及相關(guān)的技術(shù)、應(yīng)用和發(fā)展現(xiàn)狀。[本章主要內(nèi)容]:2.1Google核心云計(jì)算技術(shù);2.2Hadoop云計(jì)算技術(shù)及發(fā)展;2.3基于云計(jì)算的大數(shù)據(jù)處理架構(gòu);2.4基于云計(jì)算的大數(shù)據(jù)處理技術(shù)的應(yīng)用;2.5Hadoop運(yùn)行實(shí)踐。[本章重點(diǎn)]:Google云計(jì)算核心的概念、Hadoop基礎(chǔ)架構(gòu)。[本章難點(diǎn)]:基于云計(jì)算的大數(shù)據(jù)處理技術(shù)的應(yīng)用。第三章使用HDFS存儲(chǔ)大數(shù)據(jù)[教學(xué)目的與要求]:了解大數(shù)據(jù)的云存儲(chǔ)需求,掌握HDFS的訪問(wèn)與控制機(jī)制。[本章主要內(nèi)容]:4.1大數(shù)據(jù)的云存儲(chǔ)需求;4.2HDFS架構(gòu)與流程;4.3文件訪問(wèn)與控制;4.4HDFS性能優(yōu)化;4.5HDFS的小文件存儲(chǔ)問(wèn)題;4.6HDFS的高可用性問(wèn)題。[本章重點(diǎn)]:1.HDFS架構(gòu)和流程;2.HDFS性能優(yōu)化。[本章難點(diǎn)]:HDFS的高可用性問(wèn)題。第四章MapReduce計(jì)算模式[教學(xué)目的與要求]:熟練掌握MapReduce的原理和工作機(jī)制,掌握MapReduce設(shè)計(jì)模式和應(yīng)用開(kāi)發(fā)。[本章主要內(nèi)容]:3.1MapReduce原理;3.2MapReduce工作機(jī)制;3.3MapReduce應(yīng)用開(kāi)發(fā);3.4MapReduce設(shè)計(jì)模式;3.5MapReduce算法實(shí)踐;3.6MapReduce性能調(diào)優(yōu)[本章重點(diǎn)]:MapReduce工作機(jī)制;MapReduce的負(fù)載均衡和容錯(cuò)機(jī)制;基于MapReduce的并行算法設(shè)計(jì)。[本章難點(diǎn)]:MapReduce設(shè)計(jì)模式和性能調(diào)優(yōu)。第五章HBase大數(shù)據(jù)庫(kù)[教學(xué)目的與要求]:了解大數(shù)據(jù)環(huán)境下的數(shù)據(jù)庫(kù),掌握HBase的使用,掌握HBase的基本原理[本章主要內(nèi)容]:5.1大數(shù)據(jù)環(huán)境下的數(shù)據(jù)庫(kù);5.2HBase架構(gòu)與原理;5.3管理HBase中的數(shù)據(jù);5.4從RDBMS到HBase;5.5在HBase上運(yùn)行MapReduce;5.6HBase性能優(yōu)化。[本章重點(diǎn)]:1.HBase架構(gòu)與原理;2.HBase性能優(yōu)化。[本章難點(diǎn)]:在HBase上運(yùn)行MapReduce。第六章大數(shù)據(jù)的分析處理[教學(xué)目的與要求]:了解大數(shù)據(jù)的分析處理概述,了解Hive和Pig編程機(jī)制和原理。[本章主要內(nèi)容]:6.1大數(shù)據(jù)的分析處理概述;6.2Hive;6.3Pig;6.4Hive與Pig的對(duì)比。[本章重點(diǎn)]:Hive和Pig編程。[本章難點(diǎn)]:Hive與Pig的對(duì)比。第七章Spark生態(tài)系統(tǒng)與編程[教學(xué)目的與要求]:了解Spark相關(guān)概念與生態(tài)系統(tǒng)[本章主要內(nèi)容]:7.1了解Spark的發(fā)展歷程;7.2掌握Spark運(yùn)行原理;7.3Spark編程實(shí)踐。[本章重點(diǎn)]:掌握SparkSQL。[本章難點(diǎn)]:Spark編程實(shí)踐。第八章Hadoop集群的管理與維護(hù)[教學(xué)目的與要求]:了解ZooKeeper管理機(jī)制和基于Kerberos的Hadoop安全機(jī)制。[本章主要內(nèi)容]:8.1云計(jì)算平臺(tái)的管理體系;8.2ZooKeeper集群中的配置管理與協(xié)調(diào)者;8.3Hadoop集群部署與監(jiān)控集成工具;8.4基于Cacti的Hadoop集群服務(wù)器監(jiān)控;8.5基于Kereros的Hadoop安全管理。[本章重點(diǎn)]:ZooKeeper管理機(jī)制。[本章難點(diǎn)]:基于Kerberos的Hadoop安全機(jī)制。五、課內(nèi)實(shí)驗(yàn)5.1本課程實(shí)驗(yàn)教學(xué)的地位和作用分布式存儲(chǔ)與計(jì)算是鞏固和擴(kuò)展課程理論知識(shí)的必要環(huán)節(jié),實(shí)驗(yàn)教學(xué)能夠幫助學(xué)生將抽象的分布式存儲(chǔ)與計(jì)算理論轉(zhuǎn)化為具體的操作和實(shí)踐。通過(guò)親自搭建分布式系統(tǒng)、配置存儲(chǔ)節(jié)點(diǎn)、編寫(xiě)分布式計(jì)算程序等過(guò)程,學(xué)生可以更深入地理解分布式系統(tǒng)的內(nèi)部機(jī)制和工作原理。學(xué)生通過(guò)實(shí)驗(yàn)教學(xué)掌握大數(shù)據(jù)關(guān)鍵技術(shù)的概念和原理,掌握Hadoop的部署和基本操作,掌握大數(shù)據(jù)關(guān)鍵技術(shù)的概念和原理,掌握分布式數(shù)據(jù)庫(kù)HBase,數(shù)據(jù)倉(cāng)庫(kù)Hive的部署與應(yīng)用,了解Spark、Flink等分布式并行框架的原理與應(yīng)用。通過(guò)實(shí)驗(yàn)提高學(xué)生解決實(shí)際時(shí)序數(shù)據(jù)的分析能力,鍛煉學(xué)生分析、調(diào)試程序、設(shè)計(jì)實(shí)現(xiàn)數(shù)據(jù)分析算法以及撰寫(xiě)實(shí)驗(yàn)報(bào)告的能力。5.2教學(xué)基本要求學(xué)生應(yīng)具備一定的分布式存儲(chǔ)與計(jì)算理論基礎(chǔ),包括分布式系統(tǒng)原理、云計(jì)算概念、虛擬化技術(shù)、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫(kù)、分布式計(jì)算模型等。實(shí)驗(yàn)前應(yīng)仔細(xì)閱讀實(shí)驗(yàn)指導(dǎo)書(shū),了解實(shí)驗(yàn)?zāi)康?、?shí)驗(yàn)原理、實(shí)驗(yàn)步驟和實(shí)驗(yàn)預(yù)期結(jié)果,對(duì)實(shí)驗(yàn)過(guò)程中可能遇到的問(wèn)題進(jìn)行初步思考。學(xué)生在實(shí)驗(yàn)過(guò)程中,利用Hadoop大數(shù)據(jù)處理架構(gòu)、HDFS體系結(jié)構(gòu)、HBase數(shù)據(jù)模型、Redis數(shù)據(jù)庫(kù)、MapReduce實(shí)例分析、Hive編程實(shí)踐等學(xué)習(xí)內(nèi)容,根據(jù)要求動(dòng)手編寫(xiě)程序,搭建平臺(tái),獨(dú)立完成實(shí)驗(yàn)操作。學(xué)生應(yīng)該能夠利用大數(shù)據(jù)存儲(chǔ)和分析框架,選擇合適的大數(shù)據(jù)分析工具,編寫(xiě)相應(yīng)的代碼程序并完成調(diào)試與測(cè)試,認(rèn)真完成實(shí)驗(yàn)報(bào)告。5.3實(shí)驗(yàn)內(nèi)容及要求大綱基本內(nèi)容包括六個(gè)實(shí)驗(yàn)項(xiàng)目,在16個(gè)學(xué)時(shí)內(nèi)完成。實(shí)驗(yàn)一熟悉常用的Linux操作和Hadoop操作實(shí)驗(yàn)?zāi)康模海?)掌握Linux虛擬機(jī)的安裝方法。Hadoop在Linux操作系統(tǒng)上運(yùn)行可以發(fā)揮最佳性能。(2)掌握一些常用的Linux命令。(3)掌握Hadoop的偽分布式安裝方法。(4)掌握Hadoop的常用操作。熟悉一些基本的shell命令對(duì)Hadoop進(jìn)行操作,包括創(chuàng)建目錄、復(fù)制文件、查看文件等。實(shí)驗(yàn)內(nèi)容:1.熟悉常用的Linux操作請(qǐng)按要求上機(jī)實(shí)踐如下linux基本命令。cd命令:切換目錄(1)切換到目錄/usr/local(2)去到目前的上層目錄(3)回到自己的主文件夾ls命令:查看文件與目錄(4)查看目錄/usr下所有的文件mkdir命令:新建新目錄(5)進(jìn)入/tmp目錄,創(chuàng)建一個(gè)名為a的目錄,并查看有多少目錄存在(6)創(chuàng)建目錄a1/a2/a3/a4rmdir命令:刪除空的目錄(7)將上例創(chuàng)建的目錄a(/tmp下面)刪除(8)刪除目錄a1/a2/a3/a4,查看有多少目錄存在cp命令:復(fù)制文件或目錄(9)將主文件夾下的.bashrc復(fù)制到/usr下,命名為bashrc1(10)在/tmp下新建目錄test,再?gòu)?fù)制這個(gè)目錄內(nèi)容到/usrmv命令:移動(dòng)文件與目錄,或更名(11)將上例文件bashrc1移動(dòng)到目錄/usr/test(12)將上例test目錄重命名為test2rm命令:移除文件或目錄(13)將上例復(fù)制的bashrc1文件刪除(14)將上例的test2目錄刪除cat命令:查看文件內(nèi)容(15)查看主文件夾下的.bashrc文件內(nèi)容tac命令:反向列示(16)反向查看主文件夾下.bashrc文件內(nèi)容more命令:一頁(yè)一頁(yè)翻動(dòng)查看(17)翻頁(yè)查看主文件夾下.bashrc文件內(nèi)容head命令:取出前面幾行(18)查看主文件夾下.bashrc文件內(nèi)容前20行(19)查看主文件夾下.bashrc文件內(nèi)容,后面50行不顯示,只顯示前面幾行tail命令:取出后面幾行(20)查看主文件夾下.bashrc文件內(nèi)容最后20行(21)查看主文件夾下.bashrc文件內(nèi)容,只列出50行以后的數(shù)據(jù)find命令:文件查找(22)找出主文件夾下文件名為.bashrc的文件tar命令:壓縮命令(24)在/目錄下新建文件夾test,然后在/目錄下打包成test.tar.gz(25)解壓縮到/tmp目錄grep命令:查找字符串(26)從~/.bashrc文件中查找字符串'examples'2.熟悉常用的Hadoop操作(27)啟動(dòng)hadoop,在HDFS中創(chuàng)建用戶(hù)目錄(現(xiàn)在已經(jīng)在hadoop目錄/usr/local/hadoop)(28)接著在此用戶(hù)目錄下創(chuàng)建text文件夾,并查看文件列表(29)將~/.bashrc文件上傳到HDFS的test文件夾,并查看test(30)將HDFS文件夾test拷到本機(jī)3.進(jìn)行Hadoop偽分布式安裝訪問(wèn)Hadoop官網(wǎng),下載Hadoop安裝文件,在Linux虛擬機(jī)環(huán)境下完成Hadoop偽分布式環(huán)境的搭建,并運(yùn)行Hadoop自帶的Wordcount實(shí)例檢測(cè)是否運(yùn)行正常。完成上述實(shí)驗(yàn),并撰寫(xiě)實(shí)驗(yàn)報(bào)告?!斗植际酱鎯?chǔ)》課程機(jī)房上機(jī)實(shí)驗(yàn)報(bào)告題目:熟悉常用的Linux操作和Hadoop操作姓名日期實(shí)驗(yàn)環(huán)境:實(shí)驗(yàn)內(nèi)容與完成情況:出現(xiàn)的問(wèn)題:解決方案(列出遇到的問(wèn)題和解決辦法,列出沒(méi)有解決的問(wèn)題):實(shí)驗(yàn)二熟悉常用的HDFS操作實(shí)驗(yàn)?zāi)康模海?)理解HDFS在Hadoop體系結(jié)構(gòu)中的角色。(2)熟練使用HDFS操作常用的Shell命令。實(shí)驗(yàn)內(nèi)容:利用Hadoop提供的Shell命令完成如下任務(wù):(1)在HDFS分布式文件系統(tǒng)的Hadoop用戶(hù)目錄下創(chuàng)建一個(gè)test目錄;(2)在本地文件系統(tǒng)中創(chuàng)建一個(gè)hello.txt文件,并把hello.txt文件上傳到HDFS的test目錄下;(3)查看HDFS中的hello.txt的讀寫(xiě)權(quán)限大小、創(chuàng)建時(shí)間、路徑等信息;(4)在HDFS文件系統(tǒng)的test目錄中創(chuàng)建world.txt文件,(5)將HDFS文件系統(tǒng)中的world.txt下載到本地文件系統(tǒng)的文檔目錄/home/Hadoop/文檔中。(6)將HDFS文件系統(tǒng)test目錄中的hello.txt移動(dòng)到HDFS的根路徑(/)下。(7)刪除HDFS文件系統(tǒng)中根路徑下的hello.txt文件。(8)刪除HDFS文件系統(tǒng)中的test目錄。完成上述實(shí)驗(yàn),并撰寫(xiě)實(shí)驗(yàn)報(bào)告?!斗植际酱鎯?chǔ)》課程機(jī)房上機(jī)實(shí)驗(yàn)報(bào)告題目:熟悉常用的HDFS操作和API姓名日期實(shí)驗(yàn)環(huán)境:實(shí)驗(yàn)內(nèi)容與完成情況:出現(xiàn)的問(wèn)題:解決方案(列出遇到的問(wèn)題和解決辦法,列出沒(méi)有解決的問(wèn)題):實(shí)驗(yàn)三HDFS常用JavaAPI應(yīng)用實(shí)驗(yàn)?zāi)康模海?)理解HDFS在Hadoop體系結(jié)構(gòu)中的角色。(2)熟練使用HDFS操作常用的Shell命令。(3)熟悉HDFS操作常用的JavaAPI。實(shí)驗(yàn)內(nèi)容:編程實(shí)現(xiàn)一個(gè)類(lèi)“MyFSDataInputStream”,該類(lèi)繼承“org.apache.hadoop.fs.FSDataInputStream”,要求如下:(1)實(shí)現(xiàn)按行讀取HDFS中指定文件的方法“readLine()”,如果讀到文件末尾,則返回空,否則返回文件一行的文本。(2)查看Java幫助手冊(cè)或其它資料,用“.URL”和“org.apache.hadoop.fs.FsURLStreamHandlerFactory”編程完成輸出HDFS中指定文件的文本到終端中。(3)書(shū)上的例子MergeFile例子寫(xiě)一遍。完成上述實(shí)驗(yàn),并撰寫(xiě)實(shí)驗(yàn)報(bào)告,每一個(gè)步驟都要有命令截圖和證明操作成功的截圖?!斗植际酱鎯?chǔ)》課程機(jī)房上機(jī)實(shí)驗(yàn)報(bào)告題目:HDFS常用JavaAPI應(yīng)用姓名日期實(shí)驗(yàn)環(huán)境:實(shí)驗(yàn)內(nèi)容與完成情況:出現(xiàn)的問(wèn)題:解決方案(列出遇到的問(wèn)題和解決辦法,列出沒(méi)有解決的問(wèn)題):實(shí)驗(yàn)四熟悉常用的HBase操作實(shí)驗(yàn)?zāi)康模海?)理解HDFS在Hadoop體系結(jié)構(gòu)中的角色。(2)熟練使用HDFS操作常用的Shell命令。(3)熟悉HDFS操作常用的JavaAPI。實(shí)驗(yàn)平臺(tái):(1)操作系統(tǒng):Linux(建議Ubuntu16.04或Ubuntu18.04);(2)Hadoop版本:3.1.3;(3)HBase版本:2.2.2;(4)JDK版本:1.8;(5)JavaIDE:Eclipse實(shí)驗(yàn)內(nèi)容與要求:1.編程實(shí)現(xiàn)以下指定功能,并用Hadoop提供的HBaseShell命令完成相同任務(wù):(1)列出HBase所有的表的相關(guān)信息,例如表名;(2)在終端打印出指定的表的所有記錄數(shù)據(jù);(3)向已經(jīng)創(chuàng)建好的表添加和刪除指定的列族或列;(4)清空指定的表的所有記錄數(shù)據(jù);(5)統(tǒng)計(jì)表的行數(shù)。2.HBase數(shù)據(jù)庫(kù)操作現(xiàn)有以下關(guān)系型數(shù)據(jù)庫(kù)中的表和數(shù)據(jù)(見(jiàn)表14-3到表14-5),要求將其轉(zhuǎn)換為適合于HBase存儲(chǔ)的表并插入數(shù)據(jù):表14-3學(xué)生表(Student)學(xué)號(hào)(S_No)姓名(S_Name)性別(S_Sex)年齡(S_Age)2015001Zhangsanmale232015002Maryfemale222015003Lisimale24表14-4課程表(Course)課程號(hào)(C_No)課程名(C_Name)學(xué)分(C_Credit)123001Math2.0123002ComputerScience5.0123003English3.0表14-5選課表(SC)學(xué)號(hào)(SC_Sno)課程號(hào)(SC_Cno)成績(jī)(SC_Score)201500112300186201500112300369201500212300277201500212300399201500312300198201500312300295完成上述實(shí)驗(yàn),并撰寫(xiě)實(shí)驗(yàn)報(bào)告,每一個(gè)步驟都要有命令截圖和證明操作成功的截圖?!斗植际酱鎯?chǔ)》課程機(jī)房上機(jī)實(shí)驗(yàn)報(bào)告題目:熟悉常用的HBase操作姓名日期實(shí)驗(yàn)環(huán)境:實(shí)驗(yàn)內(nèi)容與完成情況:出現(xiàn)的問(wèn)題:解決方案(列出遇到的問(wèn)題和解決辦法,列出沒(méi)有解決的問(wèn)題):實(shí)驗(yàn)五NoSQL數(shù)據(jù)庫(kù)的操作實(shí)驗(yàn)?zāi)康模海?)理解四種數(shù)據(jù)庫(kù)(MySQL、HBase、Redis)的概念以及不同點(diǎn);(2)熟練使用三種數(shù)據(jù)庫(kù)操作常用的Shell命令;(3)熟悉三種數(shù)據(jù)庫(kù)操作常用的JavaAPI。實(shí)驗(yàn)平臺(tái):(1)操作系統(tǒng):Linux(建議Ubuntu16.04或Ubuntu18.04);(2)Hadoop版本:3.1.3;(3)HBase版本:2.2.2;(4)JDK版本:1.8;(5)JavaIDE:Eclipse實(shí)驗(yàn)內(nèi)容:(一)MySQL數(shù)據(jù)庫(kù)操作學(xué)生表如14-7所示。表14-7學(xué)生表StudentNameEnglishMathComputerzhangsan698677lisi5510088根據(jù)上面給出的Student表,在MySQL數(shù)據(jù)庫(kù)中完成如下操作:(1)在MySQL中創(chuàng)建Student表,并錄入數(shù)據(jù);(2)用SQL語(yǔ)句輸出Student表中的所有記錄;(3)查詢(xún)zhangsan的Computer成績(jī);(4)修改lisi的Math成績(jī),改為95。根據(jù)上面已經(jīng)設(shè)計(jì)出的Student表,使用MySQL的JAVA客戶(hù)端編程實(shí)現(xiàn)以下操作:(1)向Student表中添加如下所示的一條記錄:scofield4589100 (2)獲取scofield的English成績(jī)信息 (二)HBase數(shù)據(jù)庫(kù)操作學(xué)生表Student如表14-8所示。表14-8學(xué)生表StudentnamescoreEnglishMathComputerzhangsan698677lisi5510088根據(jù)上面給出的學(xué)生表Student的信息,執(zhí)行如下操作:(1)用HbaseShell命令創(chuàng)建學(xué)生表Student;(2)用scan命令瀏覽Student表的相關(guān)信息;(3)查詢(xún)zhangsan的Computer成績(jī);(4)修改lisi的Math成績(jī),改為95。2.根據(jù)上面已經(jīng)設(shè)計(jì)出的Student表,用HBaseAPI編程實(shí)現(xiàn)以下操作:(1)添加數(shù)據(jù):English:45Math:89 Computer:100scofield4589100 (2)獲取scofield的English成績(jī)信息。(三)Redis數(shù)據(jù)庫(kù)操作Student鍵值對(duì)如下:zhangsan:{English:69Math:86Computer:77}lisi:{English:55Math:100Computer:88}1.根據(jù)上面給出的鍵值對(duì),完成如下操作:(1)用Redis的哈希結(jié)構(gòu)設(shè)計(jì)出學(xué)生表Student(鍵值可以用student.zhangsan和student.lisi來(lái)表示兩個(gè)鍵值屬于同一個(gè)表);(2)用hgetall命令分別輸出zhangsan和lisi的成績(jī)信息;(3)用hget命令查詢(xún)zhangsan的Computer成績(jī);(4)修改lisi的Math成績(jī),改為95。2.根據(jù)上面已經(jīng)設(shè)計(jì)出的學(xué)生表Student,用Redis的JAVA客戶(hù)端編程(jedis),實(shí)現(xiàn)如下操作:(1)添加數(shù)據(jù):English:45Math:89 Computer:100 該數(shù)據(jù)對(duì)應(yīng)的鍵值對(duì)形式如下:scofield:{English:45Math:89Computer:100}(2)獲取scofield的English成績(jī)信息通過(guò)以上案例完成上述實(shí)驗(yàn),并撰寫(xiě)實(shí)驗(yàn)報(bào)告,每一個(gè)步驟都要有命令截圖和證明操作成功的截圖。實(shí)驗(yàn)六MapReduce初級(jí)編程實(shí)踐實(shí)驗(yàn)?zāi)康模海?)理解四種數(shù)據(jù)庫(kù)(MySQL、HBase、Redis)的概念以及不同點(diǎn);(2)熟練使用三種數(shù)據(jù)庫(kù)操作常用的Shell命令;(3)熟悉三種數(shù)據(jù)庫(kù)操作常用的JavaAPI。實(shí)驗(yàn)內(nèi)容:(1)編程實(shí)現(xiàn)文件合并和去重操作對(duì)于兩個(gè)輸入文件,即文件A和文件B,請(qǐng)編寫(xiě)MapReduce程序,對(duì)兩個(gè)文件進(jìn)行合并,并剔除其中重復(fù)的內(nèi)容,得到一個(gè)新的輸出文件C。下面是輸入文件和輸出文件的一個(gè)樣例供參考。輸入文件A的樣例如下: 20170101x 20170102y 20170103x 20170104y 20170105z20170106x輸入文件B的樣例如下:20170101y20170102y20170103x20170104z20170105y根據(jù)輸入文件A和B合并得到的輸出文件C的樣例如下:20170101x20170101y20170102y20170103x20170104y20170104z20170105y 20170105z20170106x通過(guò)以上案例完成上述實(shí)驗(yàn),并撰寫(xiě)實(shí)驗(yàn)報(bào)告。5.4教學(xué)文件及教學(xué)形式教學(xué)文件:《大數(shù)據(jù)》、《大數(shù)據(jù)技術(shù)原理與應(yīng)用》。教學(xué)形式主要包括:預(yù)習(xí)、課堂指導(dǎo)與實(shí)驗(yàn)操作、撰寫(xiě)實(shí)驗(yàn)報(bào)告。實(shí)驗(yàn)報(bào)告學(xué)生自擬。實(shí)驗(yàn)報(bào)告包括:實(shí)驗(yàn)?zāi)康?、?shí)驗(yàn)要求、實(shí)驗(yàn)內(nèi)容,詳細(xì)敘述編程步驟,要有完整的數(shù)據(jù)和編程、圖表表示的實(shí)驗(yàn)結(jié)果,以理論聯(lián)系實(shí)際為出發(fā)點(diǎn),總結(jié)實(shí)驗(yàn)中出現(xiàn)的問(wèn)題及解決方法?!斗植际酱鎯?chǔ)》課程機(jī)房上機(jī)實(shí)驗(yàn)報(bào)告題目:姓名日期實(shí)驗(yàn)環(huán)境:實(shí)驗(yàn)內(nèi)容與完成情況:出現(xiàn)的問(wèn)題:解決方案(列出遇到的問(wèn)題和解決辦法,列出沒(méi)有解決的問(wèn)題):5.5實(shí)驗(yàn)項(xiàng)目及學(xué)時(shí)分配序號(hào)實(shí)驗(yàn)項(xiàng)目實(shí)驗(yàn)學(xué)時(shí)實(shí)驗(yàn)類(lèi)型實(shí)驗(yàn)類(lèi)別實(shí)驗(yàn)性質(zhì)1熟悉常用的Linux操作和Hadoop操作2定量性專(zhuān)業(yè)必修2熟悉常用的HDFS操作2定量性專(zhuān)業(yè)必修3HDFS常用JavaAPI應(yīng)用3定量性專(zhuān)業(yè)必修4熟悉常用的HBase操作3定量性
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度無(wú)人機(jī)OEM研發(fā)與市場(chǎng)推廣合同3篇
- 年度制冷空調(diào)機(jī)械競(jìng)爭(zhēng)策略分析報(bào)告
- 二零二五版淀粉行業(yè)綠色生產(chǎn)與循環(huán)利用合同3篇
- 年度記憶綿枕市場(chǎng)分析及競(jìng)爭(zhēng)策略分析報(bào)告
- 二零二五年度谷殼供應(yīng)鏈金融服務(wù)合同3篇
- 2025年新型建筑裝修工程施工企業(yè)信用擔(dān)保合同范本3篇
- 鐵礦粉購(gòu)銷(xiāo)合同模板2025年度2篇
- 二零二五年智能硬件研發(fā)項(xiàng)目技術(shù)合同登記管理細(xì)則3篇
- 2025年度鉆井工程地質(zhì)勘察合同3篇
- 2025年度盆景植物租賃與藝術(shù)展覽合作合同范本
- 2025年生產(chǎn)主管年度工作計(jì)劃
- 2025年急診科護(hù)理工作計(jì)劃
- 高中家長(zhǎng)會(huì) 高二寒假線上家長(zhǎng)會(huì)課件
- 違規(guī)行為與處罰管理制度
- 個(gè)人教師述職報(bào)告錦集10篇
- 四川省等八省2025年普通高中學(xué)業(yè)水平選擇性考試適應(yīng)性演練歷史試題(含答案)
- 《內(nèi)部培訓(xùn)師培訓(xùn)》課件
- 《雷達(dá)原理》課件-3.3.3教學(xué)課件:相控陣?yán)走_(dá)
- 西方史學(xué)史課件3教學(xué)
- 2024年中國(guó)醫(yī)藥研發(fā)藍(lán)皮書(shū)
- 紅色中國(guó)風(fēng)蛇年年會(huì)邀請(qǐng)函
評(píng)論
0/150
提交評(píng)論