長春工程學(xué)院《數(shù)據(jù)分析與數(shù)據(jù)挖掘》2023-2024學(xué)年第一學(xué)期期末試卷_第1頁
長春工程學(xué)院《數(shù)據(jù)分析與數(shù)據(jù)挖掘》2023-2024學(xué)年第一學(xué)期期末試卷_第2頁
長春工程學(xué)院《數(shù)據(jù)分析與數(shù)據(jù)挖掘》2023-2024學(xué)年第一學(xué)期期末試卷_第3頁
長春工程學(xué)院《數(shù)據(jù)分析與數(shù)據(jù)挖掘》2023-2024學(xué)年第一學(xué)期期末試卷_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

裝訂線裝訂線PAGE2第1頁,共3頁長春工程學(xué)院《數(shù)據(jù)分析與數(shù)據(jù)挖掘》

2023-2024學(xué)年第一學(xué)期期末試卷院(系)_______班級_______學(xué)號_______姓名_______題號一二三總分得分一、單選題(本大題共20個小題,每小題2分,共40分.在每小題給出的四個選項中,只有一項是符合題目要求的.)1、對于一個存在多重共線性的回歸模型,使用嶺回歸方法進(jìn)行修正,其原理是?A.增加變量B.減少變量C.對系數(shù)進(jìn)行約束D.對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化2、在一項關(guān)于大學(xué)生就業(yè)意向的調(diào)查中,詢問了學(xué)生期望的工作地點、行業(yè)、薪資等。若要分析不同專業(yè)的學(xué)生在就業(yè)意向上是否存在顯著差異,應(yīng)采用以下哪種統(tǒng)計方法?A.卡方獨立性檢驗B.方差分析C.相關(guān)分析D.回歸分析3、某城市的交通流量在一天內(nèi)不同時間段有明顯差異。為了描述這種差異,將一天分為24個小時段,計算每個時段的交通流量均值。這種數(shù)據(jù)屬于?A.截面數(shù)據(jù)B.時間序列數(shù)據(jù)C.面板數(shù)據(jù)D.混合數(shù)據(jù)4、在進(jìn)行回歸分析時,如果存在多重共線性問題,會對模型產(chǎn)生什么影響?()A.系數(shù)估計不準(zhǔn)確B.方差增大C.預(yù)測能力下降D.以上都有可能5、某公司為了解員工對新福利政策的滿意度,隨機抽取了200名員工進(jìn)行調(diào)查。結(jié)果顯示,滿意的有120人,不滿意的有80人。要檢驗員工的滿意度是否超過50%,應(yīng)采用哪種假設(shè)檢驗方法?()A.單側(cè)Z檢驗B.單側(cè)t檢驗C.雙側(cè)Z檢驗D.雙側(cè)t檢驗6、已知一組數(shù)據(jù)的偏態(tài)系數(shù)為0,峰度系數(shù)為3,說明數(shù)據(jù)的分布情況如何?()A.接近正態(tài)分布B.左偏態(tài)C.右偏態(tài)D.無法確定7、某股票的收益率在過去10個交易日的變化情況如下:5%,-2%,8%,-3%,10%,-1%,6%,-4%,7%,2%。計算這組數(shù)據(jù)的幾何平均收益率約為多少?()A.2.5%B.3.0%C.3.5%D.4.0%8、要比較兩個獨立樣本的離散程度,以下哪個統(tǒng)計量最合適?()A.標(biāo)準(zhǔn)差B.方差C.變異系數(shù)D.極差9、已知一組數(shù)據(jù)的偏態(tài)系數(shù)為-0.8,峰態(tài)系數(shù)為2.5,說明這組數(shù)據(jù)的分布形態(tài)是?A.左偏且尖峰B.右偏且尖峰C.左偏且平峰D.右偏且平峰10、為了解某超市不同商品的銷售情況,對一周內(nèi)的銷售數(shù)據(jù)進(jìn)行分析。哪種統(tǒng)計圖表最能直觀地展示各類商品的銷售額占比?()A.柱狀圖B.折線圖C.餅圖D.箱線圖11、在比較兩種測量方法的準(zhǔn)確性時,收集了同一組樣本分別用兩種方法測量的數(shù)據(jù)。應(yīng)采用哪種統(tǒng)計方法進(jìn)行分析?()A.配對樣本t檢驗B.獨立樣本t檢驗C.方差分析D.以上都不對12、為比較兩種教學(xué)方法的效果,分別對兩個班級進(jìn)行測試。甲班30人的平均成績?yōu)?5分,標(biāo)準(zhǔn)差為10分;乙班25人的平均成績?yōu)?0分,標(biāo)準(zhǔn)差為8分。要檢驗兩個班級的平均成績是否有顯著差異,應(yīng)采用()A.單側(cè)t檢驗B.雙側(cè)t檢驗C.單側(cè)Z檢驗D.雙側(cè)Z檢驗13、已知隨機變量X服從參數(shù)為λ的泊松分布,且P(X=2)=P(X=3),則λ的值是多少?A.2B.3C.6D.914、在分析某班級學(xué)生的考試成績時,發(fā)現(xiàn)數(shù)學(xué)成績和物理成績之間存在一定的相關(guān)性。為進(jìn)一步探究這種相關(guān)性的本質(zhì),應(yīng)進(jìn)行以下哪種分析?()A.簡單線性回歸B.曲線回歸C.非線性回歸D.以上都不對15、對某城市的交通流量進(jìn)行監(jiān)測,連續(xù)記錄了30天的數(shù)據(jù)。發(fā)現(xiàn)每天的平均車流量服從正態(tài)分布,均值為5000輛,標(biāo)準(zhǔn)差為800輛。若要以90%的置信區(qū)間估計該城市的日平均車流量,其區(qū)間寬度大約是多少?()A.300輛B.400輛C.500輛D.600輛16、對一個總體進(jìn)行多次抽樣,每次抽樣的樣本均值會有所不同。樣本均值的標(biāo)準(zhǔn)差被稱為?()A.總體標(biāo)準(zhǔn)差B.樣本標(biāo)準(zhǔn)差C.抽樣平均誤差D.標(biāo)準(zhǔn)誤17、對于一個包含多個變量的數(shù)據(jù)集,若要降低變量維度同時保留大部分信息,以下哪種方法較為常用?()A.因子分析B.聚類分析C.對應(yīng)分析D.典型相關(guān)分析18、某研究人員想分析多個變量之間的復(fù)雜關(guān)系,并將這些變量歸結(jié)為幾個綜合指標(biāo)。應(yīng)采用哪種統(tǒng)計方法?()A.主成分分析B.因子分析C.對應(yīng)分析D.典型相關(guān)分析19、在對一家超市的銷售額進(jìn)行預(yù)測時,收集了過去5年每個月的銷售額數(shù)據(jù)。如果采用季節(jié)指數(shù)法,需要首先計算每個月的季節(jié)指數(shù)。已知1月份的平均銷售額為10萬元,總平均銷售額為8萬元,那么1月份的季節(jié)指數(shù)約為多少?()A.1.25B.0.8C.1.5D.0.6720、在一項關(guān)于消費者購買行為的調(diào)查中,記錄了消費者的年齡、收入、購買頻率等信息。如果要研究年齡和購買頻率之間的關(guān)系,應(yīng)該繪制哪種圖形?A.直方圖B.散點圖C.箱線圖D.餅圖二、簡答題(本大題共4個小題,共40分)1、(本題10分)對于一個時間序列數(shù)據(jù),如何判斷其是否平穩(wěn)?如果不平穩(wěn),有哪些方法可以使其平穩(wěn)化?2、(本題10分)詳細(xì)說明在進(jìn)行貝葉斯網(wǎng)絡(luò)分析時,如何構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)和進(jìn)行概率推理,并舉例應(yīng)用。3、(本題10分)對于一個包含大量缺失值的數(shù)據(jù)集合,在進(jìn)行數(shù)據(jù)分析之前應(yīng)如何處理?請詳細(xì)說明可以采用的方法和策略,并討論每種方法的優(yōu)缺點。4、(本題10分)解釋什么是層次聚類和劃分聚類,它們的基本思想和算法流程是什么?舉例說明在實際應(yīng)用中的選擇依據(jù)。三、案例分析題(本大題共2個小題,共20分)1、(本題10分)某互聯(lián)網(wǎng)公司

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論