Python經(jīng)濟(jì)大數(shù)據(jù)分析 試卷二_第1頁(yè)
Python經(jīng)濟(jì)大數(shù)據(jù)分析 試卷二_第2頁(yè)
Python經(jīng)濟(jì)大數(shù)據(jù)分析 試卷二_第3頁(yè)
Python經(jīng)濟(jì)大數(shù)據(jù)分析 試卷二_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

桂林電子科技大學(xué)試卷2022-2023學(xué)年第1學(xué)期;課號(hào)課程名稱(chēng)Python經(jīng)濟(jì)大數(shù)據(jù)分析(B閉卷);適用班級(jí)(或年級(jí)、專(zhuān)業(yè))(每位考生需要答題紙(8k)1張、草稿紙(16k)1張)考試時(shí)間120分鐘班級(jí)學(xué)號(hào)姓名題號(hào)一二三四五六七八九十成績(jī)滿分30202030得分評(píng)卷人一、單項(xiàng)選擇題(每道題2分,共30分)1.在進(jìn)行數(shù)據(jù)抽樣時(shí)候的標(biāo)準(zhǔn)不包括:()A.可靠性B.有效性C.一致性D.相關(guān)性2.以下代碼的運(yùn)行結(jié)果是?()defInputInt(a):a=15b=2InputInt(b)print(b)15B.2C.15.2D.b3.對(duì)于數(shù)據(jù)挖掘中的原始數(shù)據(jù),不需要考慮的問(wèn)題包括()。A.錯(cuò)誤值B.重復(fù)C.不完整D.數(shù)據(jù)產(chǎn)生的人4.對(duì)于不服從正態(tài)分布的變量、分類(lèi)或等級(jí)變量之間的關(guān)聯(lián)性常采用:()A.Spearman相關(guān)系數(shù)B.判定系數(shù)C.Pearson相關(guān)系數(shù)D.Gamma系數(shù)5.在進(jìn)行數(shù)據(jù)探索時(shí)能夠一次查看數(shù)據(jù)的基本情況的方法是()A.subplot()B.describe()C.cumsum()D.add_subplot()6.由于研究目的和對(duì)比基礎(chǔ)不同,在進(jìn)行相對(duì)數(shù)比較時(shí)采用的方法不包括()A.結(jié)構(gòu)相對(duì)數(shù)B.比例相對(duì)數(shù)C.過(guò)程相對(duì)數(shù)D.強(qiáng)度相對(duì)數(shù)7.以下不屬于數(shù)據(jù)處理中經(jīng)常使用的缺失值填充的方法()。A.忽略元組B.屬性均值填充缺失值C.最近鄰填充缺失值D.回歸填充缺失值8.哪些算法不需要數(shù)據(jù)歸一化?A.kNNB.SVMC.k-meansD.決策樹(shù)9.以下哪些方法不能用于處理欠擬合?A.增加模型復(fù)雜度B.增大正則化系數(shù)C.增加新的特征D.對(duì)特征進(jìn)行變換,使用組合特征或高維特征10.以下那種說(shuō)法是錯(cuò)誤的()。A.一個(gè)系統(tǒng)越是有序,信息熵就越低B.中國(guó)足球隊(duì)?wèi)?zhàn)勝巴西足球隊(duì)的信息熵要小于中國(guó)乒乓球隊(duì)?wèi)?zhàn)勝巴西乒乓球隊(duì)的信息熵C.信息增益=信息熵-條件熵D.一個(gè)系統(tǒng)越是混亂,隨機(jī)變量的不確定性就越大,信息熵就越高11.關(guān)于CART算法,錯(cuò)誤的是()。A.CART算法既可以處理分類(lèi)問(wèn)題,也可以處理回歸問(wèn)題B.可以處理樣本不平衡問(wèn)題C.CART算法采用信息增益率的大小來(lái)度量特征的各個(gè)劃分點(diǎn)D.CART分類(lèi)樹(shù)采用基尼系數(shù)的大小來(lái)度量特征的各個(gè)劃分點(diǎn)12.某超市研究銷(xiāo)售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買(mǎi)啤酒的人很大概率也會(huì)購(gòu)買(mǎi)尿布,這種屬于數(shù)據(jù)挖掘中的()。A.關(guān)聯(lián)規(guī)則B.聚類(lèi)C.分類(lèi)D.自然語(yǔ)言處理13.有關(guān)數(shù)據(jù)挖掘預(yù)處理不正確的說(shuō)法是()。A.預(yù)處理是數(shù)據(jù)挖掘一個(gè)不可少的環(huán)節(jié)B.數(shù)值規(guī)約可以使用聚類(lèi)進(jìn)行C.預(yù)處理涉及缺失值分析、異常值分析等很多工作D.預(yù)處理的過(guò)程可能本身就是一個(gè)數(shù)據(jù)挖掘過(guò)程14.假設(shè)屬性income的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方法將屬性的值映射到0至1的范圍內(nèi)。對(duì)屬性income的73600元將被轉(zhuǎn)化為:()A.0.821B.1.224C.1.458D.0.71615.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時(shí),可以使用哪種技術(shù)促使帶同類(lèi)標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離?A.分類(lèi)B.聚類(lèi)C.關(guān)聯(lián)分析D.協(xié)同過(guò)濾二、填空題(每空2分,共20分)1.數(shù)據(jù)抽樣的標(biāo)準(zhǔn)包括:可靠性、有效性、___________。2.Python中包含4種內(nèi)建的數(shù)據(jù)結(jié)構(gòu)為:________、字典、元組、_________。3.常用的異常值探測(cè)方法是簡(jiǎn)單統(tǒng)計(jì)量分析、箱型圖分析和____________。4.數(shù)據(jù)的不一致性主要是數(shù)據(jù)的_____________和______________。5.處理缺失值常用的三種方法是:刪除記錄、___________和____________。6.實(shí)現(xiàn)分類(lèi)與預(yù)測(cè)的常用算法有回歸分析、__________、人工神經(jīng)網(wǎng)絡(luò)、___________和支持向量機(jī)。三、名詞解釋題(每道題5分,共20分)1.分類(lèi)2.決策樹(shù)3.預(yù)測(cè)4.純隨機(jī)序列四、簡(jiǎn)答題(每道題6分,共30

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論