南開《數(shù)據(jù)科學(xué)導(dǎo)論》20春期末考核答案_第1頁
南開《數(shù)據(jù)科學(xué)導(dǎo)論》20春期末考核答案_第2頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)據(jù)科學(xué)導(dǎo)論20春期末考核-00001試卷總分:100 得分:70一、單選題 (共 15 道試題,共 30 分)1.下面不是分類的常用方法的有()A.K近鄰法B.樸素貝葉斯C.決策樹D.條件隨機(jī)場(chǎng)答案:D2.BFR聚類用于在()歐氏空間中對(duì)數(shù)據(jù)進(jìn)行聚類A.高維B.中維C.低維D.中高維答案:A3.聚類是一種()。A.有監(jiān)督學(xué)習(xí)B.無監(jiān)督學(xué)習(xí)C.強(qiáng)化學(xué)習(xí)D.半監(jiān)督學(xué)習(xí)答案:B4.數(shù)據(jù)庫中相關(guān)聯(lián)的兩張表都存儲(chǔ)了用戶的個(gè)人信息,但在用戶的個(gè)人信息發(fā)生改變時(shí)只更新了一張表中的數(shù)據(jù),這時(shí)兩張表中就有了不一致的數(shù)據(jù),這屬于()A.異常值B.缺失值C.不一致的值D.重復(fù)值答案:C5.某商品的產(chǎn)量(X,件)與

2、單位成本(Y,元/件)之間的回歸方程為Y=100-1.2X,這說明()。A.產(chǎn)量每增加一臺(tái),單位成本增加100元B.產(chǎn)量每增加一臺(tái),單位成本減少1.2元C.產(chǎn)量每增加一臺(tái),單位成本平均減少1.2元D.產(chǎn)量每增加一臺(tái),單位平均增加100元答案:C6.在k近鄰法中,選擇較小的k值時(shí),學(xué)習(xí)的“近似誤差”會(huì)(),“估計(jì)誤差”會(huì)()。A.減小,減小B.減小,增大C.增大,減小D.增大,增大答案:B7.在回歸分析中,自變量為(),因變量為()。A.離散型變量,離散型變量B.連續(xù)型變量,離散型變量C.離散型變量,連續(xù)型變量D.連續(xù)型變量,連續(xù)型變量答案:D8.手肘法的核心指標(biāo)是()。A.SESB.SSEC.

3、RMSED.MSE答案:B9.特征選擇的四個(gè)步驟中不包括()A.子集產(chǎn)生B.子集評(píng)估C.子集搜索D.子集驗(yàn)證答案:C10.一元線性回歸中,真實(shí)值與預(yù)測(cè)值的差稱為樣本的()。A.誤差B.方差C.測(cè)差D.殘差答案:D11.K-means聚類適用的數(shù)據(jù)類型是()。A.數(shù)值型數(shù)據(jù)B.字符型數(shù)據(jù)C.語音數(shù)據(jù)D.所有數(shù)據(jù)答案:A12.以下哪些不是缺失值的影響()A.數(shù)據(jù)建模將丟失大量有用信息B.數(shù)據(jù)建模的不確定性更加顯著C.對(duì)整體總是不產(chǎn)生什么作用D.包含空值的數(shù)據(jù)可能會(huì)使建模過程陷入混亂,導(dǎo)致異常的輸出答案:C13.下列兩個(gè)變量之間的關(guān)系中,哪個(gè)是函數(shù)關(guān)系()。A.人的性別和他的身高B.人的工資與年齡C

4、.正方形的面積和邊長D.溫度與濕度答案:C14.考慮下面的頻繁3-項(xiàng)集的集合:1,2,3,1,2,4,1,2,5,1,3,4,1,3,5,2,3,4,2,3,5,3,4,5假定數(shù)據(jù)集中只有5個(gè)項(xiàng),采用 合并策略,由候選產(chǎn)生過程得到4-項(xiàng)集不包含()A.1,2,3,4B.1,2,3,5C.1,2,4,5D.1,3,4,5答案:C15.單層感知機(jī)模型屬于()模型。A.二分類的線性分類模型B.二分類的非線性分類模型C.多分類的線性分類模型D.多分類的非線性分類模型答案:A二、多選題 (共 5 道試題,共 10 分)16.系統(tǒng)日志收集的基本特征有()A.高可用性B.高可靠性C.可擴(kuò)展性D.高效率答案:

5、ABC17.距離度量中的距離可以是()A.歐式距離B.曼哈頓距離C.Lp距離D.Minkowski距離答案:ABCD18.K-means聚類中K值選取的方法是()。A.密度分類法B.手肘法C.大腿法D.隨機(jī)選取答案:AB19.多層感知機(jī)的學(xué)習(xí)過程包含()。A.信號(hào)的正向傳播B.信號(hào)的反向傳播C.誤差的正向傳播D.誤差的反向傳播答案:AD20.一元回歸參數(shù)估計(jì)的參數(shù)求解方法有()。A.最大似然法B.距估計(jì)法C.最小二乘法D.歐式距離法答案:ABC三、判斷題 (共 15 道試題,共 30 分)21.Jaccard系數(shù)只關(guān)心個(gè)體間共同具有的特征是否一致這個(gè)問題。答案:正確22.標(biāo)準(zhǔn)BP算法是在讀取全

6、部數(shù)據(jù)集后,對(duì)參數(shù)進(jìn)行統(tǒng)一更新的算法。答案:錯(cuò)誤23.使用SVD方法進(jìn)行圖像壓縮不可以保留圖像的重要特征。答案:錯(cuò)誤24.特征選擇和降維都是用于減少特征數(shù)量,進(jìn)而降低模型復(fù)雜度、防止過度擬合。答案:正確25.一個(gè)人的身高與體重之間具有函數(shù)關(guān)系。答案:錯(cuò)誤26.K均值(K-Means)算法是密度聚類。答案:錯(cuò)誤27.數(shù)據(jù)科學(xué)可以回答復(fù)雜的問題,發(fā)現(xiàn)世界中隱藏的聯(lián)系并預(yù)測(cè)和指導(dǎo)未來。答案:正確28.選擇較小的k值,相當(dāng)于用較小的鄰域中的訓(xùn)練實(shí)例進(jìn)行預(yù)測(cè),學(xué)習(xí)的“近似誤差”會(huì)減小,“估計(jì)誤差”會(huì)增大,預(yù)測(cè)結(jié)果會(huì)對(duì)近鄰的點(diǎn)實(shí)例點(diǎn)非常敏感。答案:正確29.利用K近鄰法進(jìn)行分類時(shí),使用不同的距離度量所確定

7、的最近鄰點(diǎn)都是相同的。答案:錯(cuò)誤30.對(duì)于項(xiàng)集來說,置信度沒有意義。答案:正確31.每個(gè)類的先驗(yàn)概率可以通過屬于該類的訓(xùn)練記錄所占的比例來估計(jì)。答案:正確32.當(dāng)維度增加時(shí),特征空間的體積增加得很快,使得可用的數(shù)據(jù)變得稠密。答案:錯(cuò)誤33.利用K近鄰法進(jìn)行分類時(shí),k值過小容易發(fā)生過擬合現(xiàn)象。答案:正確34.聚合方法是自底向上的方法。答案:正確35.平均減少的不純度越大,則特征重要度越高。答案:正確四、主觀填空題 (共 5 道試題,共 10 分)36.#感知機(jī)足以解決任何復(fù)雜的分類問題。答案:雙隱層37.判定系數(shù)取值范圍為0,1,判定系數(shù)越接近#,表明變量之間的相關(guān)性越強(qiáng)。答案:-138.在線性回歸分析中,當(dāng)輸入特征的維度從一維增加到d維(d>1),則該問題為#問題。答案:多元線性回歸39.多元線性回歸中,在有統(tǒng)計(jì)學(xué)意義的前提下,標(biāo)準(zhǔn)化偏回歸系數(shù)的絕對(duì)值越大,說明相應(yīng)的自變量對(duì)y的作用#。答案:越大40.在k近鄰法中,通常采用#來選取最優(yōu)的k值。答案:交叉驗(yàn)證法五、簡(jiǎn)答題 (共 2 道試題,共 20 分)41.單層感知機(jī)和多層感知機(jī)分別解決的是哪類問題?答案:1).單層感知機(jī)只能

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論