《機器學習-Python實踐》試卷10_第1頁
《機器學習-Python實踐》試卷10_第2頁
《機器學習-Python實踐》試卷10_第3頁
《機器學習-Python實踐》試卷10_第4頁
《機器學習-Python實踐》試卷10_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第1頁,共1頁一、單項選擇題(本大題共10小題,每題3分,共30分)試卷(2021試卷(2021-2022學年第1學期)考試科目機器學習-Python實踐(A卷)適用專業(yè)班級(年級)得分命題人:審閱人:班級學號姓名考試科目裝訂線1、假設你正在做一個項目,它是一個二元分類問題。你在數據集上訓練一個模型,并在驗證數據集上得到混淆矩陣?;谏鲜龌煜仃嚕旅婺膫€選項會給你正確的預測。()1精確度是~0.912錯誤分類率是~0.913假正率(Falsecorrectclassification)是~0.954真正率(Truepositiverate)是~0.95A1和3B2和4C1和4D2和32、對于下面的超參數來說,更高的值對于決策樹算法更好嗎?1用于拆分的樣本量()2樹深3樹葉樣本A1和2B2和3C1和3D1、2和3E無法分辨3、假如我們使用非線性可分的SVM目標函數作為最優(yōu)化對象,我們怎么保證模型線性可分?()A設C=1B設C=0C設C=無窮大D以上都不對4、NaveBayes是一種特殊的Bayes分類器,特征變量是X,類別標簽是C,它的一個假定是:()A.各類別的先驗概率P(C)是相等的B.以0為均值,sqr(2)/2為標準差的正態(tài)分布C.特征變量X的各個維度是類別條件獨立隨機變量D.P(X|C)是高斯分布5、假定某同學使用NaiveBayesian(NB)分類模型時,不小心將訓練數據的兩個維度搞重復了,那么關于NB的說法中正確的是:()A.這個被重復的特征在模型中的決定作用會被加強B.模型效果相比無重復特征的情況下精確度會降低C.如果所有特征都被重復一遍,得到的模型預測結果相對于不重復的情況下的模型預測結果一樣。D.當兩列特征高度相關時,無法用兩列特征相同時所得到的結論來分析問題6、統計模式分類問題中,當先驗概率未知時,可以使用()A.最小最大損失準則B.最小誤判概率準則C.最小損失準則D.N-P判決7、甲盒中有200個螺桿,其中有160個A型螺桿;乙盒中有240個螺母,其中有180個A型的。現從甲乙兩盒中各任取一個,則能配成A型螺栓的概率為多少?()A.1/20B.15/16C.3/5D.19/208、關于激活函數功能表述正確的是?()A.信號強度大于閾值的向下一層傳播B.信號強度小于閾值的向下一層傳播C.信號強度始終不向下一層傳播D.以上都不對9、激活函數的作用描述錯誤的是?()A.輔助信號傳輸的門控函數B.構建模型的非線性特性C.提升學習復雜模型的能力D.對與非線性沒有幫助,可有可無10、如下那些函數沒有梯度消失的問題?()A.ReLUB.sigmoidC.tanhD.softmax二、判斷題(本大題共10小題,每題1分,共10分)1、如果一個經過訓練的機器學習模型在測試集上達到100%的準確率, 這是否意味著該模型將在另外一個新的測試集上也能得到100%的準確率。 ()2、如果自變量X和因變量Y之間存在高度的非線性和復雜關系,那 么樹模型很可能優(yōu)于經典回歸方法。()3、在訓練完SVM之后,我們可以只保留支持向量,而舍去所有非支持 向量。 仍然不會影響模型分類能力。()4、兩個變量相關,它們的相關系數r可能為0。()5、如果兩個變量相關,那么它們一定是線性關系嗎?()6、“過擬合”只在監(jiān)督學習中出現,在非監(jiān)督學習中,沒有“過擬合”, 這是()7、錯誤率(ErrorRate)是分類錯誤的樣本數占樣本總數的比例。 ()8、DSS主要是基于數據倉庫.聯機數據分析和數據挖掘技術的應用。 ()9、OLAP技術側重于把數據庫中的數據進行分析、轉換成輔助決策信息, 是繼數據庫技術發(fā)展之后迅猛發(fā)展起來的一種新技術。()10、商業(yè)智能系統與一般交易系統之間在系統設計上的主要區(qū)別在于: 后者把結構強加于商務之上,一旦系統設計完畢,其程序和規(guī)則不會輕 易改變;而前者則是一個學習型系統,能自動適應商務不斷變化的要求。 ()三、填空(本大題共10小題,每題3分,共30分)1、是具有相同特征和緯度的對象的集合,表現為一張二維數據表。2、線性回歸如果是泊松分布,那就是。3、經驗誤差(empiricalerror)也叫。4、訓練過程中用到的數據叫。5、模型沒有很好地捕捉到數據特征,不能夠很好地擬合數據叫。6、評判分類效果好壞的三個指標就是上面介紹的三個指標:,,。7、損失函數也叫或。8、分類(Classification):是把不同的數據劃分開,其過程是通過訓練數據集獲得一個分類器,再通過分類器去預測未知數據,分類是一種。9、聚類的一般過程數據準備:和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論