大數(shù)據(jù)-單選復(fù)習(xí)測試題_第1頁
大數(shù)據(jù)-單選復(fù)習(xí)測試題_第2頁
大數(shù)據(jù)-單選復(fù)習(xí)測試題_第3頁
大數(shù)據(jù)-單選復(fù)習(xí)測試題_第4頁
大數(shù)據(jù)-單選復(fù)習(xí)測試題_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第頁大數(shù)據(jù)-單選復(fù)習(xí)測試題1.在HMM中,如果已知觀察序列和產(chǎn)生觀察序列的狀態(tài)序列,那么可用以下哪種方法直接進(jìn)行參數(shù)估計A、EM算法B、維特比算法C、前向后向算法D、極大似然估計【正確答案】:D2.Spark計算框架在分布式環(huán)境下對數(shù)據(jù)處理后的結(jié)果進(jìn)行隨機(jī)的、實時的存儲歸功于()。A、HiveB、OracleC、MongodbD、HBase【正確答案】:D3.在shell腳本中,當(dāng)腳本編寫完成后可以通過sh命令的什么參數(shù)來調(diào)試腳本?A、-xvB、-XvC、-oD、-t【正確答案】:A4.當(dāng)決策樹出現(xiàn)過擬合后,需要使用()技術(shù)縮小樹的結(jié)構(gòu)和規(guī)模A、剪枝B、回歸C、小波D、調(diào)和【正確答案】:A5.()是一種處理時序數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),常用語語音識別、機(jī)器翻譯等領(lǐng)域。A、前饋卷神經(jīng)網(wǎng)絡(luò)B、卷積神經(jīng)網(wǎng)絡(luò)C、循環(huán)神經(jīng)網(wǎng)絡(luò)D、對抗神經(jīng)網(wǎng)絡(luò)【正確答案】:C6.importpandasaspddf=pd.DataFrame('a':[1,2,3])print(df.shape)輸出結(jié)果是A、(3,)B、(3,1)C、(,3)D、-3【正確答案】:B7.1.如下:str1="Runoobexamplewow!!!"str2="exam";Print(str1.find(str2,5))打印的結(jié)果是A、6B、7C、8D、-1【正確答案】:B8.F1參數(shù)(),說明模型越穩(wěn)定。A、越小B、越大C、越趨近于某一特定值D、F1參數(shù)和模型穩(wěn)定性沒有關(guān)系【正確答案】:B9.以下選項中不是Python對文件的打開模式的是A、rB、wC、aD、c【正確答案】:D10.回歸問題和分類問題的區(qū)別是什么?A、回歸問題與分類問題在輸入屬性值上要求不同B、回歸問題有標(biāo)簽,分類問題沒有C、回歸問題輸出值是連續(xù)的,分類問題輸出值是離散的D、回歸問題輸出值是離散的,分類問題輸出值是連續(xù)的【正確答案】:C11.現(xiàn)在有一億條數(shù)據(jù)要插入Hbase,使用下列哪種方式最好?A、shell端put命令B、put方法C、bulkload方法D、insert方法【正確答案】:C12.死鎖發(fā)生的原因是()A、并發(fā)控制B、服務(wù)器故障C、數(shù)據(jù)錯誤D、操作失誤【正確答案】:A13.Hive常被用來處理()場景。A、事務(wù)性處理B、批量計算C、實時性計算D、流計算【正確答案】:B14.一監(jiān)獄人臉識別準(zhǔn)入系統(tǒng)用來識別待進(jìn)入人員的身份,此系統(tǒng)一共包括識別4種不同的人員:獄警,小偷,送餐員,其他。下面哪種學(xué)習(xí)方法最適合此種應(yīng)用需求A、二分類問題B、多分類問題C、層次聚類問題D、回歸問題【正確答案】:B15.在shell腳本中,標(biāo)準(zhǔn)輸出文件(stdout)的文件描述符為多少?A、0B、1C、2D、3【正確答案】:B16.下列不是遞歸程序特點的是()A、一定要有基例B、執(zhí)行效率高C、思路簡單,代碼不一定容易理解D、書寫簡單【正確答案】:B17.與傳統(tǒng)關(guān)系數(shù)據(jù)庫不同的是,HBase是()的數(shù)據(jù)庫。A、結(jié)構(gòu)化的B、單一版本的C、面向列D、非開源的【正確答案】:C18.一般情況下,KNN最近鄰方法在()情況下效果最好A、樣本呈現(xiàn)團(tuán)狀分布B、樣本呈現(xiàn)鏈狀分布C、樣本較多但典型性不好D、樣本較少但典型性好【正確答案】:D19.input()輸入的是數(shù)據(jù)類型是()A、整型B、復(fù)數(shù)型C、字符串型D、浮點型【正確答案】:C20.在shell腳本中,以下哪個特殊符號代表所有向腳本傳遞的參數(shù)?A、$#B、$?C、$@D、$$【正確答案】:C21.在HDFS中()是文件系統(tǒng)的工作節(jié)點。A、DataNodeB、ClientC、NameNodeD、Flume【正確答案】:A22.ROC曲線圖凸向(),代表模型越理想。A、左上角B、左下角C、右上角D、右下角【正確答案】:A23.SparkSQL的前身是()。A、SQLB、SharkC、SparkRDDD、MapReduce【正確答案】:B24.為了觀察測試Y與X之間的線性關(guān)系,X是連續(xù)變量,使用下列哪種圖形比較適合?A、散點圖B、柱形圖C、直方圖D、以上都不對【正確答案】:A25.數(shù)據(jù)加工的本質(zhì)是()。A、將低層次數(shù)據(jù)轉(zhuǎn)換為高層次數(shù)據(jù)的過程B、將復(fù)雜數(shù)據(jù)轉(zhuǎn)換為簡單數(shù)據(jù)的過程C、將臟數(shù)據(jù)處理為干凈數(shù)據(jù)的過程D、將亂數(shù)據(jù)處理為整齊數(shù)據(jù)的過程【正確答案】:A26.使用哪個關(guān)鍵字聲明匿名函數(shù)A、functionB、funcC、defD、lambda【正確答案】:D27.下列說法錯誤的是A、當(dāng)目標(biāo)函數(shù)是凸函數(shù)時,梯度下降算法的解一般就是全局最優(yōu)解B、進(jìn)行PCA降維時,需要計算協(xié)方差矩陣C、沿負(fù)梯度的方向一定是最優(yōu)的方向D、利用拉格朗日函數(shù)能解帶約束的優(yōu)化問題【正確答案】:C28.Python中關(guān)于函數(shù)的形參與實參,以下選項中描述不正確的是A、實參就是在函數(shù)調(diào)用的時候,通過函數(shù)后面的括號傳遞給函數(shù),讓函數(shù)處理的值B、形參只是在函數(shù)定義時使用C、實參可以是變量或值D、函數(shù)的實參不可以是表達(dá)式【正確答案】:D29.關(guān)于Python賦值語句,下列選項不合法的是A、m,n=n,mB、n=2;m=3C、n,m=12D、n,m="12"【正確答案】:C30.以下哪項屬于DDL操作()A、updateB、createC、insertD、delete【正確答案】:B31.Spark為處理結(jié)構(gòu)化數(shù)據(jù)而設(shè)計的模塊是()A、SparkSQLB、SparkStreamingC、MLibD、Graphx【正確答案】:A32.下列屬于分類算法的是()A、多元線性回歸B、邏輯回歸C、K均值D、一元線性回歸【正確答案】:B33.當(dāng)不知道數(shù)據(jù)所處類別時,可以使用哪種技術(shù)促使同類數(shù)據(jù)與其他類數(shù)據(jù)分離A、分類B、聚類C、關(guān)聯(lián)分析D、隱馬爾可夫鏈【正確答案】:B34.在基本DBSCAN的參數(shù)選擇方法中,點到它的K個最近鄰的距離中的K選作為哪一個參數(shù)()A、EpsB、MinPtsC、質(zhì)心D、邊界【正確答案】:B35.下列哪一個神經(jīng)網(wǎng)絡(luò)模型更適合于自然語言處理()A、卷積神經(jīng)網(wǎng)絡(luò)CNNB、循環(huán)神經(jīng)網(wǎng)絡(luò)RNNC、BP神經(jīng)網(wǎng)絡(luò)模型D、Hopfield神經(jīng)網(wǎng)格模型【正確答案】:B36.print(df.iloc[[1,3]])顯示A、第1和第3行B、第1到第3行C、第1和第3列D、第1到第3列【正確答案】:A37.Hadoop中MapReduce組件擅長處理()場景的計算任務(wù)。A、迭代計算B、離線計算C、實時交互計算D、流式計算【正確答案】:B38.()是用來評估神經(jīng)網(wǎng)絡(luò)計算模型對樣本的預(yù)測值和真實值之間的誤差大小。A、優(yōu)化函數(shù)B、梯度下降C、反向傳播D、損失函數(shù)【正確答案】:D39.Python代碼中mpl.rcParams['font.sans-serif']=['SimHei']的作用是(____)。A、設(shè)置圖表中文顯示的字體B、設(shè)置圖表圖例的位置C、設(shè)置圖表標(biāo)題的顏色D、設(shè)置圖表標(biāo)題的位置【正確答案】:A40.print(df.iloc[:,2])顯示A、前兩列B、后兩列C、第二列D、前兩行【正確答案】:A41.下面有關(guān)分類算法的準(zhǔn)確率,召回率,F(xiàn)1值的描述,錯誤的是A、準(zhǔn)確率是檢索出相關(guān)文檔數(shù)與檢索出的文檔總數(shù)的比率,衡量的是檢索系統(tǒng)的查準(zhǔn)率B、召回率是指檢索出的相關(guān)文檔數(shù)和文檔庫中所有的相關(guān)文檔數(shù)的比率,衡量的是檢索系統(tǒng)的查全率C、率正確率.召回率和F值取值都在0和1之間,數(shù)值越接近0,查準(zhǔn)率或查全率就越高D、率為了解決準(zhǔn)確率和召回率沖突問題,引入了F1分?jǐn)?shù)【正確答案】:C42.對Boosting模型的描述錯誤的是A、采用串行訓(xùn)練模式B、增加被錯誤分類樣本的權(quán)值C、通過改變訓(xùn)練集進(jìn)行有針對性的學(xué)習(xí)D、基礎(chǔ)分類器采用少數(shù)服從多數(shù)原則進(jìn)行集成【正確答案】:D43.將年齡用區(qū)間標(biāo)簽(例如0~18、19~44、45-59、60~100)或概念標(biāo)簽(如兒童、青年、中年和老年表示),該描述中用到的數(shù)據(jù)變換的策略為()。A、標(biāo)準(zhǔn)化B、數(shù)值化C、連續(xù)化D、離散化【正確答案】:D44.能夠提取出圖片邊緣特征的網(wǎng)絡(luò)是()。A、全連接層B、池化層C、卷積層D、隱藏層【正確答案】:C45.在抽樣方法中,當(dāng)合適的樣本容量很難確定時,可以使用的抽樣方法是:()A、有放回的簡單隨機(jī)抽樣B、無放回的簡單隨機(jī)抽樣C、分層抽樣D、漸進(jìn)抽樣【正確答案】:D46.評估完模型之后,發(fā)現(xiàn)模型存在高偏差(highbias),應(yīng)該如何解決?A、減少模型的特征數(shù)量B、增加模型的特征數(shù)量C、增加樣本數(shù)量D、以上說法都正確【正確答案】:B47.數(shù)據(jù)挖掘的英文簡寫是()A、DKDB、KDDC、DMDA【正確答案】:C48.下列Python3代碼運行的結(jié)果為()a=1try:a+=1except:a+=1else:a+=1finally:a+=1print(a)A、2B、3C、4D、5【正確答案】:C49.在MapReduce中,通常把Map拆分成了M個片段,把Reduce拆分成R個片段執(zhí)行。一般情況下,()由用戶指定。A、M值B、R值C、M值和R值D、以上都不正確【正確答案】:B50.deff1(a,b):A,b=1,2returnA,bA,b=10,20Print(a,b)Print(f1(a,b))Print(a,b)第二和第三個print函數(shù)分別輸出的結(jié)果是()A、(1,2)12B、(10,20)12C、(1,2)1020D、(10,20)1020【正確答案】:C51.()屬于無監(jiān)督學(xué)習(xí)A、分類B、回歸C、聚類D、決策樹模型【正確答案】:C52.一般而言,若數(shù)據(jù)類別比例超過()即認(rèn)為數(shù)據(jù)集中存在不均衡數(shù)據(jù)的現(xiàn)象A、0.084027778B、0.167361111C、0.042361111D、0.125694444【正確答案】:B53.假如你在訓(xùn)練一個線性回歸模型,有下面兩句話:1、如果數(shù)據(jù)量較少,容易發(fā)生過擬合。2、如果假設(shè)空間較小,容易發(fā)生過擬合。關(guān)于這兩句話,下列說法正確的是?A、1和2都錯誤B、1正確,2錯誤C、1錯誤,2正確D、1和2都正確【正確答案】:B54.評估完模型后,我們發(fā)現(xiàn)模型中有很高的偏差。我們怎樣來減少這個偏差A(yù)、減少模型中特征的數(shù)量B、增加模型中特征的數(shù)量C、增加模型中的數(shù)據(jù)點D、以上所有【正確答案】:B55.1.執(zhí)行以下代碼,返回結(jié)果是x={"姓名":"張三","單位":"河北電信"}print(x.pop("單位","abcd"))A、{"姓名":"張三"}B、"河北電信"C、"abcd"D、"張三"【正確答案】:B56.deff1(a,b):c=a*breturna*b+10Print(f1(2,4))Print(c)第二print函數(shù)的輸出的是()A、c未定義B、4C、2D、8【正確答案】:A57.Python程序采用Unicode編碼,英文字符和中文字符在Python中分別對應(yīng)字符長度分A、2和2B、1和1C、2和1D、1和2【正確答案】:B58.在決策樹中,當(dāng)一個節(jié)點分叉的時候,以下關(guān)于“信息增益”正確的是1.不純的節(jié)點越少,越需要更多的信息來描述種群2.信息增益可以用熵作為“1-Entropy”來推導(dǎo)3.信息增益偏向于數(shù)值大的屬性A、1B、2C、2和3D、都正確【正確答案】:C59.數(shù)據(jù)框中方法中dropna()的作用是A、去掉空值,并以默認(rèn)值填充B、去掉空值所在的行C、去掉指定的某行D、去掉指定的某些值【正確答案】:B60.在數(shù)據(jù)清洗中,對“臟”數(shù)據(jù)源需要進(jìn)行操作處理,不包括以下哪個方面A、完全清除某些輸入字段B、自動替換掉某些錯誤數(shù)據(jù)值C、對分配和調(diào)整的規(guī)則進(jìn)行完備的文檔記錄D、補入一些丟失的數(shù)據(jù)【正確答案】:C61.下列哪個語句在Python中是非法的()A、x=(y=z+1)B、x=y=z=1C、x+=yD、x,y=y,x【正確答案】:A62.以下關(guān)于Hive內(nèi)置函效描述正確的是?A、to_data():獲取當(dāng)前日期B、descfunctionsupper:查看系統(tǒng)自帶的函效C、substr():求字符串長度D、trim():去除空字符【正確答案】:D63.下列Python3代碼運行的結(jié)果為()a='a'print(a>'b'or'c')A、aB、bC、cD、FALSE【正確答案】:C64.Hbase中數(shù)據(jù)存儲的文件格式是:()。A、HlogB、TextFileC、HfileD、SequenceFile【正確答案】:C65.關(guān)于break的作用,下列說法中正確的是()A、跳出所有for/while循環(huán)B、按照縮進(jìn)跳出一層語句塊C、跳出一層for/while循環(huán)D、按照縮進(jìn)跳出除函數(shù)縮進(jìn)外的所有語句塊【正確答案】:C66.請輸入以下代碼的輸出形式x=np.array([1,2,3])y=np.array([4,5,6])print(x**y)A、["579"]B、["-3-3-3"]C、["41018"]D、["132729"]【正確答案】:D67.設(shè)計分布式數(shù)據(jù)倉庫hive的數(shù)據(jù)表時,為取樣更高效,一般可以對表中的連續(xù)字段進(jìn)行什么操作A、分桶B、分區(qū)C、索引D、分表【正確答案】:A68.Hadoop框架是用下面()語言寫的A、PytyonB、JavaC++D、Scala【正確答案】:B69.關(guān)于選擇k層交叉檢驗中“k”的值,以下說法正確的是A、k并不是越大越好,更大的k會減慢檢驗結(jié)果的過程B、選擇更大的k會導(dǎo)致降低向真實期望錯誤的傾斜C、選擇總是能最小化交叉驗證中的方差的kD、以上所有【正確答案】:D70.執(zhí)行下列程序,輸出結(jié)果為()deffun(a,*,b):print(b)fun(1,2,3,4)A、[2,3,4]B、[3,4]C、報錯D、4【正確答案】:C71.下面關(guān)于貝葉斯分類器描述錯誤的是A、以貝葉斯定理為基礎(chǔ)B、是基于后驗概率,推導(dǎo)出先驗概率C、可以解決有監(jiān)督學(xué)習(xí)的問題D、可以用極大似然估計法解貝葉斯分類器【正確答案】:B72.在shell腳本中如何移除array數(shù)組中索引為2的元素?A、delarray[2]B、unsetarray[2]C、removearray[2]D、rmarray[2]【正確答案】:B73.關(guān)于L1、L2正則化下列說法正確的是?A、L2正則化能防止過擬合,提升模型的泛化能力,但L1做不到這點B、L2正則化技術(shù)又稱為LassoRegularizationC、L1正則化得到的解更加稀疏D、L2正則化得到的解更加稀疏【正確答案】:C74.HDFS中的block默認(rèn)保存幾個備份A、3份B、2份C、1份D、不確定【正確答案】:A75.在shell腳本中,標(biāo)準(zhǔn)錯誤文件(stderr)的文件描述符為多少?A、0B、1C、2D、3【正確答案】:C76.1.關(guān)于以下代碼,運行結(jié)果正確的是s1="k:1|k1:2|k2:3|k3:4"d1={}lst=s1.split("|")foriinlst:lst2=i.split(":")d1[lst2[0]]=lst2[1]print(d1)A、{'k':'1','k1':'2','k2':'3','k3':'4'}B、["k:1","k1:2","k2:3","k3:4"]C、["k","1","k1","2","k2","3","k3","4"]D、程序錯誤【正確答案】:A77.給出如下代碼,可以輸出"Python"的是()S='Pythonisbeautiful!'A、print(s[0:6].lower())B、print(s[-21:-14].lower)C、print(s[:-14])D、print(s[1:6])【正確答案】:C78.關(guān)于定義函數(shù),說法正確是()A、函數(shù)中必須要寫return語句B、函數(shù)沒有return返回值為NoneC、函數(shù)要返回多少個值,就需要使用多少個return語句D、函數(shù)必需要return返回函數(shù)值【正確答案】:B79.屬于監(jiān)督學(xué)習(xí)的機(jī)器學(xué)習(xí)算法是()A、貝葉斯分類器B、主成分分析C、K-MeansD、高斯混合聚類【正確答案】:A80.在shell腳本中,顯示用戶的主目錄的命令是什么?A、echo$HOMEB、echo$USERDIRC、echo$ENVD、echo$ECHO【正確答案】:A81.以下哪項不屬于批量數(shù)據(jù)采集工具?A、SqoopB、FlumeC、其他ETL工具D、MapReduce【正確答案】:D82.以下描述中,屬于決策樹策略的是()A、最優(yōu)投影方向B、梯度下降方法C、最大特征值D、最大信息增益【正確答案】:D83.以查準(zhǔn)率為縱軸、查全率為橫軸作圖,就得到了查準(zhǔn)率-查全率曲線,簡稱()A、雙曲線B、P-R曲線C、科克曲線D、共軛曲線【正確答案】:B84.以下()問題不適合應(yīng)用神經(jīng)網(wǎng)絡(luò)。A、預(yù)測電信客戶流失的可能性B、輔助確定是否給銀行的客戶貸款C、對基金公司的客戶進(jìn)行分組,了解每組客戶的特點D、股票走勢的預(yù)測【正確答案】:C85.以下哪項不屬于Python語言的特點()A、依賴平臺B、支持中文C、語法簡潔D、類庫豐富【正確答案】:A86.關(guān)于樸素貝葉斯分類算法,描述正確的是:A、它假設(shè)屬性之間相互獨立B、根據(jù)先驗概率計算后驗概率C、對于給定的待分類項X={a1,a2,…,an},求解在此項出現(xiàn)的條件下各個類別yi出現(xiàn)的概率,哪個P(yi|X)最大,就把此待分類項歸屬于哪個類別。D、有最小錯誤率判斷規(guī)則和最小風(fēng)險判斷規(guī)則【正確答案】:A87.屬于卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用方向的是()。A、圖像分類B、目標(biāo)檢測C、圖像語義分割D、以上答案都正確【正確答案】:D88.Hadoop的三種運行模式不包括()。A、單機(jī)模式B、單分布式模式C、完全分布式模式D、偽分布式模式【正確答案】:B89.卷積神經(jīng)網(wǎng)絡(luò)(convolu-tionalneuralnetwork,CNN),是一種專門用來處理具有類似()的數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)。A、網(wǎng)格結(jié)構(gòu)B、數(shù)組結(jié)構(gòu)C、序列結(jié)構(gòu)D、表格結(jié)構(gòu)【正確答案】:A90.以下代碼輸出的結(jié)果是x=(1,)print(type(x))A、<class'dict'>B、<class'set'>C、<class'tuple'>D、<class'int'>【正確答案】:C91.執(zhí)行以下代碼,當(dāng)用戶輸入:python,輸出結(jié)果為try:n=eval(input("請輸入一個整數(shù):"))print(n*3)except:print("輸入錯誤,請重新輸入!")A、輸入錯誤,請重新輸入!B、pythonpythonpythonC、沒有任何輸出D、python**3【正確答案】:A92.有關(guān)樸素貝葉斯分類算法的敘述中正確的是()A、樸素貝葉斯分類算法是一種精確的分類算法B、采用樸素貝葉斯分類算法將一個樣本分到某個類別中,表示它100%屬于該類別C、樸素貝葉斯分類算法是一種基于概率的分類算法D、以上都不對【正確答案】:C93.以下哪項不屬于Python語言的特點()A、依賴平臺B、支持中文C、語法簡潔D、類庫豐富【正確答案】:A94.SQL語句中的條件用以下哪一項來表達(dá)()A、THENB、WHILEC、WHERED、IF【正確答案】:C95.在python中,以下不能作為變量名的是A、5yB、TeacherC、studentD、_abc【正確答案】:A96.在Numpy包中,計算中位數(shù)的函數(shù)為()A、numpy.var()B、numpy.mean()C、numpy.std()D、numpy.median()【正確答案】:D97.()是通用編程語言。A、PythonB、HTMLC、JavaScriptD、SQL【正確答案】:A98.以下語句錯誤的是()A、altertableempdeletecolumnaddcolumn;B、altertableempmodifycolumnaddcolumnchar(10);C、altertableempchangeaddcolumnaddcolumnint;D、altertableempaddcolumnaddcolumnint;【正確答案】:A99.為數(shù)據(jù)表創(chuàng)建索引的目的是()A、提高查詢的檢索性能B、歸類C、創(chuàng)建唯一索引D、創(chuàng)建主鍵【正確答案】:A100.我們想在大數(shù)據(jù)集上訓(xùn)練決策樹,為了使用較少時間,我們可以()A、減少樹的數(shù)量B、增加樹的深度C、減少樹的深度D、增加學(xué)習(xí)率【正確答案】:C101.shell中,當(dāng)字符串用單引號''括起來時,SHELL將()A、解釋引號內(nèi)的特殊字符B、執(zhí)行引號中的命令C、不解釋引號內(nèi)的特殊字符D、結(jié)束進(jìn)程【正確答案】:C102.查看視圖的字段信息命令A(yù)、show視圖名B、DESCRIBE視圖名;C、create視圖名D、view視圖名【正確答案】:B103.啟動HBase集群的命令是()。A、start-dfs.shB、zkServer.shstartC、start-hbase.shD、start-yarn.sh【正確答案】:C104.關(guān)于Hive建表基本操作,描述正確的是:()A、一旦表建好,不可再修改表名B、一旦表建好,不可再增加新列C、創(chuàng)建外表時需要指定external關(guān)鍵字D、一旦表建好,不可再修改列名【正確答案】:C105.假設(shè)有命令importnumpyasnpbArray=np.array([[1,2,3],[4,5,6]])則,bArray.ndim的結(jié)果是A、1B、2C、3D、4【正確答案】:B106.將python中的.py文件轉(zhuǎn)換為.pyc文件的組件為()A、編輯器B、編譯器C、虛擬機(jī)D、解釋器【正確答案】:B107.以下程序輸出結(jié)果中,正確的是nums=[1,2,3,4]nums.append([5,6,7,8])print(len(nums))A、4B、5C、8D、以上都不對【正確答案】:B108.下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?()A、變量代換B、離散化C、聚集D、估計遺漏值【正確答案】:D109.以下保留字不屬于分支結(jié)構(gòu)的是A、ifB、elifC、elseD、while【正確答案】:D110.自然語言處理、語音識別、股票交易、氣象預(yù)測等應(yīng)用適合采用()處理。A、循環(huán)神經(jīng)網(wǎng)絡(luò)B、卷積神經(jīng)網(wǎng)絡(luò)C、多層神經(jīng)網(wǎng)絡(luò)D、單層神經(jīng)網(wǎng)絡(luò)【正確答案】:A111.下列表達(dá)式的值為True的是()A、5+5j>2-3jB、{'name1','name2'}!={'name2','name1'}C、(3,(6,4))>(3,(4,6))D、'abc'<'ab0'【正確答案】:C112.可以創(chuàng)建3*3單位矩陣的命令是:A=np.zeros(3)B、A=np.ones(3)C、A=np.eye(3)D、A=np.full(3,3)【正確答案】:C113.一般來說,下列哪種方法常用來預(yù)測連續(xù)獨立變量?A、線性回歸B、邏輯回顧C(jī)、線性回歸和邏輯回歸都行D、以上說法都不對【正確答案】:A114.以下關(guān)于神經(jīng)網(wǎng)絡(luò)的說法中,正確的是A、增加網(wǎng)絡(luò)層數(shù),一定能減小訓(xùn)練集錯誤率B、減小網(wǎng)絡(luò)層數(shù),一定能減小測試集錯誤率C、增加網(wǎng)絡(luò)層數(shù),可能增加測試集錯誤率D、增加網(wǎng)絡(luò)層數(shù),一定增加測試集錯誤率【正確答案】:C115.參數(shù)delimiter的使用說明為()A、str,數(shù)據(jù)的分割符B、bytes,編碼格式C、bool,是否將加載的數(shù)據(jù)拆分為多個組,True表示拆,F(xiàn)alse不拆D、int,跳過多少行,一般用于跳過前幾行的描述性文字【正確答案】:A116.以下語句的執(zhí)行結(jié)果是______。Y1=''Y2=''Print(y1.isspace(),y2.isspace())A、FalseFalseB、FalseTrueC、TrueTrueD、TrueFalse【正確答案】:B117.把本地文件放到集群里,可以使用下面哪個hadoopshell的命令?()A、hadoopfs-putB、hadoopfs–put/C、hadoopfs–push/D、hadoop-push/【正確答案】:B118.請選擇以下代碼的輸出形式x=np.array([1,2,3])y=np.array([4,5,6])print(x-y)A、["579"]B、["-3-3-3"]C、["132729"]D、["41018"]【正確答案】:B119.python文件的追加模式是A、+B、aC、tD、r【正確答案】:B120.Scala中,數(shù)組的遍歷方式不包含()。A、for循環(huán)遍歷B、while循環(huán)遍歷C、do...while循環(huán)遍歷D、do...for循環(huán)遍歷【正確答案】:D121.繪制散點圖用到哪種函數(shù)A、scatterB、barC、pieD、boxplot【正確答案】:A122.以下異常類型,哪一個是使用的序列對象的位置索引超出范圍時引發(fā)的異常?A、ImportErrorB、IndentationErrorC、IndexErrorD、TypeError【正確答案】:C123.下列關(guān)于存儲過程的特點說法正確的是()A、用戶創(chuàng)建的存儲過程或自定義函數(shù)可以重復(fù)調(diào)用,因此數(shù)據(jù)傳輸量少。B、編寫的SOL存儲在數(shù)據(jù)庫中,因此執(zhí)行速度快。C、創(chuàng)建時編譯,執(zhí)行時調(diào)用,因此開發(fā)效率高。D、通過指定存儲過程的訪問權(quán)限,因此安全系數(shù)高。【正確答案】:D124.HBase為什么適用于海量數(shù)據(jù)存儲?A、集群規(guī)模小B、支持列存表C、多列簇特性D、HDFS做底層存儲【正確答案】:D125.HBase依賴()提供強(qiáng)大的計算能力。A、ZookeeperB、ChubbyC、RPCD、MapReduce【正確答案】:D126.數(shù)據(jù)倉庫僅僅是提供存儲的,提供一種()的服務(wù),不面向最終分析用戶:而數(shù)據(jù)集市是()的,面向最終用戶。A、面向數(shù)據(jù)管理、面向分析應(yīng)用B、面向分析應(yīng)用、面向數(shù)據(jù)管理C、面向分析應(yīng)用、面向事務(wù)交互D、面向事務(wù)交互、面向數(shù)據(jù)管理【正確答案】:A127.foriin["one","two","three","four"]:print(i.upper(),end="")以上代碼運行之后,結(jié)果為A、onetwothreefourB、twothreefouronetwothreefourC、twothreefourONETWOTHREEFOURD、twothreefourONETWOTHREEFOUR【正確答案】:C128.下面關(guān)于支持向量機(jī)(SVM)的描述錯誤的是A、是一種監(jiān)督式學(xué)習(xí)的方法B、可用于多分類的問題C、是一種生成式模型D、支持非線性的核函數(shù)【正確答案】:C129.在shell腳本中,以下哪個特殊符號代表腳本運行的當(dāng)前進(jìn)程ID號?A、$#B、$*C、$?D、$$【正確答案】:D130.當(dāng)不知道數(shù)據(jù)所帶標(biāo)簽時,可以使用哪種技術(shù)促使帶同類標(biāo)簽的數(shù)據(jù)與帶其他標(biāo)簽的數(shù)據(jù)相分離A、分類B、聚類C、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)D、主成分分析【正確答案】:B131.下列算法常用于聚類的問題是A、k-meansB、邏輯回歸模型C、決策樹模型D、隨機(jī)森林模型【正確答案】:A132.關(guān)于排序的參數(shù)axis的使用說明為()A、要排序的數(shù)組B、排序算法,默認(rèn)為“quicksort”C、排序的字段名,可指定字段排序,默認(rèn)為NoneD、使得sort函數(shù)可以沿著指定軸對數(shù)據(jù)集進(jìn)行排序【正確答案】:D133.列表變量lis共包含10個元素,lis索引的取值范圍是A、(0,10)B、(0,9)C、[0,10]D、[0,9]【正確答案】:D134.用于分類與回歸應(yīng)用的主要算法有:()Apriori算法、HotSpot算法B、RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹C、K均值法、SOM神經(jīng)網(wǎng)絡(luò)D、決策樹、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯【正確答案】:D135.下面哪個程序負(fù)責(zé)HDFS數(shù)據(jù)存儲?()A、NameNodeB、JobtrackerC、DatanodeD、secondaryNameNode【正確答案】:C136.以下代碼的輸出結(jié)果是______。Forsin"HelloWorld":ifs=="W":continuePrint(s,end="")A、HelloB、HelloWorldC、WorldD、Helloorld【正確答案】:D137.關(guān)于k折交叉驗證,下列說法正確的是?A、k值并不是越大越好,k值過大,會降低運算速度B、選擇更大的k值,會讓偏差更小,因為k值越大,訓(xùn)練集越接近整個訓(xùn)練樣本C、選擇合適的k值,能減小驗方差D、以上說法都正確【正確答案】:D138.關(guān)于MapReduce的存儲,說法不正確的是()。A、輸入數(shù)據(jù)由GFS管理,一般存儲在集群機(jī)器的本地磁盤B、GFS把每個文件分解成多個分片,并將每一個分片保存在多臺機(jī)器C、MRv1采用基于槽位的資源分配模型,是一種粗粒度的資源劃分單位D、Hadoop將槽位Slot分為JobSlot和TaskSlot【正確答案】:D139.函數(shù)dtypes的返回值為A、維度數(shù)B、索引C、元素D、類型【正確答案】:D140.以下關(guān)于程序異常的處理描述中,錯誤的是A、在try-except-else-finally結(jié)構(gòu)中,不管是否會發(fā)生異常,都會執(zhí)行finally子句中的代碼B、一般不建議在try中放太多代碼,而建議只放入可能會引發(fā)異常的代碼C、帶有else子句的異常處理結(jié)構(gòu),如果不發(fā)生異常則執(zhí)行else子句中的代碼D、在try-except-else結(jié)構(gòu)中,如果try子句的語句引發(fā)了異常,則會執(zhí)行else子句中的代碼【正確答案】:D141.bootstrap數(shù)據(jù)是什么意思?A、有放回地從總共M個特征中抽樣m個特征B、無放回地從總共M個特征中抽樣m個特征C、有放回地從總共N個樣本中抽樣n個樣本D、無放回地從總共N個樣本中抽樣n個樣本【正確答案】:C142.根據(jù)是否需要標(biāo)注數(shù)據(jù),機(jī)器學(xué)習(xí)方法可以分為有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。監(jiān)督學(xué)習(xí)中的訓(xùn)練集用于A、定量評價機(jī)器學(xué)習(xí)性能B、估算模型C、驗證模型D、定性評價機(jī)器學(xué)習(xí)性能【正確答案】:B143.以下哪項用來分組()A、ORDERBYB、ORDEREDBYC、GROUPBYD、GROUPEDBY【正確答案】:C144.在sklearn中,下面哪個類或方法,位于preprocessing模塊A、train_test_splitB、LabelEncoderC、accuracy_scoreDecisionTreeClassifier【正確答案】:B145.通過查詢語句使用關(guān)鍵字()可以向Hive表中插入數(shù)據(jù)。A、LoadB、InsertC、ImportD、Location【正確答案】:B146.在Python中,令s='3.14159',下列選項描述錯誤的是(____)。A、float(s)的結(jié)果是3.14159B、int(s)的結(jié)果是3C、bool(s)的結(jié)果是TrueD、bool(None)的結(jié)果是True【正確答案】:D147.Hadoop生態(tài)系統(tǒng)中,HBase是一種()。A、分布式文件系統(tǒng)B、數(shù)據(jù)倉庫C、實時分布式數(shù)據(jù)庫D、分布式計算系統(tǒng)【正確答案】:C148.以下機(jī)器學(xué)習(xí)中,在數(shù)據(jù)預(yù)處理時,不需要考慮歸一化處理的是A、logistic回歸B、SVMC、樹形模型D、神經(jīng)網(wǎng)絡(luò)【正確答案】:C149.在其他條件不變的前提下,以下哪種做法容易引起機(jī)器學(xué)習(xí)中的過擬合問題A、增加訓(xùn)練集量B、減少神經(jīng)網(wǎng)絡(luò)隱藏層節(jié)點數(shù)C、刪除稀疏的特征D、SVM算法中使用高斯核/RBF核代替線性核【正確答案】:D150.以下哪個是回歸模型評判的指標(biāo)A、mean_squared_errorB、準(zhǔn)確率C、召回率D、輪廓系數(shù)【正確答案】:A151.Numpy包中創(chuàng)建數(shù)組的函數(shù)為()A、arrayB、shapeC、reshapeD、ndim【正確答案】:A152.不屬于KNN算法要素的是:A、k值的選擇B、距離度量C、分類決策的規(guī)則D、訓(xùn)練樣本的個數(shù)【正確答案】:D153.在數(shù)據(jù)分析和處理方面具有分析方法豐富、分析模型擴(kuò)展差、數(shù)據(jù)挖掘能力強(qiáng)等特點的分析工具是()。A、WekaB、SPSSC、SASD、R【正確答案】:B154.以下哪個命令不能在hadoop中創(chuàng)建test文件夾A、hadoopfs-mkdirtestB、hadoopdfs-mkdirtestC、hdfsdfs-mkdirtestD、hdfsls-mkdirtest【正確答案】:D155.Sk-learn中用于生成精準(zhǔn)率、召回率和F1得分的函數(shù)是()。APB、CMatrixC、completeness_scoreD、classification_report【正確答案】:D156.在一個線性回歸問題中,我們使用R平方(R-Squared)來判斷擬合度。此時,如果增加一個特征,模型不變,則下面說法正確的是?A、如果R-Squared增加,則這個特征有意義B、如果R-Squared減小,則這個特征沒有意義C、僅看R-Squared單一變量,無法確定這個特征是否有意義。D、以上說法都不對【正確答案】:C157.關(guān)于Python賦值語句,以下選項中不合法的是()A、x=y=1B、x=(y=1)C、x,y=y,xD、x=1;y=1【正確答案】:B158.()是一類機(jī)器學(xué)習(xí)技術(shù),在學(xué)習(xí)模型時,它使用標(biāo)記的和未標(biāo)記的實例。A、監(jiān)督學(xué)習(xí)B、無監(jiān)督學(xué)習(xí)C、半監(jiān)督學(xué)習(xí)D、主動學(xué)習(xí)【正確答案】:C159.最小二乘回歸方法的等效回歸方法()A、Logistic回歸B、多項式回歸C、非線性基函數(shù)回歸D、線性均值和正態(tài)誤差的最大似然回歸【正確答案】:D160.使用哪個關(guān)鍵字來創(chuàng)建python自定義函數(shù)A、functionB、funcC、procedureD、def【正確答案】:D161.Scikit-Learn中,()可以實現(xiàn)整數(shù)分類值轉(zhuǎn)化為獨熱向量。A、OridinalEncoderB、OneHotEncoderC、LableEncoderD、AutoEncoder【正確答案】:B162.HDFS的設(shè)計是以()為主要應(yīng)用場景。A、一次寫入,一次讀取B、多次寫入,一次讀取C、一次寫入,多次讀取D、多次寫入,多次讀取【正確答案】:C163.Scala是一種純粹的面向?qū)ο笳Z言,每一個值都是()。A、類B、接口C、特質(zhì)D、對象【正確答案】:D164.在n維空間中(n>1),下列哪種方法最適合用來檢測異常值?A、正態(tài)概率圖B、箱形圖C、馬氏距離D、散點圖【正確答案】:C165.YARN中默認(rèn)的資源調(diào)度器是:()。A、FIFO調(diào)度器B、容量調(diào)度器C、Fair調(diào)度器D、以上全部是【正確答案】:B166.Spark核心層主要關(guān)注()問題A、存儲B、計算C、傳輸D、連接【正確答案】:B167.deff1(a,b):a=a+breturnA,10Print(f1(1,2))Print函數(shù)輸出的結(jié)果是()A、(3,10)B、(10,3)C、(10,10)D、(3,3)【正確答案】:A168.shell中,以下哪個命令能判斷變量var是否為空A、test[-f$var]B、test[-e$var]C、test[-a$var]D、test[-z$var]【正確答案】:D169.大數(shù)據(jù)最顯著的特征是:()。A、數(shù)據(jù)規(guī)模大B、數(shù)據(jù)類型多樣C、數(shù)據(jù)處理速度快D、數(shù)據(jù)價值密度高【正確答案】:A170.1.下列代碼中n輸出的值是m=lambdax,y,z:(x+y)**zn=m(1,2,3)A、9B、3C、36D、27【正確答案】:D171.為了實現(xiàn)負(fù)載均衡、提升服務(wù)器端的數(shù)據(jù)處理能力、提高故障恢復(fù)能力以及保證服務(wù)質(zhì)量等目的,NoSQL數(shù)據(jù)庫采?。ǎ┘夹g(shù)。A、數(shù)據(jù)存儲B、數(shù)據(jù)轉(zhuǎn)換C、數(shù)據(jù)交互D、數(shù)據(jù)分布【正確答案】:D172.下面哪個命令可以查詢Hive中的表及表的基本信息?()A、ShowCreateTabletableNameB、ShowTablesC、ShowTableinfotableNameD、ShowtableName【正確答案】:B173.使用SVM模型遇到了欠擬合的問題,以下哪個選項能提高模型性能A、增加懲罰參數(shù)“C”B、減少懲罰參數(shù)C、減少核系數(shù)(gamma的值)D、以上均可【正確答案】:A174.數(shù)據(jù)的存儲結(jié)果指的是n=1000whilen>1:print(n)n=n/2A、11B、10C、9D、無限循環(huán)【正確答案】:B175.Lasso回歸與傳統(tǒng)的線性回歸方程區(qū)別是A、增加L1范數(shù)懲罰因子B、增加L2范數(shù)懲罰因子C、無區(qū)別D、Lasso回歸是線性方程在sigmoid函數(shù)上的嵌套【正確答案】:A176.Linux系統(tǒng)中,哪一條命令可以用來裝載所有在/etc/fstab中定義的文件系統(tǒng)?A、amountB、mount–aC、fmountD、mount–f【正確答案】:B177.關(guān)于降維算法,下列說法錯誤的是()。A、PCA是有監(jiān)督學(xué)習(xí)算法B、ICA能夠使數(shù)據(jù)中的的分量最大化獨立,而PCA不能C、LDA是有監(jiān)督學(xué)習(xí)算法D、LDA降維后,同類別的數(shù)據(jù)分布更為密集【正確答案】:A178.EM算法是A、有監(jiān)督B、無監(jiān)督C、半監(jiān)督D、都不是【正確答案】:B179.Spark的技術(shù)架構(gòu)可以分為三層,不包括()A、Spark核心層B、服務(wù)層C、平臺層D、資源管理層【正確答案】:C180.假設(shè)12個銷售價格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每種方法將它們劃分成四個箱。等頻(等深)劃分時,15在第幾個箱子內(nèi)?A、第一個B、第二個C、第三個D、第四個【正確答案】:B181

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論