版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
試題說(shuō)明
本套試題共包括1套試卷
答案和解析在每套試卷后
大數(shù)據(jù)挖掘技術(shù)練習(xí)練習(xí)題及答案4(500題)
大數(shù)據(jù)挖掘技術(shù)練習(xí)練習(xí)題及答案4
L[單選題](),用于顯示樹(shù)狀結(jié)構(gòu)數(shù)據(jù)。
A)矩形式樹(shù)狀結(jié)構(gòu)圖;
B)平行結(jié)構(gòu)樹(shù)
C)垂直結(jié)構(gòu)樹(shù)
2.[單選題]非參數(shù)檢驗(yàn)是針對(duì)()分布情況做的假設(shè)。
A)總體
B)局部
C)個(gè)體
3.[單選題]GSM網(wǎng)絡(luò)中用于傳遞并且識(shí)別用戶的唯一標(biāo)識(shí)是
A)MSISDN
B)IMEI
C)IMSI
4.[單選題]MGW與RNC的連接介質(zhì)采用
A)IP傳輸
B)PCM傳輸
C)ATM傳輸
5.[單選題]數(shù)據(jù)預(yù)處理的任務(wù)不包括()。
A)數(shù)據(jù)清洗
B)數(shù)據(jù)規(guī)范化和離散化
C)數(shù)據(jù)分類
D)特征提取與特征選擇
6.[單選題]MME具備以下功能
A)只有控制面功能
B)只有用戶面管理功能
C)同時(shí)有控制面和用戶面管理功能
D)用戶面和控制面功能都不具備
7.[單選題]分類器效果檢驗(yàn)中的準(zhǔn)確率是指()
A)預(yù)測(cè)正確的數(shù)據(jù)在總數(shù)據(jù)中的比例
B)預(yù)測(cè)為正的數(shù)據(jù)在總數(shù)據(jù)中的比例
C)預(yù)測(cè)為正的數(shù)據(jù)中實(shí)際為正的數(shù)據(jù)所占比例
D)實(shí)際為正的數(shù)據(jù)中被預(yù)測(cè)為正的數(shù)據(jù)所占比例
8.[單選題]SQL語(yǔ)句中進(jìn)行空值運(yùn)算時(shí),需要用到的短語(yǔ)是____,,
A)NULL
B)ISNULL
C)=NULL
D)=ISNULL
9.[單選題]下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?
A)變量代換
B)離散化
C)聚集
D)估計(jì)遺漏值
10.[單選題]下面哪個(gè)不是Python合法得標(biāo)識(shí)浮。
A)int32
B)40XL
C)self
D)_name_
11.[單選題]設(shè)乂=e,1),~是一個(gè)頻繁項(xiàng)集,則最多可由X產(chǎn)生()個(gè)關(guān)聯(lián)規(guī)則。
A)4
B)5
06
D)7
12.[單選題]以下不是數(shù)據(jù)挖掘工具的是()
A)WEKA
B)KNIME
C)Comnos
D)Matlab
13.[單選題]如果說(shuō)人工智能是一座高大上的房子,那么()就是它的基石
A)新技術(shù)
B)資金
C)大數(shù)據(jù)
D)需求
14.[單選題]如果對(duì)屬性值的任一組合,R中都存在一條規(guī)則加以覆蓋,則稱規(guī)則集R中的規(guī)則為
A)無(wú)序規(guī)則
B)窮舉規(guī)則
C)互斥規(guī)則
D)有序規(guī)則
15.[單選題]“大數(shù)據(jù)+云計(jì)算”將會(huì)帶來(lái)信息產(chǎn)業(yè)革命的第()個(gè)高峰
A)一
B)二
C)三
D)四
16.[單選題]lr.fit(X_train,y_train)語(yǔ)句的目的為()
A)建立LR模型
B)導(dǎo)入數(shù)據(jù)并觀察
C)查看數(shù)據(jù)框
D)用處理好的數(shù)據(jù)訓(xùn)練模型
17.[單選題]BeautifulSoup庫(kù)在進(jìn)行標(biāo)簽樹(shù)下行遍歷時(shí),以列表形式返回兒子節(jié)點(diǎn)的代碼是哪個(gè)?
A)content
B)children
C)descendants
D)string
18.[單選題]矩估計(jì)的基本原理是0
A)用樣本矩估計(jì)總體矩
B)使得似然函數(shù)達(dá)到最大
C)使得似然函數(shù)達(dá)到最小
D)小概率事件在一次試驗(yàn)中是不可能發(fā)生的
19.[單選題]多維空間中最適合的異常點(diǎn)檢測(cè)方法是
A)正態(tài)分布圖
B)等價(jià)圖
C)馬氏距離
D)散點(diǎn)圖
20.[單選題]在基于規(guī)則分類器的中,依據(jù)規(guī)則質(zhì)量的某種度量對(duì)規(guī)則排序,保證一個(gè)測(cè)試記錄都
是由覆蓋它的“最好的”規(guī)格來(lái)分類,這種方案稱為()
A)基于類的排序方案
B)基于規(guī)則的排序方案
C)基于度量的排序方案
D)基于規(guī)格的排序方案。
21.[單選題]下面列出的條目中,下列不是數(shù)據(jù)倉(cāng)庫(kù)基本特征的是:()
A)數(shù)據(jù)倉(cāng)庫(kù)是面向主題的
B)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是集成的
C)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是非時(shí)變的
D)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)是非易失的
22.[單選題]以下哪個(gè)聚類算法不屬于基于網(wǎng)格的聚類算法()。
A)STING
B)WaveCluster
C)MAFIA
D)BIRCH
23.[單選題]某小區(qū)60%居民訂晚報(bào),45%訂青年報(bào),30%兩報(bào)均訂,隨機(jī)抽一戶。則至少訂一種報(bào)的
概率為()
A)0.82
B)0.85
00.80
D)0.75
24.[單選題]()是一個(gè)觀測(cè)值,它與其他觀測(cè)值的差別如此之大,以至于懷疑它是由不同的機(jī)制產(chǎn)
生的。
A)邊界點(diǎn)
B)質(zhì)心
C)離群點(diǎn)
D)核心點(diǎn)
25.[單選題]下面哪個(gè)屬于映射數(shù)據(jù)到新的空間的方法?
A)傅立葉變換
B)特征加權(quán)
C)漸進(jìn)抽樣
D)維歸約
26.[單選題]下列算法中,不屬于外推法的是()。
A)移動(dòng)平均法
B)回歸分析法
C)指數(shù)平滑法
D)季節(jié)指數(shù)法
27.[單選題]在TDLTE網(wǎng)絡(luò)中,EnodeB到MME的接口是
A)S1
B)X2
C)S6a
D)S8
28.[單選題]有關(guān)數(shù)據(jù)抽取工具的敘述中正確的是()
A)只能使用數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)工具所提供的數(shù)據(jù)抽取工具
B)只能使用開(kāi)發(fā)人員自己開(kāi)發(fā)的數(shù)據(jù)抽取工具
C)根據(jù)實(shí)際需要確定是否自己開(kāi)發(fā)數(shù)據(jù)抽取工具
D)以上都不對(duì)
29.[單選題]以下哪個(gè)指標(biāo)不是用來(lái)評(píng)估分類模型()
A)準(zhǔn)確率(Accuracy)
B)召回率(Recall)
C)輪廓系數(shù)(SilhouetteScore)
D)Fl-score
30.[單選題]LTE中的TA概念哪個(gè)是錯(cuò)誤的()
A)TAI由MCC+MNC+TAC三部分組成
B)TAC的FQDN格式為:tac-hb〈xlx2>.tac-lb<x3x4>.tac.epc.mnc<MNC>.mcc<MCC>.3gppnetwork.org
C)TAC與LAC可重疊使用
D)一個(gè)TA可由一個(gè)或多個(gè)小區(qū)構(gòu)成
31.[單選題]Zookeeper是Hadoop和()的重要組件
A)Hive
B)HBASE
C)MapReduce
D)HDFS
32.[單選題]在集團(tuán)公司四維十輪網(wǎng)絡(luò)質(zhì)量評(píng)估體系中,下列哪項(xiàng)不是評(píng)估移動(dòng)業(yè)務(wù)感知的指標(biāo):
A)重點(diǎn)保障場(chǎng)景VoLTE接通率(%)
B)4G客戶網(wǎng)絡(luò)質(zhì)量滿意度
C)HTTP下載速率(Mbps)
D)家庭寬帶網(wǎng)絡(luò)質(zhì)量滿意度
33.[單選題]下面哪項(xiàng)是集中性能管理面向終端專題()
A)2/3G高流量小區(qū)遷移
B)終端在網(wǎng)質(zhì)量評(píng)估分析
C)客戶投訴溯源分析
D)網(wǎng)絡(luò)實(shí)時(shí)性能監(jiān)控
34.[單選題]關(guān)于混合模型聚類算法的優(yōu)缺點(diǎn),下面說(shuō)法正確的是()
A)當(dāng)簇只包含少量數(shù)據(jù)點(diǎn),或者數(shù)據(jù)點(diǎn)近似協(xié)線性時(shí),混
合模型也能很好地處理。
B)混合模型比K均值或模糊C均值更一般,因?yàn)樗梢允褂酶鞣N類型的分布。
C)混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇。
D)混合模型在有噪聲和離群點(diǎn)時(shí)不會(huì)存在問(wèn)題。
35.[單選題]除輸入層外,每一層都有一個(gè)偏置值,其值在()之間
A)[0,1]
B)[-1,0]
C)-l,0,l
D)[-1,1]
36.[單選題]為了可以把多個(gè)評(píng)估器鏈接成一個(gè)復(fù)合評(píng)估器,sklearn中提供了Pipeline機(jī)制,下
面關(guān)于
Pipeline描述不正確的是()
A)管道中的最后一個(gè)評(píng)估器一定要是一個(gè)實(shí)現(xiàn)了predict方法的學(xué)習(xí)器
B)管道中的所有評(píng)估器,除了最后一個(gè)評(píng)估器,管道中的所有評(píng)估器必須都是轉(zhuǎn)換器。
C)管道中的評(píng)估器參數(shù)可以通過(guò)<estimator>_語(yǔ)義來(lái)訪問(wèn)
D)管道中的評(píng)估器可以通過(guò)索引或名稱訪問(wèn)
37.[單選題]下列關(guān)于等距離分箱的說(shuō)法中錯(cuò)誤的是()。
A)等距離分箱能使每個(gè)區(qū)間內(nèi)包含的取值個(gè)數(shù)大致相同
B)若區(qū)間個(gè)數(shù)為k,每個(gè)區(qū)間的間距為1=(max-min)/k
C)等距離分箱可能導(dǎo)致屬于某些的取值非常多,而某些又非常少
D)又稱為等寬度分箱
38.[單選題]個(gè)人信息保護(hù)影響評(píng)估報(bào)告和處理情況記錄應(yīng)當(dāng)至少保存()年。
A)一
B)十
C)五
D)三
39.[單選題]以下有關(guān)貝葉斯信念網(wǎng)絡(luò)(BBN)的敘述中錯(cuò)誤的是()
A)BBN是一個(gè)有向無(wú)環(huán)圖
B)BBN中每個(gè)結(jié)點(diǎn)代表一個(gè)隨機(jī)變量
C)BBN中每條有向邊表示變量之間的依賴關(guān)系
D)BBN中最多只有一個(gè)輸出結(jié)點(diǎn)
40.[單選題]關(guān)于OLAP的特性,下面正確的是:()(1)快速性(2)可分析性(3)多維性(4)信
息性(5)共享性
A)(l)
B)(2)
0(1)
D)(1)
41.[單選題]《視頻業(yè)務(wù)端到端業(yè)務(wù)質(zhì)量分析》應(yīng)用落地手冊(cè)中定義的視頻業(yè)務(wù)用戶感知KQI指標(biāo)不
包括()
A)視頻播放等待時(shí)長(zhǎng)
B)視頻播放成功率
C)視頻播放清晰度
D)視頻停頓次數(shù)
42.[單選題]在數(shù)據(jù)預(yù)處理中,將數(shù)據(jù)轉(zhuǎn)換為易于進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)存儲(chǔ)形式,如數(shù)據(jù)規(guī)格化,這一
過(guò)程稱為()
A)數(shù)據(jù)提取
B)數(shù)據(jù)變換
C)數(shù)據(jù)清理
D)數(shù)據(jù)加載
43.[單選題]關(guān)于回歸分析,下列說(shuō)法中錯(cuò)誤的是()
A)作回歸分析的變量之間要有實(shí)際意義,不能把毫無(wú)關(guān)聯(lián)的兩種現(xiàn)象隨意進(jìn)行回歸分析,要結(jié)合專業(yè)
知識(shí)對(duì)兩事物之間是否存在因果關(guān)系作出合理解釋和結(jié)論。
B)在進(jìn)行線性回歸分析進(jìn)行的數(shù)據(jù)準(zhǔn)備的時(shí)候,要求因變量y和自變量x都是符合總體正態(tài)的隨機(jī)
變量。
C)回歸直線不要隨意外延
D)所有非線性回歸都可以轉(zhuǎn)化為線性回歸
44.[單選題]S6a接口基于以下哪個(gè)協(xié)議
A)GTP
B)SCTP
C)Diameter
D)S1-AP
45.[單選題]如下表所示,
交易號(hào)(D)商品(terns)
1beer,diaper,nuts
2beer,biscuit,diaper
3bread,butter,cheese
4beer,cheese,diaper,nuts
5beer,butter,cheese,nuts
3)如下表所示,使用FP-Growth計(jì)算其頻繁集,給定最小支持度為40%,頻繁模式樹(shù)(樹(shù))有(
)個(gè)結(jié)點(diǎn)。(不包括根結(jié)點(diǎn))。
A)10
B)9
08
D)5
46.[單選題]打開(kāi)一個(gè)已有文件,然后在文件末尾添加信息,正確的打開(kāi)方式為()。
A)r
B)w
C)a
D)w+
47.[單選題]無(wú)監(jiān)督學(xué)習(xí),應(yīng)用最廣的是()算法
A)聚類算法;
B)降維算法;
C)關(guān)聯(lián)規(guī)則算法;
D)文本挖掘
48.[單選題]將兩個(gè)簇的鄰近度定義為不同簇中任意兩點(diǎn)的最短距離,它是一種()連接方式。
A)單鏈接
B)全鏈接
C)組平均
D)質(zhì)心距離
49.[單選題]os的下列函數(shù)中,用來(lái)給文件重命名的是?
A)remove()
B)rename()
C)system()
D)listdir()
50.[單選題]假設(shè)檢驗(yàn)中,拒絕域的邊界稱為()
A)臨界值
B)臨界點(diǎn)
C)置信水平
D)邊際值
51.[單選題]對(duì)于人工智能認(rèn)知錯(cuò)誤的是。
A)人工智能應(yīng)該是人類用來(lái)改造世界的技術(shù)手段,是輔助性的工具,而不是對(duì)人類進(jìn)行了替代
B)目前人工智能還處于初級(jí)階段,算是弱人工智能,AI技術(shù)還是離不開(kāi)大數(shù)據(jù)
C)人工智能在計(jì)算方面,超過(guò)人類。在部分感識(shí)方面,可與人類相媲美。但在認(rèn)知方面,人工智能
還處于幾乎空白階段,而這恰恰是我們?nèi)祟惖淖畲髢?yōu)勢(shì)
D)人工智能會(huì)毀滅人類
52.[單選題]用于將Python程序打包成可執(zhí)行文件的工具是。
A)Panda3D
B)cocos2d
C)pip
D)Pylnstaller
53.[單選題]DBSCAN最大時(shí)間復(fù)雜度的是
A)O(m)
B)0(m2)
C)0(logm)
D)0(m*logm)
54.[單選題]面對(duì)人工智能存在的諸多倫理道德問(wèn)題,下列不應(yīng)當(dāng)采取的行動(dòng)為()
A)思考如何將人類的價(jià)值觀和規(guī)范嵌入人工智能系統(tǒng),賦予AI以人性的光輝
B)開(kāi)展人工智能倫理的研究和頂層設(shè)計(jì),促進(jìn)民生福祉改善,推進(jìn)行業(yè)健康發(fā)展,掌握新一輪技術(shù)
革命的主動(dòng)權(quán)
C)人工智能的倫理,實(shí)際上是人的問(wèn)題。國(guó)家和機(jī)構(gòu)需要重視,共同做出更多的努力
D)發(fā)展人工智能時(shí)面對(duì)有問(wèn)題的地方不去發(fā)展
55.[單選題]下列說(shuō)法錯(cuò)誤的是()
A)相關(guān)系數(shù)矩陣是一個(gè)對(duì)稱矩陣,其中對(duì)角線上的元素都是1,表示自相關(guān)系數(shù)
B)非對(duì)角線元素表示互相關(guān)系數(shù),每個(gè)元素的絕對(duì)值都小于等于0,反應(yīng)變量變化趨勢(shì)的相似程度
C)相關(guān)系數(shù)的絕對(duì)值越大,表示兩個(gè)信號(hào)互相影響的程度越大
D)如果的相關(guān)系數(shù)矩陣中非對(duì)角線元素大于0,表示兩個(gè)信號(hào)正相關(guān),其中一個(gè)信號(hào)變大時(shí)另一個(gè)信
號(hào)也變大,變化方向一致
56.[單選題]以下哪個(gè)指標(biāo)屬于無(wú)線網(wǎng)絡(luò)結(jié)構(gòu)指標(biāo)
A)即時(shí)通信響應(yīng)成功率
B)重疊覆蓋小區(qū)占比
C)4G占網(wǎng)時(shí)長(zhǎng)占比
D)網(wǎng)絡(luò)質(zhì)量綜合滿意度
57.[單選題]關(guān)聯(lián)規(guī)則是反映事物之間的依賴關(guān)系,典型例子是購(gòu)物籃分析,常見(jiàn)算法有Apriori關(guān)聯(lián)
算法和()算法。
A)貝葉斯算法
B)線性回歸
C)F.P-growth關(guān)聯(lián)算法
D)聚類算法
58.[單選題]當(dāng)置信水平一定時(shí),置信區(qū)間的寬度()
A)隨著樣本量的增大而減小
B)隨著樣本量的增大而增大
C)與樣本量的大小無(wú)關(guān)
D)先隨著樣本量的增大而減小,到一定程度后會(huì)隨著樣本
量的增大而增大。
59.[單選題]有一條關(guān)聯(lián)規(guī)則為A
B,此規(guī)則的信心水平(confidence)為60%,則代表()
A)買(mǎi)B商品的顧客中,有60%的顧客會(huì)同時(shí)購(gòu)買(mǎi)A
B)同時(shí)購(gòu)買(mǎi)
A.B兩商品的顧客,占所有顧客的60%
C)買(mǎi)A商品的顧客中,有60%的顧客會(huì)同時(shí)購(gòu)買(mǎi)B
D)兩商品
A.B在交易數(shù)據(jù)庫(kù)中同時(shí)被購(gòu)買(mǎi)的機(jī)率為60%
60.[單選題]通過(guò)聚集多個(gè)分類器的預(yù)測(cè)來(lái)提高分類準(zhǔn)確率的技術(shù)稱為
A)組合
B)聚集
C)合并
D)投票
61.[單選題]利用"linear_model.LinearRegression()”訓(xùn)練模型時(shí)調(diào)用.fit。方法需要傳遞的
,第二個(gè)參數(shù)是Oo
A)是否考慮計(jì)算截距
B)樣本權(quán)重
C)樣本特征X
D)樣本標(biāo)簽Y
62.[單選題]以下哪些算法是基于規(guī)則的分類器()
A)C4.5
B)KNN
C)NaiveBayes
D)ANN
63.[單選題]LTE中,對(duì)于頻分雙工(FDD)的操作,定義了4中隨機(jī)接入的前導(dǎo)格式,其中格式3的
Tcp()us
A)203.13
B)406.26
O101.3
D)684.38
64.[單選題]在圖集合中發(fā)現(xiàn)一組公共子結(jié)構(gòu),這樣的任務(wù)稱為
A)頻繁子集挖掘
B)頻繁子圖挖掘
C)頻繁數(shù)據(jù)項(xiàng)挖掘
D)頻繁模式挖掘
65.[單選題]下面關(guān)于數(shù)據(jù)粒度的描述不正確的是:()
A)粒度是指數(shù)據(jù)倉(cāng)庫(kù)小數(shù)據(jù)單元的詳細(xì)程度和級(jí)別;
B)數(shù)據(jù)越詳細(xì),粒度就越小,級(jí)別也就越高;
C)數(shù)據(jù)綜合度越高,粒度也就越大,級(jí)別也就越高;
D)粒度的具體劃分將直接影響數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量以及查詢質(zhì)量.
66.[單選題]統(tǒng)計(jì)檔案表中學(xué)生來(lái)自多少個(gè)城市,下面SQL語(yǔ)句正確的是。
A)SELCETSUM(DISTINCT家庭住址)FROM檔案表;
B)SELCETDISTINCT家庭住址FROM檔案表;
OSELCETCOUNT(家庭住址)FROM檔案表;
D)SELCETCOUNT(DISTINCT家庭住址)FROM檔案表;
67.[單選題]利用"linear_model.LinearRegressionO”訓(xùn)練模型時(shí)調(diào)用.fit()方法需要傳遞的第
一個(gè)參數(shù)是OO
A)是否考慮計(jì)算截距
B)樣本權(quán)重
C)樣本特征X
D)樣本標(biāo)簽Y
68.[單選題]SELECT語(yǔ)句中的WHERE用于說(shuō)明。
A)查詢數(shù)據(jù)
B)查詢條件
0查詢分組
D)查詢排序
69.[單選題]Hbase是哪種數(shù)據(jù)庫(kù)?
A)關(guān)系型數(shù)據(jù)庫(kù)
B)Nosql數(shù)據(jù)庫(kù)
C)網(wǎng)狀數(shù)據(jù)庫(kù)
D)層次數(shù)據(jù)庫(kù)
70.[單選題]下面選項(xiàng)中t不是s的子序列的是()
A)S=<{2,4},{3,5,6},{8}>t=<{2},{3,6},{8}>
B)S=<{2,4},{3,5,6},{8}>t=<⑵,{8}>
C)S=<{1,2},{3,4}>t=<{l},{2}>
D)S=<{2,4},{2,4}>t=<{2},{4}>
71.[單選題]自然語(yǔ)言理解是人工智能重要應(yīng)用領(lǐng)域,下面()不是人工智能要實(shí)現(xiàn)的目標(biāo)
A)理解人講的話
B)對(duì)自然語(yǔ)言表示的信息分析概括
C)欣賞音樂(lè)
D)機(jī)器翻譯
72.[單選題]下列關(guān)于數(shù)據(jù)重組的說(shuō)法中,錯(cuò)誤的是0
A)數(shù)據(jù)重組是數(shù)據(jù)的重新生產(chǎn)和重新采集
B)數(shù)據(jù)重組能夠使數(shù)據(jù)煥發(fā)新的光芒
C)數(shù)據(jù)重組實(shí)現(xiàn)的關(guān)鍵在于多源數(shù)據(jù)融合和數(shù)據(jù)集成
D)數(shù)據(jù)重組有利于實(shí)現(xiàn)新穎的數(shù)據(jù)模式創(chuàng)新
73.[單選題]以下哪個(gè)聚類算法不是屬于基于原型的聚類
A)CLIQUE
B)模糊C均值
OEM算法
D)S0M
74.[單選題]以下OLAP操作中()的作用是改變維的層次,變換分析的粒度。
A)切塊
B)平移
C)鉆取
D)切片
75.[單選題]分析顧客消費(fèi)行業(yè),以便有針對(duì)性的向其推薦感興趣的服務(wù),屬于()問(wèn)題
A)關(guān)聯(lián)規(guī)則挖掘
B)分類與回歸
C)聚類分析
D)時(shí)序預(yù)測(cè)
76.[單選題]以下哪個(gè)聚類算法不屬于基于網(wǎng)格的聚類算法
A)BIRCH
B)WaveCluster
C)STING
D)MAFIA
77.[單選題]P(22,1,42,10),Q(20,0,36,8)為兩個(gè)向量對(duì)象,這兩個(gè)對(duì)象的歐幾里得距離是()。
A)根號(hào)下45
B)ll
C)6
D)三次根號(hào)下233
78.[單選題]能夠完全匹配字符串“gogo”和“kittykitty”,但不能完全匹配"gokitty”的正
則表達(dá)
式()
A)r"\b(\w+)\b\s+\l\b”
B)R"\w{2,5}\s*\l"
C)r"(\S+)\s+\l”
D)r"(\S{2,5})\S{1,}\1"
79.[單選題]若數(shù)據(jù)量較大,下面哪種方式比較適合()
A)系統(tǒng)聚類
B)快速聚類(k-means)
C)A和B都可以
D)A和B都不可以
80.[單選題]()框架是大數(shù)據(jù)的核心框架
A)集中式計(jì)算
B)隔離式計(jì)算
C)分布式計(jì)算
D)混合式計(jì)算
81.[單選題]下列哪種調(diào)制方式抗干擾能力最強(qiáng)
A)BPSK
B)QPSK
C)16QAM
D)64QAM
82.[單選題]在SQL語(yǔ)句中,可使用的通配符“%(百分號(hào))”表示—
A)一個(gè)字符
B)純數(shù)字
C)計(jì)算百分?jǐn)?shù)
D)0到多個(gè)字符
83.[單選題]主成分分析方法PCA屬于屬于python中的哪個(gè)包()。
A)skiearn
B)numpy
C)scipy
D)pandas
84.[單選題]在Python中有
S=[,a','b,]
S.append([1,2])
S.insert(1,7);
執(zhí)行以上代碼后,s值為()
A)'a',7,'b',1,2]
2],7,'a','b']
C)[l,2,'a',7','b']
D)['a',7,'b',[1,2]]
85.[單選題]下面哪個(gè)屬于映射數(shù)據(jù)到新的空間的方法?
A)傅立葉變換
B)特征加權(quán)
C)漸進(jìn)抽樣
D)維歸約
86.[單選題]開(kāi)始將N個(gè)樣品各自作為一類,將規(guī)定樣品之間的距離和類與類之間的距離,然后將距離
最近的兩類合并成一個(gè)新類,計(jì)算新類與其他類的距離,重復(fù)進(jìn)行兩個(gè)最近類的合并,每次減少一
類,直至所有的樣品合并為一類,此種聚類方法是()
A)K-means
B)SOM聚類
C)系統(tǒng)聚類
D)有序聚類
87.[單選題]下面哪個(gè)關(guān)鍵字用來(lái)定義函數(shù)?
A)def
B)define
C)function
D)class
88.[單選題]大數(shù)據(jù)技術(shù)由()公司首先提出來(lái)的
A)騰訊
B)谷歌
C)阿里巴巴
D)微軟
89.[單選題]如下哪些不是最近鄰分類器的特點(diǎn)
A)它使用具體的訓(xùn)練實(shí)例進(jìn)行預(yù)測(cè),不必維護(hù)源自數(shù)據(jù)的模型
B)分類一個(gè)測(cè)試樣例開(kāi)銷很大
C)最近鄰分類器基于全局信息進(jìn)行預(yù)測(cè)
D)可以生產(chǎn)任意形狀的決策邊界
90.[單選題]決策樹(shù)算法有多個(gè)實(shí)現(xiàn)方式,下面哪個(gè)算法是基于基尼指數(shù)計(jì)算得到的()
A)ID3
B)C4.5
C)C5.0
D)CART
91.[單選題]以下哪種方法不屬于特征選擇的標(biāo)準(zhǔn)方法:()
A)嵌入
B)過(guò)濾
C)包裝
D)抽樣
92.[單選題]以下哪個(gè)APP主要使用的是HTTPS協(xié)議
A)優(yōu)酷
B)微信
C)百度搜索
D)王者榮耀
93.[單選題]2016年,集團(tuán)公司提出了()內(nèi)容質(zhì)量保障體系
A)四維三步法
B)三維三步法
C)四維四步法
D)四維五步法
94.[單選題]下列方法,用于向文件寫(xiě)入內(nèi)容的是()
A)write
B)read
C)open
D)close
95.[單選題]給定一個(gè)置信概率和置信區(qū)域,若誤差超過(guò)置信區(qū)域,則認(rèn)為誤差不是隨機(jī)誤差引起,視
為異常值的判別方法()。
A)聚類判別法;
B)回歸判別法
C)抽樣判別法
D)統(tǒng)計(jì)判別法
96.[單選題]考慮兩隊(duì)之間的足球比賽:隊(duì)。和隊(duì)1。假設(shè)65%的比賽隊(duì)0勝出,剩余的比賽隊(duì)1獲勝。
隊(duì)0獲勝的比賽中只有30%是在隊(duì)1的主場(chǎng),而隊(duì)1取勝的比賽中75%是主場(chǎng)獲勝。如果下一場(chǎng)比賽在隊(duì)
1的主場(chǎng)進(jìn)行隊(duì)1獲勝的概率為
A)0.75
B)0.35
C)0.4678
D)0.5738
97.[單選題]以下哪些不是業(yè)務(wù)質(zhì)量指標(biāo)KQI
A)頁(yè)面響應(yīng)成功率
B)視頻下載速率
C)及時(shí)通信接入時(shí)延
D)Attach成功率
98.[單選題]()打開(kāi)了自動(dòng)駕駛的天花板
A)駕駛員駕駛技術(shù)提升
B)汽車剎車性能增強(qiáng)
C)人工智能的理論和實(shí)踐的突破
D)汽車制造商轉(zhuǎn)型
99.[單選題]大數(shù)據(jù)科學(xué)關(guān)注大數(shù)據(jù)網(wǎng)絡(luò)發(fā)展和運(yùn)營(yíng)過(guò)程中()大數(shù)據(jù)的規(guī)律及其與自然和社會(huì)活動(dòng)
之間的關(guān)系。
A)大數(shù)據(jù)網(wǎng)絡(luò)發(fā)展和運(yùn)營(yíng)過(guò)程
B)規(guī)劃建設(shè)運(yùn)營(yíng)管理
C)規(guī)律和驗(yàn)證
D)發(fā)現(xiàn)和驗(yàn)證
100.[單選題]通過(guò)代碼"fromsklearn.clusterimportKMeansn引入Kmeans模塊,生成模型對(duì)象
“kmeans=KMeans(_clusters=2)”后,對(duì)于數(shù)據(jù)X訓(xùn)練時(shí)要調(diào)用的方法是()□
A)kmaens.fit()
B)kmeans.fit()
C)kmaens.trainO
D)kmeans.trainO
101.[單選題]假設(shè)屬性income的最大最小值分別是12000元和98000元。利用最大最小規(guī)范化的方法
將屬性的值映射到0至1的范圍內(nèi)。對(duì)屬性income的73600元將被轉(zhuǎn)化為:
A)0.821
B)1.224
01.458
D)0.716
102.[單選題]sum([i*iforiinrange(3)])的計(jì)算結(jié)果是?
A)3
B)5
C)2
D)4
103.[單選題]示例程序如下importurllib.request
response=urllib.request,urlopen('http://python.
Org')print(response.getcodeO)若上述示例程序正常運(yùn)行成功,則程序輸出的結(jié)果為_(kāi)__。
A)200
B)304
0403
D)500
104.[單選題]在數(shù)據(jù)庫(kù)中已建立了tBook表,若查找圖書(shū)編號(hào)是“TP1134”和“TP1138”的記錄,則
SELECT查詢
的WHERE條件為o
A)圖書(shū)編號(hào)="TP1134"AND"TP1138"
B)圖書(shū)編號(hào)NOTIN("TP1134","TP1138")
C)圖書(shū)編號(hào)IN("TP1134","TP1138")
D)圖書(shū)編號(hào)N0T("TP1134"AND"TP1138")
105.[單選題]以下()不是影響時(shí)間序列變化的要素。
A)長(zhǎng)期趨勢(shì)
B)季節(jié)變動(dòng)
C)循環(huán)波動(dòng)
D)有規(guī)則變化
106.[單選題]語(yǔ)音識(shí)別的突破在()
A)用人類思維去做,讓機(jī)器認(rèn)識(shí)每個(gè)音節(jié)音素,然后通過(guò)音節(jié)音素去分辨字和單詞
B)研發(fā)過(guò)程中,計(jì)算機(jī)工程師與科學(xué)家圍繞著語(yǔ)言學(xué)家進(jìn)行工作
C)開(kāi)創(chuàng)了統(tǒng)計(jì)學(xué)的模式,拋棄了模仿人類思維方式,不再通過(guò)總結(jié)思維規(guī)則的老路,研發(fā)過(guò)程中極
少語(yǔ)言學(xué)家的參與,更多是計(jì)算機(jī)科學(xué)家與數(shù)學(xué)家的合作
D)圖靈測(cè)試
107.[單選題]一個(gè)對(duì)象的離群點(diǎn)得分是該對(duì)象周圍密度的逆。這是基于()的離群點(diǎn)定義。
A)概率
B)鄰近度
C)密度
D)聚類
108.[單選題]個(gè)人信息的收集、處理和利用應(yīng)當(dāng)遵循()的原則,不得違反法律、法規(guī)的規(guī)定和雙方
的約定收集、處理和利用個(gè)人信息。()
A)正規(guī)、合法、必要
B)合法、正當(dāng)、必要
C)合法、合規(guī)、正當(dāng)
D)合法、合理、合規(guī)
109.[單選題]Sl-basedhandover流程中建立臨時(shí)數(shù)據(jù)轉(zhuǎn)發(fā)通道時(shí),數(shù)據(jù)傳輸方向是
A)SourceENB->SourcePGW->TargetPGW->TargetENB
B)TargetENB->TargetSGW->SourceSGW->SourceENB
C)SourceSGW->TargetSGW->TargetENB
D)SourceENB->SourceSGW->TargetSGW->TargetENB
110.[單選題]requests庫(kù)獲取HTTP請(qǐng)求獲得reponse對(duì)象,該對(duì)象對(duì)應(yīng)的()屬性,用于判斷網(wǎng)頁(yè)
請(qǐng)求狀
態(tài)。
A)status_code
B)enconding
C)apprence_enconding
D)headers
111.[單選題]已知:
d={123:'Tom",'age':18,'score':[91,92,93]}
print(d[123][1],d['age'],d['score'][-1])
輸出的結(jié)果是:
A)T,18,91
B)o,18,91
C)T,18,92
D)o,18,93
112.[單選題]eSRVCC方案相對(duì)于SRVCC方案的增強(qiáng)在于減少了切換時(shí)長(zhǎng),eSRVCC切換時(shí)長(zhǎng)小于。
A)20ms
B)40ms
C)160ms
D)300ms
113.[單選題]Requests庫(kù)中,下面哪個(gè)屬性代表了從服務(wù)器返回HTTP協(xié)議頭所推薦的編碼方式?
A)headers
B)apparent_encoding
C)text
D)encoding
114.[單選題]數(shù)據(jù)正規(guī)化(DataNormalization)是在知識(shí)發(fā)掘處理
(KnowledgeDiscoveryProcess)中的哪一個(gè)階段進(jìn)行?
A)數(shù)據(jù)清洗
B)數(shù)據(jù)選擇
C)數(shù)據(jù)編碼
D)數(shù)據(jù)擴(kuò)充
115.[單選題]用信息增益方法作為屬性選擇度量建立決策樹(shù)時(shí),已知某訓(xùn)練樣本集的4個(gè)條件屬性的
信息增益分別為:G(收人)=0.940位,G(職業(yè))=0.151位,G(年齡)0.780位,G(信譽(yù))=0.048位,則應(yīng)該選
擇()屬性作為決策樹(shù)的測(cè)試屬性。
A)收入
B)職業(yè)
C)年齡
D)信譽(yù)
116.[單選題]數(shù)據(jù)挖掘是從數(shù)據(jù)中發(fā)掘知識(shí)的過(guò)程,在這個(gè)過(guò)程中()可以作為挖掘工具,數(shù)據(jù)可
以被看作是土壤,云平臺(tái)可以看作是承載數(shù)據(jù)和挖掘算法的基礎(chǔ)設(shè)施。
A)鋤頭
B)數(shù)據(jù)庫(kù)服務(wù)器
C)聚類分析
D)人工智能和數(shù)據(jù)庫(kù)技術(shù)
117.[單選題]對(duì)原始數(shù)據(jù)進(jìn)行聚集、抽樣、違歸約等是哪個(gè)步驟的任務(wù)
A)數(shù)據(jù)預(yù)處理
B)業(yè)務(wù)理解
C)數(shù)據(jù)理解
D)數(shù)據(jù)量挖掘
118.[單選題]人工智能的目的是讓機(jī)器能夠()
A)具有完全的智能
B)完全和人腦一樣考慮問(wèn)題
C)完全替代人
D)模擬、延伸和擴(kuò)展人的智能
119.[單選題]VBA語(yǔ)言中,聲明變量的關(guān)鍵字是()。
A)SET;
B)C.ONST
C)PRIVATE
D)D.IM
120.[單選題]考慮這么一種情況:一個(gè)對(duì)象碰巧與另一個(gè)對(duì)象相對(duì)接近,但屬于不同的類,因?yàn)檫@
兩個(gè)對(duì)象一般不會(huì)共享許多近鄰,所以應(yīng)該選擇()的相似度計(jì)算方法。
A)平方歐幾里德距離
B)余弦距離
C)直接相似度
D)共享最近鄰
121.[單選題]在抽樣方法中,當(dāng)合適的樣本容量很難確定時(shí),可以使用的抽樣方法是:
A)有放回的簡(jiǎn)單隨機(jī)抽樣
B)無(wú)放回的簡(jiǎn)單隨機(jī)抽樣
C)分層抽樣
D)漸進(jìn)抽樣
122.[單選題]以下有關(guān)回歸分析與時(shí)間序列分析的敘述中正確的是()
A)時(shí)間序列分析方法明確強(qiáng)調(diào)變量值順序的重要性,而回歸分析方法不是
B)時(shí)間序列各觀測(cè)值之間存在一定的依存關(guān)系,而回歸分析一般要求每一變量各自
獨(dú)立
C)時(shí)間序列是一組隨機(jī)變量的一次樣本實(shí)現(xiàn),而回歸分析的樣本值一般是對(duì)同一隨
機(jī)變量進(jìn)行多次獨(dú)立重復(fù)實(shí)驗(yàn)的結(jié)果
D)以上都是正確的
123.[單選題]下列選項(xiàng)中,屬于結(jié)構(gòu)化數(shù)據(jù)的是—o
A)圖像
B)文本
C)辦公文檔
D)JSON
124.[單選題]設(shè)有一個(gè)回歸方程為y=2-2.5x,則變量x增加一個(gè)單位時(shí)()
A)y平均增加2.5個(gè)單位
B)y平均增加2個(gè)單位
C)y平均減少2.5個(gè)單位
D)y平均減少2個(gè)單位
125.[單選題]CRISP-DM模型中Evaluation表示對(duì)建立的模型進(jìn)行評(píng)估,重點(diǎn)具體考慮得出的結(jié)
果是否符合()的商業(yè)目的。
A)第二步
B)第三步
C)第一步
D)最后一步
126.[單選題]目前業(yè)務(wù)流量占比最高的業(yè)務(wù)大類是
A)即時(shí)通信
B)郵件
C)視頻
D)下載
127.[單選題]表示職稱為副教授、性別為男的表達(dá)式為()
A)職稱='副教授'OR性別='男'
B)職稱='副教授'AND性別='男’
C)BETWEEN'副教授'AND'男'
D)IN('副教授','男')
128.[單選題]下列屬于維歸約常用的線性代數(shù)技術(shù)的有()
A)主成分分析
B)特征提取
C)特征加權(quán)
D)離散化
129.[單選題]以下兩種描述分別對(duì)應(yīng)哪兩種對(duì)分類算法的評(píng)價(jià)標(biāo)準(zhǔn)?
(a)警察抓小偷,描述警察抓的人中有多少個(gè)是小偷的標(biāo)準(zhǔn)。
(b)描述有多少比例的小偷給警察抓了的標(biāo)準(zhǔn)。
A)Precision,Recall
B)Recall,Precision
C)Precision,ROC
D)Recall,ROC
130.[單選題]假設(shè)某分類器在一個(gè)測(cè)試數(shù)據(jù)集上的分類結(jié)果的混淆矩陣如下所示,該分類器的精確
率為()。
Predicted
yesno
Actualyesl55
nol020
A)75%
B)80%
060%
D)70%
131.[單選題]字符串是一個(gè)連續(xù)的字符序列,哪個(gè)選項(xiàng)可以實(shí)現(xiàn)打印字符信息的換行?
A)使用\n
B)使用轉(zhuǎn)義符\\
C)使用空格
D)使用“\換行”
132.[單選題]以下敘述中()是正確的。
A)分類和聚類都是有指導(dǎo)的學(xué)習(xí)
B)分類和聚類都是無(wú)指導(dǎo)的學(xué)習(xí)
C)分類是有指導(dǎo)的學(xué)習(xí),聚類是無(wú)指導(dǎo)的學(xué)習(xí)
D)分類是無(wú)指導(dǎo)的學(xué)習(xí),聚類是有指導(dǎo)的學(xué)習(xí)
133.[單選題]大數(shù)據(jù)是指()
A)一個(gè)圖書(shū)館內(nèi)的書(shū)籍信息
B)無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才
能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)
C)城市管理信息
D)Facebook用戶信息
134.[單選題]以下哪個(gè)不是數(shù)據(jù)清理的方法()
A)填充缺失值
B)光滑噪聲
C)識(shí)別離群點(diǎn)
D)數(shù)據(jù)變換
135.[單選題]東北人養(yǎng)了一只雞和一頭豬。一天雞問(wèn)豬:"主人呢?"豬說(shuō):"出去買(mǎi)蘑菇了。"雞聽(tīng)了
撒丫子就跑。豬說(shuō):"你跑什么?"雞叫道:"有本事主人買(mǎi)粉條的時(shí)候你小子別跑!"
以上對(duì)話體現(xiàn)了數(shù)據(jù)分析方法中的()
A)關(guān)聯(lián)
B)聚類
C)分類
D)自然語(yǔ)言處理
136.[單選題]通過(guò)代碼"fromsklearnimportlinear_modelw引入線性模型模塊,并通過(guò)代碼
"reg=linearmodel.LinearRegression()**構(gòu)造回歸器對(duì)象后,在訓(xùn)練時(shí)要調(diào)用的方法是
(B),在訓(xùn)練后做預(yù)測(cè)時(shí)要調(diào)用的方法是(D)。
A)reg.train()
B)reg.fit()
C)reg.learn()
D)reg.predict()
137.[單選題]假設(shè)12個(gè)銷售價(jià)格記錄組已經(jīng)排序如下:5,10,11,13,15,35,50,55,72,
92,204,215使用如下每種方法將它們劃分成四個(gè)箱。等頻(等深)劃分時(shí),15在第幾個(gè)箱子內(nèi)(
)
A)第一個(gè)
B)第二個(gè)
C)第三個(gè)
D)第四個(gè)
138.[單選題]如果一個(gè)分類模型經(jīng)訓(xùn)練后,能在訓(xùn)練集上達(dá)到99%的準(zhǔn)確率,但在測(cè)試集上僅能達(dá)
到75%左
右,這說(shuō)明()
A)欠擬合
B)過(guò)擬合
C)正?,F(xiàn)象
D)模型選擇不合適
139.[單選題]下列說(shuō)法不正確的是()
A)歸納是從特殊到一般的“泛化”,演繹是從一般到特殊的“特化”
B)對(duì)于西瓜來(lái)說(shuō),若色澤、根蒂、敲聲皆有3種取值,加上某種屬性什么都不取和沒(méi)有好瓜這個(gè)概念
,則好瓜的假設(shè)空間共有4X4X4+1=65種假設(shè)(規(guī)則)
C)與訓(xùn)練集一致的假設(shè)的集合稱為“版本空間”
D)對(duì)新樣本,不同假設(shè)可能輸出不同結(jié)果,在正確假設(shè)的選取上,模型(學(xué)習(xí)器)不一定需要偏好
,學(xué)習(xí)算法和歸納偏好也可有可無(wú)
140.[單選題]視頻業(yè)務(wù)流程可以分為播放準(zhǔn)備階段和播放階段,其中屬于播放階段KQI指標(biāo)有()
A)停頓次數(shù)
B)視頻播放等待時(shí)長(zhǎng)
C)初始緩沖成功率
D)初始緩沖時(shí)長(zhǎng)
141.[單選題]以下哪些網(wǎng)元不是VOLTE特有網(wǎng)元
A)MGCF
B)S-CSCF
OMME
D)SBC
142.[單選題]設(shè)置hadoop啟動(dòng)環(huán)境變量的文件是?
A)core-site,xml
B)hdfs-site.xml
C)mapred-site.xml
D)hadoop-env.sh
143.[單選題]維度規(guī)約是在以下哪個(gè)步驟的任務(wù)?()
A)頻繁模式挖掘
B)降維
C)數(shù)據(jù)預(yù)處理
D)數(shù)據(jù)流挖掘
144.[單選題]某牙膏廠原來(lái)生產(chǎn)兩面針?biāo)幬镅栏啵F(xiàn)在又增加牙刷生產(chǎn),這屬于()
A)同心多元化
B)水平多元化
C)集團(tuán)多元化
D)相關(guān)多元化
145.[單選題]weka系統(tǒng)匯集了最前沿的機(jī)器學(xué)習(xí)算法和數(shù)據(jù)預(yù)處理工具,提供的主要應(yīng)用程序不包
括
A)Explorer
B)KnowledgeFlow
C)Experimenter
D)Conclusion
146.[單選題]為數(shù)據(jù)的總體分布建模;把多維空間劃分成組等問(wèn)題屬于數(shù)據(jù)挖掘的哪一類任務(wù)?()
A)探索性數(shù)據(jù)分析
B)建模描述
C)預(yù)測(cè)建模
D)尋找模式和規(guī)則
147.[單選題]在基于規(guī)則分類器的中,依據(jù)規(guī)則質(zhì)量的某種度量對(duì)規(guī)則排序,保證每一個(gè)測(cè)試記錄都
是由覆蓋它的“最好的”規(guī)格來(lái)分類,這種方案稱為
A)基于類的排序方案
B)基于規(guī)則的排序方案
C)基于度量的排序方案
D)基于規(guī)格的排序方案。
148.[單選題]下列不屬于瀏覽器開(kāi)發(fā)者模式面板的為()
A)Elements
B)Console
C)Sources
D)headers
149.[單選題]在OLAP的基本操作中,在給定的數(shù)據(jù)立方體的兩個(gè)或更多個(gè)維上進(jìn)行選擇操作得到一個(gè)
子立方體,這個(gè)操作稱為()
A)切塊
B)轉(zhuǎn)軸
C)上卷
D)下鉆
150.[單選題]eNodeB對(duì)哪種類型的數(shù)據(jù)進(jìn)行完整性保護(hù)()
A)RRCsignalling
B)NASsignalling
C)Userplanedata
D)SystemInformation
151.[單選題]字符串是一個(gè)字符序列,給字符串s,以下表示s從右側(cè)向左第三個(gè)字符的是:
A)s[-3]
B)s[:-3]
Os[3]
D)s[0:-3]
152.[單選題]關(guān)于混合模型聚類算法的優(yōu)缺點(diǎn),下面說(shuō)法正確的是()。
A)當(dāng)簇只包含少量數(shù)據(jù)點(diǎn),或者數(shù)據(jù)點(diǎn)近似協(xié)線性時(shí),混合模型也能很好地處理。
B)混合模型比
C)混合模型很難發(fā)現(xiàn)不同大小和橢球形狀的簇。
D)混合模型在有噪聲和離群點(diǎn)時(shí)不會(huì)存在問(wèn)題。
153.[單選題]以下敘述中正確的是()
A)OLAP是針對(duì)特定事務(wù)聯(lián)機(jī)數(shù)據(jù)訪問(wèn)
B)如果一個(gè)維是多層次的,那么該維的維成員就是相同維層次的取值的組合
O0LTP存儲(chǔ)的是歷史數(shù)據(jù),不可更新,但可周期性地刷新
D)0LAP的特點(diǎn)是能夠?qū)Χ嗑S信息進(jìn)行快速分析
154.[單選題]以下哪種方法不屬于特征選擇的標(biāo)準(zhǔn)方法:
A)嵌入
B)過(guò)濾
C)包裝
D)抽樣
155.[單選題]邏輯回歸適用于以下哪種問(wèn)題()
A)回歸問(wèn)題
B)二分類問(wèn)題
C)聚類問(wèn)題
D)關(guān)聯(lián)規(guī)則
156.[單選題]某超市研究銷售記錄發(fā)現(xiàn),購(gòu)買(mǎi)奶的很概率會(huì)購(gòu)買(mǎi)包,這種屬于數(shù)據(jù)挖掘的哪類問(wèn)
題?()
A)聚類分析
B)關(guān)聯(lián)規(guī)則
C)分類分析
D)自然語(yǔ)言處理
157.[單選題]()是統(tǒng)計(jì)學(xué)的基礎(chǔ),是統(tǒng)計(jì)學(xué)里面最重要的概率分布
A)正態(tài)分布;
B)靜態(tài)分布
C)動(dòng)態(tài)分布
D)穩(wěn)態(tài)分布
158.[單選題]關(guān)于統(tǒng)計(jì)學(xué)和大數(shù)據(jù)之間的關(guān)系,一下說(shuō)法錯(cuò)誤的是()。
A)面臨大數(shù)據(jù),統(tǒng)計(jì)學(xué)的研究對(duì)象有所改變;
B)在大數(shù)據(jù)環(huán)境中,需要首先將未知的問(wèn)題轉(zhuǎn)化為可用的統(tǒng)計(jì)方法;
C)在大數(shù)據(jù)分析過(guò)程中,傳統(tǒng)的統(tǒng)計(jì)分析過(guò)程“定量-定位-再定性”轉(zhuǎn)變?yōu)椤岸?定性”;
D)在大數(shù)據(jù)環(huán)境中,需要將統(tǒng)計(jì)研究的對(duì)象范圍擴(kuò)展到一切數(shù)據(jù)。
159.[單選題]《中華人民共和國(guó)數(shù)據(jù)安全法》中的數(shù)據(jù),是指任何以電子或者其他方式對(duì)()的記錄
O
A)數(shù)據(jù)
B)信息
C)文件
D)知識(shí)
160.[單選題]選擇在3行4列的子圖中第2個(gè)的子圖
A)plt.subplot(3,4,1)
B)pit.subplot(3,4,2)
C)pit.subplot(4,3,1)
D)pit.subplot(4,3,2)
161.[單選題]人工智能不會(huì)()
A)聽(tīng)(語(yǔ)音識(shí)別、機(jī)器翻譯),看(圖像識(shí)別、文字識(shí)別)
B)說(shuō)(語(yǔ)音合成、人機(jī)對(duì)話),思考(人機(jī)對(duì)弈、定理證明等)
C)學(xué)習(xí)(機(jī)器學(xué)習(xí)、知識(shí)表示等),行動(dòng)(機(jī)器人、自動(dòng)駕駛汽車等)
D)表達(dá)感情
162.[單選題]下面不屬于人工智能研究基本內(nèi)容是()
A)機(jī)器感知
B)機(jī)器學(xué)習(xí)
0自動(dòng)化
D)機(jī)器思維
163.[單選題]可用作數(shù)據(jù)挖掘分析中的關(guān)聯(lián)規(guī)則算法有()。
A)決策樹(shù)、對(duì)數(shù)回歸、關(guān)聯(lián)模式
B)K均值法、SOM神經(jīng)網(wǎng)絡(luò)
C)Apriori算法、FP-Tree算法
D)RBF神經(jīng)網(wǎng)絡(luò)、K均值法、決策樹(shù)
164.[單選題]下面哪種不屬于數(shù)據(jù)預(yù)處理的方法?
A)變量代換
B)離散化
C)聚集
D)估計(jì)遺漏值
165.[單選題]LTE支持靈活的系統(tǒng)帶寬配置,以下哪種帶寬是LTE協(xié)議不支持的
A)5M
B)10M
C)20M
D)40M
166.[單選題]貝葉斯決策是根據(jù)()進(jìn)行決策的一種方法。
A)極大似然概率
B)先驗(yàn)概率
C)邊際概率
D)后驗(yàn)概率
167.[單選題]KNN的英文全寫(xiě)為()
A)k-NearerNeighbor
B)k-NearestNeighbor
C)k-NearNeighbors
D)k-NearestNeighbors
168.[單選題]一個(gè)對(duì)象的離群點(diǎn)得分是該對(duì)象周圍密度的逆。這是基于()的離群點(diǎn)定義。
A)概率
B)鄰近度
C)密度
D)聚類
169.[單選題]使用等距離分箱法進(jìn)行數(shù)據(jù)離散化,數(shù)據(jù)范圍為20,40,50,58,65,80,80,82,
86,90,96,105,120,200,區(qū)間個(gè)數(shù)為4。下列屬于4個(gè)箱的區(qū)間是()。
A)[20,65]
B)(155,200]
C)[110,155)
D)(65,110)
170.[單選題]給定df是一個(gè)DataFrame對(duì)象,對(duì)df所有字段進(jìn)行描述性統(tǒng)計(jì),可以利用的方法為(
)O
A)df.describe()
B)df.statistics()
C)df.mean()
D)df.summary()
171.[單選題]關(guān)于字符編碼的類型中,用于指明瀏覽器可接受簡(jiǎn)體中文的是()
A)gb2312
B)iso-8859-l
C)utf-8
D)utf
172.[單選題]分布式存儲(chǔ)框架的配置信息在哪個(gè)文件中
A)core-site,xml
B)hdfs-site.xml
C)mapred-site.xml
D)hadoop-env.sh
173.[單選題]下面的代碼其功能為()?>x=[range(3*i,3*i+5)foriinrange(2)]>?x
list(map(list,x))?>x=list(map(list,zip(*x)))
A)首先生成一個(gè)隨機(jī)的列表,然后生成矩陣
B)首先生成一個(gè)包含列表的列表,然后生成矩陣
C)首先生成一個(gè)包含列表的列表,然后模擬矩陣轉(zhuǎn)置
D)首先排序列表,然后模擬矩陣轉(zhuǎn)置
174.[單選題]下列度量不具有反演性的是()
A)系數(shù)
B)幾率
C)Cohen
D)興趣因子
175.[單選題]某超市研究銷售紀(jì)錄數(shù)據(jù)后發(fā)現(xiàn),買(mǎi)啤酒的人很大概率也會(huì)購(gòu)買(mǎi)尿布,這種屬于數(shù)據(jù)挖
掘的哪類問(wèn)題?
A)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)
B)聚類
C)分類
D)自然語(yǔ)言處理
176.[單選題]下列解析技術(shù)中,用于解析JS0N文檔的是—。
A)XPath
B)JSONPath
C)BeautifulSoup
D)正則表達(dá)式
177.[單選題]某終端換機(jī)用戶識(shí)別的需求中,需對(duì)使用體驗(yàn)和用戶使用需求不匹配的用戶進(jìn)行識(shí)別
,挖掘重度游戲迷等用戶畫(huà)像,使用哪類算法最合適
A)決策樹(shù)
B)最小二乘法
C)時(shí)間序列
D)貝葉斯判別
178.[單選題]物聯(lián)網(wǎng)端到端定界分析()法,可實(shí)現(xiàn)物聯(lián)網(wǎng)端到端業(yè)務(wù)質(zhì)量全流程無(wú)死角的分析
A)四元四階
B)七元四階
C)五元五階
D)六元四階
179.[單選題]下面關(guān)于數(shù)據(jù)粒度的描述不正確的是:()
A)粒度是指數(shù)據(jù)倉(cāng)庫(kù)小數(shù)據(jù)單元的詳細(xì)程度和級(jí)別
B)數(shù)據(jù)越詳細(xì),粒度就越小,級(jí)別也就越高
C)數(shù)據(jù)綜合度越高,粒度也就越大,級(jí)別也就越高
D)粒度的具體劃分將直接影響數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)量以及查詢質(zhì)量
180.[單選題]以下哪個(gè)APP主要使用的是HTTP協(xié)議
A)淘寶
B)今日頭條
C)陰陽(yáng)師
D)汽車之家
181.[單選題]()將兩個(gè)簇的鄰近度定義為兩個(gè)簇合并時(shí)導(dǎo)致的平方誤差的增量,它是一種凝聚層
次聚類技術(shù)。
A)MIN(單鏈)
B)MAX(全鏈)
C)組平均
D)Ward方法
182.[單選題]考慮下面的頻繁3-項(xiàng)集的集合:
{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定數(shù)據(jù)集中只有5個(gè)項(xiàng)
,采用合并策略,由候選產(chǎn)生過(guò)程得到4-項(xiàng)集不包含()
A)l,2,3,4
B)l,2,3,5
01,2,4,5
D)1,3,4,5
183.[單選題]在基于規(guī)則分類器的中,依據(jù)規(guī)則質(zhì)量的某種度量對(duì)規(guī)則排序,保證每一個(gè)測(cè)試記錄
都是由覆蓋它的“最好的”規(guī)格來(lái)分類,這種方案稱為()
A)基于類的排序方案
B)基于規(guī)則的排序方案
C)基于度量的排序方案
D)基于規(guī)格的排序方案。
184.[單選題]在SQL中,創(chuàng)建數(shù)據(jù)庫(kù)用的命令是()
A)CREATESCHEMA
B)CREATETABLE
C)CREATEVIEW
D)CREATEDATABASE
185.[單選題]為數(shù)據(jù)的總體分布建模;把多維空間劃分成組等問(wèn)題屬于數(shù)據(jù)挖掘的哪一類任務(wù)?
A)探索性數(shù)據(jù)分析
B)建模描述
C)預(yù)測(cè)建模
D)尋找模式和規(guī)則
186.[單選題]網(wǎng)絡(luò)建設(shè)大類的標(biāo)簽中不包括
A)4G弱覆蓋
B)寬帶未覆蓋
C)寬帶需光改
D)4G發(fā)展不足
187.[單選題]Apriori算法是最基本的一種關(guān)聯(lián)規(guī)則算法,它采用布爾關(guān)聯(lián)規(guī)則的挖掘頻繁項(xiàng)集的算
法,利用()搜索的方法挖掘頻繁項(xiàng)集。
A)逐層
B)逐級(jí)
0自底向上
D)自上而下
188.[單選題]在利用sklearn.cluster.AgglomerativeClustering進(jìn)行凝聚聚類時(shí),使用的默認(rèn)距離
度量是()。
A)曼哈頓距離
B)馬氏距離
C)余弦距離
D)歐氏距離
189.[單選題]下列關(guān)于聚類挖掘技術(shù)的說(shuō)法中,錯(cuò)誤的是()
A)不預(yù)先設(shè)定數(shù)據(jù)歸類類目,完全根據(jù)數(shù)據(jù)本身性質(zhì)將數(shù)據(jù)聚合成不同類別
B)要求同類數(shù)據(jù)的內(nèi)容相似度盡可能
C)要求不同類數(shù)據(jù)的內(nèi)容相似度盡可能
D)與分類挖掘技術(shù)相似的是,都是要對(duì)數(shù)據(jù)進(jìn)行分類處理
190.[單選題]DBSCAN在最壞情況下的時(shí)間復(fù)雜度是()。
A)0(m)
B)0(m2)
C)0(logm)
D)0(m*logm)
191.[單選題]下列不是金融科技公司的是()
A)諾亞財(cái)富
B)高盛公司
C)文藝復(fù)興公司
D)中國(guó)平安
192.[單選題]在基本K均值算法里,當(dāng)鄰近度函數(shù)采用()的時(shí)候,合適的質(zhì)心是簇中各點(diǎn)的中位
數(shù)
A)曼哈頓距離
B)平方歐幾里德距離
C)余弦距離
D)Bregman散度
193.[單選題]為什么BeautifulSoup庫(kù)叫這個(gè)名字?
A)原因不詳,第三方庫(kù)起名原因多種多樣,沒(méi)必要深究
B)之前有類似的庫(kù)叫類似的名字
C)PythonSoftwareFoundation要求開(kāi)發(fā)者叫這個(gè)名字
D)開(kāi)發(fā)者喜歡煲湯
194.[單選題]在某文章很多話中部分或全部提到了顧客的年齡,性別,收入和工作地點(diǎn),想查找這四個(gè)
詞之間的聯(lián)系以及聯(lián)系的強(qiáng)弱,可以用()
A)回歸方法
B)分類方法
C)聚類方法
D)關(guān)聯(lián)分析
195.[單選題]有關(guān)數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)特點(diǎn),不正確的描述是:()
A)數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)要從數(shù)據(jù)出發(fā);
B)數(shù)據(jù)倉(cāng)庫(kù)使用的需求在開(kāi)發(fā)出去就要明確;
C)數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)是一個(gè)不斷循環(huán)的過(guò)程,是啟發(fā)式的開(kāi)發(fā)
D)在數(shù)據(jù)倉(cāng)庫(kù)環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)分析和處
理更靈活,且沒(méi)有固定的模式
196.[單選題]根據(jù)中國(guó)移動(dòng)統(tǒng)一DPI設(shè)備技術(shù)規(guī)范-LTE信令采集解析服務(wù)器接口規(guī)范,S1-MME接口信
息的XDR中,ProcedureType取值范圍為:
A)0-32
B)1-33
00-33
D)1-32
197.[單選題]從購(gòu)物籃商品集中找出商品與商品之間的關(guān)系,有助于發(fā)現(xiàn)同商品之間的聯(lián)系()
A)聚類
B)分類
C)預(yù)測(cè)
D)關(guān)聯(lián)
198.[單選題]以下哪個(gè)指標(biāo)不是家客數(shù)據(jù)端到端指標(biāo)
A)網(wǎng)頁(yè)首屏?xí)r延
B)網(wǎng)頁(yè)打開(kāi)成功率
C)視頻平均播放卡頓次數(shù)
D)4G占網(wǎng)時(shí)長(zhǎng)占比
199.[單選題]什么是KDD?()
A)數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)
B)領(lǐng)域知識(shí)發(fā)現(xiàn)
C)文檔知識(shí)發(fā)現(xiàn)
D)動(dòng)態(tài)知識(shí)發(fā)現(xiàn)
200.[單選題]Lasso回歸與傳統(tǒng)的線性回歸最主要的區(qū)別是()
A)增加L1正則項(xiàng)
B)增加L2正則項(xiàng)
C)無(wú)區(qū)別
D)Lasso回歸是線性方程在sigmoid函數(shù)上的嵌套
201.[單選題]EXCEL中,求標(biāo)準(zhǔn)差的函數(shù)是0
A)AVERAGE
B)MEDIAN
OMODE
D)STDEV
202.[單選題]以下指標(biāo)中,與終端性能無(wú)關(guān)的指標(biāo)是
A)http響應(yīng)時(shí)延
B)TCP2、3次握手成功率
C)4G用戶附著成功率
D)視頻緩沖時(shí)長(zhǎng)
203.[單選題]在基本DBSCAN的參數(shù)選擇方法中,點(diǎn)到它的K個(gè)最近鄰的距離中的K選作為哪一個(gè)參數(shù)
()
A)Eps
B)MinPts
C)質(zhì)心
D)邊界
204.[單選題]如果一個(gè)匹配中,任何一個(gè)節(jié)點(diǎn)都不同時(shí)是兩條或多條邊的端點(diǎn),也稱作()
A)極大匹配
B)二分匹配
C)完美匹配
D)極小匹配
205.[單選題]Byte代表一個(gè)字節(jié),及()的數(shù)值范圍。
A)0^100
B)0~155
C)0~200
D)0~255
206.[單選題]在事先不知道數(shù)據(jù)分類的情況下,根據(jù)數(shù)據(jù)之間的相似程度進(jìn)行劃分,目的是使得同類
別的數(shù)據(jù)對(duì)象之間的差別盡可能的小,不同類別的數(shù)據(jù)對(duì)象之間的差別盡可能的大。屬于()
A)聚類
B)分類
C)預(yù)測(cè)
D)關(guān)聯(lián)
207.[單選題]在哪里能下載到hadoop軟件
A)apache網(wǎng)站或者捐獻(xiàn)給apache使用的公開(kāi)服務(wù)器
B)oracle官網(wǎng)
C)hadoop公司官網(wǎng)
D)linux官網(wǎng)
208.[單選題]檢測(cè)一元正態(tài)分布中的離群點(diǎn),屬于異常檢測(cè)中的基于
()的離群點(diǎn)檢測(cè)
A)統(tǒng)計(jì)方法
B)鄰近度
C)密度
D)聚類技術(shù)
209.[單選題]MME附著用戶數(shù)的指標(biāo)來(lái)源是
A)網(wǎng)管系統(tǒng)
B)網(wǎng)優(yōu)平臺(tái)
C)集中性能平臺(tái)
D)大數(shù)據(jù)平臺(tái)
210.[單選題]實(shí)現(xiàn)多項(xiàng)式回歸時(shí),數(shù)據(jù)需要進(jìn)行多項(xiàng)式轉(zhuǎn)換,其目的是()
A)數(shù)據(jù)進(jìn)行升維
B)數(shù)據(jù)進(jìn)行降維
C)數(shù)據(jù)有噪音
D)數(shù)據(jù)不夠平滑
211.[單選題]給定歷史時(shí)間數(shù)據(jù),通過(guò)擬合時(shí)序模型,分析研究時(shí)序數(shù)據(jù)的發(fā)展變化規(guī)律,得出觀測(cè)數(shù)
據(jù)的歷史統(tǒng)計(jì)特征,再據(jù)此進(jìn)行外推預(yù)測(cè)目標(biāo)的分析方法是()。
A)聚類;
B)回歸
C)時(shí)間序列
D)匯總統(tǒng)計(jì)
212.[單選題]DPI規(guī)范中,流量流向統(tǒng)計(jì)字段AppType=0x03代表()
A)所有流量
B)某個(gè)應(yīng)用大類
C)某個(gè)應(yīng)用小類
D)某個(gè)協(xié)議類別
213.[單選題]樸素貝葉斯分類中得到條件概率的方法錯(cuò)誤的是()。
A)對(duì)于定量屬性,將取值離散化變?yōu)閰^(qū)間,再當(dāng)做定性屬性處理
B)對(duì)于定性屬性,將轉(zhuǎn)化為定量屬性,再計(jì)算相應(yīng)的概率
C)對(duì)于定量屬性,假設(shè)變量服從某種概率分布,通過(guò)訓(xùn)練數(shù)據(jù)集估計(jì)分布的參數(shù)
D)對(duì)于定性屬性,計(jì)算某一類別的樣本中某種屬性取該值的樣本所占比例來(lái)近似
214.[單選題]協(xié)同過(guò)濾算法解決的是數(shù)據(jù)挖掘中的哪類問(wèn)題()
A)分類問(wèn)題
B)聚類問(wèn)題
C)推薦問(wèn)題
D)自然語(yǔ)言處理問(wèn)題
215.[單選題]如果我使用數(shù)據(jù)集的全部特征并且能夠達(dá)到100%的準(zhǔn)確率,但在測(cè)試集上僅能達(dá)到
70%左右,這
說(shuō)明()
A)欠擬合
B)模型很棒
C)過(guò)擬合
D)算法不好
216.[單選題]通過(guò)(),計(jì)算頻數(shù)、眾數(shù)、中位數(shù)等一個(gè)或多個(gè)數(shù)據(jù)指標(biāo),探索數(shù)據(jù)的分布結(jié)構(gòu)。
A)概率統(tǒng)計(jì)法
B)匯總統(tǒng)計(jì)法
C)可視化法
D)分類統(tǒng)計(jì)法
217.[單選題]數(shù)據(jù)挖掘是從數(shù)據(jù)中發(fā)掘知識(shí)的過(guò)程,在這個(gè)過(guò)程中()可以作為挖掘工具,數(shù)據(jù)可
以被看作是土壤,云平臺(tái)可以看作是承載數(shù)據(jù)和挖掘算法的基礎(chǔ)設(shè)施。
A)鋤頭
B)數(shù)據(jù)庫(kù)服務(wù)器
C)聚類分析
D)人工智能和數(shù)據(jù)庫(kù)技術(shù)
218.[單選題]下面哪個(gè)說(shuō)法是不正確的?
A)一個(gè)HTML文檔與BeautifulSoup對(duì)象等價(jià)
B)標(biāo)簽樹(shù)上除了標(biāo)簽外,節(jié)點(diǎn)還可能是字符串(NavigableString)類型。
C)一個(gè)HTML文檔與一個(gè)標(biāo)簽樹(shù)等價(jià)
D)一個(gè)HTML文檔可以包含多個(gè)標(biāo)簽樹(shù)
219.[單選題]在TDLTE網(wǎng)絡(luò)中,負(fù)責(zé)用戶鑒權(quán)及密鑰管理的網(wǎng)元是?
A)MME
B)SAEGateway
C)PDNGateway
D)HSS
220.[單選題]可以對(duì)按城市匯總的銷售數(shù)據(jù)進(jìn)行(),來(lái)觀察按國(guó)家總的數(shù)據(jù)。
A)上卷
B)下鉆
C)切片
D)切塊
221.[單選題]關(guān)聯(lián)規(guī)則的評(píng)價(jià)指標(biāo)是:()。
A)均方誤差、均方根誤差
B)Kappa統(tǒng)計(jì)、顯著性檢驗(yàn)
C)支持度、置信度
D)平均絕對(duì)誤差、相對(duì)誤差
222.[單選題]以下()不是影響聚類算法結(jié)果的主要因素。
A)已知類別的樣本的質(zhì)量
B)聚類結(jié)束條件
C)描述屬性的選取
D)對(duì)象的相似性度量
223.[單選題]以下哪些算法是基于規(guī)則的分類器()
A)C4.5
B)KNN
C)Naive
D)ANN
224.[單選題]有關(guān)樸素貝葉斯分類算法的敘述中正確的是()
A)樸素貝葉斯分類算法是一種精確的分類算法
B)采用樸素貝葉斯分類算法將一個(gè)樣本分到某個(gè)類別中,表示它100%屬于該類別
C)樸素貝葉斯分類算法是一種基于概率的分類算法
D)以上都不對(duì)
225.[單選題]協(xié)同過(guò)濾分析用戶興趣,在用戶群中找到指定用戶的相似(興趣)用戶,綜合這些
用戶對(duì)某一信息的評(píng)價(jià),形成系統(tǒng)對(duì)該指定用戶對(duì)此信息的喜好程度(),并將這些用戶喜歡的項(xiàng)
推薦給有相似興趣的用戶。
A)相似
B)相同
C)推薦
D)預(yù)測(cè)
226.[單選題]使用離差平方和法聚類時(shí),計(jì)算樣品間的距離必須采用()
A)曼哈頓距離
B)歐氏距離
C)切比雪夫距離
D)絕對(duì)值距離
227.[單選題]要查詢所有課程中,各門(mén)課程的最低分,下面SQL語(yǔ)句正確的是___o
A)SELCET課程號(hào),MIN(成績(jī))FROM選課表GROUPBY課程號(hào);
B)SELCET課程號(hào),SUM(成績(jī)),F(xiàn)ROM選課表GROUPBY課程號(hào);
C)SELCET課程號(hào),MAX(成績(jī)),MIN(成績(jī)),AVERAGE(成績(jī))FROM選課表GROUPBY課程號(hào);
D)SELCET課程號(hào),MAX(成績(jī)),F(xiàn)ROM選課表GROUPBY課程號(hào);
228.[單選題]()博士和洪小文一起構(gòu)建了世界上第一個(gè)大詞匯量、非特定人、連續(xù)語(yǔ)音
A)瑞迪
B)李開(kāi)復(fù)
C)吳軍
D)弗雷德
229.[單選題]分析顧客消費(fèi)行業(yè),以便有針對(duì)性的向其推薦感興趣的服務(wù),屬于()問(wèn)題
A)關(guān)聯(lián)規(guī)則挖掘
B)分類與回歸
C)聚類分析
D)時(shí)序預(yù)測(cè)
230.[單選題]Hadoop擅長(zhǎng)支撐hive進(jìn)行()
A)數(shù)據(jù)采集
B)數(shù)據(jù)計(jì)算
0日志存儲(chǔ)
D)日志搜索
231.[單選題]有些數(shù)據(jù)挖掘算法,要求數(shù)據(jù)屬性是標(biāo)稱類別,當(dāng)數(shù)據(jù)中包含數(shù)值屬性時(shí),為了使用
這些算法需要將數(shù)值屬性轉(zhuǎn)換成標(biāo)稱屬性。通過(guò)采取各種方法將數(shù)值屬性的值域劃分成一些小的區(qū)
間,并將這連續(xù)的小區(qū)間與離散的值關(guān)聯(lián)起來(lái),每個(gè)區(qū)間看作一個(gè)類別。例如,某個(gè)問(wèn)題中的年齡
屬性一種可能的劃分成類別操作是:[0…11]一兒童,[12…17]-青少年,[18…44]-青年
,[45…69]->中年,[69…8]->老年。這種將連續(xù)變量劃分成不同類別的過(guò)程通常稱為()。
A)特征化
B)優(yōu)化
C)標(biāo)準(zhǔn)化
D)離散化
232.[單選題]面對(duì)人工智能可能存在高度風(fēng)險(xiǎn),暗藏危機(jī),我們應(yīng)()
A)因人類的生物進(jìn)化速度相當(dāng)有限,終將被人工智能淘汰,所以要阻斷人工智能發(fā)展
B)人工智能對(duì)人類造成威脅論調(diào)沒(méi)有科研依據(jù),人工智能可以隨意發(fā)展
C)以盡力發(fā)展為前提,擁抱AI技術(shù)的同時(shí),多多考慮如何避免損害人類
D)不必去面對(duì)此類問(wèn)題
233.[單選題]發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的算法通常要經(jīng)過(guò)以下三個(gè)步驟:連接數(shù)據(jù),作數(shù)據(jù)準(zhǔn)備;給定最小支
持度和(),利用數(shù)據(jù)挖掘工具提供的算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則;可視化顯示、理解、評(píng)估關(guān)聯(lián)規(guī)則
A)最小興趣度
B)最小置信度
C)最大支持度
D)最小可信度
234.[單選題]第三次人工智能浪潮區(qū)別前兩次在于()
A)理論的革新
B)思維的轉(zhuǎn)變
C)人工智能戰(zhàn)勝了人類國(guó)際象棋世界冠軍
D)人工智能的產(chǎn)品打破了人們的預(yù)期,真正做到了在識(shí)別方面比人類本身更智能更高效,是真正可
以用的東西
235.[單選題]在利用linearmodel.LinearRegression()構(gòu)造的reg對(duì)象訓(xùn)練模型后,可以通過(guò)以下哪
行代碼查看回歸模型系數(shù)()。
A)reg._coef
B)reg._coefficient
C)reg.coefficient_
D)reg.coef_
236.[單選題]以下哪種方法不屬于特征選擇的標(biāo)準(zhǔn)方法:()
A)嵌入
B)過(guò)濾
C)包裝
D)抽樣
237.[單選題]考慮下面的頻繁3-項(xiàng)集的集合
:(1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5
}假定數(shù)據(jù)集中只有5個(gè)項(xiàng),采用合并策略,由候選產(chǎn)生過(guò)程得到4-項(xiàng)集不包含()
A)l,2,3,4
B)l,2,3,5
01,2,4,5
D)l,3,4,5
238.[單選題]大數(shù)據(jù)最明顯的特點(diǎn)是()
A)數(shù)據(jù)類型多樣
B)數(shù)據(jù)規(guī)模大
C)數(shù)據(jù)價(jià)值密度高
D)數(shù)據(jù)處理速度快
239.[單選題]下列不屬于原始數(shù)據(jù)來(lái)源的是()
A)行政記錄
B)統(tǒng)計(jì)調(diào)查
C)統(tǒng)計(jì)年鑒
D)實(shí)驗(yàn)
240.[單選題]下面有關(guān)分類算法的準(zhǔn)確率、召回率、F1值的描述,錯(cuò)誤的是()
A)準(zhǔn)確率是檢索出相關(guān)文檔數(shù)與檢索出的文檔總數(shù)的比率,衡量的是檢索系統(tǒng)的查準(zhǔn)率
B)召回率是指檢索出的相關(guān)文檔數(shù)和文檔庫(kù)中所有的相關(guān)文檔數(shù)的比率,衡量的是檢索系統(tǒng)的查全
率
C)正確率、召回率和F值取值都在0和1之間,數(shù)值越接近0,查準(zhǔn)率或查全率就越高
D)為了解決準(zhǔn)確率和召回率沖突問(wèn)題,引入了F1分?jǐn)?shù)
241.[單選題]下列不屬于數(shù)據(jù)質(zhì)量問(wèn)題的是()。
A)缺失值
B)不一致的值
C)重復(fù)數(shù)據(jù)
D)非結(jié)構(gòu)數(shù)據(jù)
242.[單選題]0LAP技術(shù)路線分類不包括
A)ROLAP
B)MOLAP
OH0LAP
D)VoLAP
243.[單選題]在LTE/EPC網(wǎng)絡(luò)里,我們?yōu)橛脩羯膳R時(shí)標(biāo)識(shí)叫什么名稱()
A)IMSI
B)GUMMEI
OGUTI
D)TLLI
244.[單選題]數(shù)據(jù)倉(cāng)庫(kù)是隨著時(shí)間變化的,下面的描述不正確的是0
A)數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間的變化不斷增加新的數(shù)據(jù)內(nèi)容
B)捕捉到的新數(shù)據(jù)會(huì)覆蓋原來(lái)的快照
C)數(shù)據(jù)倉(cāng)庫(kù)隨時(shí)間變化不斷刪去舊的數(shù)據(jù)內(nèi)容
D)數(shù)據(jù)倉(cāng)庫(kù)中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨著時(shí)間的變化不斷地進(jìn)行重新綜合
245.[單選題]檢查省公司統(tǒng)一DPI系統(tǒng)設(shè)備4A登錄使用率情況,4A登錄使用率應(yīng)不低于()
A)80%
B)90%
095%
D)99%
246.[單選題]假設(shè)文件不存在,如果使用open方法打開(kāi)文件會(huì)報(bào)錯(cuò),那么該文件的打開(kāi)方式為下列
的哪種模
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二手房房屋買(mǎi)賣按揭問(wèn)題解析
- 寒假工代理協(xié)議書(shū)
- 招標(biāo)代理專項(xiàng)補(bǔ)充協(xié)議范例
- 電腦批發(fā)購(gòu)銷合同
- 綠化托管服務(wù)合作風(fēng)險(xiǎn)控制
- 木匠分包合同模板
- 公積金借款合同范本
- 熟石灰原料購(gòu)銷購(gòu)銷合同
- 企業(yè)服務(wù)合同模板
- 專業(yè)設(shè)計(jì)勘察勞務(wù)分包
- 湘教版九年級(jí)上冊(cè)數(shù)學(xué)期末考試試卷附答案
- 八上道法知識(shí)點(diǎn)默寫(xiě)+答案
- 中學(xué)輿情處理登記表
- 2024年《職業(yè)道德與法律》考試復(fù)習(xí)題庫(kù)及答案(含各題型)
- 道法集體生活成就我+課件-2024-2025學(xué)年統(tǒng)編版道德與法治七年級(jí)上冊(cè)
- 企業(yè)首席質(zhì)量官職業(yè)技能競(jìng)賽理論試題庫(kù)500題(含答案)
- 更夫聘用合同書(shū)2024年
- 2024年秋季學(xué)期新魯教版(五四制)六年級(jí)上冊(cè)英語(yǔ)課件 Unit6 Section B (2a-Reflecting)(第5課時(shí))
- GB/Z 44314-2024生物技術(shù)生物樣本保藏動(dòng)物生物樣本保藏要求
- 中醫(yī)與輔助生殖
- 2024年一年級(jí)上冊(cè)科學(xué)第一單元基礎(chǔ)專項(xiàng)練習(xí)(含答案)
評(píng)論
0/150
提交評(píng)論