




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
數(shù)據(jù)采集1+x中級練習題含答案一、單選題(共63題,每題1分,共63分)1.以下選項中,不符合Python語言變量命名規(guī)則的是A、keyword33_B、_33keywordC、keyword_33D、33_keyword正確答案:D2.在RedhatLinux中一般使用()命令查看網(wǎng)絡接口狀態(tài)。A、winipcfgB、ifconfigC、ipconfigD、ping正確答案:B3.關于Tomcat以下描述錯誤的是()A、是一個JSP/Servlet容器B、支持靜態(tài)頁,但效率沒有Apache高C、一個Tomcat中可以配置多個虛擬主機,一個虛擬主機中可以配置多個web應用D、可以在TOMCAT_HOME/conf下的web.xml文件中修改其默認端口正確答案:D4.目前從Internet上下載文件的方法主要有3種,下列哪項不是A、通過FTP下載B、通過瀏覽器下載C、通過SMTP協(xié)議下載D、P2P下載正確答案:C5.關于python類,說法錯誤的是()A、類的實例方法必須創(chuàng)建對象前才可以調(diào)用B、類的類方法可以用對象和類名來調(diào)用C、類的靜態(tài)屬性可以用類名和對象來調(diào)用D、類的實例方法必須創(chuàng)建對象后才可以調(diào)用正確答案:A6.哪個表達式可以驗證輸入只能是漢字?A、^[u4e00-u9fa5]{0}$B、^[u4e00-u9fa5]{0.}C、^[u4e00-u9fa5]{0.}$D、以上都不對正確答案:C7.關鍵詞分布中對SEO有危害的是A、錨節(jié)點B、標題C、左導航D、隱藏文字正確答案:D8.HBase是分布式列式存儲系統(tǒng),記錄按什么()集中存放。A、列族B、列C、行D、不確定正確答案:A9.下列哪種行為符合使用計算機的道德規(guī)范()。A、刪除自己計算機中不用的軟件B、利用網(wǎng)絡歪曲他人私人信息C、利用網(wǎng)絡破壞他人計算機D、利用網(wǎng)絡公布他人隱私正確答案:A10.哪個匹配非零開頭的最多帶兩位小數(shù)的數(shù)字?A、^([1-9][0-9]*)+(.[0-9]{1.2})?B、^([1-9][0-9]*)+(.[0-9]{1.2})?$C、^([1-9][0-9]*)+(.[0-9]{1.2})$D、^([1-9][0-9]*)+([0-9]{1.2})?$正確答案:B11.選取第一個book的title?A、/bookstore/book[1]/titleB、/bookstore/book/titleC、bookstore/book[1]/titleD、/bookstore/book[0]/title正確答案:A12.下列哪種不是Python元組的定義方式()。A、(1.)B、(1.2.(3.4))C、(1.2)D、(1)正確答案:D13.以下代碼的輸出結果是s="helloworld.andyoupat=r"hello(w+).and(w+)"m=re.search(pat.s)print(m.group(2))"A、拋出異常B、youC、worldD、helloworld.andyou正確答案:B14.網(wǎng)絡監(jiān)測技術sFlow報文采用什么協(xié)議封裝A、UDPB、IPC、TCPD、HTTP正確答案:A15.分層網(wǎng)絡設計模型中的哪一層提供了將設備接入網(wǎng)絡的途徑并控制允許那些設備通過網(wǎng)絡進行通信?A、分布層B、應用層C、核心層D、接入層E、網(wǎng)絡層正確答案:D16.多個進程的實體能存在于同一內(nèi)存中,在一段時間內(nèi)都得到運行。這種性質稱作進程的()A、并發(fā)性B、動態(tài)性C、異步性D、調(diào)度性正確答案:A17.Apache服務器運行后會生成兩個日志文件,訪問日志是哪個文件()A、access_logsB、access_logC、error_logD、errors_log正確答案:B18.設計表格時,以下配置可以讓表格邊框不顯示的是()A、<tableborder=1></table>B、<tableborder="></table>C、<tableborder=0></table>D、<tableborder=-1></table>正確答案:C19.Python中,執(zhí)行下列語句后的顯示結果是什么?()>>>frommathimportsqrt>>>print(sqrt(3)*sqrt(3)==3)A、3B、sqrt(3)*sqrt(3)==3C、TrueD、False正確答案:D20.Logstash的運行需要什么基礎環(huán)境A、JDKB、NetFrameworkC、ApacheD、Tomcat正確答案:A21.以下關于數(shù)據(jù)采集特點的描述,不正確的是A、采集方式多樣化、內(nèi)容豐富化B、以自動化手段為主,擺脫人工錄入的方式C、涵蓋了全量采集、增量采集,不對數(shù)據(jù)進行采樣D、編寫python程序可以爬取任意網(wǎng)站的任意數(shù)據(jù)正確答案:D22.《電信和互聯(lián)網(wǎng)用戶個人信息保護規(guī)定》中規(guī)定接受與用戶個人信息保護有關的投訴,并自接到投訴之日起()內(nèi)答復投訴人。A、二十日B、十五日C、三十日D、十日正確答案:B23.客戶端首次查詢HBase數(shù)據(jù)庫時,首先需要從哪個()表開始查找。A、META.B、–ROOT-C、用戶表D、信息表正確答案:B24.python中,導入模塊的方式錯誤的是()A、importmfrommoB、importmoC、frommoimport*D、importmoasm正確答案:A25.Python中,關于字符串下列說法錯誤的是()A、在三引號字符串中可以包含換行回車等特殊字符B、字符應該視為長度為1的字符串C、字符串以標志字符串的結束D、既可以用單引號,也可以用雙引號創(chuàng)建字符串正確答案:D26.下面對HBase的描述哪些是錯誤的?()。A、不是開源的B、是面向列的C、是分布式的D、是一種NoSQL數(shù)據(jù)庫正確答案:A27.設置一個內(nèi)聯(lián)子窗口時,使用哪個標簽()A、<fieldset>B、<iframe>C、<table>D、<noframe>正確答案:B28.正則表達式“[a-z_]”表示的含義是()A、取所有小寫英文字母以及_中的任意多個。B、取“a、-、z、_”中的任意多個。C、取“a、-、z、_”中的任意一個。D、取所有小寫英文字母以及_中的任意一個。正確答案:D29.關于“user-agent”(用戶代理)的描述錯誤的是A、代表用戶發(fā)起HTTP請求的客戶端程序B、所有發(fā)布Web請求的應用程序都是HTTPAgent代理C、Web瀏覽器也是一種HTTPAgent代理D、網(wǎng)絡爬蟲只是一段程序,并不是代理正確答案:D30.水平子系統(tǒng)的線纜端與工作區(qū)的端接,另一端與樓層配線間的相連接。()A、垂直干線、配線架B、建筑外主干線纜、配線架C、信息插座、建筑外主干線纜D、信息插座、配線架正確答案:D31.對數(shù)據(jù)采集相關法律說法正確的是()A、明確數(shù)據(jù)信息收集主體的資格與責任B、不限定數(shù)據(jù)信息收集的對象與范圍C、不規(guī)范數(shù)據(jù)信息收集的方式與要求D、不需要明確數(shù)據(jù)信息收集的政府責任正確答案:A32.以下()命令可正確顯示shell環(huán)境變量PATH的值A、echoPATHB、echo$PATHC、catPATHD、cat$PATH正確答案:B33.為了得到所有的命令行輸入的參數(shù),我們可以使用變量()A、$#B、$!C、$0D、$*正確答案:D34.下列哪種行為符合使用計算機的道德規(guī)范A、利用網(wǎng)絡公布他人隱私B、利用網(wǎng)絡歪曲他人私人信息C、利用網(wǎng)絡破壞他人計算機D、刪除自己計算機中不用的軟件正確答案:D35.定義類如下classHello():def__init__()=namedefshowInfo(self)print()下面代碼能正常執(zhí)行的()A、h=Helloh.showInfo()B、h=Hello(‘張三’)h.showInfo()C、h=Hello()h.showInfo(‘張三’)D、h=Hello(‘a(chǎn)dmin’)1.showInfo正確答案:B36.Logstash中,哪個插件可以通過正則解析文本,通過正則匹配將非結構化日志數(shù)據(jù)構建成結構化數(shù)據(jù)。A、geoipB、mutateC、grokD、parse正確答案:C37.關于賦值語句,以下選項中描述錯誤的是:()A、a.點b.c=b點c.a是不合法的B、賦值語句采用符號“=”表示C、賦值與二元操作符可以組合,例如&=D、a.b=b點a可以實現(xiàn)a和b值的互換正確答案:D38.在xpath中,選取當前節(jié)點的所有先輩(父、祖父等)通過哪個軸()來實現(xiàn)?A、ancestorB、ancestor-or-selfC、ancestor-orD、以上都可以正確答案:A39.在Windows中,對文件夾進行復制時,()A、只復制文件夾名,不復制其內(nèi)容B、只復制文件夾名和其下的文件,不復制其下的文件夾C、復制文件夾名的其下所有的文件和子文件夾D、復制文件夾名和其下所有的文件和子文件夾,但不復制子文件夾下的文件正確答案:C40.數(shù)字法表示的權限中數(shù)字5代表()A、讀寫B(tài)、讀運行C、讀寫運行D、寫運行正確答案:B41.選取當前節(jié)點的所有后代元素(子、孫等)以及當前節(jié)點本身需要哪個軸?A、childB、descendant-or-selfC、parentD、descendant正確答案:B42.jQuery中,定義array的語法錯誤的是()A、newArray(size);B、newArray(ele0.ele1ele);C、newArray();D、newArray[];正確答案:D43.數(shù)據(jù)庫管理系統(tǒng)是A、一種操作系統(tǒng)B、操作系統(tǒng)的一部分C、一種編譯程序D、在操作系統(tǒng)支持下的系統(tǒng)軟件正確答案:D44.數(shù)據(jù)包丟失一般是由網(wǎng)絡()引起的A、擁塞B、斷線C、安全D、死機正確答案:A45.數(shù)據(jù)采集中,數(shù)據(jù)加工內(nèi)容不包括()A、數(shù)據(jù)挖掘B、數(shù)據(jù)過濾C、數(shù)據(jù)拆分D、數(shù)據(jù)去噪正確答案:A46.Mininet模擬真實網(wǎng)絡的原理是使用Linux內(nèi)核的什么機制A、directiveB、filespaceC、namespaceD、network正確答案:C47.關于JavaScript基本規(guī)范,描述不正確是是()A、使用=或!=來比較兩個對象,返回true/falseB、switch必須帶有default分支C、函數(shù)應該有返回值D、命名要有意義,使用駝峰命名法正確答案:A48.使用httpd命令查看Apache軟件的安裝版本信息,命令為()A、httpd-vB、httpd-versionC、httpdD、http正確答案:A49.HBase依靠()存儲底層數(shù)據(jù)。A、HDFSB、HadoopC、MemoryD、MapReduce正確答案:A50.jQuery中,以下哪個中方式可以給input元素賦值()A、$("input").html("值")B、$("input").text("值")C、$("input).val("值")D、$("input").content("值")正確答案:C51.關于大數(shù)據(jù)的特征描述錯誤的是()A、數(shù)據(jù)處理速度要相對高效B、數(shù)據(jù)價值密度相對較高C、數(shù)據(jù)種類繁多D、對數(shù)據(jù)實時性要求相對較高正確答案:B52.下面哪類友情鏈接可以進行交換A、隱藏看不到的鏈接B、有跳轉的鏈接C、帶有nofollow的鏈接D、導出鏈接比較少的鏈接正確答案:D53.關于Python,type(1+2L*3.14)的結果是:()A、<type"long">B、<type"float">C、<type"str">D、<type"int>正確答案:B54.自由軟件的含義是()A、只有軟件作者才能向用戶收費B、用戶不需要付費C、軟件發(fā)行商不能向用戶收費D、軟件可以自由修改和發(fā)布正確答案:D55.在計算機網(wǎng)絡中,能將異種網(wǎng)絡互連起來,實現(xiàn)不同網(wǎng)絡協(xié)議相互轉換的網(wǎng)絡互連設備是()。A、交換機B、路由器C、中繼器D、網(wǎng)關正確答案:B56.()又稱全網(wǎng)爬蟲,爬行對象由一批種子URL擴充至整個Web,主要為門戶站點、搜索引擎和大型Web服務提供商采集數(shù)據(jù)。A、聚焦網(wǎng)絡爬蟲B、深層頁面爬蟲C、增量式網(wǎng)絡爬蟲D、通用網(wǎng)絡爬蟲正確答案:D57.公司中有多個部門和多名職員,每個職員只能屬于一個部門,一個部門可以有多名職員,從部門到職員的聯(lián)系類型是()A、一對多B、一對一C、多對一D、多對多正確答案:A58.使用scrapy命令創(chuàng)建的項目中,哪個文件用于定義爬取內(nèi)容的輸出A、middleware.pyB、items.pyC、pipelines.pyD、out.py正確答案:C59.哪個軸可以選取當前節(jié)點的所有命名空間節(jié)點?A、ancestorB、namespaceC、childD、parent正確答案:B60.以下哪個屬性可以修飾HTML中單詞換行()A、letter-spacingB、text-decorationC、word-breakD、text-transform正確答案:C61.有關行業(yè)組織建立健全本行業(yè)的網(wǎng)絡安全保護規(guī)范和協(xié)作機制,加強對網(wǎng)絡安全風險的分析評估,是哪個法律中規(guī)定的()A、《中華人民共和國網(wǎng)絡安全法》B、《電信和互聯(lián)網(wǎng)用戶個人信息保護規(guī)定》C、《互聯(lián)網(wǎng)用戶個人信息保護規(guī)定》D、《民法總則》正確答案:A62.重新啟動Apache服務命令為()A、ServicehttpdrestartB、ServicerestartC、ServiceHttprestartD、Httpdrestart正確答案:A63.Logstash主要由三部分組成,不包含下列哪一項()。A、數(shù)據(jù)存儲B、處理數(shù)據(jù)C、數(shù)據(jù)輸出D、數(shù)據(jù)輸入正確答案:A二、多選題(共17題,每題1分,共17分)1.下列命令是主機信息類查詢命令的是()A、unameB、cpunameC、hostnameD、host正確答案:AC2.業(yè)務系統(tǒng)中產(chǎn)生的兩種數(shù)據(jù)是()。A、日志數(shù)據(jù)B、數(shù)據(jù)庫數(shù)據(jù)C、圖像數(shù)據(jù)D、文本快照正確答案:AB3.BeautifulSoup的解析器包括A、lxmlB、xmlC、html.parserD、html5lib正確答案:ABCD4.下列哪些列類型是數(shù)值型的數(shù)據(jù)()A、DOUBLEB、INTC、SETD、FLOAT正確答案:ABD5.關系數(shù)據(jù)庫中,不是用來實現(xiàn)表與表之間聯(lián)系的是()A、值域B、參照完整性規(guī)則C、實體完整性規(guī)則D、用戶自定義的完整性規(guī)則正確答案:ACD6.正則表達式的特點?A、功能性B、復雜性C、邏輯性D、靈活性正確答案:ACD7.根據(jù)《中華人民共和國網(wǎng)絡安全法》,下列說法正確的是()A、網(wǎng)絡運營者在一定條件下可以泄露、篡改、毀損其收集的個人信息;未經(jīng)被收集者同意,不得向他人提供個人信息B、發(fā)現(xiàn)網(wǎng)絡運營者收集、存儲的其個人信息有錯誤的,有權要求網(wǎng)絡運營者予以更正C、網(wǎng)絡運營者應當采取技術措施和其他必要措施,確保其收集的個人信息安全,防止信息泄露、毀損、丟失D、第四十條網(wǎng)絡運營者應當對其收集的用戶信息嚴格保密,并建立健全用戶信息保護制度正確答案:BCD8.jQuery對DOM的操作,以下說法正確的是()A、$(A).append(B)表示將A追加到B中B、$(A).after(B)表示將A插入到B以后C、$(A).appendTo(B)表示把A追加到B中D、$(A).insertAfter(B)表示將A插入到B以后正確答案:CD9.Python中,以下選項中說法不正確的是()A、編譯是將源代碼逐條轉換成目標代碼同時逐條運行目標代碼的過程B、Python語言是腳本語言C、靜態(tài)語言采用解釋方式執(zhí)行,腳本語言采用編譯方式執(zhí)行D、解釋是將源代碼轉換成目標代碼的過程正確答案:ACD10.主要用來處理HTTP協(xié)議的Web服務器有哪些()。A、nginxB、IISC、apacheD、tomcat正確答案:ABCD11.Windows事件日志中的事件類型主要有信息事件和()。A、失敗審核事件B、成功審核事件C、錯誤事件D、警告事件正確答案:ABCD12.在xpath中,基本值是()節(jié)點。A、有根B、無子C、沒有根D、無父正確答案:BD13.按照數(shù)據(jù)發(fā)生的主體不同,數(shù)據(jù)采集范圍主要包括()。A、感知設備數(shù)據(jù)采集B、系統(tǒng)日志采集C、數(shù)據(jù)庫采集D、網(wǎng)絡數(shù)據(jù)采集正確答案:ABCD14.節(jié)點是通過沿著()或者步()來選取的?A、屬性B、路徑C、步D、謂語正確答案:BC15.Linux體系結構一般有哪些部分()A、內(nèi)核(kernel)B、命令解釋層(Shell或其他操作環(huán)境)C、實用工具D、應用程序正確答案:ABC16.下列哪些可以匹配由26個英文字母組成的字符串?A、^[A-Z]+$B、^[a-z]+$C、^[A-Za-z]+$D、^[A-Za-z]正確答案:ABC17.關于形參和實參的描述,以下選項中錯誤的是()A、程序在調(diào)用時,將形參復制給函數(shù)的實參B、函數(shù)定義中參數(shù)列表里面的參數(shù)是實際參數(shù),簡稱實參C、參數(shù)列表中給出要傳入函數(shù)內(nèi)部的參數(shù),這類參數(shù)稱為形式參數(shù),簡稱形參D、函數(shù)調(diào)用時,實參默認采用按照位置順序的方式傳遞給函數(shù),Python也提供了按照形參名稱輸入實參的方式正確答案:ABC三、判斷題(共27題,每題1分,共27分)1.RARP將IP地址轉換到物理地址,而ARP相反A、正確B、錯誤正確答案:B2.使用Xpath需要從lxml庫中導入etree模塊,并使用HTML類對需要匹配的HTML對象進行初始化A、正確B、錯誤正確答案:A3.print()函數(shù)可同時輸出一個或多個數(shù)據(jù),在輸出多個數(shù)據(jù)時,默認使用空格作為輸出分隔符。A、正確B、錯誤正確答案:A4.正則表達式的關鍵之處在于確定你要搜索匹配的東西,如果沒有這一概念,正則將毫無用處。每一個表達式都包含需要查找的指令。A、正確B、錯誤正確答案:A5.w與[0-9a-zA-Z]是等效的A、正確B、錯誤正確答案:B6.logstash只負責傳輸數(shù)據(jù),不具備數(shù)據(jù)解析、驗證、拆分功能A、正確B、錯誤正確答案:B7.HBase的底層存儲為HDFS。A、正確B、錯誤正確答案:A8.在網(wǎng)絡上爬蟲抓取到的數(shù)據(jù),可直接應用于商業(yè)交易,不必關系數(shù)據(jù)所有權屬A、正確B、錯誤正確答案:B9.針對數(shù)據(jù)庫操作,候選關鍵字中的屬性稱為復合屬性。A、正確B、錯誤正確答案:B10.靜態(tài)路由是手工添加,適用于小型網(wǎng)絡,動態(tài)路由是自動生成路徑,適用于大型網(wǎng)絡。A、正確B、錯誤正確答案:A11.文件共享是指系統(tǒng)允許多個用戶或者進程去共享同一個文件,文件共享只限于系統(tǒng)內(nèi)共享。A、正確B、錯誤正確答案:B12.//@lang選取名為lang的一些屬性。A、正確B、錯
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小學語文:修辭手法講解
- 安全知識知多少
- 電氣行業(yè)工作計劃
- 佩梅病的健康宣教
- 工務防洪知識培訓
- 管道保護工初級練習試題及答案
- 廣西壯族自治區(qū)河池市東蘭縣市級名校2023-2024學年中考二模數(shù)學試題含解析
- 2025房屋租賃合同模板打印
- 幼年性黃色肉芽腫的健康宣教
- 幼兒園預防血吸蟲課程
- 2024年河北省普通高中學業(yè)水平選擇性考試物理試題含答案
- Unit 4 Healthy food(說課稿)-2024-2025學年人教PEP版(2024)英語三年級下冊
- 部編人教版二年級道德與法治下冊同步練習(全冊)
- 蘇教版小學數(shù)學三年級下冊期中測試卷(3套含答案)
- 畢業(yè)設計(論文)-ZJ-600型羅茨真空泵設計
- 淺談河北地下水資源開采情況及引發(fā)的災害
- 2023年南通市特殊教育崗位教師招聘考試筆試題庫及答案解析
- GB/T 3810.2-2016陶瓷磚試驗方法第2部分:尺寸和表面質量的檢驗
- 脊柱CT診斷醫(yī)學課件
- 電鑄成型1(上課8)
- GA 38-2021銀行安全防范要求
評論
0/150
提交評論