數(shù)據(jù)采集1+x初級練習題庫(含參考答案)_第1頁
數(shù)據(jù)采集1+x初級練習題庫(含參考答案)_第2頁
數(shù)據(jù)采集1+x初級練習題庫(含參考答案)_第3頁
數(shù)據(jù)采集1+x初級練習題庫(含參考答案)_第4頁
數(shù)據(jù)采集1+x初級練習題庫(含參考答案)_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數(shù)據(jù)采集1+x初級練習題庫(含參考答案)一、單選題(共41題,每題1分,共41分)1.哪個表達式用來選取當前節(jié)點?A、..B、.C、/D、@正確答案:B2.將一個使用GBK編碼的字節(jié)序列解碼為字符串格式,應使用的方法是A、encode("utf-8")B、decode("utf-8")C、encode("gbk")D、decode("gbk")正確答案:D3.基本的Python內置函數(shù)eval(x)的作用是()A、將x轉換成浮點數(shù)B、去掉字符串x最外側引號,當作Python表達式評估返回其值C、計算字符串x作為Python語句的值D、將整數(shù)x轉換為十六進制字符串正確答案:B4.刪除用戶賬號命令是()A、DROPUSERB、DROPTABLEUSERC、DELETEUSERD、DELETEFROMUSER正確答案:A5.jQuery中被譽為工廠函數(shù)的是()A、$()B、function()C、ready()D、以上都不對正確答案:A6.httpd的MPM特性中的三種工作方式為()A、preforks、worker、eventB、prefork、worker、eventC、preforks、worker、threadD、preforks、worker、正確答案:B7.CSS技術中盒子模型的()屬性設置邊框和內部元素之間的距離的屬性。A、borderB、paddingC、backgroundD、margin正確答案:B8.哪個表達式用來從根節(jié)點選?。緼、..B、.C、/D、@正確答案:C9.以下不屬于數(shù)據(jù)采集工具的是()A、MySQLB、八爪魚采集器C、FlumeD、Filebeat正確答案:A10.Scrapy中,用于封裝數(shù)據(jù)的類是A、ItemB、SpiderC、settingsD、pipline正確答案:A11.關于UTF-8編碼,以下描述錯誤的是A、可以用來表示Unicode標準中的任何字符B、用1個字節(jié)表示一個英文字符C、3個字節(jié)表示一個中文漢字D、是一種定長的字符編碼正確答案:C12.Python源程序執(zhí)行的方式()A、解析執(zhí)行B、編譯執(zhí)行C、直接執(zhí)行D、邊編譯邊執(zhí)行正確答案:A13.網絡層以上的中繼系統(tǒng)是()A、網橋B、轉發(fā)器C、網關D、路由器正確答案:C14.使用xpath,選取屬于body子節(jié)點下的最后一個div節(jié)點的表達式為()A、/html/body/div[last()]B、/html/body/div[first()]C、/html/body/div[positon()=first()]D、/html/body/div[positon()=last()]正確答案:A15.如果在一個關系中,存在某個屬性(或屬性組),雖然不是該關系的主鍵或只是主鍵的一部分,但卻是另一個關系的主鍵時,稱該屬性(或屬性組)為這個關系的A、外鍵B、主鍵C、連接鍵D、候選鍵正確答案:A16.Elasticsearch使用什么語言開發(fā)A、CB、.NetC、HTMLD、Java正確答案:D17.以下聚合函數(shù)求平均數(shù)的是()A、COUNTB、MAXC、AVGD、SUM正確答案:C18.TCP/IP協(xié)議將整個通信功能劃分為四個層次,處于最底層的是()A、數(shù)據(jù)鏈路層B、網絡接口層C、物理層D、網絡層正確答案:B19.()不是用來查詢、添加、修改和刪除數(shù)據(jù)庫中數(shù)據(jù)的語句A、SELECTB、INSERTC、UPDATED、DROP正確答案:D20.以下CSS中,不屬于font屬性的是()A、font-sizeB、font-weightC、sizeD、font-style正確答案:C21.Apache服務器是實現(xiàn)()網絡協(xié)議的服務器。A、FTPB、DHCPC、HTTPDD、HTTP正確答案:D22.CSS中通過哪個屬性設定元素的背景圖像()A、imageB、background-imageC、background-positionD、background-attachment正確答案:B23.以下不是修改表操作的是()A、droptableuser;B、altertableuseraddremarkvarchar(20);C、altertableuserdropremark;D、altertableusercharactersetutf8;正確答案:A24.以下哪一項與網站優(yōu)化關鍵詞排名無關()A、網站開發(fā)語言B、網站程序復雜度C、網站域名D、網站空間穩(wěn)定性正確答案:A25.關于數(shù)據(jù)采集特點,描述正確的是()A、只采集基本數(shù)據(jù)B、主要進行抽樣采集方式C、采集的數(shù)據(jù)內容相對單一D、數(shù)據(jù)采集以自動化采集手段為主要方式正確答案:D26.如果需要在數(shù)據(jù)表中刪除一個字段,其語法為()。A、deletefrom表名where條件;B、altertable表名drop字段名;C、altertable表名modify字段名新數(shù)據(jù)類型;D、deletefrom表名字段名;正確答案:B27.HTTP協(xié)議是A、網絡層協(xié)議B、應用層協(xié)議C、會話層協(xié)議D、傳輸層協(xié)議正確答案:B28.以下BeautifulSoup4的描述中,錯誤的是A、BeautifulSoup可以進行html文檔的解析,但不能實現(xiàn)對網頁的抓取B、默認使用的是標準庫解析器C、使用lxmlHTML解析器對文檔的糾錯能力強,但解析速度較慢D、自動將輸入文檔轉換為Unicode編碼,輸出文檔轉換為utf-8編碼。正確答案:C29.以下屬于網頁文本數(shù)據(jù)的是()A、HTMLB、PNGC、MPEG-1D、JPG正確答案:A30.Tomcat的默認端口是()。A、80B、8089C、8080D、7070正確答案:C31.網頁前端設計中,()語言作用是瀏覽器端組織和顯示網頁信息(文本、圖片、視頻等)。A、CSSB、JavaScriptC、HTMLD、JSP正確答案:C32.()是通過爬蟲程序監(jiān)測某網站數(shù)據(jù)更新的情況,以便可以爬取到該網站更新的新數(shù)據(jù),對于未發(fā)生內容變化的網頁,則不會爬取。A、通用網絡爬蟲B、増量式網絡爬蟲C、深層頁面爬蟲D、聚焦網絡爬蟲正確答案:B33.Apache服務器運行后會生成兩個日志文件,其中,()是記錄Web服務器的所有訪問活動的文件。A、error_log(錯誤日志)B、/usr/local/tomcat/logsC、access_log(訪問日志)D、logs正確答案:C34.使用Xpath獲取一篇HTML文檔中所有超鏈接的href屬性,Xpath代碼為()。A、/a/@hrefB、//@hrefC、/a/hrefD、//a/@href正確答案:D35.關于數(shù)據(jù)采集的描述不正確的是()A、數(shù)據(jù)采集不在于掌握龐大的的數(shù)據(jù)信息,而在于對數(shù)據(jù)的智能處理,挖掘出有價值的信息B、數(shù)據(jù)采集來源廣泛,類型也豐富多樣,很看重數(shù)據(jù)處理的高效性和實時性C、數(shù)據(jù)采集,要注重數(shù)據(jù)質量和數(shù)據(jù)采集性能提升,為數(shù)據(jù)的準確分析打下基礎D、以上描述都不正確正確答案:D36.向數(shù)據(jù)表中插入一條記錄用以下哪一項A、CREATEB、INSERTC、SAVED、UPDATE正確答案:B37.自由軟件的含義是()A、軟件可以自由修改和發(fā)布B、軟件發(fā)行商不能向用戶收費C、用戶不需要付費D、只有軟件作者才能向用戶收費正確答案:A38.層次型、網狀型和關系型數(shù)據(jù)庫劃分原則是()A、聯(lián)系的復雜程度B、記錄長度C、文件的大小D、數(shù)據(jù)之間的聯(lián)系正確答案:D39.Shell程序的注釋符為()。A、@B、!C、%D、#正確答案:D40.OSI參考模型共劃分為7層,從下到上依次為()。A、物理層、數(shù)據(jù)鏈路層、傳輸層、會話層、網絡層、表示層和應用層B、物理層、網絡層、傳輸層、會話層、數(shù)據(jù)鏈路層、表示層和應用層C、物理層、數(shù)據(jù)鏈路層、網絡層、傳輸層、表示層、應用層和會話層D、物理層、數(shù)據(jù)鏈路層、網絡層、傳輸層、會話層、表示層和應用層正確答案:D41.計算機網絡的OSI參考模型共劃分為7層,其中處于最底層或第一層的是A、會話層B、數(shù)據(jù)鏈路層C、傳輸層D、物理層正確答案:D二、多選題(共21題,每題1分,共21分)1.關于insert語句下列說法正確的有()A、insertinto表名(字段名1,字段名2)values(字段名1對應的值,字段名2對應值);B、insertinto表名values(字段名1對應的值,字段名2對應值);C、insertinto表名values(字段名1對應的值);D、insertinto表名(字段名1)value(字段名1對應的值);正確答案:AB2.關于socket編程,對于服務端編程的主要步驟包括()A、打開socketB、監(jiān)聽客戶端連接C、綁定到一個地址和端口D、讀寫數(shù)據(jù)正確答案:ABCD3.以下對網站排名有較大影響的因素是()A、服務器穩(wěn)定性B、Title標簽C、Keywords標簽D、網站內容正確答案:ABD4.計算機網絡的拓撲結構就是用網絡的站點與連接線的幾何關系來表示網絡的結構,以下為拓撲結構類型的是()。A、環(huán)型B、總線型C、星型D、樹型E、網狀型正確答案:ABCDE5.元素type屬性取值可以為()A、buttonB、radioC、imageD、password正確答案:ABCD6.從采集數(shù)據(jù)的類型看,數(shù)據(jù)的類型是復雜多樣的,包括以下哪些類型()。A、結構化B、全結構化C、半結構化D、非結構化正確答案:ACD7.以下,屬于Python語言應用領域的包括()A、科學計算B、爬蟲開發(fā)C、自動化運維D、Web開發(fā)正確答案:ABCD8.以下關于scrapy框架的描述,正確的有()A、Scrapy是一個開放源碼的協(xié)作框架B、Scrapy是用純Python編寫的C、scrapy框架包含的python包中不包括lxmlD、scrapy框架是一種快速、簡單、可擴展的方式從網站中提取所需要的數(shù)據(jù)正確答案:ABD9.關于Python類,說法正確的是()A、類的實例方法必須創(chuàng)建對象后才可以調用B、類的實例方法必須創(chuàng)建對象前才可以調用C、類的類方法可以用對象和類名來調用D、類的靜態(tài)屬性可以用類名和對象來調用正確答案:ACD10.對于日志類型的數(shù)據(jù)采集,常用的采集工具有A、beautifulSoupB、scrapyC、filebeatD、logstash正確答案:CD11.正則表達式可以用下列哪種方式匹配正整數(shù)?A、^[1-9]*[1-9][0-9]*$B、^[0-9]*[1-9][0-9]*$C、^[a-zA-Z]w{7.10}$D、都可以正確答案:AB12.下面哪個不是Python合法的標識符()A、3selfB、int32C、__name__D、40XL正確答案:AD13.以下屬于Windows事件日志中的事件類型的是()A、錯誤事件B、失敗審核事件C、警告事件D、信息事件E、成功審核事件正確答案:ABCDE14.進程的基本狀態(tài)有()。A、就緒態(tài)B、運行態(tài)C、阻塞態(tài)D、停止態(tài)正確答案:ABC15.以下哪幾項是設計手機用戶界面時應注意的問題A、界面設計與程序邏輯的分離B、能夠合理利用較小的屏幕顯示空間,構造出符合人機交互規(guī)律的用戶界面C、根據(jù)不同型號手機的屏幕解析度、尺寸和縱橫比各不相同,自動調整界面上部分控件的位置和尺寸,避免因為屏幕信息的變化而出現(xiàn)顯示錯誤D、設計風格保持一致正確答案:ABCD16.以下關于資源命名的規(guī)則正確的有:()A、同類資源的文件名或變量名不能重復B、資源命名要符合Java變量命名規(guī)范C、資源文件名不可使用大寫D、在同一個資源類型的目錄中不能存在文件名相同,擴展名不同的資源文件正確答案:ABCD17.以下CSS中,屬于font屬性的是()。A、font-sizeB、font-weightC、sizeD、font-style正確答案:ABD18.以下哪些是Python的保留字和關鍵字()。A、classB、importC、GlobalD、Def正確答案:AB19.常見的URL分隔符包括()A、$(美元符號)B、/(反斜杠)C、_(下劃線)D、*(星)正確答案:BC20.在CSS3里可以使用以下()方法,將樣式表的功能加到網頁里。A、定義標記的style屬性B、定義內部樣式C、嵌入外部樣式表D、鏈接外部樣式表正確答案:ABCD21.ELK由_(1)_._(2)_._(3)_三個開源工具組成()。A、LogstashB、KibanaC、LogflowD、ElasticSearch正確答案:ABD三、判斷題(共37題,每題1分,共37分)1.vi命令模式中a是從光標所在位置后面開始新增內容。A、正確B、錯誤正確答案:A2.單向通信,只能有一個方向的通信而沒有反方向的交互A、正確B、錯誤正確答案:A3.type()函數(shù)是可以查看變量類型的Python內置函數(shù)A、正確B、錯誤正確答案:A4.若要撤銷數(shù)據(jù)庫中已經存在的表S,可用DROPTABLESA、正確B、錯誤正確答案:A5.SLF4J不是一個真正的日志實現(xiàn),而是一個抽象層,它允許你在后臺使用任意一個日志類庫。A、正確B、錯誤正確答案:A6.網絡傳輸介質只可以是有形的,不可以是無形的A、正確B、錯誤正確答案:B7.刪除表用droptable關鍵字A、正確B、錯誤正確答案:A8.網頁中一個id可以用很多次A、正確B、錯誤正確答案:B9.決定局域網特性的主要技術是傳輸介質、拓撲結構和介質訪問控制方法,其中最重要的是傳輸介質A、正確B、錯誤正確答案:B10.Python語言語句塊的標記分號A、正確B、錯誤正確答案:B11.刪除表中數(shù)據(jù)使用delete關鍵字A、正確B、錯誤正確答案:A12.事務的結束并提交能使用rollback命令A、正確B、錯誤正確答案:B13.xpath中,使用@符號表示屬性A、正確B、錯誤正確答案:A14.JavaScript中標識符首字母不能為數(shù)字A、正確B、錯誤正確答案:A15.堆疊是用專用的端口把交換機連接起來,當作一個交換機使用。A、正確B、錯誤正確答案:A16.列表和元組類似,都是可變的A、正確B、錯誤正確答案:B17.避免產生錯誤的方法就是在符號之前加上一個斜杠,構成轉義字符。A、正確B、錯誤正確答案:B18.連接各建筑物之間的傳輸介質和各種支持設備(硬件)組成一個建筑群綜合布線系統(tǒng)。A、正確B、錯誤正確答案:A19.ARP協(xié)議可以通過IP地址獲取對應主機的物理地址,是網絡層協(xié)議。A、正確B、錯誤正確答案:A20.Robots協(xié)議全稱是“網絡爬蟲排除標準”,網站通過Robots協(xié)議告訴搜索引擎哪些頁面可以抓取,哪些頁面不能抓取。A、正確B、錯誤正確答案:A21.企業(yè)業(yè)務系統(tǒng)是解決企業(yè)的外部問題,與解決企業(yè)內部問題的組織系統(tǒng)相輔相成。A、正確B、錯誤正確答案:A22.Linux中終止進程的命令可以用kill。A、正確B、錯誤正確答案:A23.存儲設備通過通用網絡連接到網絡設備上.主要應用于中小型網絡的存儲技術是NAS。A、正確B、錯誤正確答案:A24.Linux操作系統(tǒng)的命令名必須是小寫英文字母。A、正確B、錯誤正確答案:A25.公開鑰用于解密,私鑰用來加密。A

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論