![數(shù)據(jù)采集與處理選擇題題庫_第1頁](http://file4.renrendoc.com/view10/M03/34/0D/wKhkGWWGyGGAI5n3AAC-EcF0hxM602.jpg)
![數(shù)據(jù)采集與處理選擇題題庫_第2頁](http://file4.renrendoc.com/view10/M03/34/0D/wKhkGWWGyGGAI5n3AAC-EcF0hxM6022.jpg)
![數(shù)據(jù)采集與處理選擇題題庫_第3頁](http://file4.renrendoc.com/view10/M03/34/0D/wKhkGWWGyGGAI5n3AAC-EcF0hxM6023.jpg)
![數(shù)據(jù)采集與處理選擇題題庫_第4頁](http://file4.renrendoc.com/view10/M03/34/0D/wKhkGWWGyGGAI5n3AAC-EcF0hxM6024.jpg)
![數(shù)據(jù)采集與處理選擇題題庫_第5頁](http://file4.renrendoc.com/view10/M03/34/0D/wKhkGWWGyGGAI5n3AAC-EcF0hxM6025.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)采集與處理選擇題題庫1.下列不屬于常見爬蟲類型的是(C)A.通用網(wǎng)絡(luò)爬蟲B.增量式網(wǎng)絡(luò)爬蟲C.淺層網(wǎng)絡(luò)爬蟲D.聚焦網(wǎng)絡(luò)爬蟲2.下列不屬于聚焦網(wǎng)絡(luò)爬蟲的常用策略的是(A)A.基于深度優(yōu)先的爬取策略B.基于內(nèi)容評價的爬取策略C.基于鏈接結(jié)構(gòu)評價的爬取策略D.基于語境圖的爬取策略3.下列不屬于常用反爬蟲手段的是(D)A.訪問頻度B.驗證碼校驗C.賬號權(quán)限D(zhuǎn).人工篩選4.下列屬于反爬蟲目的的是(B)A.限制訪問人數(shù)B.防止網(wǎng)站信息被競爭對手隨意獲取C.限制用戶訪問權(quán)限D(zhuǎn).變換網(wǎng)頁結(jié)構(gòu)5.下列關(guān)于Python爬蟲庫的功能,描述不正確的是(D)A.通用爬蟲庫-urllib3B.通用爬蟲庫-RequestsC.爬蟲框架-ScrapyD.HTML/XML解析器pycurl6.下列不屬于Socket庫中的方法是(C)A.服務(wù)器端方法B.公共方法C.通信方法D.客戶端方法7.下列屬于HTTP必須實現(xiàn)的請求方法的是(A)A.GET與HEADB.POST與DELETEC.TRACE和OPTIONSD.OPTIONS和CONNECT8.下列關(guān)于HTTP狀態(tài)碼類型描述錯誤的是(C)A.4XX表示客戶端可能發(fā)生錯誤B.5XX表示服務(wù)器可能發(fā)生錯誤C.1XX表示請求已被服務(wù)器接受,無須后續(xù)處理D.3XX表示客戶端的請求需采取進一步操作9.下列不屬于HTTP頭部類型的是(B)A.通用頭B.回復頭C.請求頭D.響應(yīng)頭10.下列有關(guān)Cookie機制描述錯誤的是(D)A.服務(wù)器能通過Cookie識別用戶B.通過Cookie驗證后不需重新提交表單C.Cookie按內(nèi)存式或硬盤式進行存儲D.Cookie不存在時效性11.下列不屬于HTTP請求過程的是(D)A.生成請求B.超時設(shè)置C.請求重定向D.搜索文檔12.下列關(guān)于Chrome開發(fā)者工具描述錯誤的是(C)A.元素面板可查看元素在頁面的對應(yīng)位置B.源代碼面板可查看HTML源碼C.網(wǎng)絡(luò)面板無法查看HTML源碼D.網(wǎng)絡(luò)面板可查看HTTP頭部信息13.下列關(guān)于Xpath中功能函數(shù)描述錯誤的是(A)A.contains方法可用于選取以指定值開頭的節(jié)點B.and方法可用于選取同時包含兩種指定值的節(jié)點C.text函數(shù)可用于選取包含指定文本內(nèi)容的節(jié)點D.text函數(shù)可提取節(jié)點文本內(nèi)容14.下列關(guān)于BeautifulSoup中對象類型描述錯誤的是(B)A.name方法可以獲取及修改Tag對象名稱B.attrs方法可獲取Tag對象的HTML屬性,返回值為列表形式C.string方法可獲取Tag對象中的文本字符串內(nèi)容D.NavigableString對象無法被編輯,但可以進行替換15.下列關(guān)于JSON模塊描述錯誤的是(D)A.JSON模塊可實現(xiàn)在Python中對JSN編碼及解碼的兩種操作B.將數(shù)據(jù)存儲為JSON文件是一個編碼過程C.dump方法可將JSON對象寫入文件內(nèi)D.dump方法可生成一個字符串16.下列不屬于動態(tài)網(wǎng)頁的是(D)A.京東首頁B.CSDN首頁C.微博首頁D.Selenium官網(wǎng)17.(多選)下列Selenium庫的方法中,通過元素名稱進行多元素定位的是(BCD)A.findelementbynameB.findelementsbynameC.find_elements_by_idD.find_elements_by_class_name18.下列連接MongoDB數(shù)據(jù)庫的代碼中,錯誤的是(B)A.pymongo.MongoClient()B.pymongo.MongoClient(27017)C.pymongo.MongoClient('localhost')D.pymongo.MongoClient('localhost',27017)19.獲取代理IP的方法有(D).A.VPNB.IP代理池C.ADSL寬帶撥號D.以上皆是20.表單登錄需要使用的請求方法是(B)A.GETB.POSTC.PUTD.DELETE21.使用Requests庫配置代理IP發(fā)送請求的參數(shù)是(A)A.proxiesB.agencyC.IPD.url22.(多選)Requests庫甲攜帶Cookie友送請求的參數(shù)是cookies,它接收的數(shù)據(jù)類型包括(AB)A.dictB.CookieJarC.listD.str23.關(guān)于LWPCookieJar對家,下列說法錯誤的是(D)A.用于存儲和加載CookieB.存儲Cookie的方法是saveC.加載Cookie的方法是loadD.FileCookieJar是LWPCookieJar的子類24.下列不屬于Scrapy框架的基本組成部分的是(A)A.引擎與調(diào)度器B.下載器與SpidersC.ItemPipelinesD.解析中間件25.下列對于Scrapy數(shù)據(jù)流向描述錯誤的是(C)A.引擎僅需要負責打開一個網(wǎng)站,并找到該網(wǎng)站的Spiders,并向該Spiders請求第一個要爬取的URLB.調(diào)度器返回下一個要爬取的URL給引擎,引擎將URL通過下載器中間件(請求方向)轉(zhuǎn)發(fā)給下載器(Downloader)C.Spiders處理響應(yīng)并返回爬取到的Items及(跟進的)新的請求給引擎解析中間件D.一旦網(wǎng)頁下載完畢,下載器會生成一個該網(wǎng)頁的響應(yīng),并將其通過下載器中間件(返回響應(yīng)方向)發(fā)送給引擎26.下列對于Scrapy常用命令及其作用描述正確的是(A).A.startproject是一個全局命令,主要用于運行一個獨立的爬蟲B.genspider是一個項目命令,主要用于創(chuàng)建爬蟲模板C.crawl是一個項目命令,主要用于啟動爬蟲D.list是一個全局命令,主要用于列出項目中所有可用的爬蟲27.下列對于Scrapy爬蟲項目目錄說法錯誤的是(B)A.spiders目錄用于存放用戶編寫的爬蟲腳本B.items腳本定義了一個Item類,能夠存儲爬取的數(shù)據(jù)C.settings腳本用于設(shè)置參數(shù)D.pipelines腳本定義了一個Pipeline類,可以根據(jù)需求將數(shù)據(jù)保存至數(shù)據(jù)庫、文件等28.下列對于Scrapy的設(shè)置說法錯誤的是(D).A.Scrapy設(shè)置允許自
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 焊接銷釘行業(yè)深度研究報告
- 新藥進院申請書
- 2024-2025年中國網(wǎng)絡(luò)視頻市場供需預測及投資戰(zhàn)略研究咨詢報告
- 利息低合同范例
- 2025年度環(huán)保型建筑材料研發(fā)合作合同
- 專利權(quán)合同范本
- 保險債權(quán)轉(zhuǎn)讓合同范例
- 公寓經(jīng)營餐飲合同范本
- 農(nóng)民轉(zhuǎn)賣房屋合同范本
- bot模式運營合同范本
- 交管12123學法減分題庫(含答案)
- 山東省濟南市槐蔭區(qū)2024-2025學年八年級上學期期末語文試題(含答案)
- 2025年廣西柳州市中級人民法院招錄聘用工作人員17人高頻重點提升(共500題)附帶答案詳解
- 2024年全國職業(yè)院校技能大賽高職組(研學旅行賽項)考試題庫(含答案)
- 十八項核心制度
- 工程施工安全培訓教育
- 2024年08月浙江2024渤海銀行杭州分行秋季校園招考筆試歷年參考題庫附帶答案詳解
- 2025年潔凈室工程師培訓:從理論到實踐的全面提升
- 2025年臨床醫(yī)師定期考核必考復習題庫及答案(620題)
- 2025年物業(yè)公司安全生產(chǎn)工作計劃(5篇)
- 2025社保政策培訓
評論
0/150
提交評論