南開大學(xué)(答案)2024春學(xué)期(高起本1709-2103、專升本高起專2003-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)_第1頁
南開大學(xué)(答案)2024春學(xué)期(高起本1709-2103、專升本高起專2003-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)_第2頁
南開大學(xué)(答案)2024春學(xué)期(高起本1709-2103、專升本高起專2003-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)_第3頁
南開大學(xué)(答案)2024春學(xué)期(高起本1709-2103、專升本高起專2003-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)_第4頁
南開大學(xué)(答案)2024春學(xué)期(高起本1709-2103、專升本高起專2003-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

24春學(xué)期(高起本:1709-2103、專升本/高起專:2003-2103)《網(wǎng)絡(luò)爬蟲與信息提取》在線作業(yè) 共50道題總分:100分 100分 單選題 多選題 判斷題 一、單選題 共20題,40分 1 2分 PyMongo中邏輯查詢表示小于的符號是() A$gt B$lt C$gte$$lte 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 正則表達(dá)式的基本符號 2 2分 Scrapy_redis是Scrapy的“()”,它已經(jīng)封裝了使用Scrapy操作Redis的各個(gè)方法 A組件 B模塊 C控件 D單元 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Scrapy與Redis 3 2分 在Linux中哪個(gè)命令是添加權(quán)限的() Achmod Bsudo Ccp Dmkdir 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 4 2分 如果很多爬蟲同時(shí)對一個(gè)網(wǎng)站全速爬取,那么其實(shí)就是對網(wǎng)站進(jìn)行了()攻擊 AXSS BDOS CDDOS D跨域 我的得分:2分 我的答案:C 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 階段案例——小說網(wǎng)站爬蟲開發(fā) 5 2分 下列說法錯(cuò)誤的是() A小程序的請求極其簡單,基本上沒有驗(yàn)證信息 B用Python來請求小程序的后臺接口從而獲取數(shù)據(jù),比請求異步加載網(wǎng)頁的后臺接口要復(fù)雜很多。 C如果目標(biāo)網(wǎng)站有微信小程序,那么一定要優(yōu)先調(diào)查能否通過小程序的接口來抓取數(shù)據(jù)。 D小程序的反爬蟲能力比網(wǎng)頁版的低很多。使用小程序的接口來爬數(shù)據(jù),能極大提高爬蟲的開發(fā)效率。 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 異步加載與請求頭 6 2分 Python中列表可以用()方法在末尾添加元素 Aadd Bappend Cplus D+ 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Python基礎(chǔ) findall方法 Python編譯器 7 2分 使用UIAutomatorr點(diǎn)亮屏幕的操作是得到相應(yīng)控件后使用命令() Awakeup Blight Cbright Dsleep 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 文件操作 8 2分 ()是一個(gè)傳遞信息的通道。它負(fù)責(zé)將爬取博文列表頁獲取到的信息傳遞給負(fù)責(zé)爬取正文頁的方法中。 Ameta Bhead Cheader Dbody 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 階段案例——樂視網(wǎng)爬取視頻 9 2分 使用UIAutomator打開微信的操作是獲取相應(yīng)圖標(biāo)后使用命令() Atouch Bclick Cpush Dhover 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 文件操作 10 2分 Scrapy中使用Xpath獲得的結(jié)果調(diào)用了.extract方法,結(jié)果以()形式生成 A列表 B元組 C字典 D集合 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Scrapy的使用 11 2分 HTTP常用狀態(tài)碼表明服務(wù)器內(nèi)部資源出故障了的是() A500 B503 C403 D404 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 12 2分 當(dāng)需要把Python里面的數(shù)據(jù)發(fā)送給網(wǎng)頁時(shí),應(yīng)先將其轉(zhuǎn)換成() AJson字符串 BGET CPOST DRequest 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Python基礎(chǔ) Python與數(shù)據(jù)庫 Python編譯器 13 2分 Redis若要進(jìn)入交互環(huán)境,需要打開終端輸入() Aredis-cli Bredis Credis-cmd Dredis-start 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Redis的使用 14 2分 在Scrapy的目錄下,哪個(gè)文件負(fù)責(zé)存放爬蟲文件?() Aspiders文件夾 Bitem.py Cpipeline.py Dsettings.py 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 文件操作 15 2分 Python操作CSV文件可通過()容器的方式操作單元格 A列表 B元組 C字典 D集合 我的得分:2分 我的答案:C 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 文件操作 16 2分 Python正則表達(dá)式模塊的findall方法返回結(jié)果為() A列表 B元組 C字典 D集合 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): findall方法 17 2分 以下關(guān)于Charles的說法正確的是() ACharles是一個(gè)跨平臺的HTTP抓包工具,可以截取HTTP或者HTTPS請求的數(shù)據(jù)包 BCharles有Windows32/64版和Linux64版,但是目前還沒有對MacOS進(jìn)行有效的支持。 CCharles上面滾動的數(shù)據(jù)就是目前計(jì)算機(jī)發(fā)起的數(shù)據(jù)包。單擊工具欄上面的黃色笤帚圖標(biāo),可以清停止抓包。 D在Charles啟動時(shí),系統(tǒng)自帶瀏覽器的部分HTTP流量不會經(jīng)過Charles。 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 使用Charles抓取數(shù)據(jù)包 18 2分 如果使用Python的數(shù)據(jù)結(jié)構(gòu)來做類比的話,MongoDB中庫相當(dāng)于一個(gè)() A列表 B元組 C字典 D集合 我的得分:2分 我的答案:C 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): MongoDB的使用 MongoDB 19 2分 Redis中讀取數(shù)據(jù)語句lrangechapter03,那么表示讀列表中()個(gè)值 A2 B3 C4 D5 我的得分:2分 我的答案:C 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Python的條件語句和循環(huán)語句 20 2分 Python正則表達(dá)式模塊的findall方法提取內(nèi)容包含多個(gè),則返回結(jié)果的列表中會包含() A列表 B元組 C字典 D集合 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): findall方法 二、多選題 共10題,20分 1 2分 一個(gè)可行的自動更換代理的爬蟲系統(tǒng),應(yīng)該下列哪些功能? A有一個(gè)小爬蟲ProxySpider去各大代理網(wǎng)站爬取免費(fèi)代理并驗(yàn)證,將可以使用的代理IP保存到數(shù)據(jù)庫中 B在發(fā)現(xiàn)某個(gè)請求已經(jīng)被設(shè)置過代理后,什么也不做,直接返回 C在ProxyMiddlerware的process_request中,每次從數(shù)據(jù)庫里面隨機(jī)選擇一條代理IP地址使用 D周期性驗(yàn)證數(shù)據(jù)庫中的無效代理,及時(shí)將其刪除 我的得分:2分 我的答案:ACD 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 帶權(quán)限管理的反向代理 2 2分 Python中有哪些實(shí)現(xiàn)多線程方法() Amultiprocess.dummy Bthreading.Thread Cprocess DPyMongoDB 我的得分:2分 我的答案:BA 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): findall方法 Python基礎(chǔ) Python編譯器 3 2分 以下哪些可以獨(dú)立成為Python編譯器() APycharm BIDLE CEclipse DVisualStudio2010 我的得分:2分 我的答案:AB 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Python編譯器 4 2分 網(wǎng)絡(luò)爬蟲的用途有() A收集數(shù)據(jù) B盡職調(diào)查 C提高流量 D攻擊服務(wù)器 我的得分:2分 我的答案:ABC 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 網(wǎng)絡(luò)爬蟲的用途 5 2分 HTTP常用狀態(tài)碼表明請求被正常處理的有() A200 B301 C302 D204 我的得分:2分 我的答案:AD 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 請求頭 6 2分 下列關(guān)于在IOS上配置charles的說法正確的是() A不同ios設(shè)備之間會有比較大的差別,所以配置的時(shí)候需要找到對應(yīng)的安裝證書的入口。 B手機(jī)和電腦需要在同一個(gè)局域網(wǎng)下。 CHTTP代理可以使用“自動”選項(xiàng)。 D安裝好證書以后,打開iOS設(shè)備上的任何一個(gè)App,可以看到Charles中有數(shù)據(jù)包在流動 我的得分:2分 我的答案:BD 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 使用Charles抓取數(shù)據(jù)包 7 2分 Python中一個(gè)函數(shù)沒有返回值則可以寫() A沒有return Breturn CreturnNone DreturnNULL 我的得分:2分 我的答案:ABC 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Python函數(shù)的定義和使用 8 2分 最常見的HTTP請求類型有() AGET BPOST CSEND DRECEIVE 我的得分:2分 我的答案:BA 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 請求頭 9 2分 HTTP常用狀態(tài)碼表明表明服務(wù)器本身發(fā)生錯(cuò)誤的有() A403 B404 C500 D503 我的得分:2分 我的答案:CD 解析: 暫無內(nèi)容 10 2分 自動填充驗(yàn)證碼的方式有 A手動識別填寫 B圖像識別 C打碼網(wǎng)站 D瀏覽器自動識別 我的得分:2分 我的答案:BC 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 填充驗(yàn)證碼 三、判斷題 共20題,40分 1 2分 微信小程序的反爬蟲能力要比網(wǎng)頁的高很多。 A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): App爬蟲和小程序爬蟲 2 2分 Python中寫CSV文件的writerows方法參數(shù)為字典類型 A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Python編譯器 字典與集合 Python基礎(chǔ) 3 2分 Redis插入數(shù)據(jù)都是插入到列表右側(cè),因此讀取數(shù)據(jù)也是從右側(cè)讀取 A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Redis的使用 4 2分 UIAutomatorViewer與Pythonuiautomator可以同時(shí)使用 A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Python編譯器 Python與數(shù)據(jù)庫 Python基礎(chǔ) 5 2分 robots.txt是一種規(guī)范,在法律范疇內(nèi) A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 爬蟲開發(fā)中的法律和道德問題 6 2分 雖然MongoDB相比于MySQL來說,速度快了很多,但是頻繁讀寫MongoDB還是會嚴(yán)重拖慢程序的執(zhí)行速度。 A對 B錯(cuò) 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): MongoDB MongoDB的使用 7 2分 上課傳紙條。A要把紙條傳給B,但是A與B距離太遠(yuǎn),于是讓C來轉(zhuǎn)交紙條。此時(shí),C先篡改紙條的內(nèi)容再傳給B,這是一種類似抓包的方式。 A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 8 2分 默認(rèn)情況下,MongoDB可以通過外網(wǎng)訪問 A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): MongoDB的使用 MongoDB 9 2分 使用AJAX技術(shù),可以在不刷新網(wǎng)頁的情況下更新網(wǎng)頁數(shù)據(jù) A對 B錯(cuò) 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 簡單的網(wǎng)頁爬蟲方法 10 2分 Charles能截獲HTTP和HTTPS的數(shù)據(jù)包,如果網(wǎng)站使用websocket就可以截獲。 A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 使用Charles抓取數(shù)據(jù)包 11 2分 如果元組里面只有整數(shù)、浮點(diǎn)數(shù)、字符串、一個(gè)列表,就既不能添加數(shù)據(jù),也不能刪除數(shù)據(jù),還不能修改里面數(shù)據(jù)的值。 A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 字符串、列表、元組 12 2分 HTTP狀態(tài)碼302表示資源永久重定向。 A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 13 2分 對Charles設(shè)置代理時(shí),Ip可以設(shè)置為,端口為8888. A對 B錯(cuò) 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): 使用Charles抓取數(shù)據(jù)包 14 2分 使用Charles,可以輕松截獲手機(jī)App和微信小程序的數(shù)據(jù)包,從而開發(fā)出直接抓取App后臺和小程序后臺的爬蟲。 A對 B錯(cuò) 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): App爬蟲和小程序爬蟲 15 2分 在Windows中下若要運(yùn)行Redis可以運(yùn)行redis-server/usr/local/etc/redis.conf A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): Python的安裝和運(yùn)行 16 2分 PyMongoDB中排序方法sort第二個(gè)參數(shù)-1表示升序 A對 B錯(cuò) 我的得分:2分 我的答案:B 解析: 暫無內(nèi)容 相關(guān)知識點(diǎn): findall方法 17 2分 Redis的集合與Python的集合一樣,沒有順序,值不重復(fù) A對 B錯(cuò) 我的得分:2分 我的答案:A 解析: 暫無內(nèi)容 相

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論