版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
5.2.2數(shù)據(jù)的存儲與保護數(shù)據(jù)的存儲一、本地內(nèi)部存儲本地電腦硬盤存儲卡光盤數(shù)據(jù)存儲服務器數(shù)據(jù)的存儲二、第三方云存儲數(shù)據(jù)的存儲二、第三方云存儲供應商用戶管理運營維護訪問權(quán)限存儲空間存儲數(shù)據(jù)數(shù)據(jù)的存儲數(shù)據(jù)的存儲方式數(shù)據(jù)的保護數(shù)據(jù)的安全隱患數(shù)據(jù)保護刻不容緩數(shù)據(jù)的保護數(shù)據(jù)安全保護技術(shù)1、安裝殺毒軟件和防火墻數(shù)據(jù)的保護數(shù)據(jù)安全保護技術(shù)2、拷貝、備份、復制、鏡像、持續(xù)備份數(shù)據(jù)的保護數(shù)據(jù)安全保護技術(shù)2、拷貝、備份、復制、鏡像、持續(xù)備份1、安裝殺毒軟件和防火墻3、加密:對稱式加密
非對稱式加密數(shù)據(jù)的保護數(shù)據(jù)的隱私保護大數(shù)據(jù)時代,信息傳播的速度更快,范圍更大數(shù)據(jù)的保護數(shù)據(jù)的隱私保護數(shù)據(jù)的保護數(shù)據(jù)的隱私保護爬蟲數(shù)據(jù)下載爬蟲數(shù)據(jù)下載下載圖片:open(文件名,模式)模式:只讀(r),寫入(w),追加(+)等。
這個參數(shù)是非強制的,默認文件訪問模式為只讀(r)。為wb,是以二進制格式打開一個文件只用于寫入。
如果該文件已存在則打開文件,并從開頭開始編輯,即原有內(nèi)容會被刪除。如果該文件不存在,創(chuàng)建新文件。一般用于非文本文件如圖片等。response.content。獲得response對象的二進制形式。爬蟲數(shù)據(jù)下載爬蟲小結(jié)request.get(url,headers=headers)模擬發(fā)出請求獲得回應取出htmlBS4梳理BeautifulSoup(html,’lxml’)查找同類soup.find_all(“標記”,”屬性”=“”)爬內(nèi)容:item.find(“標記”,”屬性”=“”).get_text()爬屬性值:<標記屬性1=屬性值
屬性2=屬性值
......>內(nèi)容</標記>item.find(“標記”,”屬性”=“”).attrs[“屬性”]rsp.text網(wǎng)址用戶代理for循環(huán)爬蟲數(shù)據(jù)下載把爬到的數(shù)據(jù)存入Excel(openpyxl庫)import
openpyxlwb=openpyxl.Workbook()實例化一個工作簿ws=wb.active激活的工作表ws.title=“電影top250"設置工作表名ws.append([“序號”,“片名”,“地址"])追加表頭wb.save(“movie.xlsx")保存工作簿列表ws.append((sn,name,url))爬蟲數(shù)據(jù)下載完整參考代碼:拓展:如何爬取連續(xù)的多個網(wǎng)頁?爬蟲數(shù)據(jù)下載有人說爬蟲簡單有人說爬蟲簡單,于是我學了簡單的爬蟲。為了解析網(wǎng)頁學了HTML:為了存儲數(shù)據(jù)并理解原理學了MySQL和MongoDB;為了構(gòu)建增量和分布式爬蟲學了redis;為了解決網(wǎng)頁加密與混淆學了JavaScript;為了優(yōu)化開發(fā)效率和處理滑動驗證碼學了selenium和pyppeteer;為了處理數(shù)字驗證碼學了卷積神經(jīng)網(wǎng)絡;為了爬取的數(shù)據(jù)更有價值學了numpy、pandas和sklearn;為了更直觀的理解數(shù)據(jù)學了matplotlib和altair;為了爬取手機APP
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度特種車輛買賣及售后服務協(xié)議3篇
- 《稅款征收基本制度》課件
- 二零二五年度2025版木材碳排放權(quán)交易合同2篇
- 2025版門窗產(chǎn)品進出口貿(mào)易合同4篇
- 二零二五年度商業(yè)步行街鋪面租賃及品牌管理合同
- 二零二五版行政合同行政主體特權(quán)與公眾權(quán)益保護協(xié)議3篇
- 二零二五年度家居用品貼牌設計與市場拓展協(xié)議
- 2025年度離婚房產(chǎn)贈與合同附帶配偶經(jīng)濟補償協(xié)議
- 2025年度解除租賃合同簡易協(xié)議書(教育培訓場地)
- 2025年度舞蹈表演培訓學員招生合同書
- 2024年遼寧石化職業(yè)技術(shù)學院單招職業(yè)適應性測試題庫含答案
- 廣西桂林市2023-2024學年高二上學期期末考試物理試卷
- 財務指標與財務管理
- 2023-2024學年西安市高二數(shù)學第一學期期末考試卷附答案解析
- 部編版二年級下冊道德與法治第三單元《綠色小衛(wèi)士》全部教案
- 【京東倉庫出庫作業(yè)優(yōu)化設計13000字(論文)】
- 保安春節(jié)安全生產(chǎn)培訓
- 初一語文上冊基礎(chǔ)知識訓練及答案(5篇)
- 血液透析水處理系統(tǒng)演示
- GB/T 27030-2006合格評定第三方符合性標志的通用要求
- GB/T 13663.2-2018給水用聚乙烯(PE)管道系統(tǒng)第2部分:管材
評論
0/150
提交評論