版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第三章數(shù)據(jù)處理與應(yīng)用第1節(jié)數(shù)據(jù)采集、整理與安全目錄CONTENTS01020304課程導(dǎo)入本課內(nèi)容課堂練習(xí)課后作業(yè)AddthetexthereAddthetexthereAddthetexthereAddthetexthereAddthetexthereAddthetexthereAddthetexthereAddthetexthere本章學(xué)習(xí)目標(biāo)?通過典型的應(yīng)用實(shí)例,了解數(shù)據(jù)采集和整理的基本方法,理解數(shù)據(jù)安全的重要性。?選用合適的軟件工具或平臺(tái)處理數(shù)據(jù),掌握數(shù)據(jù)可視化的基本方法。?了解數(shù)據(jù)分析報(bào)告的結(jié)構(gòu)形式,完成解決問題的數(shù)據(jù)分析報(bào)告,感悟數(shù)據(jù)分析的價(jià)值體驗(yàn)思考單車數(shù)據(jù):用戶數(shù)據(jù):共享單車都能產(chǎn)生哪些數(shù)據(jù)通信連接狀態(tài)、車鎖狀態(tài)、使用記錄單車ID、經(jīng)緯度、時(shí)間等用戶基本信息、消費(fèi)記錄、騎行的記錄共享單車還能能產(chǎn)生哪些數(shù)據(jù)?圖表展示不同時(shí)間點(diǎn)分別七天的使用量,不同顏色的數(shù)據(jù)表示不同距離數(shù)的使用量,右上角為天氣數(shù)據(jù)。使用單車的城市體驗(yàn)思考數(shù)據(jù)采集的方法傳感數(shù)據(jù)采集互聯(lián)網(wǎng)數(shù)據(jù)采集數(shù)據(jù)保存的方法:數(shù)據(jù)庫當(dāng)今社會(huì),信息技術(shù)開始滲透至人類日常生活的方方面面,隨之而產(chǎn)生的數(shù)據(jù)量也呈現(xiàn)指數(shù)級數(shù)增長的態(tài)勢,例如物聯(lián)網(wǎng)傳感器、社交網(wǎng)絡(luò)等每時(shí)每刻都產(chǎn)生著大量的數(shù)據(jù)。面對數(shù)據(jù)量的快速增長及變化、數(shù)據(jù)來源的多元化、數(shù)據(jù)呈現(xiàn)方式的多樣化,我們在遵守相關(guān)法律法規(guī)、尊重知識產(chǎn)權(quán)的前提下,有效地采集與整理數(shù)據(jù)是進(jìn)行數(shù)據(jù)處理的基礎(chǔ)。一.數(shù)據(jù)采集明確數(shù)據(jù)要求確定數(shù)據(jù)來源選擇采集方法實(shí)施數(shù)據(jù)采集的過程數(shù)據(jù)來源傳感設(shè)備互聯(lián)網(wǎng)問卷調(diào)查企業(yè)內(nèi)部數(shù)據(jù)庫傳感數(shù)據(jù)采集互聯(lián)網(wǎng)數(shù)據(jù)采集獲取網(wǎng)頁獲取網(wǎng)頁獲取網(wǎng)頁解析網(wǎng)頁保存數(shù)據(jù)二、數(shù)據(jù)整理針對記錄重復(fù)的處理,Python的數(shù)據(jù)分析核心庫Pandas提供了一個(gè)名為drop_duplicates()的去重方法。該方法只對DataFrame或者Series類型有效。其基本語法如下:1.檢測與處理重復(fù)值1.檢測與處理重復(fù)值2.檢測與處理缺失值三、數(shù)據(jù)安全1.數(shù)據(jù)安全意識數(shù)據(jù)泄露三、數(shù)據(jù)安全1.數(shù)據(jù)安全意識計(jì)算機(jī)病毒三、數(shù)據(jù)安全1.數(shù)據(jù)安全意識黑客攻擊2.數(shù)據(jù)安全防護(hù)樹立數(shù)據(jù)安全意識(1)數(shù)據(jù)加密(2)數(shù)據(jù)脫敏(3)訪問控制(4)數(shù)據(jù)備份(5)異地容災(zāi)2.數(shù)據(jù)安全防護(hù)(1)數(shù)據(jù)加密數(shù)據(jù)加密是計(jì)算機(jī)系統(tǒng)對數(shù)據(jù)進(jìn)行保護(hù)的一種較為可靠的辦法。對需要保護(hù)的數(shù)據(jù)(也稱為明文)進(jìn)行加密,即利用加密算法和加密密鑰將需要保護(hù)的數(shù)據(jù)轉(zhuǎn)化成另外一種數(shù)據(jù)(也稱為密文),然后將密文進(jìn)行存儲(chǔ)或者傳輸給需要使用數(shù)據(jù)的人,使得竊取者在沒有密鑰和不了解加密算法的情況下無法識別密文,從而起到數(shù)據(jù)保密的作用。2.數(shù)據(jù)安全防護(hù)(2)數(shù)據(jù)脫敏數(shù)據(jù)脫敏是在不影響數(shù)據(jù)分析結(jié)果準(zhǔn)確性的前提下,對需要保護(hù)的數(shù)據(jù)進(jìn)行一定的變換操作,如替換、過濾或刪除等,從而降低數(shù)據(jù)的敏感性,保護(hù)用戶的隱私不被泄露,如圖所示。2.數(shù)據(jù)安全防護(hù)(3)訪問控制在各種計(jì)算機(jī)系統(tǒng)中,涉及各類服務(wù)的使用、文件的訪問、數(shù)據(jù)的存取時(shí),需要規(guī)定特定的人對部分?jǐn)?shù)據(jù)負(fù)責(zé)或獲得管理權(quán)限,從而做到被授權(quán)的人允許使用特定信息。此時(shí),就需要進(jìn)行訪問控制,這是確定用戶身份及其所享有權(quán)限的一種技術(shù)。訪問控制主要由身份驗(yàn)證與授權(quán)兩個(gè)部分組成,身份驗(yàn)證是用于驗(yàn)證用戶身份合法性的一種技術(shù)。身份驗(yàn)證本身并不足以防護(hù)數(shù)據(jù),還需要授權(quán)技術(shù)來確定用戶是否可以訪問數(shù)據(jù)或執(zhí)行其所嘗試的操作。2.數(shù)據(jù)安全防護(hù)(4)數(shù)據(jù)備份數(shù)據(jù)備份是指為了防止由于操作失誤、系統(tǒng)故障等人為因素或意外原因?qū)е聰?shù)據(jù)丟失,而將整個(gè)系統(tǒng)的數(shù)據(jù)或者一部分關(guān)鍵數(shù)據(jù)通過一定的方法從主計(jì)算機(jī)系統(tǒng)的存儲(chǔ)設(shè)備中復(fù)制到其他存儲(chǔ)設(shè)備中的過程,如圖3.10所示。一旦數(shù)據(jù)丟失,就可以從備份中恢復(fù)歷史版本的數(shù)據(jù)。數(shù)據(jù)備份往往需要定期定時(shí)進(jìn)行,從而使得備份的數(shù)據(jù)能夠保持最新的狀態(tài)。2.數(shù)據(jù)安全防護(hù)(5)異地容災(zāi)當(dāng)某處的計(jì)算機(jī)系統(tǒng)因意外、不可抗力因素(如火災(zāi)、地震等)的原因?qū)е峦V构ぷ鞑⑶覠o法提供計(jì)算機(jī)服務(wù)時(shí),往往需要切換到另外一套備用系統(tǒng)上,使其能夠繼續(xù)提供相關(guān)計(jì)算機(jī)服務(wù)。如果兩套或多套計(jì)算機(jī)系統(tǒng)都安放在同一處,一旦遭到不可抗力因素的影響時(shí),將會(huì)是災(zāi)難性的。為了防止出現(xiàn)這種情況,人們采用了一種異地容災(zāi)的方式,在相隔較遠(yuǎn)的地方,建立兩套或多套功能相同的計(jì)算機(jī)系統(tǒng),相互進(jìn)行數(shù)據(jù)備份或應(yīng)急時(shí)提供備用計(jì)算機(jī)服務(wù)。例如,銀行的數(shù)據(jù)中心都實(shí)現(xiàn)了異地容災(zāi),從而可以保證用戶的金融數(shù)據(jù)安全。謝謝大家觀
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年店鋪合伙人權(quán)益與義務(wù)協(xié)議
- 人教版2019學(xué)年七年級生物上冊全一冊教案
- 牦牛絨課件教學(xué)課件
- 企業(yè)借款合同模板皮革行業(yè)
- 倉儲(chǔ)服務(wù)安全生產(chǎn)管理制度范本
- 個(gè)人行紀(jì)合同范本
- 代理協(xié)議書圍墻
- 個(gè)體防護(hù)用品質(zhì)量檢驗(yàn)標(biāo)準(zhǔn)
- 互聯(lián)網(wǎng)外賣服務(wù)合同協(xié)議書范本
- 三方咨詢合作協(xié)議范本
- 期中綜合檢測(1-4單元)(試題)- 2024-2025學(xué)年二年級上冊數(shù)學(xué)人教版
- 2024年消防宣傳月知識競賽考試題庫500題(含答案)
- 國開2024年秋《機(jī)電控制工程基礎(chǔ)》形考任務(wù)1答案
- 2024年典型事故案例警示教育手冊15例
- 國際音標(biāo)簡表
- 液壓傳動(dòng)課程設(shè)計(jì).
- 葡萄糖中一般雜質(zhì)檢查
- 標(biāo)準(zhǔn)圖集S161
- 送貨單電子模板
- 4-船閘總體設(shè)計(jì)
- 《2021國標(biāo)結(jié)構(gòu)專業(yè)圖集資料》04G410-2 1.5mX6.0m預(yù)應(yīng)力混凝土屋面板(鋼筋混凝土部分)
評論
0/150
提交評論