版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
高中信息技術(shù)必修一
數(shù)據(jù)與計算第三章數(shù)據(jù)處理與應(yīng)用第2節(jié)數(shù)據(jù)分析與可視化
課堂導入數(shù)據(jù)分析是指使用適當?shù)姆治龇椒▽Σ杉驼砗蟮臄?shù)據(jù)加以詳細研究,提取有用的信息和形成概括總結(jié)的過程。我們通常運用統(tǒng)計方法,對數(shù)據(jù)進行定性與定量的分析,然后借助可視化工具,直觀清晰地呈現(xiàn)信息,并把信息的特征形象地傳遞給人們。一、數(shù)據(jù)分析為了從數(shù)據(jù)中獲取有價值的信息,對數(shù)據(jù)進行采集和整理后,還需要選用適當?shù)姆椒ㄅc工具對數(shù)據(jù)進行分析。通過數(shù)據(jù)分析,可以描述事物的現(xiàn)狀,發(fā)現(xiàn)相關(guān)要素的關(guān)系,并對事物的發(fā)展趨勢做出相應(yīng)的預測。1.數(shù)據(jù)分析基本方法對比分析法平均分析法結(jié)構(gòu)分析法(1)對比分析法對比分析法是指將兩個或兩個以上的數(shù)據(jù)進行比較,分析它們的差異,從而揭示這些數(shù)據(jù)所隱含的事物發(fā)展變化或差距,并且可以準確、量化地表示出這種變化或差距。圖3.14對不同場景下的共享單車使用情況進行了比較。(2)平均分析法平均分析法是利用平均數(shù)指標來反映某一特征數(shù)據(jù)總體在一定時間、地點條件下的一般水平。通過特征數(shù)據(jù)的平均數(shù)指標,呈現(xiàn)事物目前所處的位置和水平,進而對不同時期、不同類型單位的平均數(shù)指標進行對比,明示事物的發(fā)展趨勢和變化規(guī)律。(3)結(jié)構(gòu)分析法是通過計算各個部分占總體的比重,進而分析某一總體現(xiàn)象的內(nèi)部結(jié)構(gòu)特征、總體的性質(zhì)、總體內(nèi)部結(jié)構(gòu)隨時間推移而表現(xiàn)出的變化規(guī)律性。各個部分占總體的比重即為結(jié)構(gòu)指標,總體中各結(jié)構(gòu)指標的總和為100%。2.數(shù)據(jù)分析常用工具電子表格軟件在線數(shù)據(jù)分析平臺數(shù)據(jù)分析語言(1)電子表格軟件圖3.17電子表格軟件應(yīng)用界面示例(2)在線數(shù)據(jù)分析平臺圖3.18在線數(shù)據(jù)分析平臺示例(3)數(shù)據(jù)分析語言Python語言R語言MATLAB語言在對數(shù)據(jù)進行分析時,Python語言具有較強的網(wǎng)絡(luò)數(shù)據(jù)獲取優(yōu)勢,還可調(diào)用豐富的工具庫。例如,Numpy庫中的sum()、mean()、min()、max()和Pandas庫中的value_counts()等都是可以用于統(tǒng)計的函數(shù)。R語言和MATLAB語言依靠其獨特的功能在相關(guān)專業(yè)領(lǐng)域使用得更為廣泛。例如,R語言在統(tǒng)計學領(lǐng)域使用較多R語言和MATLAB語言依靠其獨特的功能在相關(guān)專業(yè)領(lǐng)域使用得更為廣泛。例如,MATLAB語言則在工程計算等領(lǐng)域更受歡迎。二、數(shù)據(jù)可視化1.數(shù)據(jù)可視化的基本工具電子表格軟件中的圖表功能可以基于選定的數(shù)據(jù),用柱形圖、折線圖、餅圖等方式呈現(xiàn)出來。創(chuàng)建圖表后,可以通過修改數(shù)據(jù)標記、圖例、標題、文字等來美化圖表或強調(diào)某些信息,也可以用圖案、顏色、對齊方式、字體及其他格式屬性來對圖表進行設(shè)置。
電子表格軟件的數(shù)據(jù)可視化過程直觀、易用,但是對于大量數(shù)據(jù)可視化的實現(xiàn)就比較困難了。當數(shù)據(jù)量較大時,可以使用編程語言對這些數(shù)據(jù)進行可視化。Python語言中,Matplotlib是一種應(yīng)用較廣的繪圖工具包,使用其中的pyplot子庫所提供的函數(shù)可以快速繪制圖形,并能使用標簽進行修飾,從而制作出高質(zhì)量的數(shù)據(jù)分析圖。Python語言中,引入Matplotlib的pyplot子庫的語法為:pyplot繪制圖形有一個基本流程:創(chuàng)建畫布與創(chuàng)建子圖添加畫布內(nèi)容保存與顯示圖形表3.8pyplot中創(chuàng)建畫布以及創(chuàng)建并選中子圖的常用函數(shù)表3.9pyplot中添加各類標簽和圖例的常用函數(shù)表3.10pyplot中保存和顯示圖形的常用函數(shù)圖3.21繪制不含子圖的圖形2.常用的數(shù)據(jù)分析圖(1)分析特征間的關(guān)系散點圖和折線圖是數(shù)據(jù)分析最常用的兩種圖形。這兩種圖形都能夠分析不同數(shù)值型特征間的關(guān)系。其中,散點圖主要用于分析特征間的相關(guān)關(guān)系,折線圖則用于分析自變量特征和因變量特征之間的趨勢關(guān)系。
散點圖(scatterdiagram)又稱為散點分布圖,是以一個特征為橫坐標,以另一個特征為縱坐標,利用坐標點(散點)的分布形態(tài)反映特征間統(tǒng)計關(guān)系的一種圖形。散點圖中,值由點在圖中的位置表示。圖3.22繪制簡單的散點圖圖3.23繪制折線圖(2)分析特征內(nèi)部數(shù)據(jù)分布與分散狀態(tài)柱狀圖、餅圖和箱形圖是數(shù)據(jù)分析常用的另外三種圖形,主要用于分析數(shù)據(jù)內(nèi)部的分布狀態(tài)與分散狀態(tài)。柱狀圖主要用于查看各分組數(shù)據(jù)的數(shù)量分布以及各分組數(shù)據(jù)之間的數(shù)量比較。餅圖傾向于查看各分組數(shù)據(jù)在總數(shù)據(jù)中的占比。箱形圖的主要作用是發(fā)現(xiàn)整體數(shù)據(jù)的分布、分散情況。圖3.24繪制柱狀圖項目實踐共享單車的精準投放和及時調(diào)配至今依然是共享單車經(jīng)營企業(yè)所面臨的難題。圍繞“近三年共享單車租賃量變化”“用戶騎行半徑分布”“各站點用戶租賃量比較”等特征,對本章第一節(jié)“一、數(shù)據(jù)采集”的項目實踐中的數(shù)據(jù)進行可視化呈現(xiàn),為有效管理共享單車提出合理建議
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024蘋果產(chǎn)業(yè)鏈金融風險防控合作協(xié)議3篇
- 2025年度林地林木種植與生態(tài)修復合同2篇
- 2024食堂食材的采購合同協(xié)議
- 2025賓館客房銷售數(shù)據(jù)共享與處理合同模板3篇
- 2025年度特色美食研發(fā)與酒店合作合同3篇
- 2025年度豬欄工程總承包及生態(tài)環(huán)保合同4篇
- 2025年度智能家居與安防系統(tǒng)一體化合同2篇
- 2025年4-甲基咪唑項目可行性研究報告
- 2025個人收藏品交易合同參考樣本4篇
- 電線電纜加工質(zhì)量控制流程
- 山東省淄博市張店區(qū)祥瑞園小學?-2024-2025年第一學期一年級班主任經(jīng)驗分享(著眼于愛 著手于細)【課件】
- 提優(yōu)精練08-2023-2024學年九年級英語上學期完形填空與閱讀理解提優(yōu)精練(原卷版)
- DB4511T 0002-2023 瓶裝液化石油氣充裝、配送安全管理規(guī)范
- 企業(yè)內(nèi)部客供物料管理辦法
- 婦科臨床葡萄胎課件
- 三基三嚴練習題庫與答案
- 傳媒行業(yè)突發(fā)事件應(yīng)急預案
- 債務(wù)抵租金協(xié)議書范文范本
- 藥學技能競賽標準答案與評分細則處方
- 2025屆高考英語 716個閱讀理解高頻詞清單
評論
0/150
提交評論