版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第1章緒論商務(wù)數(shù)據(jù)可視化思維導(dǎo)圖MindMapping數(shù)據(jù)的采集和清洗1.11.1數(shù)據(jù)的采集和清洗第1章緒論在開始分析數(shù)據(jù),進(jìn)行數(shù)據(jù)可視化之前,需要完成兩個(gè)關(guān)鍵的任務(wù):數(shù)據(jù)的采集和數(shù)據(jù)的清洗。接下來的兩小節(jié)將會(huì)對這兩個(gè)關(guān)鍵任務(wù)進(jìn)行詳細(xì)地解釋與闡述。數(shù)據(jù)的采集又稱為數(shù)據(jù)的收集,就是指通過各種工具和方法,獲取需要數(shù)據(jù)的過程,為以后數(shù)據(jù)的分析和數(shù)據(jù)可視化提供直接的依據(jù)和素材。第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.1數(shù)據(jù)的采集數(shù)據(jù)采集的來源有很多種方式,比如內(nèi)部數(shù)據(jù)可以通過公司自有的數(shù)據(jù)庫進(jìn)行獲取。外部數(shù)據(jù)在如今更易收集,比如可以通過公開的出版物或者搜索引擎快速找到需要的數(shù)據(jù),一些專業(yè)的數(shù)據(jù)可以從國家或地方統(tǒng)計(jì)局的網(wǎng)站,行業(yè)組織的官方網(wǎng)站或行業(yè)信息網(wǎng)站獲得。本節(jié)將會(huì)對數(shù)據(jù)的采集進(jìn)行詳細(xì)地解釋與闡述,以采集國家統(tǒng)計(jì)局?jǐn)?shù)據(jù)為案例講解數(shù)據(jù)采集。第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.1數(shù)據(jù)的采集步驟一:從web導(dǎo)入數(shù)據(jù)打開Excel2016,新建一個(gè)工作簿,在菜單中找到數(shù)據(jù)這一欄,點(diǎn)擊自網(wǎng)站,從Web獲取數(shù)據(jù),見圖1-1圖1-1從Web導(dǎo)入數(shù)據(jù)第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.1數(shù)據(jù)的采集步驟二:新建web查詢點(diǎn)擊以后,會(huì)彈出一個(gè)新建Web查詢窗口,在地址這一欄輸入想要跳轉(zhuǎn)的網(wǎng)址,在這里選取了國家統(tǒng)計(jì)局中第四次全國經(jīng)濟(jì)普查公報(bào)中的數(shù)據(jù),按地區(qū)分組的單位情況,見圖1-2,網(wǎng)址如下:/tjsj/zxfb/201911/t20191119_1710340.html。圖1-2新建web查詢第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.1數(shù)據(jù)的采集步驟三:導(dǎo)入報(bào)表輸入網(wǎng)址跳轉(zhuǎn)以后,網(wǎng)站會(huì)顯示出黃色箭頭,單擊選中報(bào)表,然后單擊導(dǎo)入,見圖1-3。圖
1-3導(dǎo)入報(bào)表第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.1數(shù)據(jù)的采集步驟四:選擇導(dǎo)入的位置點(diǎn)擊導(dǎo)入以后,會(huì)彈出一個(gè)窗口指導(dǎo)你導(dǎo)入數(shù)據(jù),可以在窗口改變你想要導(dǎo)入數(shù)據(jù)的位置,見圖1-4。圖1-4選擇導(dǎo)入的位置第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.1數(shù)據(jù)的采集步驟五:刷新數(shù)據(jù)一般網(wǎng)上的數(shù)據(jù)都是實(shí)時(shí)更新的,因此我們需要通過數(shù)據(jù)刷新來獲取最新的數(shù)據(jù),一般有兩種方法,點(diǎn)擊數(shù)據(jù)中的全部刷新,見圖1-5,或者選中任意數(shù)據(jù)單元格,右擊鼠標(biāo)設(shè)置“數(shù)據(jù)范圍屬性”,見圖1-6。圖1-5刷新數(shù)據(jù)圖1-6數(shù)據(jù)范圍屬性第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.1數(shù)據(jù)的采集步驟六:實(shí)時(shí)更新數(shù)據(jù)點(diǎn)擊數(shù)據(jù)范圍屬性后,將刷新控件中的前三項(xiàng)勾選,在點(diǎn)擊右下角的確定,這樣數(shù)據(jù)就會(huì)實(shí)時(shí)更新了,見圖1-7。圖1-7實(shí)時(shí)更新數(shù)據(jù)第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.2數(shù)據(jù)的清洗當(dāng)我們完成了數(shù)據(jù)的采集,可以看出網(wǎng)上的數(shù)據(jù)實(shí)際上是紛繁復(fù)雜的,因此數(shù)據(jù)不是導(dǎo)入就可以使用的,還需要我們通過數(shù)據(jù)清洗來選出我們所需要的數(shù)據(jù),這樣做出來的數(shù)據(jù)可視化才有它存在的意義。數(shù)據(jù)清洗一般有三種方法:數(shù)據(jù)工具法、高亮排序法和函數(shù)法。圖1-8成功導(dǎo)入的數(shù)據(jù)第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.2數(shù)據(jù)的清洗:工具數(shù)據(jù)法步驟一:選中想要數(shù)據(jù)清洗的完整數(shù)據(jù)表,完整數(shù)據(jù)表見圖1-9。找到菜單中的數(shù)據(jù)一欄,找到數(shù)據(jù)工具中的刪除重復(fù)項(xiàng),見圖1-10。圖1-10點(diǎn)擊數(shù)據(jù)工具中的刪除重復(fù)項(xiàng)圖1-9完整數(shù)據(jù)表第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.2數(shù)據(jù)的清洗:工具數(shù)據(jù)法步驟二:點(diǎn)擊刪除重復(fù)項(xiàng)以后,會(huì)跳出一個(gè)窗口,在窗口里可以選擇需要?jiǎng)h除重復(fù)項(xiàng)的列,勾選“數(shù)據(jù)包含標(biāo)題”選項(xiàng),可以顯示數(shù)據(jù)列的標(biāo)題,見圖1-11。點(diǎn)擊確定會(huì)跳出一個(gè)提示框,表示刪除重復(fù)項(xiàng)成功,見圖1-12,刪除之后的效果圖見圖1-13。圖1-11選擇并刪除重復(fù)項(xiàng)圖1-12成功刪除重復(fù)項(xiàng)圖1-13刪除之后的效果圖第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.2數(shù)據(jù)的清洗:高亮排序法步驟一:選中想要?jiǎng)h除重復(fù)項(xiàng)的值,選擇開始菜單里的條件格式選項(xiàng),找到其中的重復(fù)項(xiàng)并點(diǎn)擊,見圖1-14,點(diǎn)擊以后可以看到跳出一個(gè)設(shè)置格式的窗口,并且有重復(fù)項(xiàng)的數(shù)據(jù)格已經(jīng)標(biāo)紅,高亮顯示,見圖1-15。圖1-14選中想刪除重復(fù)項(xiàng)的列圖1-15設(shè)置單元格格式第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.2數(shù)據(jù)的清洗:高亮排序法步驟二:全選數(shù)據(jù)表,在菜單中找到數(shù)據(jù)一欄,點(diǎn)擊排序和篩選里的排序按鈕,見圖1-16。圖1-16對數(shù)據(jù)表排序第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.2數(shù)據(jù)的清洗:高亮排序法步驟三:因?yàn)閯偛盼覀冞x擇的是A列,所以我們要在彈出的排序窗口里添加列的主要關(guān)鍵字A列、排序依據(jù)為單元格顏色,次序選擇剛才選擇的顏色,把它們排在頂端,方便我們刪除重復(fù)項(xiàng),見圖1-17。完成以后結(jié)果如圖所示,見圖1-18,隨后可以根據(jù)自己的需要?jiǎng)h除或修改。圖1-17選擇關(guān)鍵字和排序依據(jù)圖1-18排序結(jié)果展示第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.2數(shù)據(jù)的清洗:函數(shù)法步驟一:新增一列用來放置COUNTIF()函數(shù)所計(jì)算出來的值,通過COUNTIF()函數(shù)能知道關(guān)鍵字的個(gè)數(shù),當(dāng)它的關(guān)鍵字個(gè)數(shù)大于1的時(shí)候,說明這一項(xiàng)有重復(fù)項(xiàng),見圖1-19。圖1-19新增一列放置函數(shù)值第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.2數(shù)據(jù)的清洗:函數(shù)法步驟二:光標(biāo)停留在B4內(nèi),輸入“=COUNTIF(A:A,A4)”,按下回車,會(huì)計(jì)算出函數(shù)值,這個(gè)式子表示從A列到A列,計(jì)算有A4這個(gè)數(shù)據(jù)格里的值的單元格的個(gè)數(shù)。我們可以看到A4單元格中的值是“廣西”,計(jì)算出來的函數(shù)值表示A列中單元格中的值為“廣西”的單元格的個(gè)數(shù)共有幾個(gè),從而查找出重復(fù)項(xiàng),見圖1-20。圖1-20計(jì)算函數(shù)值第1章緒論1.1數(shù)據(jù)的采集和清洗1.1.2數(shù)據(jù)的清洗:函數(shù)法步驟三:長按數(shù)據(jù)格右下角的方點(diǎn)下拉,可以依次計(jì)算每一行的函數(shù)值,計(jì)算完以后可以通過點(diǎn)擊在菜單中找到數(shù)據(jù)一欄,點(diǎn)擊排序和篩選里的排序按鈕,隨后進(jìn)行關(guān)于函數(shù)值的排序,見圖1-21。圖1-21關(guān)于函數(shù)值對數(shù)據(jù)表排序數(shù)據(jù)可視化概述1.21.2數(shù)據(jù)可視化概述第1章緒論數(shù)據(jù)可視化是以圖形、圖表或其他視覺格式表示數(shù)據(jù)或信息。它能更容易地看到數(shù)據(jù)的趨勢和模式。數(shù)據(jù)可視化通俗地來講就是將抽象數(shù)字的集合轉(zhuǎn)換為讀者或者觀眾能快速掌握和理解的形狀和形式。隨著大數(shù)據(jù)的興起,我們需要解釋越來越多的數(shù)據(jù)。因此數(shù)據(jù)可視化不僅對數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析人員很重要,而且對于任何職業(yè)中的數(shù)據(jù)可視化都很有必要。無論從事的是金融、營銷、技術(shù)、設(shè)計(jì)或其他領(lǐng)域,基本都需要可視化數(shù)據(jù)。1.2.1可視化認(rèn)知(1)柱狀圖柱狀圖是最常見的數(shù)據(jù)可視化圖表之一,它是顯示不同數(shù)據(jù)集之間的比較中,最簡單也是最歷史悠久的方法。柱狀圖包括水平x軸的數(shù)據(jù)標(biāo)簽,在垂直y軸上顯示測量的指標(biāo)或值。y軸通常從0開始,與圖表中最大的測量值高度相同。圖1-22柱狀圖一般來說,數(shù)據(jù)可視化基本用圖表來進(jìn)行展示。一些最常見的數(shù)據(jù)可視化圖表包括但不僅限于:第1章緒論1.2數(shù)據(jù)可視化概述1.2.2數(shù)據(jù)可視化圖表(2)折線圖折線圖適合二維的大數(shù)據(jù)集,旨在顯示隨時(shí)間變化的趨勢、進(jìn)度或變化。因此,當(dāng)數(shù)據(jù)集是連續(xù)的,而不是充滿斷點(diǎn)的時(shí)候,折線圖能發(fā)揮出它最大的效果。與柱狀圖相同,x軸表示數(shù)據(jù)標(biāo)簽,而測量值在y軸上。圖1-23折線圖第1章緒論1.2數(shù)據(jù)可視化概述1.2.2數(shù)據(jù)可視化圖表(3)餅圖餅圖常用于統(tǒng)計(jì),顯示一個(gè)數(shù)據(jù)系列中各項(xiàng)的大小與各項(xiàng)所占的比例。餅圖中的數(shù)據(jù)點(diǎn)顯示為整個(gè)餅圖的百分比。使用餅圖,可以比較值、測量每個(gè)值的組成以及分析數(shù)據(jù)分布。餅圖表示一個(gè)靜態(tài)數(shù)字,這些在數(shù)字營銷中特別有幫助,比如市場份額、營銷支出、客戶統(tǒng)計(jì)、設(shè)備使用情況等等。圖1-24餅圖第1章緒論1.2數(shù)據(jù)可視化概述1.2.2數(shù)據(jù)可視化圖表除了以上闡述的三類最常見的可視化圖表以外,還有很多其他的可視化圖表,比如條形圖、散點(diǎn)圖、圓環(huán)圖、旭日圖、樹狀圖、箱線圖、雷達(dá)圖、熱力圖等等,這些圖表在后面的章節(jié)都會(huì)一一詳細(xì)地介紹其繪制及應(yīng)用(1)了解你的受眾。要通過受眾來確定你做數(shù)據(jù)可視化的風(fēng)格和形式。(2)明確自己的目標(biāo)。在構(gòu)建數(shù)據(jù)報(bào)表、圖表和視覺效果之前,必須設(shè)定好目標(biāo),才能有的放矢地去尋找數(shù)據(jù),并制作可視化效果。(3)選擇正確的圖表類型。要成功有效地呈現(xiàn)需要的數(shù)據(jù),必須為特定項(xiàng)目、受眾和目的選擇正確的圖表。(4)利用色彩理論。在制作數(shù)據(jù)可視化的時(shí)候,需要保持整個(gè)數(shù)據(jù)可視化過程中保持配色方案一致,適用清晰的對比度來區(qū)分元素。1.2數(shù)據(jù)可視化概述1.2.3數(shù)據(jù)可視化原則第1章緒論Excel可以用圖表對任何一組數(shù)據(jù)進(jìn)行圖形表示。圖表是數(shù)據(jù)的可視化表示,Excel為使用者提供了許多圖表類型,使用者可以選擇適合所選數(shù)據(jù)的圖表類型或者可以使用Excel推薦圖表選項(xiàng)查看自定義為數(shù)據(jù)的圖表,選擇其中一種。通過選中想要做成圖表的數(shù)據(jù),點(diǎn)擊推薦的圖表,Excel會(huì)生成幾種適合你的數(shù)據(jù)的圖表,見圖1-26,圖1-27。第1章緒論1.2數(shù)據(jù)可視化概述1.2.4Excel數(shù)據(jù)可視化的形式圖1-26推薦的圖表圖1-27插入圖表接下來本書會(huì)用一個(gè)簡單的例子進(jìn)行Excel數(shù)據(jù)可視化形式的展示,用來直觀地講述沒有數(shù)據(jù)可視化和進(jìn)行數(shù)據(jù)可視化的區(qū)別。先來看沒有數(shù)據(jù)可視化的表格,見圖1-28,當(dāng)表格數(shù)據(jù)量更多的時(shí)候,很難一眼看出這些數(shù)據(jù)的規(guī)律,因此要進(jìn)行數(shù)據(jù)可視化。第1章緒論1.2數(shù)據(jù)可視化概述1.2.4Excel數(shù)據(jù)可視化的形式圖1-28未進(jìn)行數(shù)據(jù)可視化的表格選中表格,點(diǎn)擊工具欄里的“推薦的圖表”,選擇合適的圖表進(jìn)行生成,能很輕松地完成圖表的生成,見圖1-29。第1章緒論1.2數(shù)據(jù)可視化概述1.2.4Excel數(shù)據(jù)可視化的形式圖1-29數(shù)據(jù)可視化圖表從圖表中可以很清楚地看出每個(gè)季度的目標(biāo)利潤和實(shí)際利潤的差距,這就是Excel數(shù)據(jù)可視化的形式,通過對特定數(shù)據(jù)進(jìn)行合適的可視化處理,從而形成直觀、一目了然的數(shù)據(jù)可視化形式,其他圖表的數(shù)據(jù)可視化形式會(huì)在后面的章節(jié)中詳細(xì)敘述。商務(wù)應(yīng)用案例1.31.3商務(wù)應(yīng)用案例1.3.1案例一:銷售數(shù)據(jù)的預(yù)處理【背景材料】:本案例采用“2021年1—2月份商品零售數(shù)據(jù)”進(jìn)行銷售數(shù)據(jù)的預(yù)處理的演示,如圖1-30所示。圖1-302021年1-2月份商品零售數(shù)據(jù)第1章緒論1.3商務(wù)應(yīng)用案例1.3.1案例一:銷售數(shù)據(jù)的預(yù)處理【分析過程】:步驟一:首先對數(shù)據(jù)進(jìn)行清洗,通過數(shù)據(jù)-數(shù)據(jù)工具-刪除重復(fù)值,刪除數(shù)據(jù)表中重復(fù)的值,見圖1-31。圖1-31刪除重復(fù)值后的數(shù)據(jù)第1章緒論1.3商務(wù)應(yīng)用案例1.3.1案例一:銷售數(shù)據(jù)的預(yù)處理步驟二:對數(shù)據(jù)表進(jìn)行缺失值查找和填充,在開始菜單中的查找與選擇選項(xiàng)下選擇空值,選出的空值對表格數(shù)據(jù)的表達(dá)不造成影響,即未發(fā)現(xiàn)重復(fù)記錄,見圖1-32。圖1-32空值查找和填充第1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度個(gè)人養(yǎng)老金投資管理合同4篇
- 2025版專業(yè)舞蹈鞋訂購與租賃合同3篇
- 2025版木質(zhì)墻板供貨與安裝服務(wù)合同4篇
- 2025年度城市軌道交通建設(shè)項(xiàng)目工程總承包合同4篇
- 2025版土地儲備土地使用權(quán)流轉(zhuǎn)合同3篇
- 五金行業(yè)電子商務(wù)應(yīng)用考核試卷
- 安徽省黃山市高三第一次質(zhì)量檢測語文試卷(含答案)
- 2025版升級版土方工程勞務(wù)承包合同范本2篇
- 2025版危險(xiǎn)化學(xué)品運(yùn)輸安全責(zé)任合同3篇
- 二零二五版海運(yùn)出口運(yùn)輸代理合同貨物跟蹤查詢協(xié)議3篇
- 無人化農(nóng)場項(xiàng)目可行性研究報(bào)告
- 《如何存款最合算》課件
- 社區(qū)團(tuán)支部工作計(jì)劃
- 拖欠工程款上訪信范文
- 2024屆上海市金山區(qū)高三下學(xué)期二模英語試題(原卷版)
- 《wifi協(xié)議文庫》課件
- 2025年新高考語文復(fù)習(xí) 文言文速讀技巧 考情分析及備考策略
- 2024年??谑羞x調(diào)生考試(行政職業(yè)能力測驗(yàn))綜合能力測試題及答案1套
- 一年級下冊數(shù)學(xué)口算題卡打印
- 2024年中科院心理咨詢師新教材各單元考試題庫大全-下(多選題部分)
- 真人cs基于信號發(fā)射的激光武器設(shè)計(jì)
評論
0/150
提交評論