




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第6章Excel圖表:
分布分析圖商務(wù)數(shù)據(jù)可視化思維導(dǎo)圖MindMapping使用直方圖分析頻率分布6.16.1.1直方圖的概念及適用場(chǎng)景第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布直方圖(Histogram)是一種用來展示一組連續(xù)數(shù)據(jù)潛在的頻率分布的圖表,而數(shù)據(jù)分布的特點(diǎn)則體現(xiàn)在直方圖的形狀上。從直方圖數(shù)據(jù)分布的形狀、中心位置以及數(shù)據(jù)的離散程度等了解到數(shù)據(jù)的分布情況。6.1.1直方圖的概念及適用場(chǎng)景第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布以下內(nèi)容是一組原始數(shù)據(jù)及其對(duì)應(yīng)的直方圖展現(xiàn)。圖6-1直方圖將數(shù)據(jù)分組展示6.1.1直方圖的概念及適用場(chǎng)景第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布這里將年齡數(shù)據(jù)默認(rèn)切分成三個(gè)大的組別,在數(shù)據(jù)標(biāo)簽上顯示每個(gè)組別的頻數(shù)。可以明顯看出,組別(bin)設(shè)置過大,需要改進(jìn)。如下圖6-2和6-3,在設(shè)置坐標(biāo)軸格式中更改“箱”的寬度至10.0,即組距調(diào)整為10.0。圖6-2設(shè)置坐標(biāo)軸格式示意圖圖6-3經(jīng)過組距改進(jìn)后更加合理化的直方圖6.1.1直方圖的概念及適用場(chǎng)景第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布我們也可以將頻數(shù)轉(zhuǎn)換成頻率,用另一種指標(biāo)以直方圖度量相同數(shù)據(jù),讀者可以自己嘗試一下。另外除了直接插入直方圖外,還有一種操作方法是點(diǎn)擊數(shù)據(jù)分析選項(xiàng)卡而后選中直方圖選項(xiàng)。這里要特別注意通過兩種途徑創(chuàng)建的直方圖在圖表設(shè)置上存在潛在的差異。6.1.1直方圖的概念及適用場(chǎng)景第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布同時(shí),如果使用柱形圖來反映每個(gè)分組中頻數(shù),也十分直觀。圖6-4中的BIN表示每一個(gè)分組的上界值,NUM表示每一個(gè)組別中頻數(shù)是多少,需要手動(dòng)輸入。圖6-4[1]組界限與頻數(shù)信息圖6-4[2]三維柱形圖的圖表表示6.1.1直方圖的概念及適用場(chǎng)景第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布直方圖和柱狀圖在外觀上非常近似,但是一些細(xì)節(jié)處不同,x軸和y軸的數(shù)據(jù)度量含義也是不同的。柱狀圖描述分類變量,直方圖描述數(shù)值變量;直方圖的x軸是一條線,柱狀圖的x軸是分類變量;柱狀圖是以矩形的長(zhǎng)度表示每一組頻數(shù)其寬度固定,利于較小的數(shù)據(jù)集分析;直方圖是以矩形的長(zhǎng)度表示每一組頻數(shù),寬度則表示組距,是故標(biāo)準(zhǔn)的直方圖的高度與寬度均有意義,利于統(tǒng)計(jì)大量數(shù)據(jù)集的分布特征。同時(shí)可以注意到直方圖的各個(gè)矩形是連續(xù)的,柱狀圖的各個(gè)矩形相互之間有一定的間隔。6.1.1直方圖的概念及適用場(chǎng)景第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布下圖6-5是一個(gè)二維柱狀圖的實(shí)例,描繪的是某產(chǎn)品的用戶體驗(yàn)反饋情況。讀者可以看出直方圖和柱狀圖的不同使用場(chǎng)景。圖6-5用戶產(chǎn)品滿意度柱形圖6.1.1直方圖的概念及適用場(chǎng)景第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布除了用于表示分布情況外,直方圖還可以用于觀察異?;蚬铝?shù)據(jù)。6.1.2直方圖的形狀分析第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布1、鐘形分布(Bell-shaped):數(shù)據(jù)分布顯示為一個(gè)鐘形的形狀。最常見的鐘形分布是正態(tài)分布,也是最理想的數(shù)據(jù)分布狀態(tài)。但是鐘形分布的概念要廣得多,只要符合以下特點(diǎn)即可:“兩頭小,中間大”??拷虚g變量比較集中,靠近兩邊的變量值比較稀少。圖6-6正態(tài)分布6.1.2直方圖的形狀分析第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布2、雙峰分布(Bimodal-shaped):雙峰分布,如同其名稱中所描述的,具有兩個(gè)峰值(Peaks)。這種分布的特點(diǎn)是具有數(shù)據(jù)在某一度量值上最集中的兩個(gè)區(qū)域,可以理解為具有兩個(gè)眾數(shù)。圖6-7雙峰分布6.1.2直方圖的形狀分析第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布3、右偏分布(Skewed-right-shaped):在數(shù)據(jù)圖的圖表展示中,偏態(tài)分布中左側(cè)觀測(cè)值個(gè)數(shù)多,而右邊的觀測(cè)值則少,稱之為右偏分布。在右偏分布下,數(shù)據(jù)統(tǒng)計(jì)指標(biāo)平均數(shù)(average)>中位數(shù)(median)>眾數(shù)(mode)。圖6-8右偏分布6.1.2直方圖的形狀分析第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布4、左偏分布(Skewed-left-shaped):在數(shù)據(jù)圖的圖表展示中,偏態(tài)分布中右側(cè)觀測(cè)值個(gè)數(shù)多,而左邊的觀測(cè)值則少,稱之為左偏分布。在左偏分布下,數(shù)據(jù)統(tǒng)計(jì)指標(biāo)平均數(shù)(average)<中位數(shù)(median)<眾數(shù)(mode)。圖6-9左偏分布6.1.2直方圖的形狀分析第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布5、均勻分布(Uniform):均勻分配,又稱均勻分布(Uniformdistribution),是一種簡(jiǎn)單的概率分布,其分為離散型均勻分布和連續(xù)型均勻分布兩種類型的機(jī)率分布。從下圖可以看出,并沒有什么有價(jià)值的差異化信息。均勻分布的例子有彩票,因?yàn)槠渲写蟛糠秩说墨@益值都是均等的。在多數(shù)情況下,數(shù)據(jù)的分布遵從均勻分布的概率分布,意味著存在不同來源的變量被合并的錯(cuò)誤可能;如不是此問題導(dǎo)致的,還可以嘗試不同的分組準(zhǔn)則??偟膩碚f,均勻分布表明數(shù)據(jù)所分組類過少。圖6-10均勻分布6.1.2直方圖的形狀分析第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布6、隨機(jī)分布(Random):隨機(jī)分布,顧名思義,是沒有明顯的數(shù)據(jù)分布特征的;如同均勻分布一樣,它也是一個(gè)有多個(gè)峰值區(qū)域(眾數(shù))的概率分布。隨機(jī)分布在大多數(shù)場(chǎng)合是很常見的,但是并不能很好地反映現(xiàn)實(shí)中的問題,也就是這種概率分布對(duì)于進(jìn)一步理解數(shù)據(jù)是無作用的。往往是所分組別過多導(dǎo)致的。建議去除冗余的組別或者減少數(shù)據(jù)量,這是很有必要的。圖6-11隨機(jī)分布第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布在數(shù)據(jù)可視化的實(shí)際操作中,我們要區(qū)別頻數(shù)分布直方圖和非標(biāo)準(zhǔn)的直方圖。圖6-12和圖6-13是螞蟻金服數(shù)據(jù)可視化團(tuán)隊(duì)AntV在實(shí)踐教程中所舉的例子??梢钥闯鲱l數(shù)分布直方圖和非標(biāo)直方圖在應(yīng)用時(shí)賦予它們的功能意義不同。如頻數(shù)分布直方圖是用相等組距內(nèi)的頻數(shù)來刻畫數(shù)據(jù)的分布的,而非標(biāo)直方圖無需這樣做,因?yàn)樗哪康膬H是直觀表示一組數(shù)據(jù)系列,也沒有其他預(yù)處理操作。圖6-12標(biāo)準(zhǔn)的直方圖——頻數(shù)分布直方圖6.1.2直方圖的形狀分析圖6-13非標(biāo)準(zhǔn)的直方圖6.1.3直方圖的繪制及應(yīng)用第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布在直方圖的繪制步驟中,一方面要知曉整體的圖表建立思路,另一方面要學(xué)會(huì)如何優(yōu)化圖表的可視化,直到使之最大限度地呈現(xiàn)出直方圖的優(yōu)點(diǎn),并且做到合理地使用數(shù)據(jù),有必要時(shí)放棄一些影響整體效果的樣本。由于直方圖適合大樣本的數(shù)據(jù)研究,特別是頻數(shù)上的統(tǒng)計(jì),因此選定了某一隨機(jī)抽樣的個(gè)體樣本的年齡、收入共同構(gòu)成本例的數(shù)據(jù)來源,并以此來分析不同年齡的群體在收入上是否存在系統(tǒng)性的差異。第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布步驟一:首先獲取數(shù)據(jù)源。為了方便統(tǒng)計(jì),對(duì)Income(單位為美元)作round(四舍五入)處理,使數(shù)據(jù)等比例縮小更易被觀察。為了試驗(yàn)性需要,對(duì)于Age列和Income列的數(shù)據(jù)使用了RANDBETWEEN()函數(shù)隨機(jī)化生成了所需的數(shù)據(jù)。發(fā)現(xiàn)雙擊列分割線處可以反復(fù)進(jìn)行隨機(jī)操作,進(jìn)一步為數(shù)據(jù)的動(dòng)態(tài)可視化打下基礎(chǔ);需要讀者更改單元格中的數(shù)據(jù)類型,以固定隨機(jī)數(shù)據(jù),見圖6-14。圖6-14樣本數(shù)據(jù)(RANDBETWEEN()函數(shù)隨機(jī)生成)6.1.3直方圖的繪制及應(yīng)用第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布步驟二:選中Age數(shù)據(jù)列,插入一張初始的直方圖,見圖6-15。圖6-15年齡的各組頻數(shù)分布(初始)6.1.3直方圖的繪制及應(yīng)用第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布步驟三:調(diào)整箱的寬度到合理的數(shù)值,得到一張完善后分組更細(xì)的直方圖。并加上數(shù)據(jù)標(biāo)簽使之更為美觀,見圖6-16。注:這里如果能獲取到足夠多的樣本,理想的情況是年齡呈正態(tài)概率分布,收入呈一個(gè)類指數(shù)分布。因?yàn)槭褂秒S機(jī)函數(shù),所以可能數(shù)據(jù)分布并不是最理想。圖6-16年齡的各組頻數(shù)分布(改進(jìn))6.1.3直方圖的繪制及應(yīng)用第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布步驟四:選中Income(Rounded)數(shù)據(jù)列,生成一張直方圖,并調(diào)整箱大小,見圖6-17。圖6-17收入組頻數(shù)分布6.1.3直方圖的繪制及應(yīng)用第6章Excel圖表:分布分析圖6.1使用直方圖分析頻率分布步驟五:在調(diào)整組距的同時(shí)也可以設(shè)置一個(gè)溢出箱,將大于某一定值的數(shù)據(jù)全部放在同一個(gè)組中,如圖6-18所示。圖6-18溢出箱6.1.3直方圖的繪制及應(yīng)用6.2箱線圖的繪制及應(yīng)用6.2.1什么是四分位數(shù)第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用四分位數(shù)(英語:Quartile)是統(tǒng)計(jì)學(xué)中分位數(shù)的一種,即把所有數(shù)值由小到大排列并分成四等份,處于三個(gè)分割點(diǎn)位置的數(shù)值就是四分位數(shù)。在根據(jù)未分組的數(shù)據(jù)確定四分位數(shù)時(shí),首先要確定四分位數(shù)的位置。然后將變量數(shù)列總項(xiàng)數(shù)代入n,即可下四分位數(shù)、中位數(shù)和上四分位數(shù)。Q1的位置Q2的位置Q3的位置6.2.2箱線圖的結(jié)構(gòu)第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用箱線圖(英文:Boxplot),也稱盒須圖、盒式圖、盒狀圖或箱形圖,是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計(jì)圖。因形狀如箱子而得名。在各種領(lǐng)域也經(jīng)常被使用,常見于品質(zhì)管理。箱形圖不受異常值的影響,準(zhǔn)確穩(wěn)定地描繪出數(shù)據(jù)的離散分布情況,對(duì)數(shù)據(jù)清洗也有幫助。6.2.2箱線圖的結(jié)構(gòu)第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用比如當(dāng)回顧企業(yè)年度工作報(bào)告的時(shí)候,要檢查其中有無異常情況的出現(xiàn),那么可以最為清晰地反映這一信息的便是箱線圖。圖6-19箱線圖的結(jié)構(gòu)6.2.2箱線圖的結(jié)構(gòu)第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用上四分位數(shù)與下四分位數(shù)之間的差是盒子的長(zhǎng)度,即IQR=Q3-Q1。可以使用IQR來判斷離群點(diǎn)。下限值min=Q1-1.5IQR,如果最小觀測(cè)值小于min,可用最小值來替換下限值。上限制max=Q3+1.5IQR,同樣也可以用最大值替換。所以會(huì)出現(xiàn)上下兩根線長(zhǎng)度不等的情形。如果觀測(cè)值大于平均值的偏差部分超過一組測(cè)定樣本數(shù)值的兩倍方差(精確來說是2.7倍)則稱為組中的異常值。6.2.2箱線圖的結(jié)構(gòu)第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用圖6-20結(jié)合了直方圖、箱線圖和置信區(qū)間估計(jì)的內(nèi)容,非常綜合實(shí)用。圖6-20圖表的結(jié)合使用6.2.2箱線圖的結(jié)構(gòu)第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用我們?cè)賮砜匆淮沃狈綀D中的例題。如果用箱線圖來進(jìn)行數(shù)據(jù)的表達(dá)和展示,見圖6-21,雖然沒有大的謬誤,但是顯然不盡合理。箱線圖最大的作用是展示分類數(shù)據(jù)(比如時(shí)間序列數(shù)據(jù))在每個(gè)類別中的離散點(diǎn)分布特征,而在下圖中只能看到一條線段,因?yàn)檫@里的縱坐標(biāo)是頻數(shù)并沒有具體到每個(gè)數(shù)據(jù)。圖6-21不適用箱線圖的場(chǎng)景6.2.3箱線圖的繪制方法第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用通過分析諸如股票行情這樣的時(shí)序數(shù)據(jù),介紹一下箱線圖的繪制方法。步驟一:輸入某連續(xù)兩天的股票部分股票成交記錄的實(shí)時(shí)價(jià)格(單位:元),見圖6-22。(此處同樣適用了randbetween()函數(shù),為的是在已知當(dāng)日最大值和最小值的情況下隨機(jī)出一些記錄供實(shí)驗(yàn))圖6-22連續(xù)兩天的股票實(shí)時(shí)成交價(jià)格節(jié)選6.2.3箱線圖的繪制方法第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用步驟二:選中兩列數(shù)據(jù)并插入一張箱線圖,見圖6-23和6-24。圖6-24箱線圖的初始情況圖6-23點(diǎn)擊直方圖的下拉箭頭即可找到6.2.3箱線圖的繪制方法第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用圖6-25設(shè)置數(shù)據(jù)系列格式步驟三:可以在設(shè)置數(shù)據(jù)系列格式中調(diào)整數(shù)據(jù)的顯示選項(xiàng),比如顯示內(nèi)部值點(diǎn)、顯示中線等,見圖6-25。6.2.3箱線圖的繪制方法第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用圖6-26改進(jìn)后的箱線圖步驟三:我們從圖6-26中可以看到四分位數(shù)和箱線圖是怎樣結(jié)合在一起的,同時(shí)也觀察到,如果在四分位數(shù)的運(yùn)算包含除中值的話,得出的箱線圖將會(huì)更符合標(biāo)準(zhǔn)的狀態(tài)。6.2.4從箱線圖看數(shù)據(jù)分布第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用為了進(jìn)一步說明箱線圖如何描繪各分組中的四分位數(shù)分布狀態(tài),在這里以楊浦區(qū)2020/1二手房成交數(shù)據(jù)為案例,從箱線圖看數(shù)據(jù)可視化的分布。而箱線圖本身的四分位分類功能即可很好地滿足房?jī)r(jià)分段的需要。第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用圖6-27樣本數(shù)據(jù)步驟一:整理?xiàng)钇指靼鍓K的二手房房?jī)r(jià)數(shù)據(jù)。為了簡(jiǎn)化模型只研究三個(gè)板塊各項(xiàng)目的最高單價(jià),借此直觀上從反映板塊之間的價(jià)格差異。(項(xiàng)目的地段因素在這里不屬于考慮的范圍,故只是將同一板塊中的項(xiàng)目同等看待)三個(gè)板塊總共113條數(shù)據(jù),格式如圖6-27。6.2.4從箱線圖看數(shù)據(jù)分布第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用圖6-28從箱線圖看數(shù)據(jù)分布步驟二:選取全部數(shù)據(jù),插入如下圖6-28的箱線圖。6.2.4從箱線圖看數(shù)據(jù)分布第6章Excel圖表:分布分析圖6.2箱線圖的繪制及應(yīng)用圖6-29優(yōu)化后更完整的箱線圖展示步驟三:數(shù)據(jù)分布如圖6-29所示??傻贸鋈缦陆Y(jié)論:整體上鞍山的二手房單價(jià)要高于另兩個(gè),體現(xiàn)在最大值和最小值上;鞍山的數(shù)據(jù)箱最寬,說明含有各種等級(jí)的房源;黃興公園板塊沒有異常點(diǎn),說明價(jià)格穩(wěn)定,鞍山和東外灘各有兩個(gè)異常點(diǎn);東外灘的數(shù)據(jù)箱最窄,說明大體上的房屋類型是趨同的。6.2.4從箱線圖看數(shù)據(jù)分布6.3雷達(dá)圖的繪制與應(yīng)用6.3.1雷達(dá)圖的概念及使用場(chǎng)景雷達(dá)圖(radarchart)通常將三個(gè)或以上的數(shù)據(jù)值靠近中心點(diǎn)的距離進(jìn)行比較,以此來展現(xiàn)某一對(duì)象在各個(gè)屬性上的數(shù)值表現(xiàn)。當(dāng)不能直接比較各變量的時(shí)候,使用雷達(dá)圖很有幫助;雷達(dá)圖廣泛用于可視化員工表現(xiàn)分析或者調(diào)查問卷的數(shù)據(jù)分析。第6章Excel圖表:分布分析圖6.3雷達(dá)圖的繪制及應(yīng)用6.3.1雷達(dá)圖的概念及使用場(chǎng)景第6章Excel圖表:分布分析圖6.3雷達(dá)圖的繪制及應(yīng)用圖6-31填充雷達(dá)圖樣例圖6-30普通雷達(dá)圖樣例6.3.2雷達(dá)圖的繪制及應(yīng)用第6章Excel圖表:分布分析圖圖6-32初始的雷達(dá)圖6.3雷達(dá)圖的繪制及應(yīng)用接著以六項(xiàng)指標(biāo)反映員工的綜合能力,講解一下雷達(dá)圖的繪制及應(yīng)用,這里需要用到輔助列。步驟一:準(zhǔn)備數(shù)據(jù)源,輸入各方面的能力分值,插入填充雷達(dá)圖,見圖6-32。6.3.2雷達(dá)圖的繪制及應(yīng)用第6章Excel圖表:分布分析圖圖6-33設(shè)置坐標(biāo)軸格式6.3雷達(dá)圖的繪制及應(yīng)用步驟二:點(diǎn)擊坐標(biāo)軸,選擇設(shè)置坐標(biāo)軸格式,更改最小值最大值為0~5中的一個(gè)數(shù),見圖6-33、6-34和6-35。6.3.2雷達(dá)圖的繪制及應(yīng)用第6章Excel圖表:分布分析圖圖6-34更改了坐標(biāo)軸格式的雷達(dá)圖6.3雷達(dá)圖的繪制及應(yīng)用圖6-35更改文字顏色和背景顏色6.3.2雷達(dá)圖的繪制及應(yīng)用第6章Excel圖表:分布分析圖圖6-36添加輔助列6.3雷達(dá)圖的繪制及應(yīng)用步驟三:添加輔助列并應(yīng)用如下圖6-36的公式,將文字和數(shù)值結(jié)合。6.3.2雷達(dá)圖的繪制及應(yīng)用第6章Excel圖表:分布分析圖圖6-37最終雷達(dá)圖效果顯示6.3雷達(dá)圖的繪制及應(yīng)用步驟四:將輔助列選擇性粘貼到第一列上,自動(dòng)生成新的雷達(dá)圖,見圖6-37。6.4熱力數(shù)據(jù)圖6.4.1熱力分析熱力圖是以特殊高亮的形式顯示訪客熱衷的頁(yè)面區(qū)域或是訪客所在的地理位置的圖示。熱力分析,即應(yīng)用一種特殊高亮的顏色、數(shù)據(jù)標(biāo)注等,顯示頁(yè)面或頁(yè)面組區(qū)域中不同元素點(diǎn)擊密度、觸達(dá)率、停留分布等特征。反映該時(shí)刻人口的密度和區(qū)域人流量情況,讀者可從地圖類app如百度地圖中查看。第6章Excel圖表:分布分析圖6.4熱力數(shù)據(jù)圖第6章Excel圖表:分布分析圖圖6-38百度首頁(yè)的頁(yè)面區(qū)域熱力圖圖6-38顯示是百度首頁(yè)的頁(yè)面區(qū)域熱力圖,經(jīng)過熱力分析可以得出頁(yè)面訪問的熱衷度情況。6.4.1熱力分析6.4熱力數(shù)據(jù)圖第5章Excel圖表:結(jié)構(gòu)分析圖熱力分析由于采用了可視化的設(shè)計(jì)思想和架構(gòu),因此具有分析過程高效、效果直觀、易用的特點(diǎn)。以簡(jiǎn)潔直觀的操作方式,就能呈現(xiàn)熱點(diǎn)區(qū)域,幫助運(yùn)營(yíng)人員或產(chǎn)品人員做分析與決策。6.4.1熱力分析6.4熱力數(shù)據(jù)圖第6章Excel圖表:分布分析圖圖6-39九城的房?jī)r(jià)走勢(shì)情況熱力圖有多種繪制方法,有的需要借助第三方插件,本節(jié)將以房?jī)r(jià)走勢(shì)情況介紹最基本的一種,在后面會(huì)具體介紹借助其他工具的作圖方法。步驟一:獲取數(shù)據(jù)源,此時(shí)所有的數(shù)據(jù)堆在一起難以分辨具體的走勢(shì)情況,見圖6-39。6.4.2熱力圖的繪制與應(yīng)用6.4熱力數(shù)據(jù)圖第6章Excel圖表:分布分析圖圖6-40條件格式步驟二:選中某一列數(shù)據(jù)→“條件格式”→“色階”,見圖6-40。6.4.2熱力圖的繪制與應(yīng)用6.4熱力數(shù)據(jù)圖第6章Excel圖表:分布分析圖圖6-41管理規(guī)則如果對(duì)色階的顏色不滿意,可以在“管理規(guī)則”中修改,見圖6-41和6-42。6.4.2熱力圖的繪制與應(yīng)用6.4熱力數(shù)據(jù)圖圖6-42漸變顏色的修改第6章Excel圖表:分布分析圖步驟三:使用“格式刷”覆蓋剩下的列,見圖6-43。6.4.2熱力圖的繪制與應(yīng)用6.4熱力數(shù)據(jù)圖圖6-43使用格式刷將條件覆蓋至剩余的列第6章Excel圖表:分布分析圖6.4.2熱力圖的繪制與應(yīng)用6.4熱力數(shù)據(jù)圖圖6-44隱藏?cái)?shù)據(jù)步驟四:美化階段,可以選擇將數(shù)據(jù)隱藏,選中所有單元格→右鍵點(diǎn)擊“設(shè)置單元格格式”→找到自定義并輸入三個(gè)分號(hào)。同時(shí)可以在“邊框”中添加白色框線,見圖6-44。第6章Excel圖表:分布分析圖最后就能得到下圖6-45的結(jié)果。6.4.2熱力圖的繪制與應(yīng)用6.4熱力數(shù)據(jù)圖圖6-45熱力圖成品第6章Excel圖表:分布分析圖我們可以根據(jù)主要城市的房?jī)r(jià)走勢(shì)看出房?jī)r(jià)的淡旺季以及價(jià)格分布情況。在每年的6、7月份房?jī)r(jià)最低,可能是由于氣溫升高導(dǎo)致客戶缺少看房的興致與熱情,或是市場(chǎng)剛經(jīng)歷一波旺季,在夏天時(shí)已經(jīng)趨于平穩(wěn),客戶的消化使得買房需求量下降。而每年的2、3月由于年前一些買房的客戶回老家耽擱了業(yè)務(wù),在年后回來會(huì)有一波需求的集中釋放,需求量增大也會(huì)使得市場(chǎng)價(jià)格上揚(yáng)。經(jīng)過本例相信讀者也能體會(huì)到熱力圖的主要應(yīng)用場(chǎng)景,即適合展示含有熱度的數(shù)據(jù)情況(點(diǎn)擊量、成交量、訪問量等)。6.4.2熱力圖的繪制與應(yīng)用6.4熱力數(shù)據(jù)圖6.5概率密度分布——正態(tài)曲線與區(qū)間分布6.5.1正態(tài)分布的概念和公式第5章Excel圖表:結(jié)構(gòu)分析圖6.5概率密度分布——正態(tài)曲線與區(qū)間分布正態(tài)分布(Normaldistribution),也稱“常態(tài)分布”,又名高斯分布(Gaussiandistribution),是一個(gè)在數(shù)學(xué)、物理及工程等領(lǐng)域都非常重要的概率分布,在統(tǒng)計(jì)學(xué)的許多方面有著重大的影響力。若隨機(jī)變量X服從一個(gè)位置參數(shù)為μ、尺度參數(shù)為σ的概率分布,且其概率密度公式如下時(shí),這個(gè)隨機(jī)變量X就稱為正態(tài)隨機(jī)變量,其服從的分布就是正態(tài)分布,記作X~N(μ,σ2)。此外,當(dāng)μ=0,σ=1時(shí),正態(tài)分布就成為標(biāo)準(zhǔn)正態(tài)分布。第5章Excel圖表:結(jié)構(gòu)分析圖6.5概率密度分布——正態(tài)曲線與區(qū)間分布正態(tài)曲線呈鐘型,兩頭低,中間高,左右對(duì)稱因其曲線呈鐘形,因此人們又經(jīng)常稱之為鐘形曲線。6.5.2正態(tài)分布和正態(tài)曲線根據(jù)曲線圖像我們可以看出正態(tài)曲線的三個(gè)圖形特征:集中性:正態(tài)曲線的高峰位于正中央,即均值所在的位置。對(duì)稱性:正態(tài)曲線以均值為中心(且在該值時(shí)取到最大值),左右對(duì)稱,曲線兩端永遠(yuǎn)不與橫軸相交。均勻變動(dòng)性:正態(tài)曲線由均值所在處開始,分別向左右兩側(cè)逐漸均勻下降。第6章Excel圖表:分布分析圖6.5.2正態(tài)分布和正態(tài)曲線6.5概率密度分布——正態(tài)曲線與區(qū)間分布第6章Excel圖表:分布分析圖上節(jié)中已經(jīng)提到,正態(tài)分布涉及均值和標(biāo)準(zhǔn)差兩個(gè)參數(shù),因此在繪制正態(tài)曲線時(shí)我們不僅需要數(shù)據(jù)源,還要根據(jù)統(tǒng)計(jì)的方法計(jì)算出一些指標(biāo)。通常情況下涉及評(píng)分、成績(jī)的數(shù)據(jù)都以正態(tài)分布為主,故本節(jié)以員工的績(jī)效評(píng)分為例講述使用組合圖繪制正態(tài)曲線的方法。6.5.3插入組合圖以折線圖展示正態(tài)曲線圖表6.5概率密度分布——正態(tài)曲線與區(qū)間分布第6章Excel圖表:分布分析圖步驟一:獲取數(shù)據(jù)源,并根據(jù)如圖6-47給出的公式計(jì)算出一系列指標(biāo)。6.5.3插入組合圖以折線圖展示正態(tài)曲線圖表6.5概率密度分布——正態(tài)曲線與區(qū)間分布圖6-47數(shù)據(jù)源以及指標(biāo)計(jì)算第6章Excel圖表:分布分析圖步驟二:對(duì)數(shù)據(jù)進(jìn)行分組(實(shí)際分組時(shí)可能和計(jì)算出來的值有所差異),直到最大值覆蓋完整個(gè)數(shù)據(jù),同時(shí)計(jì)算出頻率(落在區(qū)間范圍內(nèi)的個(gè)數(shù)),具體的計(jì)算方法為:首先選中想要輸出結(jié)果的單元格區(qū)域,再根據(jù)公式計(jì)算出頻率(本題中為=FREQUENCY(B2:B26,D2:D7),逗號(hào)前為數(shù)據(jù)列,逗號(hào)后為分隔列)。接著同時(shí)按下Ctrl,Shift和Enter即可得到如下圖6-48的結(jié)果。6.5.3插入組合圖以折線圖展示正態(tài)曲線圖表6.5概率密度分布——正態(tài)曲線與區(qū)間分布圖6-48頻率輔助列的計(jì)算方法第6章Excel圖表:分布分析圖步驟三:根據(jù)公式(這里為=NORM.DIST(D2,H$5,H$6,0))計(jì)算正態(tài)分布概率密度。NORM.DIST()函數(shù)的用法為NORM.DIST(x,mean,standard_dev,cumulative)。其中:x選用分組邊界值,mean為計(jì)算出的數(shù)據(jù)算術(shù)平均數(shù),standard_dev為數(shù)據(jù)的標(biāo)準(zhǔn)方差,cumlative為邏輯值,取0時(shí)返回概率密度函數(shù)。經(jīng)過計(jì)算后得到如下圖6-49的結(jié)果。6.5.3插入組合圖以折線圖展示正態(tài)曲線圖表6.5概率密度分布——正態(tài)曲線與區(qū)間分布圖6-49計(jì)算概率密度函數(shù)第6章Excel圖表:分布分析圖步驟四:選中頻率一列,“插入”→“二維柱形圖”,在“設(shè)置數(shù)據(jù)系列格式”中將“間距”改為0,并添加邊框顏色,見圖6-50。6.5.3插入組合圖以折線圖展示正態(tài)曲線圖表6.5概率密度分布——正態(tài)曲線與區(qū)間分布圖6-49計(jì)算概率密度函數(shù)第6章Excel圖表:分布分析圖步驟五:右擊圖表,在彈出的快捷菜單中點(diǎn)擊“選擇數(shù)據(jù)”,找到“添加”處,將計(jì)算出的概率密度值添加至圖表中。添加完后“更改圖表類型”→找到“組合圖”,在正態(tài)曲線一欄中勾選“次坐標(biāo)軸”以及“折線圖”,見圖6-51。6.5.3插入組合圖以折線圖展示正態(tài)曲線圖表6.5概率密度分布——正態(tài)曲線與區(qū)間分布圖6-51組合圖選擇方法第6章Excel圖表:分布分析圖步驟六:選中正態(tài)曲線,“設(shè)置數(shù)據(jù)系列格式”,選擇“平滑線”,就能得到正態(tài)曲線了,如圖6-52所示。6.5.3插入組合圖以折線圖展示正態(tài)曲線圖表6.5概率密度分布——正態(tài)曲線與區(qū)間分布圖6-52正態(tài)曲線成品商務(wù)應(yīng)用分析6.66.6.1案例一:工廠分時(shí)段完成零件個(gè)數(shù)統(tǒng)計(jì)6.6商務(wù)應(yīng)用分析【背景材料】:已知某工廠員工在不同時(shí)間段平均完成零件個(gè)數(shù)統(tǒng)計(jì)表,分析得出員工完成零件個(gè)數(shù)受不同時(shí)間段的影響有多大,即在各個(gè)時(shí)間段員工完成零件個(gè)數(shù)的分布情況。第6章Excel圖表:分布分析圖6.6.1案例一:工廠分時(shí)段完成零件個(gè)數(shù)統(tǒng)計(jì)6.6商務(wù)應(yīng)用分析第6章Excel圖表:分布分析圖【分析過程】:步驟一:收集數(shù)據(jù),得到的原始數(shù)據(jù)如圖6-53所示。圖6-53原始數(shù)據(jù)6.6.1案例一:工廠分時(shí)段完成零件個(gè)數(shù)統(tǒng)計(jì)6.6商務(wù)應(yīng)用分析第6章Excel圖表:分布分析圖步驟二:選擇數(shù)據(jù),在“插入”中選擇“箱形圖”。在這里我們會(huì)發(fā)現(xiàn),如果選擇的數(shù)據(jù)過多,則箱形圖會(huì)失去它原有的形狀。這時(shí)可以使用一個(gè)小技巧,先選擇少數(shù)數(shù)據(jù)生成箱形圖,再擴(kuò)充選擇更多的數(shù)據(jù)見圖6-54。圖6-54生成箱形圖6.6.1案例一:工廠分時(shí)段完成零件個(gè)數(shù)統(tǒng)計(jì)6.6商務(wù)應(yīng)用分析第6章Excel圖表:分布分析圖步驟三:適當(dāng)對(duì)圖標(biāo)進(jìn)行美化。添加上圖表的圖例,設(shè)置數(shù)據(jù)系列格式,顯示內(nèi)部點(diǎn)、離群值點(diǎn)、平均值標(biāo)記和中線等,使得圖表更完整,形成最終圖表,見圖6-55。圖6-55最終圖表箱形圖6.6.1案例一:工廠分時(shí)段完成零件個(gè)數(shù)統(tǒng)計(jì)6.6商務(wù)應(yīng)用分析第6章Excel圖表:分布分析圖由圖6-55可以分析得出,不同的時(shí)間段工人們完成零件個(gè)數(shù)有較大的差異,在早晨的時(shí)間段里工人們的效率較高,完成的零件個(gè)數(shù)也較高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 山建成人教育《鋼結(jié)構(gòu)》期末考試試題及參考答案
- 2025年度餐飲行業(yè)跨界合作股東投資合同
- 2025年度花卉租擺與城市綠化工程合作協(xié)議
- 2025年度高新技術(shù)研發(fā)委托貸款合同
- 二零二五年度高端人才引進(jìn)聘用合同
- 2025年度蔬菜大棚溫室租賃與農(nóng)業(yè)物聯(lián)網(wǎng)技術(shù)應(yīng)用合同
- 2025年度婚姻財(cái)產(chǎn)管理及風(fēng)險(xiǎn)控制協(xié)議
- 2025年度房屋租賃合同解除與租賃關(guān)系終止確認(rèn)書
- 2025年度委托付款合同-農(nóng)業(yè)產(chǎn)業(yè)化項(xiàng)目資金支付協(xié)議
- 2025年度國(guó)際物流采購(gòu)與配送合同范本
- 中央2025年中國(guó)科協(xié)所屬單位招聘社會(huì)在職人員14人筆試歷年參考題庫(kù)附帶答案詳解-1
- 圓柱的表面積(說課稿)-2023-2024學(xué)年六年級(jí)下冊(cè)數(shù)學(xué)北師大版
- 《神經(jīng)系統(tǒng)MRI解讀》課件
- 2024年江蘇信息職業(yè)技術(shù)學(xué)院高職單招語文歷年參考題庫(kù)含答案解析
- 2025年學(xué)校春季開學(xué)典禮校長(zhǎng)講話致辭 (匯編11份)
- 城市軌道交通專業(yè)英語(第三版) 課件 U7 Tram
- 高等院校附屬醫(yī)院醫(yī)共體合作制度
- 2025年中國(guó)半導(dǎo)體第三方檢測(cè)行業(yè)市場(chǎng)集中度、市場(chǎng)規(guī)模及未來前景分析報(bào)告
- 2025年餐飲部主管年度工作計(jì)劃
- 學(xué)工管理系統(tǒng)功能設(shè)計(jì)方案
- 中華人民共和國(guó)保守國(guó)家秘密法實(shí)施條例培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論