版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第十一章第十一章 多變量的可視化分析多變量的可視化分析 第一節(jié)第一節(jié) 引言引言 第二節(jié)第二節(jié) 折線圖分析法折線圖分析法 第三節(jié)第三節(jié) 條形圖分析法條形圖分析法 第四節(jié)第四節(jié) 散點圖分析法散點圖分析法 第五節(jié)第五節(jié) 雷達圖分析法雷達圖分析法 第六節(jié)第六節(jié) 星座圖分析法星座圖分析法 第一節(jié)第一節(jié) 引言引言n眾所周知,圖形是我們直觀了解、認識數(shù)據(jù)的一種可視化手眾所周知,圖形是我們直觀了解、認識數(shù)據(jù)的一種可視化手段。如果能將所研究的數(shù)據(jù)直接顯示在一個平面圖上,便可段。如果能將所研究的數(shù)據(jù)直接顯示在一個平面圖上,便可以一目了然地看出分析變量間的數(shù)量關系。直方圖、散點圖以一目了然地看出分析變量間的數(shù)量關系
2、。直方圖、散點圖等就是我們常用的二維平面圖示方法。雖然三維數(shù)據(jù)也可以等就是我們常用的二維平面圖示方法。雖然三維數(shù)據(jù)也可以用三維圖形來表示,但觀測三維數(shù)據(jù)卻存在一定的難度,而用三維圖形來表示,但觀測三維數(shù)據(jù)卻存在一定的難度,而且在許多實際問題中,多變量數(shù)據(jù)的維數(shù)通常又都大于且在許多實際問題中,多變量數(shù)據(jù)的維數(shù)通常又都大于3,那么如何用圖形直觀表現(xiàn)三維以上的數(shù)據(jù)呢?自上世紀那么如何用圖形直觀表現(xiàn)三維以上的數(shù)據(jù)呢?自上世紀70年年代以來,多變量數(shù)據(jù)的可視化分析研究就一直是人們關注的代以來,多變量數(shù)據(jù)的可視化分析研究就一直是人們關注的一個問題。一個問題。n從研究的成果來看,主要可以分為兩類從研究的成果
3、來看,主要可以分為兩類:一類是使高維空間的點與平面上的某種圖形對應,這種一類是使高維空間的點與平面上的某種圖形對應,這種圖形能反映高維數(shù)據(jù)的某些特點或數(shù)據(jù)間的某些關系;圖形能反映高維數(shù)據(jù)的某些特點或數(shù)據(jù)間的某些關系;另一類是對多變量數(shù)據(jù)進行降維處理,在盡可能多地保另一類是對多變量數(shù)據(jù)進行降維處理,在盡可能多地保留原始信息的原則下,將數(shù)據(jù)的維數(shù)降為留原始信息的原則下,將數(shù)據(jù)的維數(shù)降為2維或維或1維,然維,然后再在平面上表示。例如前面介紹的主成分分析方法、后再在平面上表示。例如前面介紹的主成分分析方法、因子分析方法、多維尺度法等就屬于此類方法。這里僅因子分析方法、多維尺度法等就屬于此類方法。這里僅
4、介紹介紹5種實用而有效的多變量可視化方法。種實用而有效的多變量可視化方法。 n表表11.1是我國華北地區(qū)是我國華北地區(qū)5個省市個省市2003年城鎮(zhèn)居民家庭平均每人年城鎮(zhèn)居民家庭平均每人全年消費性支出的六項指標數(shù)據(jù),下面分別用全年消費性支出的六項指標數(shù)據(jù),下面分別用5種可視化方種可視化方法對數(shù)據(jù)進行分析。法對數(shù)據(jù)進行分析。n考慮微機的普及應用,本章主要介紹考慮微機的普及應用,本章主要介紹5種圖形的制作方法,種圖形的制作方法,圖形的制作則通過電腦實現(xiàn)。折線圖、條形圖、矩陣散點圖圖形的制作則通過電腦實現(xiàn)。折線圖、條形圖、矩陣散點圖在在SPSS中制作,雷達圖和星座圖則在中制作,雷達圖和星座圖則在EXC
5、EL中實現(xiàn)。中實現(xiàn)。 表表11.1 華北華北5省市城鎮(zhèn)居民家庭消費性支出省市城鎮(zhèn)居民家庭消費性支出第二節(jié)第二節(jié) 折線圖分析法折線圖分析法n折線圖是將多個樣品觀測數(shù)據(jù)以折線的方式表示在平面圖中折線圖是將多個樣品觀測數(shù)據(jù)以折線的方式表示在平面圖中的一種多變量可視化圖形。折線圖用線段的升降來表示變量的一種多變量可視化圖形。折線圖用線段的升降來表示變量的大小,常用于表示現(xiàn)象在時間上的變化趨勢、現(xiàn)象的分配的大小,常用于表示現(xiàn)象在時間上的變化趨勢、現(xiàn)象的分配情況和兩個現(xiàn)象之間的依存關系等。情況和兩個現(xiàn)象之間的依存關系等。n折線圖的作圖原理如下:折線圖的作圖原理如下: (1)作平面坐標系,橫坐標?。┳髌矫孀?/p>
6、標系,橫坐標取p個點,表示個點,表示p個變量,縱坐個變量,縱坐 標表示變量取值。標表示變量取值。 (2)對給定的樣品觀測值,在)對給定的樣品觀測值,在p個點的縱坐標上標出相應的個點的縱坐標上標出相應的 變量取值。變量取值。 (3)將表示)將表示p個變量取值的點連接成一條折線,即得到了表個變量取值的點連接成一條折線,即得到了表 示一個樣品觀測數(shù)據(jù)的折線,示一個樣品觀測數(shù)據(jù)的折線,n次觀測可繪出次觀測可繪出n條折條折 線,構成多變量折線圖。線,構成多變量折線圖。 n在在SPSS中作折線圖的方法如下:中作折線圖的方法如下: (1)將原始數(shù)據(jù)輸入)將原始數(shù)據(jù)輸入SPSS中。注意數(shù)據(jù)的組織形式要像圖中。
7、注意數(shù)據(jù)的組織形式要像圖11.1那樣。即把不同地區(qū)當成變量,而把支出指標當成觀測。那樣。即把不同地區(qū)當成變量,而把支出指標當成觀測。圖圖11.1 作折線圖時的數(shù)據(jù)組織形式作折線圖時的數(shù)據(jù)組織形式 (2)選擇菜單項)選擇菜單項GraphsLine,打開,打開Line Charts對話框,對話框,如圖如圖11.2。在對話框上方的三個選項用于選擇折線圖的形式,。在對話框上方的三個選項用于選擇折線圖的形式,由于是這里是多變量作圖,所以選擇由于是這里是多變量作圖,所以選擇Multiple。在對話框下。在對話框下面的三個選項中選擇面的三個選項中選擇Value of individual cases。單擊。
8、單擊Define按鈕,打開按鈕,打開Define Multiple Line對話框。對話框。 圖圖11.2 Line Charts對話框對話框 (3)在)在Define Multiple Line對話框中,將代表不同地區(qū)的對話框中,將代表不同地區(qū)的5個變量移入個變量移入Lines Represent列表框中,將代表支出指標的變列表框中,將代表支出指標的變量(量(variable)移入)移入Variable框中。單擊框中。單擊OK按鈕,即可作出按鈕,即可作出如圖如圖11.4所示的折線圖。從圖中可以清楚地看出北京市幾乎所示的折線圖。從圖中可以清楚地看出北京市幾乎各項支出都排在第一,而山西省則幾乎每
9、項支出都是最低的。各項支出都排在第一,而山西省則幾乎每項支出都是最低的。 圖圖11.3 Define Multiple Line對話框對話框圖圖11.4 折線圖折線圖第三節(jié)第三節(jié) 條形圖分析法條形圖分析法n條形圖是由若干平行條狀的矩形所構成,而以每一個矩形的條形圖是由若干平行條狀的矩形所構成,而以每一個矩形的高度來代表數(shù)值的大小。高度來代表數(shù)值的大小。n按圖按圖11.1所示的方式在所示的方式在SPSS中組織好數(shù)據(jù)后,條形圖的制作中組織好數(shù)據(jù)后,條形圖的制作步驟如下:步驟如下: (1)選擇菜單項)選擇菜單項GraphsLine,打開,打開Bar Charts對話框,該對話框,該對話框與圖對話框與
10、圖11.2所示的所示的Line Charts對話框有相同的選項。在對話框有相同的選項。在對話框上方的三個選項用于選擇條形圖的形式,由于是這里對話框上方的三個選項用于選擇條形圖的形式,由于是這里是多變量作圖,所以選擇是多變量作圖,所以選擇Clustered。在對話框下面的三個選。在對話框下面的三個選項中選擇項中選擇Value of individual cases。單擊。單擊Define按鈕,打開按鈕,打開Define Clustered Bar對話框。對話框。 (2)在)在Define Clustered Bar對話框中,將代表不同地區(qū)的對話框中,將代表不同地區(qū)的5個變量移入個變量移入Bars
11、 Represent列表框中,將代表支出指標的變列表框中,將代表支出指標的變量移入量移入Variable框中。單擊框中。單擊OK按鈕,即可作出如圖按鈕,即可作出如圖11.5所示所示的條形圖。的條形圖。 圖圖11.5 條形圖條形圖n可以發(fā)現(xiàn),折線圖和條行圖的作圖過程幾乎相同,作圖原理可以發(fā)現(xiàn),折線圖和條行圖的作圖過程幾乎相同,作圖原理也大同小異,折線圖是以折線的高低來表示變量的大小,條也大同小異,折線圖是以折線的高低來表示變量的大小,條形圖是以矩形的高低來表示變量的大小。形圖是以矩形的高低來表示變量的大小。n從圖從圖11.5也可以得出與折線圖同樣的結論:北京市各項支出也可以得出與折線圖同樣的結論
12、:北京市各項支出都比較高,而山西省各項支出都比較低。都比較高,而山西省各項支出都比較低。第四節(jié)第四節(jié) 散點圖分析法散點圖分析法n散點圖又稱散布圖,它是以點的分布反映變量之間相關關系散點圖又稱散布圖,它是以點的分布反映變量之間相關關系的可視化方法。矩陣散點圖則是一種反映多個變量之間相關的可視化方法。矩陣散點圖則是一種反映多個變量之間相關關系的二維散點圖。關系的二維散點圖。n利用利用SPSS制作矩陣散點圖的步驟如下:制作矩陣散點圖的步驟如下: (1)在)在SPSS中按圖中按圖11.6的形式組織數(shù)據(jù),即把支出指標當成的形式組織數(shù)據(jù),即把支出指標當成變量,而把不同地區(qū)當成觀測。變量,而把不同地區(qū)當成觀
13、測。 圖圖11.6 作散點圖時的數(shù)據(jù)組織形式作散點圖時的數(shù)據(jù)組織形式 (2)選擇菜單項)選擇菜單項GraphsScatter,打開,打開Scatter plot對話框對話框,如圖如圖11.7。該對話框用于選擇散點圖的形式。選定。該對話框用于選擇散點圖的形式。選定Matrix,即矩陣散點圖即矩陣散點圖 ,單擊,單擊Define按鈕,打開按鈕,打開Scatter plot Matrix對對話框,如圖話框,如圖11.8。 圖圖11.7 Scatter plot對話框對話框圖圖11.8 Scatter plot Matrix對話框對話框 (3)在打開的)在打開的Scatter plot Matrix對
14、話框中,將食品、衣著、對話框中,將食品、衣著、居住三個變量移入居住三個變量移入Matrix Variables列表框中,將標志變量列表框中,將標志變量region移入移入Label Cases by列表框中。列表框中。 (4)點擊)點擊OK按鈕,得到如圖按鈕,得到如圖11.9所示的矩陣散點圖。所示的矩陣散點圖。 n從圖從圖11.9可以看出,河北、山西、內蒙古在居住和食品消費可以看出,河北、山西、內蒙古在居住和食品消費支出方面與北京、天津相比較低,食品與居住支出變量之間支出方面與北京、天津相比較低,食品與居住支出變量之間存在一定的線性關系。天津在衣著支出方面較低,與最低的存在一定的線性關系。天津
15、在衣著支出方面較低,與最低的河北接近,與最高居住支出形成鮮明對比。北京則除在居住河北接近,與最高居住支出形成鮮明對比。北京則除在居住支出方面低于天津外,其他方面支出均高于華北其他省市。支出方面低于天津外,其他方面支出均高于華北其他省市。內蒙古則在衣著支出方面僅次于北京,顯示出某種特殊消費內蒙古則在衣著支出方面僅次于北京,顯示出某種特殊消費特征。特征。 圖圖11.9 矩陣散點圖矩陣散點圖 n另外,還可以作三維立體散點圖。只需在另外,還可以作三維立體散點圖。只需在Scatter plot對話框對話框(圖(圖11.7)中選擇)中選擇3-D選項。在跳出的選項。在跳出的3-D Scatter plot對
16、話框對話框中將食品、衣著、居住三個變量分別移入中將食品、衣著、居住三個變量分別移入X Axis、Y Axis和和Z Axis列表框中,將標志變量列表框中,將標志變量region移入移入Label Cases by列表列表框中。單擊框中。單擊OK按鈕,則作出圖按鈕,則作出圖11.10所示的三維立體散點圖。所示的三維立體散點圖。n矩陣散點圖不僅可以在二維平面上同時反映多個變量數(shù)值,矩陣散點圖不僅可以在二維平面上同時反映多個變量數(shù)值,而且可以用于直觀反映多個變量間是否存在某種關系。與三而且可以用于直觀反映多個變量間是否存在某種關系。與三維立體圖相比,有著更好的可視性。比較圖維立體圖相比,有著更好的可
17、視性。比較圖11.9與圖與圖11.10不不難看出這一點。難看出這一點。 圖圖11.10 三維立體散點圖三維立體散點圖 第五節(jié)第五節(jié) 雷達圖分析法雷達圖分析法n雷達圖是一種較為常用的多變量可視化圖形。在雷達圖中,雷達圖是一種較為常用的多變量可視化圖形。在雷達圖中,每個變量都有它自己的數(shù)值軸,每個數(shù)值軸都是從中心向外每個變量都有它自己的數(shù)值軸,每個數(shù)值軸都是從中心向外輻射。由于圖形就好像雷達熒光屏上的圖像,故稱其為雷達輻射。由于圖形就好像雷達熒光屏上的圖像,故稱其為雷達圖。又像蜘蛛網,所以也稱蛛網圖。圖。又像蜘蛛網,所以也稱蛛網圖。n雷達圖的作圖方法:雷達圖的作圖方法: (1)作一圓,并按變量的個
18、數(shù))作一圓,并按變量的個數(shù)p將圓周分成將圓周分成p等分。等分。 (2)連接圓心和各分點,將這)連接圓心和各分點,將這p條半徑連線依次定義為各變條半徑連線依次定義為各變量的坐標軸,并標以適當?shù)目潭取A康淖鴺溯S,并標以適當?shù)目潭取?(3)對給定的一次觀測值,將每個變量值分別標在相應的)對給定的一次觀測值,將每個變量值分別標在相應的坐標軸上,把坐標軸上,把p個點相連就形成了一個個點相連就形成了一個p邊形,邊形,n次觀測值就次觀測值就可畫出可畫出n個個p邊形。邊形。 n例如,根據(jù)表例如,根據(jù)表11.1中的數(shù)據(jù),調用中的數(shù)據(jù),調用EXCEL圖表向導,選擇雷圖表向導,選擇雷達圖,然后按圖表向導提示,即可制
19、作出如圖達圖,然后按圖表向導提示,即可制作出如圖11.1117所示所示的雷達圖。圖的雷達圖。圖11.5畫出了北京、天津和河北的雷達圖,從圖畫出了北京、天津和河北的雷達圖,從圖可以看出,三省市消費支出結構有較大差異。北京人均消費可以看出,三省市消費支出結構有較大差異。北京人均消費支出的各項指標都高,對應面積最大的六邊形,其次是天津,支出的各項指標都高,對應面積最大的六邊形,其次是天津,在三個省市中面積最小的是河北,天津在居住支出方面與北在三個省市中面積最小的是河北,天津在居住支出方面與北京較為接近,而在衣著和交通、通訊支出方面則與河北接近。京較為接近,而在衣著和交通、通訊支出方面則與河北接近。其他支出方面三地存在較大差異。利用雷達圖的形狀、面積其他支出方面三地存在較大差異。利用雷達圖的形狀、面積大小,可以對樣品進行初始分類分析。大小,可以對樣品進行初始分類分析。n為了加強雷達圖的效果,在雷達圖中適當?shù)姆峙渥鴺溯S是很為了加強雷達圖的效果,在雷達圖中適當?shù)姆峙渥鴺溯S是很重要的,具體的分配辦法要結合分析的問題而定。例如可將重要的,具體的分配辦法要結合分析的問題而定。例如可將要對比的指標分布在左、右或上、下方,以便
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年特殊崗位人員返聘勞動合同2篇
- 政府購買服務崗位人員勞務合同(2篇)
- 打機井協(xié)議書(2篇)
- 2024年文藝晚會演出委托制作與執(zhí)行協(xié)議3篇
- 2025年重慶模擬考貨運從業(yè)資格
- 2025年南寧貨運從業(yè)資格證考試題及答案解析
- 2025年阿壩貨運從業(yè)資格證怎么考
- 七年級下冊語文第2課 說和做
- 2024年樓宇自動化監(jiān)控設備供應合同
- 《春季食療養(yǎng)生》課件
- 《散文創(chuàng)作與研究(10543)》自考考試題庫(含典型題)
- 老君山分析報告范文
- 2024年世界職業(yè)院校技能大賽中職組“飼料營養(yǎng)與檢測組”賽項考試題庫(含答案)
- 中國對外貿易中心集團有限公司招聘筆試
- 學校長遠發(fā)展規(guī)劃
- 概率論與數(shù)理統(tǒng)計知到智慧樹章節(jié)測試課后答案2024年秋中國農業(yè)大學
- 2024年廣西職業(yè)院校技能大賽高職組《供應鏈管理》賽項樣題-供應鏈規(guī)劃設計
- 商城系統(tǒng)定制開發(fā)(2024版)合同3篇
- 城市基建豎井施工風險管理方案
- 2024年廣西公需科目參考答案
- 北京市海淀區(qū)2023-2024學年高二上學期期末考試 生物 含解析
評論
0/150
提交評論