實(shí)驗(yàn)四我國各地區(qū)城鎮(zhèn)居民消費(fèi)性支出的主成分分析和聚類分析_第1頁
實(shí)驗(yàn)四我國各地區(qū)城鎮(zhèn)居民消費(fèi)性支出的主成分分析和聚類分析_第2頁
實(shí)驗(yàn)四我國各地區(qū)城鎮(zhèn)居民消費(fèi)性支出的主成分分析和聚類分析_第3頁
實(shí)驗(yàn)四我國各地區(qū)城鎮(zhèn)居民消費(fèi)性支出的主成分分析和聚類分析_第4頁
實(shí)驗(yàn)四我國各地區(qū)城鎮(zhèn)居民消費(fèi)性支出的主成分分析和聚類分析_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、實(shí)驗(yàn)三 我國各地區(qū)城鎮(zhèn)居民消費(fèi)性支出的主成分分析和聚類分析一、實(shí)驗(yàn)?zāi)康?.掌握如何使用SAS軟件來進(jìn)行主成分分析和聚類分析;2.看懂和理解SAS輸出的結(jié)果,并學(xué)會(huì)以此來作出分析;3.掌握對(duì)實(shí)際數(shù)據(jù)如何來進(jìn)行主成分分析;4.對(duì)同一組數(shù)據(jù)使用五種系統(tǒng)聚類方法,學(xué)會(huì)對(duì)各種聚類效果的比較,獲取重要經(jīng)驗(yàn);5.掌握使用主成分進(jìn)行聚類二、實(shí)驗(yàn)內(nèi)容數(shù)據(jù)集sasuser.examp633中含有1999年全國31個(gè)省、直轄市和自治區(qū)的城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出的八個(gè)主要變量數(shù)據(jù)。對(duì)這些數(shù)據(jù)進(jìn)行主成分分析,可將這31個(gè)地區(qū)的前兩個(gè)主成分得分標(biāo)示于平面坐標(biāo)系內(nèi),對(duì)各地區(qū)作直觀的比較分析。對(duì)同樣的數(shù)據(jù)使用五種系

2、統(tǒng)聚類方法聚類,并對(duì)聚類效果作比較。最后,對(duì)主成分的圖形聚類和正規(guī)聚類的效果進(jìn)行比較。實(shí)驗(yàn)1進(jìn)行主成分分析,根據(jù)前兩個(gè)主成分得分所作的散點(diǎn)圖對(duì)31個(gè)地區(qū)進(jìn)行比較分析。實(shí)驗(yàn)2分別使用最長距離法、中間距離法、兩種類平均法和離差平方和法進(jìn)行聚類分析,并比較其聚類效果。實(shí)驗(yàn)3主成分聚類,并與上述正規(guī)的聚類方法進(jìn)行比較三、實(shí)驗(yàn)要求1.用SAS軟件的交互式數(shù)據(jù)分析菜單系統(tǒng)完成主成分分析;2.完成五種系統(tǒng)聚類方法,比較其聚類效果;3.根據(jù)前兩個(gè)主成分得分的散點(diǎn)圖作直觀的聚類,并與上述正規(guī)的聚類方法進(jìn)行比較。四、實(shí)驗(yàn)指導(dǎo)1.進(jìn)行主成分分析在inshigt中打開數(shù)據(jù)集sasuser.examp633,見圖1。選

3、菜單過程如下:在圖1中選分析多元(Y X)在變量框中選 x1,x2,x3,x4,x5,x6,x7,x8 (見圖2)Y選輸出選主分量分析,主分量選項(xiàng)(見圖3)在圖4中作圖中的選擇(主成分個(gè)數(shù)缺省時(shí)為“自動(dòng)”選項(xiàng),此時(shí)只輸出特征值大于1的主成分)確定確定確定圖1圖2圖3圖4在圖1中選分析散點(diǎn)圖(Y X)選 PCR1X ;PCR2Y ;region標(biāo)簽變量 (見圖7)確定隨即出現(xiàn)如圖8所示的散點(diǎn)圖,接下來我們對(duì)該圖進(jìn)行設(shè)置、調(diào)整,使之符合我們的要求。圖7圖8在圖9的數(shù)據(jù)窗口中點(diǎn)擊左上角的“31”,以使所有觀測(cè)都選中將鼠標(biāo)移至觀測(cè)號(hào)中,點(diǎn)擊右鍵,選在圖中加標(biāo)簽在圖8中點(diǎn)擊左下角,出現(xiàn)上托菜單刻度作圖1

4、0中的選擇確定作圖11中的選擇確定調(diào)整好散點(diǎn)圖:拉大圖外圍方框;圖8 中點(diǎn)擊標(biāo)記大小 ,選擇6號(hào)字;下拉橫坐標(biāo),左拉縱坐標(biāo)圖9圖10圖11圖12隨即得到圖12,該圖是關(guān)于第一和第二主成分得分的散點(diǎn)圖,該圖對(duì)各地區(qū)的綜合消費(fèi)性支出和受地區(qū)氣候影響的消費(fèi)性支出占的比重有較直觀的描述。從圖中可以看出,上海、廣東和北京在最右邊,城鎮(zhèn)居民綜合消費(fèi)性支出是最高的;其次是浙江和天津;江西在散點(diǎn)圖的最左邊,表明綜合消費(fèi)性支出是最低的;北京和西藏在散點(diǎn)圖的最上邊,說明受地區(qū)氣候影響的消費(fèi)性支出占的比重最高;廣東在最底部,表明受地區(qū)氣候影響的消費(fèi)性支出占的比重最低。2.用五種系統(tǒng)聚類法聚類,并比較其效果分別使用最

5、長距離法、中間距離法、兩種類平均法和離差平方和法進(jìn)行聚類分析。為此編制如下的SAS程序:proccluster data=sasuser.examp633 method=com std;id region;proctree horizontal;id region;proccluster data=sasuser.examp633 method=med std;id region;proctree horizontal;id region;proccluster data=sasuser.examp633 method=avestd;id region;proctree horizontal;

6、id region;proccluster data=sasuser.examp633 method=avenosquarestd;id region;proctree horizontal;id region;proccluster data=sasuser.examp633 method=war std;id region;proctree horizontal;id region;run;程序說明:“proccluster”是一個(gè)聚類分析過程;“data=sasuser.examp633”規(guī)定過程分析的是sasuser邏輯庫中的examp633數(shù)據(jù)集;“method=com” 規(guī)定了采用

7、的系統(tǒng)聚類方法是最長距離法(“method= med”是采用中間距離法;“method=ave”是采用類平均法,缺省時(shí)是類之間的距離為均方距離,如使用選項(xiàng)“nosquare”則類之間的距離為平均距離;“method= war”是采用離差平方和法);選項(xiàng)“std” 規(guī)定了在聚類之前須先對(duì)各變量數(shù)據(jù)作標(biāo)準(zhǔn)化變換,缺省時(shí)是直接對(duì)原始數(shù)據(jù)進(jìn)行聚類,而不作事先的標(biāo)準(zhǔn)化處理。3.主成分聚類,并與上述正規(guī)的聚類方法進(jìn)行比較 從圖12中直觀地進(jìn)行聚類,將其結(jié)果與上述正規(guī)的聚類方法進(jìn)行比較。12345proc cluster data=sasuser.examp633 method=com std pseudo

8、 ccc outtree=a;id region;proc tree horizontal;id region;proc cluster data=sasuser.examp633 method=med std pseudo ccc outtree=b;id region;proc tree horizontal;id region;proc cluster data=sasuser.examp633 method=ave std pseudo ccc outtree=c;id region;proc tree horizontal;id region;proc cluster data=sasuser.examp633 method=ave nosquare std pseudo ccc outtree=d;id region;proc tree horizon

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論