應(yīng)用多元統(tǒng)計(jì)分析習(xí)題解答_聚類分析_第1頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析習(xí)題解答_聚類分析_第2頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析習(xí)題解答_聚類分析_第3頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析習(xí)題解答_聚類分析_第4頁(yè)
應(yīng)用多元統(tǒng)計(jì)分析習(xí)題解答_聚類分析_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第五章聚類分析5.1 判別分析和聚類分析有何區(qū)別?答:即根據(jù)一定的判別準(zhǔn)則,判定一個(gè)樣本歸屬于哪一類。具體而言,設(shè)有 n個(gè)樣本,對(duì)每 個(gè)樣本測(cè)得p項(xiàng)指標(biāo)(變量)的數(shù)據(jù),已知每個(gè)樣本屬于k個(gè)類別(或總體)中的某一類,通過(guò)找出一個(gè)最優(yōu)的劃分,使得不同類別的樣本盡可能地區(qū)別開(kāi),并判別該樣本屬于哪個(gè)總體。聚類分析是分析如何對(duì)樣品(或變量)進(jìn)行量化分類的問(wèn)題。在聚類之前,我們并不知 道總體,而是通過(guò)一次次的聚類,使相近的樣品(或變量)聚合形成總體。通俗來(lái)講,判別 分析是在已知有多少類及是什么類的情況下進(jìn)行分類,而聚類分析是在不知道類的情況下進(jìn)行分類。5.2 試述系統(tǒng)聚類的基本思想。答:系統(tǒng)聚類的基本思想

2、是:距離相近的樣品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類, 過(guò)程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中。5.3 對(duì)樣品和變量進(jìn)行聚類分析時(shí),所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡(jiǎn)要說(shuō)明為什么這樣構(gòu)造?答:對(duì)樣品進(jìn)行聚類分析時(shí),用距離來(lái)測(cè)定樣品之間的相似程度。因?yàn)槲覀儼裯個(gè)樣本看作p維空間的n個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為 小,/ q、i/q(一)閔可夫斯基距離:dj (q) = (e xik - x jk ) k=1q取不同值,分為 (1)絕對(duì)距離(q =1)pdj(1) = xik-xjk k 1(2)歐氏距離(q=2)p2dij(2 式 xik x j:/)2 k

3、=1(3)切比雪夫距離(q=)dij(qo) = mkaxp xik-xjk(二)馬氏距離dj(l)=-z ixlxjk-j pk+xik xjk(三)蘭氏距離dj(m) = (xi xj)j(xix )對(duì)變量的相似性,我們更多地要了解變量的變化趨勢(shì)或變化方向,因此用相關(guān)性進(jìn)行衡量。將變量看作p維空間的向量,一般用 p(一)夾角余弦v xikxjkcos毒pp(xi2)0xji)k 1k 1(二)相關(guān)系數(shù)r1 ijp_二.(xik -xi)(xjk x j)k 1ppxik -xi)2 (xjkk 1k 1-xj)25.4在進(jìn)行系統(tǒng)聚類時(shí),不同類間距離計(jì)算方法有何區(qū)別?選擇距離公式應(yīng)遵循哪些原

4、 則?答:設(shè)dj表示小品為與xj之間距離,用 dj表示類gi與gj之間的距離。(1).最短距離法djminxi gi,xj .gjdjminxi gk ,x j grdj =mindkp,dkq(2)最長(zhǎng)距離法dpq= maxdijxi - g p , x j -gqdkr max dij n maxdkp,dkqxi gk ,xj gr(3)中間距離法_ 21 _ 21 _ 2 二 _ 2dkr = dkp dkq dpq221i-1 /ji 0其中(4)重心法d2q =(xp-xq)(xp-xq) 兄=女nqxq)ndi% d2dkpnrnq d2dkq 一nrhpaq2 nrdjq(5)

5、類平均法djqzxi .gd2r12dijnknr xi gk xj.d二為 dkp adkqnr(6)可變類平均法nq dkq) dpqd2r =(1)(npdkp nr其中昵可變的且p 1(7)可變法21222dkr =-2-(dkp +dkq) + pdpq其中 p是可變的且 p 1(8)離差平方和法n _st (xit -xt)(xit -xt)11d2r片盯九一七通常選擇距離公式應(yīng)注意遵循以下的基本原則:(1)要考慮所選擇的距離公式在實(shí)際應(yīng)用中有明確的意義。如歐氏距離就有非常明確的空間距離概念。馬氏距離有消除量綱影響的作用。(2)要綜合考慮對(duì)樣本觀測(cè)數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方

6、法。如在進(jìn)行聚類分析之前已經(jīng)對(duì)變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。(3)要考慮研究對(duì)象的特點(diǎn)和計(jì)算量的大小。樣品間距離公式的選擇是一個(gè)比較復(fù)雜且?guī)в幸欢ㄖ饔^性的問(wèn)題, 我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)不同做出具體分折。 實(shí)際中,聚類分析前不妨試探性地多選擇幾個(gè)距離公式分別進(jìn)行聚類,然后對(duì)聚類分析的結(jié)果進(jìn)行對(duì)比分析,以確定最合適的距離測(cè)度方法。5.5 試述k均值法與系統(tǒng)聚類法的異同。答:相同:k均值法和系統(tǒng)聚類法一樣,都是以距離的遠(yuǎn)近親疏為標(biāo)準(zhǔn)進(jìn)行聚類的。不同:系統(tǒng)聚類對(duì)不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而k均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,離不開(kāi)實(shí)踐經(jīng)驗(yàn)的積累; 有時(shí)也可以借助系

7、統(tǒng)聚類法以一部分樣品為 對(duì)象進(jìn)行聚類,其結(jié)果作為 k均值法確定類數(shù)的參考。5.6 試述k均值法與系統(tǒng)聚類有何區(qū)別?試述有序聚類法的基本思想。答:k均值法的基本思想是將每一個(gè)樣品分配給最近中心(均值)的類中。系統(tǒng)聚類對(duì)不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而k均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,有時(shí)也可以借助系統(tǒng)聚類法以一部分樣品為對(duì)象進(jìn)行聚類,其結(jié)果作為k均值法確定類數(shù)的參考。有序聚類就是解決樣品的次序不能變動(dòng)時(shí)的聚類分析問(wèn)題。如果用x(1), x,,x(n)表示n個(gè)有序的樣品,則每一類必須是這樣的形式,即x(i),x(i卻,x,其中iwiwn,且j 26 =2于是將g , g6聚為一

8、類,記為gs計(jì)算樣本距離陣一,二.g? g& gg冽0立;30,630卜。:i口y”中最小元素是”于是將g,,聚為一類,記為g9因此,g1gw1gg,1 2 w(2)用重心法進(jìn)行聚類分析計(jì)算樣品間平方距離陣 i.vgg?g g.gcgftl.3*口n國(guó)04102516906449369010081642540于是將gi易知doy中最小元素是 記為“計(jì)算距離陣y1y1649258164160注:計(jì)算方法,其他以此類推。02y1y中最小元素是d”6 =4于是將gs6聚為一類,記為gb計(jì)算樣本距離陣一亡y16d?2y中最小元素是 于是將g.,聚為一類,記為gg 因此,5.8下表是15個(gè)上市公司200

9、1年的一些主要財(cái)務(wù)指標(biāo),使用系統(tǒng)聚類法和k-均值法分別對(duì)這些公司進(jìn)行聚類,并對(duì)結(jié)果進(jìn)行比較分析。公司 編號(hào)凈資產(chǎn) 收益率每股凈 利潤(rùn)總資產(chǎn)周轉(zhuǎn)率資產(chǎn)負(fù) 債率流動(dòng)負(fù) 債比率每股凈 資產(chǎn)凈利潤(rùn) 增長(zhǎng)率總資產(chǎn)增長(zhǎng)率111.090.210.0596.9870.531.86-44.0481.99211.960.590.7451.7890.734.957.0216.11300.030.03181.99100-2.98103.3321.18411.580.130.1746.0792.181.146.55-56.325-6.19-0.090.0343.382.241.52-1713.5-3.366100.47

10、0.4868.4864.7-11.560.85710.490.110.3582.9899.871.02100.2330.32811.12-1.690.12132.14100-0.66-4454.39-62.7593.410.040.267.8698.511.25-11.25-11.43101.160.010.5443.71001.03-87.18-7.411130.220.160.487.3694.880.53729.41-9.97128.190.220.3830.311002.73-12.31-2.771395.79-5.20.5252.3499.34-5.42-9816.52-46.821

11、416.550.350.9372.3184.052.14115.95123.4115-24.18-1.160.7956.2697.84.81-533.89-27.74解:令凈資產(chǎn)收益率為 x1,每股凈利潤(rùn) x2,總資產(chǎn)周轉(zhuǎn)率為 x3,資產(chǎn)負(fù)債率為 x4,流動(dòng)負(fù) 債比率為x5,每股凈資產(chǎn)為 x6,凈利潤(rùn)增長(zhǎng)率為 x7,總資產(chǎn)增長(zhǎng)率為 x8,用spss對(duì)公司 聚類分析的步驟如下: a)系統(tǒng)聚類法:1.在 spss口中選擇 analyze-classify fhierachical cluster ,調(diào)出 系統(tǒng)聚類分析主界面,并將變量x1-x8移入variables框中。在cluster 欄中選擇c

12、ases單選按鈕,即對(duì)樣品進(jìn)行聚類(若選擇variables ,則對(duì)變量進(jìn)行聚類)。在 display欄中選擇statistics 和plots復(fù)選框, 這樣在結(jié)果輸出窗口中可以同時(shí)得到聚類結(jié)果統(tǒng)計(jì)量和統(tǒng)計(jì)圖。2.3.圖5.1系統(tǒng)分析法主界面點(diǎn)擊statistics 按鈕,設(shè)置在結(jié)果輸出窗口中給出的聚類分析統(tǒng)計(jì)量。我們選擇 agglomeration schedule 與 cluster membership 中的 rangeof solution 2-4,如圖5.2所示,點(diǎn)擊continue按鈕,返回主界面。(其中,agglomeration schedule表示在結(jié)果中給出聚類過(guò)程表,顯示

13、 系統(tǒng)聚類的詳細(xì)步驟;proximity matrix表示輸出各個(gè)體之間的距離矩 陣;cluster membership表示在結(jié)果中輸出一個(gè)表,表中顯示每個(gè)個(gè)體 被分配到的類別,rangeof solution 2-4即將所有個(gè)體分為2至4類。) 點(diǎn)擊plots按鈕,設(shè)置結(jié)果輸出窗口中給出的聚類分析統(tǒng)計(jì)圖。選中 dendrogram復(fù)選框和icicle 欄中的none單選按鈕,如圖5.3 ,即只給 出聚類樹(shù)形圖,而不給出冰柱圖。單擊 continue按鈕,返回主界面。hierardikal cluster analysis: pfo.h hierarchical cluster ana ly

14、sis:同a的修巾聲前時(shí)1疑也出出prsisdriity rtiiirixckiirler memlwhipq sfqic sdbtonnumber df dusters::*) range of tdiliantmnmjni number 川 du目ww2number 口f卓r況4圖5.2 statistics 子對(duì)話框圖5.3 plots子對(duì)話框4.點(diǎn)擊method按鈕,設(shè)置系統(tǒng)聚類的方法選項(xiàng)。cluster method 下拉列表用于指定聚類的方法,這里選擇 between-group inkage (組間平均數(shù) 連接距離);measure欄用于選擇對(duì)距離和相似性的測(cè)度方法,選擇 squ

15、ared euclidean distance (歐氏距離);單擊 continue 按鈕,返回 主界面。也制4趨生3班生口攔生111121113111111521611171118321g11110111111111211113q321411115111群集成員pescaled distance cluster cgnfciine10g11圖5.6聚類樹(shù)形圖caselakiel num124 id踮 hierarchical cluster airudly5is: sa!.匕邈micluster membership1c乜叫已c single solution! nuitiber of cl

16、usters:11 j 5,amge of snlutiansivfnimuih number of clusters: 2 hfexjmum number gf dusters; 4cntmue cante help一圖5.4 method子對(duì)話框圖5.5 save子對(duì)話框5 .點(diǎn)擊save按鈕,指定保存在數(shù)據(jù)文件中的用于表明聚類結(jié)果的新變量。none表示不保存任何新變量;single solution表示生成一個(gè)分類變量,在其后的矩形框中輸入要分成的類數(shù);range of solutions表示生成多個(gè)分類變量。這里我們選擇 range of solutions ,并在后面的兩個(gè)矩形 框中

17、分別輸入2和4,即生成三個(gè)新的分類變量,分別表明將樣品分為2 類、3類和4類時(shí)的聚類結(jié)果,如圖5.5。點(diǎn)擊continue ,返回主界面。6 .點(diǎn)擊ok按鈕,運(yùn)行系統(tǒng)聚類過(guò)程。聚類結(jié)果分析:下面的群集成員表給出了把公司分為2類,3類,4類時(shí)各個(gè)樣本所屬類別的情況,另外,從右邊的樹(shù)形圖也可以直觀地看到,若將15個(gè)公司分為2類,則13獨(dú)自為一類,其余的為一類;若分為3類,則公司8分離出來(lái),自成一類。以此類推。表5.1各樣品所屬類別表b) k均值法的步驟如下:1 .在 spss口中選擇 analyze-classify -k-means cluster ,調(diào)出 k均 值聚類分析主界面,并將變量 x1

18、-x8移入variables 框中。在method 框中選擇iterate classify ,即使用k-means算法不斷計(jì)算新的類中心, 并替換舊的類中心(若選擇classify only ,則根據(jù)初始類中心進(jìn)行聚類,在聚類過(guò)程中不改變類中心)。在 number of cluster 后面的矩形 框中輸入想要把樣品聚成的類數(shù),這里我們輸入 3,即將15個(gè)公司分為3類。(centers按鈕,則用于設(shè)置迭代的初始類中心。如果不手工設(shè)置,則 系統(tǒng)會(huì)自動(dòng)設(shè)置初始類中心,這里我們不作設(shè)置。)圖5.7 k均值聚類分析主界面2.點(diǎn)擊iterate 按鈕,對(duì)迭代參數(shù)進(jìn)行設(shè)置。maximumlteratio

19、ns 參數(shù)框 用于設(shè)定 k-means算法迭代 的最大次數(shù),輸入10, convergence criterion 參數(shù)框用于設(shè)定算法的收斂判據(jù),輸入0,只要在迭代的過(guò)程 中先滿足了其中的參數(shù),則迭代過(guò)程就停止。單擊 continue ,返回主界 面。圖5.8 iterate子對(duì)話框3.點(diǎn)擊save按鈕,設(shè)置保存在數(shù)據(jù)文件中的表明聚類結(jié)果的新變量。我們將兩個(gè)復(fù)選框都選中,其中cluster membership選項(xiàng)用于建立一個(gè)代表 聚類結(jié)果的變量,默認(rèn)變量名為 qcl_1 ; distance from cluster center 選項(xiàng)建立一個(gè)新變量,代表各觀測(cè)量皿所屬類中心的歐氏距離。單擊

20、 continue按鈕返回。4.圖5.9 save子對(duì)話框點(diǎn)擊options按鈕,指定要計(jì)算的統(tǒng)計(jì)量。選中initial cluster centers和cluste門(mén)nformation for each case復(fù)選框。這樣,在輸出窗口中將給出聚類的初始類中心和每個(gè)公司的分類信息,包括分配到哪一類和 該公司距所屬類中心的距離。單擊continue返回。弼 k-meam cluster analysis: optio. msbstaftslira*卜而引clust jenters匚紳iwm的lg匣 qusler infernwtion for each casemishin 啕 valuer

21、f* exclude cases itstwiseq exdude casescirtinue cancel | help |圖5.10 options子對(duì)話框5.點(diǎn)擊ok按鈕,運(yùn)行k均值聚類分析程序。聚類結(jié)果分析:以下三表給出了各公司所屬的類及其與所屬類中心的距離,聚類形成的類的中心的各變量值以及各類的公司數(shù)。由以上表格可得公司 13與公司8各自成一類,其余的公司為 一類。通過(guò)比較可知,兩種聚類方法得到的聚類結(jié)果完全一致。塞,“奧舉距離1398,15323112,95933235.34643132 426531 609.958630330973206,51182,0009395,923103

22、38,967113834134123101,852131,0001 43246,882153433,179聚類成員果類 11.00021.d00313,000有效1 5,000缺失00誨個(gè)聚類中的案例數(shù)匏類123x195.7911.12648x2-5.20-i.es.08x3.5012,39x4252.3+132.1 471 48x599.34100.0092.06x5-5 42-.561 sox7-9b16.52-4454.39-103.04x3-46.92-627511.01最多聚類中心x5,娛樂(lè)教育文化支出為 x6,用spss對(duì)16各地區(qū)聚類分析的步驟如 第4個(gè)步驟的method子對(duì)話框

23、中選擇不同的 cluster method。1. between-group inkage (組間平均數(shù)連接距離)至副4注隹3番篁111122?1332143215221e2217221822194321c221111111222113221142211532116321群維成員5.9下表是某年我國(guó)16個(gè)地區(qū)農(nóng)民支出情況的抽樣調(diào)查數(shù)據(jù),每個(gè)地區(qū)調(diào)查了反映每人平 均生活消費(fèi)支出情況的六個(gè)經(jīng)濟(jì)指標(biāo)。試通過(guò)統(tǒng)計(jì)分析軟件用不同的方法進(jìn)行系統(tǒng)聚類分地區(qū)食品衣著燃料住房交通和 通訊娛樂(lè)教 育文化北京190.3343.779.7360.5449.019.04天津135.236.410.4744.1636.4

24、93.94河北95.2122.839.322.4422.812.8山西104.7825.116.49.8918.173.25內(nèi)蒙128.4127.638.9412.5823.992.27遼寧145.6832.8317.7927.2939.093.47吉林159.3733.3818.3711.8125.295.22黑龍江116.2229.5713.2413.7621.756.04上海221.1138.6412.53115.6550.825.89江蘇144.9829.1211.6742.627.35.74浙江169.9232.7512.7247.1234.355安徽135.1123.0915.62

25、23.5418.186.39福建144.9221.2616.9619.5221.756.73江西140.5421.517.6419.1915.974.94山東115.8430.2612.233.633.773.85河南101.1823.268.4620.220.54.3解:令食品支出為x1,衣著支出為x2,燃料支出為x3,住房支出為x4,交通和通訊支出為析,并比較何種方法與人們觀察到的實(shí)際情況較接近。5.8題,不同的方法在上表給出了把全國(guó)16個(gè)地區(qū)分為2類、3類和4類時(shí),各地區(qū)所屬的類別,另外從右邊的樹(shù)形圖也可以直觀地觀察到,若用組間平均數(shù)連接距離將這些地區(qū)分為3類,則9 (上海)獨(dú)自為一類,

26、1 (北京)和11 (浙江)為一類,剩余地區(qū)為一類。2. within-group linkage(組內(nèi)平均連接距離)零時(shí)4重生建獎(jiǎng)x憔11112221322141215事212217221a321g432102211122112?2113721142211532116321器集成員若用組內(nèi)平均數(shù)連接距離將這些地區(qū)分為 為一類,剩余地區(qū)為一類。3類,則9 (上海)獨(dú)自為一類,1 (北京)獨(dú)自3. nearest neighbor (最短距離法)若用最短距離法將這些地區(qū)分為 剩余地區(qū)為一類。3類,則9 (上海)獨(dú)自為一類,1 (北京)獨(dú)自為一類,4. furthest neighbor(最遠(yuǎn)距離

27、法)矗隔14撥孽3蚌葬111122223322432253226222t222e322943110222111111222213312142221532216322成集成員若用最遠(yuǎn)距離法將這些地區(qū)分為 3類,則9 (上海)獨(dú)自為一類,1 (北京) 和11 (浙江)為一類,剩余地區(qū)為一類。5.centroid cluster(重心法)群集施員7. ward method (離差平方和)若用重心法將這些地區(qū)分為3類,則9 (上海)獨(dú)自為一類,1 (北京)和 11 (浙江)為一類,剩余地區(qū)為一類。6. median cluster(中位數(shù)距離)caseltahel若用中位數(shù)距離法將這些地區(qū)分為010

28、num為一類,剩余地區(qū)為一類。軍加4h隼3群第1111232323224332563327 a2229a12110?22111111222213222142221533216332群集成員3類,則9 (上海),1 (北京)和11 (浙江)為一類,2若用離差平方和法將這些地區(qū)分為(天津)、6 (遼寧)、7 (吉林)、10 (江蘇)、12 (安徽)、13 (福建)和14 (江西)為一類, 剩余地區(qū)為一類。5.10根據(jù)上題數(shù)據(jù)通過(guò) sps斑計(jì)分析軟件進(jìn)行快速聚類運(yùn)算,并與系統(tǒng)聚類分析結(jié)果進(jìn)行比較。解:快速聚類運(yùn)算即 k均值法聚類,具體步驟同 5.8,聚類結(jié)果如下:寶第弊距離1146.7512122,

29、9203322,4804316.ss45313,3300115.2557126,265837.51392,00010114,59811117,98612319,50113125,91214325,20315319,20116310 483聚類成員123xi155 77221 1111 7.1 6x232.7938.6425.41x313.9612.6311.40皿36.15115.6519.40k533.3350 8221 .s9油5.595 894.23最城果類中心制 17.00021.0003津卯口曲16.000.000每個(gè)器類中的案阿幼聚類的結(jié)果為9 (上海)獨(dú)自為一類,1 (北京)、2

30、 (天津)、6 (遼寧)、7 (吉林)、10 (江 蘇)、11 (浙江)、13 (福建)和14 (江西)為一類,剩余地區(qū)為一類。5.11下表是2003年我國(guó)省會(huì)城市和計(jì)劃單列市的主要經(jīng)濟(jì)指標(biāo):人均gdpx1 (元)、人均工業(yè)產(chǎn)值x2 (元)、客運(yùn)總量x3 (萬(wàn)人)、貨運(yùn)總量x4 (萬(wàn)噸)、地方財(cái)政預(yù)算內(nèi)收入 x5 (億元)、固定資產(chǎn)投資總額 x6 (億元)、在崗職工占總?cè)丝诘谋壤?x7(%)、在崗職工人均 工資額x8 (元)、城鄉(xiāng)居民年底儲(chǔ)蓄余額 x9 (億元)。試通過(guò)統(tǒng)計(jì)分析軟件進(jìn)行系統(tǒng)聚類分析,并比較何種方法與人們觀察到的實(shí)際情況較接近。城市xix2x3x4xx6x7xx9北京318863

31、31683052030671593200037.8253126441天津264334373235073467920593418.8186481825石家莊15134131591184310008494169.5123061044太原15752158312975152483319722.812679660呼和浩特1899111257350841552118213.514116255沈陽(yáng)23268154466612146368155714.8149611423大連2914527615110012108111140714.7175601310長(zhǎng)春18630210456999108924629412.

32、513870831哈爾濱148257561645895187642317.7124511154上海4658677083721263861899227421.0273056055南京2754743853167901480513679415.4221901134杭州3266749823213491681515071711.8246671466寧波3254347904249381379713955510.9236911060合肥106211171460344641362458.313901359福州2228121310968082506737611.815053876廈門(mén)53590931264441

33、30557023838.619024397南昌142219205572844543121011.013913483濟(jì)南23437226345810143547642913.516027758青島2470535506146663055312054814.515335908鄭州16674140231070978476637312.7135381048武漢212781708311882166108062317.4137301286長(zhǎng)沙15446887310609106316043410.016987705廣州48220554042975128859275108925.1288053727深圳1918

34、3834751910989679329187569.6310532199甫丁8176339070165893361708.313171451???644214553132843304129916.514819284重慶71905076582903245016211876.5124401897成都17914928972793287989078811.9152741494貴陽(yáng)11046103501851153184023115.812181345昆明16215116015126123386034214.614255709西安1314089131141393926544615.9135051211蘭

35、州1445917136220955812120318.013489468西寧706656052788203787610.114629175銀川1178711013214621271213421.913497193烏魯木齊22508171372188127544118026.116509420甫丁31886331683052030671593200037.8253126441???64334373235073467920593418.8186481825資料來(lái)源:中國(guó)統(tǒng)計(jì)年鑒 2004解:用spss對(duì)37個(gè)地區(qū)聚類分析的步驟如5.8題,不同的方法在第 4個(gè)步驟的method子對(duì)話框中選擇不同的 cluster method。i.between-group inkage(組間平均數(shù)連接距離)1p - 1 36-12 13 -j j -14 -5 -358-151021-號(hào) 25-33-2b 目 3 口 一320-2231-14if -34-532-2126e1c:243類,則24從上面的樹(shù)形圖可以直觀地觀察到,若用組間平均數(shù)連接距離將這些地區(qū)分為 (深圳)獨(dú)自為一類,10 (上海)和16 (廈門(mén))為一類,剩余地區(qū)為一類。2 .within-group linkage (組內(nèi)平均連接距離)27 (重慶)和若用

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論