版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
精選優(yōu)質(zhì)文檔-----傾情為你奉上精選優(yōu)質(zhì)文檔-----傾情為你奉上專心---專注---專業(yè)專心---專注---專業(yè)精選優(yōu)質(zhì)文檔-----傾情為你奉上專心---專注---專業(yè)應用數(shù)理統(tǒng)計(論文)中國區(qū)域經(jīng)濟類型的聚類和判別分析指導老師:馮偉院系名稱:材料科學與工程學號:SY姓名:劉桎東2014年12月20日
摘要區(qū)域經(jīng)濟發(fā)展的指標體系,包括人口總數(shù)、第一產(chǎn)業(yè)總產(chǎn)值、第二產(chǎn)業(yè)總產(chǎn)值、第三產(chǎn)業(yè)總產(chǎn)值、財政收入、社會消費品零售總額、貨物進出口總額、平均工資、人均可支配收入和居民消費水平等。本文主要通過系統(tǒng)類聚的方法,將全國31個省市(自治區(qū))的2013年經(jīng)濟發(fā)展狀況進行歸類分析,得出全國區(qū)域經(jīng)濟發(fā)展水平的一些基本情況,并進行了相應的判別分析,為我國經(jīng)濟在快速發(fā)展的前提下,做好協(xié)調(diào)發(fā)展提供一些啟示。關(guān)鍵字:區(qū)域經(jīng)濟聚類分析判別分析目錄
引言在制定國民經(jīng)濟和社會發(fā)展規(guī)劃時,通常需要按照行政區(qū)域進行經(jīng)濟類型的劃分,這有助于對不同地區(qū)經(jīng)濟發(fā)展存在的差異進行宏觀調(diào)控,從而因地制宜出臺相應的經(jīng)濟政策,促進各地區(qū)經(jīng)濟的協(xié)調(diào)發(fā)展,為國民經(jīng)濟持續(xù)協(xié)調(diào)健康發(fā)展奠定了堅實基礎。明確當前我國發(fā)達地區(qū)和落后地區(qū)的區(qū)間格局,對于進一步的研究和分析我國各區(qū)域間經(jīng)濟發(fā)展的狀況,并探求切實可行的區(qū)域協(xié)調(diào)發(fā)展政策以實現(xiàn)我國經(jīng)濟的可持續(xù)發(fā)展有著極為重要的現(xiàn)實意義。在多元統(tǒng)計分析中,常常使用聚類分析和判別分析來解決樣本的分類問題。在事先并不知道應將樣品或指標分為幾類的情況下,可以使用聚類分析根據(jù)樣本或指標的相似程度,將樣本或指標歸組分類;而在事先已經(jīng)建立了樣品分類,需要將新樣本歸入到已知分類的樣本組中時,就可以使用判別分析。本文試圖通過聚類分析的方法,分析2013年中國31個省市(區(qū)域)經(jīng)濟發(fā)展發(fā)展狀況和差異情況,從中尋找一些有用的信息,提出對我國經(jīng)濟如何在快速發(fā)展的基礎上,做到協(xié)調(diào)發(fā)展的一些思考。本文采用多元統(tǒng)計分析方法,對我國區(qū)域經(jīng)濟發(fā)展指標進行聚類分析,客觀地反映當前各地區(qū)的經(jīng)濟類型。
數(shù)據(jù)收集分區(qū)指標是表征分區(qū)單位的特征因子,它的確定合理與否是分區(qū)成敗的關(guān)鍵。由于經(jīng)濟是與科技以及人民生活狀況等因素直接聯(lián)系的,為反映全國經(jīng)濟系統(tǒng)的全貌,評價或分析系統(tǒng)時必須充分考慮這三個方面的水平和狀態(tài),這是本文選擇指標的理論依據(jù),實際選擇指標時還要考慮指標與目標的一致性和取得指標數(shù)據(jù)的可能性。本文選取2013年大陸31省市的10項與經(jīng)濟相關(guān)的指標來衡量一個地區(qū)的經(jīng)濟發(fā)展水平:人口總數(shù)(萬人)、第一產(chǎn)業(yè)總產(chǎn)值(億元)、第二產(chǎn)業(yè)總產(chǎn)值(億元)、第三產(chǎn)業(yè)總產(chǎn)值(億元)、財政收入(億元)、社會消費品零售總額(億元)、貨物進出口總額(億元)、平均工資(元)、人均可支配收入(元)和居民消費水平(元)。上述數(shù)據(jù)來源于《中國統(tǒng)計年鑒2014》,如表2.1所示。選取33個省市作為聚類的變量。表2.1數(shù)據(jù)收集地區(qū)國內(nèi)生產(chǎn)總值(億元)總?cè)丝冢ㄈf人)在崗職工平均工資(元)社會商品零售總額(億元)貨物進出口總額(百萬美元)北京21330.831333.49638.1天津15726.931016.66738394738.7.6太原2531.09369.74577711450.210671.05呼和浩特2894.05237.88504691256.12195沈陽7098.71730.84565903570.115800.29長春5342.43754.55569772217.520728.75哈爾濱5340.07987.29515543070.96807.96上海23567.71438.699303.5.3南京8820.75648.72772864167.257220.77杭州9206.16715.76708234201.567997.75寧波7610.28583.78702282992.1合肥5157.97712.81596481666.820087福州5169.16674.94588383062.934663.17廈門3273.58203.44630621072.383553.11南昌3667.96517.73518481304.912226.43濟南5770.6621.61623233087.610500.14青島8692.1780.64620973361.779888.33鄭州6776.99937.8497562913.646430.9武漢10069.48827.31606244369.326428.87長沙7824.81671.41618473162.112561.3廣州16706.87842.42742467144.5.8深圳16001.82332.21734924844南寧3148.3729.66543301616.94814.1???091.7165.3150653541.33400.9重慶14262.63375.2568525710.795450.24成都10056.591210.74632014468.955844.39昆明3712.99550.5581531905.929394.32拉薩347.4552.7372468180.32076.29西安5492.64815.29540983093.924982.97蘭州2000.94374.6754008944.94556.49西寧1065.78202.6454914414.11596.74銀川1388.6219659080382.54500烏魯木齊2461.47266.916161710708284.58表2.1數(shù)據(jù)收集這個數(shù)據(jù)我也沒有哇,只有上面那個數(shù)據(jù),沒用的話刪除了吧這個數(shù)據(jù)我也沒有哇,只有上面那個數(shù)據(jù),沒用的話刪除了吧省份社會消費品零售總額(億元)貨物進出口總額(億元)平均工資(元)人均可支配收入(元)居民消費水平(元)北京8375.19300640321.033337天津4470.46777332293.626261河北10516.74150122580.311557山西5139.34640722455.612078內(nèi)蒙古5114.25072325496.717168遼寧10581.44550525578.220156吉林5426.44284622274.613676黑龍江6251.24079419597.012978上海8052.09090843851.439223江蘇20796.55717732537.523585浙江15225.55657137850.824771安徽6542.44780623114.211618福建8275.34853830816.417115江西4576711910山東22294.84699828264.116728河南12426.63830122398.011782湖北10885.94389922906.413912湖南9018.64272623414.012920廣東25453.95331833090.023739廣西5133411710海南992.94497122928.911712重慶4599.85000625216.115270四川10561.44796522367.612485貴州2366.24736420667.19541云南4004.64244723235.511224西藏293.25777320023.46275陜西4999.54744622858.413206甘肅2173.84283318964.89616青海544512070寧夏610.55047621833.313537新疆2108.24906419873.811401
聚類分析聚類分析概述聚類分析的基本思想認為所研究的樣品或指標之間存在著程度不同的相似性,于是根據(jù)一批樣品的多個觀測指標,找出能夠度量樣品或變量之間相似程度的統(tǒng)計量,并以此為依據(jù),采用某種聚類法,將所有的樣品或變量分別聚合到不同的類中,使同一類中的個體有較大的相似性,不同類中的個體差異較大。研究怎樣對事物進行合理分類(歸類)的統(tǒng)計方法稱為聚類分析。依據(jù)分類對象的不同可以把聚類分析再分成Q型聚類和R型聚類,Q型聚類是指對樣品進行聚類,R型聚類是指對變量進行聚類。聚類分析的基本原理是把某種性質(zhì)相似的對象歸于同一類,而不同類的之間則存在較大差異。為此,首先要能刻畫各個變量之間或者各個樣本點之間的相似性。Q聚類一般使用“距離”度量樣本點之間的相似性,定義樣本點之間的距離可以采用歐氏距離、明考夫斯基距離、馬氏距離、蘭氏距離等測度。R聚類則使用“相似系數(shù)”作為變量相似性的度量。定義各變量之間的相似系數(shù)則多采用樣本相關(guān)系數(shù)、夾角余弦等測度。聚類分析包括很多種方法,包括系統(tǒng)聚類法、有序樣品聚類法、動態(tài)聚類法、模糊聚類法、圖論聚類法、聚類預報法等,不同的方法適合解決不同類型的問題,本文中使用的為系統(tǒng)聚類法。系統(tǒng)聚類法是最常用的一種聚類方法,初始時要先把要歸類的n個對象各自視為一類,然后逐漸把關(guān)系最密切的兩個類合并成一個新類,知道最后把n個對象都歸為一類時停止。這種聚類過程可以用一張聚類譜系圖形象的展示出來。由于系統(tǒng)聚類時要把兩個“最接近”的類合并到一起構(gòu)成一個新類,這是還需要規(guī)定類與類之間的相似性測度,常用的方法有最短距離法、最長距離法、中間距離法、重心法、類平均法、離差平法和。聚類分析過程及結(jié)果輸出用SPSS程序中的聚類分析進行分類計算。聚類方法使用Ward,所用的距離種類選擇歐氏平方距離以兩變量差值平方和為距離,即兩觀察單位間的距離為其值差的平方和。標準化選擇Z得分。對33各省市進行聚類處理,結(jié)果匯總?cè)缦拢罕?.1表示所有觀測量都加入聚類分析,沒有遺漏。表3.1個案處理摘要a個案有效缺失總計個案數(shù)百分比個案數(shù)百分比個案數(shù)百分比33100.0%00.0%33100.0%a.平方歐氏距離使用中表3.2聚類表階段組合聚類系數(shù)首次出現(xiàn)聚類的階段下一個階段聚類1聚類2聚類1聚類21612.10700623132.113001431316.131009433014800106627.199101571523.19900158424.203001891320.212301110718.215502111513.262092012333.280401413910.288001914331.3081221815615.38667211618.4030032171719.43300201834.4801482219911.6171302520517.6491117232167.89215102322314.9581802623561.149202127242211.2330029259261.84819027263282.1522202827592.63423252828353.477262730292228.61024030302313.3702928313122528.72730032321240.12516310表3.2為分層聚類分析的聚類過程表。表中第一列表示聚類分析的步驟,第二列和第三列表示該步聚類分析中,哪兩個樣本聚成了一類;如:第一步是第6個變量和第12個變量進行聚類,第二步是第31個變量和第32個變量進行聚類,以此類推,聚類過程共進行了32步,所有的樣本聚成了一大類。第四列表示兩個樣本間的距離系數(shù),從表中可以看出,距離小的樣本之間先聚類;第五和第六列表示某步聚類分析中,參與聚類的是樣本還是類,0則表示樣本,數(shù)字n(非零)表示第n步聚類產(chǎn)生的類參與了本步聚類;第七列表示本步聚類結(jié)果在下面聚類的第幾步中用到。圖3.1為系統(tǒng)聚類的冰柱圖,圖的縱坐標表示聚類的數(shù)目,從圖最下方看起,從32類,逐漸到20類、15類、最后聚成一個大類。首先是合肥和昆明聚成一類,其余變量各為一類。第二步將蘭州和烏魯木齊聚成另一類中,以此類推,最后所有變量聚成了一個大類。該圖相較而言更為直觀的顯示了聚類過程。圖3.1系統(tǒng)聚類的冰柱圖圖3.2Ward聯(lián)結(jié)的樹狀圖圖3.2為Ward聯(lián)結(jié)的樹狀圖,該圖比冰柱圖更容易看出分類狀況,并且分析結(jié)果與聚類表和聚類冰柱圖的分析結(jié)果是一致的。通過比較,選擇四群集,即將變量分成四類,如表3.3所示。
表3.3Ward聯(lián)結(jié)的樹狀圖案例區(qū)域群集1:北京12:天津23:河北34:山西35:內(nèi)蒙古36:遼寧37:吉林38:黑龍江19:江蘇310:浙江311:安徽312:福建313:江西314:河南315:湖北316:廣東317:廣西318:海南319:重慶320:四川321:云南222:西藏223:甘肅324:青海325:寧夏426:新疆327:上海3討論北京是我國的首都,屬于我國政治經(jīng)濟文化中心,而上海是我國的第一大城市,屬于經(jīng)濟龍頭,無論是經(jīng)濟發(fā)展水平還是科技文化教育的實力在我國都是領(lǐng)先的,因此這兩者分在一類(第一類)。而廣東、江蘇作為沿海開放的省份,外商投資多,經(jīng)濟實力相當雄厚,所以分為一類(第四類);相比之下,天津、河北、遼寧、浙江、福建、河南、湖北、四川這幾個省份,福建、遼寧、天津、浙江、河北作為沿海省份,在經(jīng)濟上稍遜于前兩個類,但遼寧作為我國的重工業(yè)發(fā)展基地,福建緊靠臺灣,近兩年沿海交流加深,浙江近幾年由于引進外資以及小商品行業(yè)的發(fā)展,經(jīng)濟實力迅猛提高,而天津與河北則處在緊鄰北京的優(yōu)勢地理位置上,河南、湖北與四川則各自有著自己的優(yōu)勢,因此劃分為一類(第二類),其余劃分為第三類,這些省份主要集中在我國的西部和中部內(nèi)陸,與前面類別中的省份存在一定的差異未改動。未改動。文末最后有將分類整理成段落的格式,可以看那個寫描述分析,隨便寫寫吧
判別分析判別分析概述判別分析是在已知分類數(shù)目的情況下,根據(jù)一定的指標對不知類別的數(shù)據(jù)進行歸類。它是判別樣品所屬類型的一種統(tǒng)計方法。其主要原理是利用原有的分類信息,得到體現(xiàn)這種分類的函數(shù)關(guān)系式(稱之為判別函數(shù),一般是與分類相關(guān)的若干個指標的線形關(guān)系式),然后利用該函數(shù)去判斷未知樣品屬于哪一類。因而是個學習和預測的過程。我們常用的判別分析方法有距離判別法、費歇爾判別法和貝葉斯判別法等。判別分析過程及結(jié)果輸出選取27個省份的數(shù)據(jù)與其對應的類別作為已知分類,湖南、貴州、山東、陜西作為帶分類變量進行判別分析,定義分類結(jié)果為變量“分組類別”,采用自變量全進入模型來進行判別分析,因此分類結(jié)果變量的取值范圍為1~4。輸出結(jié)果如下所示:表4.1分析案例處理摘要表未加權(quán)個案數(shù)個案數(shù)百分比有效33100.0排除缺失或超出范圍組代碼0.0至少一個缺失判別變量0.0既包括缺失或超出范圍組代碼,也包括至少一個缺失判別變量0.0總計0.0總計33100.0表4.1為分析案例處理摘要表,表明一共有33條記錄,已分好類的有33條,還有0條需要進行分類。表4.2為特征值表。由于本文中的預測變量有四個,類別數(shù)也為4個,因此判別函數(shù)的個數(shù)應為4。判別函數(shù)的特征值越大,表明該函數(shù)越具有區(qū)別力。從表中可以得到不同函數(shù)的特征值。
表4.2特征值表表函數(shù)特征值方差百分比累計百分比典型相關(guān)性18.683a52.452.4.94726.777a40.993.4.93331.098a6.6100.0.723a.在分析中使用了前3個典則判別函數(shù)。表4.3判別函數(shù)顯著性檢驗函數(shù)檢驗威爾克Lambda卡方自由度顯著性1直至3.006139.22415.0002直至3.06176.7878.0003.47720.3793.000表4.3為判別函數(shù)的顯著性檢驗結(jié)果表,從Sig.值來看,三個判別函數(shù)的效果是顯著的。表4.4標準化典型判別式函數(shù)系數(shù)函數(shù)123國內(nèi)生產(chǎn)總值(億元)-1.572.843-2.949總?cè)丝冢ㄈf人)2.066-.569.118在崗職工平均工資(元).637.175.600社會商品零售總額(億元)-.178.1032.416貨物進出口總額(百萬美元).740.412.433表4.4為標準化典型判別式函數(shù)系數(shù),即標準化的Fisher判別函數(shù)系數(shù),由該表可以得到三個Fisher判別函數(shù),將標準化的變量代入該函數(shù)計算可以得到各觀測值的具體空間位置。表4.5組重心Fisher判別函數(shù)值AverageLinkage(BetweenGroups)函數(shù)12313.6317.3172.1482-1.9194.391-2.4623-.586-.920.184414.322-2.962-1.876表4.5為各類別重心在空間中的坐標位置,故若將個觀測值代入前一個表格得到的判別函數(shù)中得到具體坐標位置后,即可計算其與各類別重心的距離,從而得到分類。表4.6分類函數(shù)系數(shù)AverageLinkage(BetweenGroups)1234國內(nèi)生產(chǎn)總值(億元)-.0074.502E-5-.005-.012總?cè)丝冢ㄈf人).066.030.051.160在崗職工平均工資(元).003.002.002.003社會商品零售總額(億元).003-.005-.001-.007貨物進出口總額(百萬美元).0005.382E-55.286E-5.000(常量)-168.887-75.669-66.403-271.508表4.6為Bayes判別函數(shù)系數(shù),可以得到四個Bayes判別函數(shù),將觀測值代入該函數(shù),可以得到四個函數(shù)值,通過比較函數(shù)值的大小即可判斷該樣品判入哪一類。下圖為典型判別函數(shù)圖,從該圖可以直觀的看出各類別的分布。圖4.1典型判別函數(shù)圖討論通過一系列的計算,可以得到如表4.7的分類結(jié)果矩陣,由表可知原已分類案例的判別回報率為100%,說明判別正確率非常高。同時,從表中還可以得出待分類的四個案例中,有兩個被分到了第一類,有三個被分到了第二類,有27個被分到了第三類,有一個被分到了第四類。表4.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度房地產(chǎn)抵押擔保合作協(xié)議2篇
- 2024年大數(shù)據(jù)處理與分析IT外包合同3篇
- 2024年個人汽車消費借款合同抵押版下載3篇
- 2024年產(chǎn)品代理銷售與區(qū)域獨家合同3篇
- 2024年度商品房租賃合同范本解析2篇
- 2024年度城市核心區(qū)域房產(chǎn)互換項目合作協(xié)議書3篇
- 濾光片、濾色片投資規(guī)劃項目建議書
- 磨切機生產(chǎn)加工項目可行性研究報告
- 餐盒定制合同模板
- 2024年度加工承攬合同承攬內(nèi)容和要求以及承攬費用和支付方式3篇
- 《新視野商務英語視聽說》第四版-上-U2 Jobs and Responsibilities
- 醫(yī)院業(yè)務標準流程圖
- (新版)吉林省生態(tài)環(huán)境監(jiān)測專業(yè)技術(shù)人員大比武理論試題庫(含答案)
- 裝修合同逾期訴狀模板
- 人音版(主編:吳斌) 四年級上冊 音樂 第7課 幸福拍手歌 教案
- 2024年02月中國文物保護基金會2024年招考4名人員筆試歷年典型考題及考點研判與答案解析
- QB/T 8024-2024 電熱采暖爐(正式版)
- 中國飲食文化智慧樹知到期末考試答案2024年
- 音樂技能綜合實訓智慧樹知到期末考試答案2024年
- MOOC 飼料毒物學-華中農(nóng)業(yè)大學 中國大學慕課答案
- 第五單元《京腔昆韻》-欣賞 ☆姹紫嫣紅 課件- 2023-2024學年人音版初中音樂八年級下冊
評論
0/150
提交評論