多元統(tǒng)計分析及實例討論_第1頁
多元統(tǒng)計分析及實例討論_第2頁
多元統(tǒng)計分析及實例討論_第3頁
多元統(tǒng)計分析及實例討論_第4頁
多元統(tǒng)計分析及實例討論_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

多元統(tǒng)計分析及實例討論第一頁,共二十頁,2022年,8月28日參考書目《多元統(tǒng)計分析》于秀林中國統(tǒng)計出版社《應用多元統(tǒng)計分析》高惠璇北京大學出版社《應用多元統(tǒng)計分析》朱建平科學出版社第二頁,共二十頁,2022年,8月28日課程概要

1、多元數(shù)據(jù)圖表示法

2、聚類分析

3、判別分析;

4、主成分分析;

5、因子分析;

6、對應分析;

7、典型相關(guān)分析;

8、多重多元回歸分析;

9、定性資料的統(tǒng)計分析第三頁,共二十頁,2022年,8月28日通過實例了解《多元統(tǒng)計分析》《多元統(tǒng)計分析》的概述計算機在《多元統(tǒng)計分析》中的應用2012年全國大學生數(shù)模競賽A題分析簡介經(jīng)驗總結(jié)第四頁,共二十頁,2022年,8月28日例1、對10位應聘者做智能檢驗。指標X,Y和Z分別表示數(shù)學推理能力,空間想象能力和語言理解能力。例2、家庭特征(年齡、收入、受教育程度)與家庭消費(外食、電影娛樂)之間的關(guān)系例3、奧運會十項全能運動項目得分數(shù)據(jù)的因子分析例4、對應與聚類分析在建筑企業(yè)競爭力評價中的應用

第五頁,共二十頁,2022年,8月28日例1對10位應聘者做智能檢驗。3項指標X,Y和Z分別表示數(shù)學推理能力,空間想象能力和語言理解能力。其得分如下,畫出它的輪廓(折線)圖.選擇合適的統(tǒng)計方法對應聘者進行分類。應聘者12345678910X28181121262016142422Y29232223292322232927Z28181622262222242424第六頁,共二十頁,2022年,8月28日例1(EXCEL)-樣品第七頁,共二十頁,2022年,8月28日例1(EXCEL)-變量第八頁,共二十頁,2022年,8月28日第九頁,共二十頁,2022年,8月28日我們直觀地來看,這個分類是否合理?計算4號和6號得分的離差平方和:

(21-20)2+(23-23)2+(22-22)2=1

計算1號和2號得分的離差平方和:

(28-18)2+(29-23)2+(28-18)2=236

計算1號和3號得分的離差平方和為482,由此可見一般,分類可能是合理的,歐氏距離很大的應聘者沒有被聚在一起

聚類分析基本思想簡介第十頁,共二十頁,2022年,8月28日例2家庭特征與家庭消費之間的關(guān)系為了了解家庭的特征與其消費模式之間的關(guān)系。調(diào)查了70個家庭的下面兩組變量:分析兩組變量之間的關(guān)系。第十一頁,共二十頁,2022年,8月28日典型變量的結(jié)構(gòu)(相關(guān)系數(shù))

U1U2X1就餐頻率0.9866-0.1632X2看電影頻率0.88720.4614

V1V2Y1戶主年齡0.42110.8464Y2家庭收入0.9822-0.1101Y3受教育程度0.51450.3013第十二頁,共二十頁,2022年,8月28日兩個反映消費的指標與第一對典型變量中u1的相關(guān)系數(shù)分別為0.9866和0.8872,可以看出u1可以作為消費特性的指標,第一對典型變量中v1與Y2之間的相關(guān)系數(shù)為0.9822,可見典型變量v1主要代表了了家庭收入,u1和v1的相關(guān)系數(shù)為0.6879,這就說明家庭的消費與一個家庭的收入之間其關(guān)系是很密切的;第十三頁,共二十頁,2022年,8月28日第二對典型變量中u2與x2的相關(guān)系數(shù)為0.4614,可以看出u2可以作為文化消費特性的指標,第二對典型變量中v2與Y1和Y3之間的分別相關(guān)系數(shù)為0.8464和0.3013,可見典型變量v2主要代表了家庭成員的年齡特征和教育程度,u2和v2的相關(guān)系數(shù)為0.1869,說明文化消費與年齡和受教育程度之間的有關(guān)。

典型相關(guān)分析基本思想簡介第十四頁,共二十頁,2022年,8月28日

百米跑成績跳遠成績鉛球成績跳高成績

400米跑成績百米跨欄鐵餅成績撐桿跳遠成績標槍成績

1500米跑成績

例3奧運會十項全能運動項目得分數(shù)據(jù)的因子分析

第十五頁,共二十頁,2022年,8月28日第十六頁,共二十頁,2022年,8月28日

第十七頁,共二十頁,2022年,8月28日

通過因子分析,多個變量被“凝聚”,并有了較為明確的含義。X1:百米跑,X2:跳遠和X5:400米跑,需要爆發(fā)力的項目在F1有較大的載荷,稱為短跑速度因子;X3:鉛球,X7:鐵餅和X9:標槍,在F2上有較大的載荷,稱為爆發(fā)性臂力因子;X6:百米跨欄,X8:撐桿跳遠,X2:跳遠和X4:跳高在F3上有較大的載荷,爆發(fā)腿力因子;F4:長跑耐力因子。

因子分析基本思想簡介第十八頁,共二十頁,2022年,8月28日多元統(tǒng)計分析是以p個變量的n次觀測數(shù)所組成的數(shù)據(jù)為依據(jù)。*簡化數(shù)據(jù)結(jié)構(gòu)(降維)

將某些較復雜的數(shù)據(jù)結(jié)構(gòu)通過變量變換等方法使相互依賴的變量變成互不相關(guān)的;將高維空間數(shù)據(jù)投影成到低維空間數(shù)據(jù);*分類與判別(歸類)

對所考察觀測點(或變量)按相似程度進行分類或歸類;*變量間的相互聯(lián)系

相互依賴關(guān)系:分析一個或幾個變量的變化是否依賴于另一些變量的變化;變量間相關(guān)關(guān)系:分析兩組變量相互關(guān)系;*多元數(shù)據(jù)的統(tǒng)計推斷

多元正態(tài)分布的均值向量與協(xié)方差陣的估計及其假設(shè)檢驗;*多元統(tǒng)計分析的理論基礎(chǔ)

多維隨機變量及其分布,抽樣分布第十九頁,共二十頁,2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論