下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 第7章 相關(guān)分析相關(guān)分析的概念 相關(guān)分析是研究變量間密切程度的一種常用統(tǒng)計方法。線性相關(guān)分析研究兩個變量間線性關(guān)系的程度。相關(guān)系數(shù)是描述這種線性關(guān)系程度和方向的統(tǒng)計量,通常用r表示。如果一個變量Y可以確切地用另一個變量X的線性函數(shù)表示,那么,兩個變量間的相關(guān)系數(shù)是+1或-l。如果變量Y隨著變量X的增、減而增、減,即變化的方向一致。例如身高與體重的關(guān)系,身高越高,體重相對也就越大。這種相關(guān)稱為正向相關(guān),其相關(guān)系數(shù)大于0。如果變量Y隨著變量X的增加而減少,變化方向相反。例如吸煙與肺功能的關(guān)系,隨著吸煙量增加,時間加長,肺功能下降。這種相關(guān)關(guān)系稱為負相關(guān),其相關(guān)系數(shù)小于0。相關(guān)系數(shù)r沒有單位;其值
2、在-l+1之間。當數(shù)值愈接近-l或+1之間時,關(guān)系愈緊密,接近于0時,關(guān)系愈不緊密。對其數(shù)值可以從小到大排列的數(shù)據(jù)才能計算其相關(guān)系數(shù)。 1 積矩相關(guān)系數(shù) 積矩相關(guān)系數(shù)(又稱積差相關(guān)系數(shù))適用于等間隔測度,相關(guān)系數(shù)采用Pearson積矩相關(guān)。2 Spearman和Kendall秩相關(guān)系數(shù) 秩相關(guān)適用于下列資料:不服從雙變量正態(tài)分布總體分布型未知用等級表示的資料。(衛(wèi)生統(tǒng)計四版本28頁)Spearman和Kendall秩相關(guān)系數(shù)是一種非參測度。Spearman相關(guān)系數(shù)是Pearson相關(guān)系數(shù)的非參形式。是根據(jù)數(shù)據(jù)的秩而不是根據(jù)實際值計算的。也就是說,先對原始變量的數(shù)據(jù)排秩,根據(jù)各秩使用相關(guān)系數(shù)公式
3、進行計算。它適合有序數(shù)據(jù)或不滿足正態(tài)分布假設(shè)的等間隔數(shù)據(jù)。相關(guān)系數(shù)的值范圍也是在-l+1之間。絕對值越大表明相關(guān)越強。相關(guān)系數(shù)的符號也表示相關(guān)的方向。這兩種相關(guān)系數(shù)的計算必須對連續(xù)變量值排秩,對離散變量排序。例如,我們可以將一組學生按入學考試成績和第一學年結(jié)業(yè)成績的順序排隊。如果將入學考試成績的評秩記為X1,X2,XN,而學年結(jié)業(yè)成績的評秩記為Y1,Y2,YN,我們就可以用秩相關(guān)度量來決定X和Y之間的相關(guān)性。Kendalls tau-b也是一種對兩個有序變量或兩個秩變量間的關(guān)系程度的測度,因此也屬于一種非參測度。 Kenedl秩相關(guān)系數(shù)比較難于講解,我們以一個例子來進行Kendall秩相關(guān)系數(shù)
4、的計算。如果兩位鑒定家各自以吸引力的大小將7幅抽象派畫評定了秩,那么可能知道這些秩評定之間的相符的程度。畫的秩評定表畫號2651437鑒別家11234567鑒別家22314657 依次取觀測2(鑒別家2)給出的秩,數(shù)出每一個右面在秩次上比自己小的個數(shù),并將這些個數(shù)加起來。例如抽象畫2的秩為2,其個數(shù)是l,因為其右邊的只有抽象畫5的秩比它小。6個數(shù)依次為1,l,O,0,1和0,所以總和為Q3,Kendall秩相關(guān)系數(shù)則為 r=1-4Q/n(n-1)=1-12/42=0.714 3偏相關(guān)系數(shù)。偏相關(guān)分析計算偏相關(guān)系數(shù),它描述的是當控制了一個或幾個另外的變量的影響條件下兩個變量間的相關(guān)性。例如??梢?/p>
5、控制年齡和工作經(jīng)驗兩個變量的影響,估計工資收入與受教育程度之間的相關(guān)關(guān)系。控制了變量Z,變量X與 y之間的偏相關(guān),和控制了兩個變量 Z1、Z2,變量 X與y之間的偏相關(guān)系數(shù)計算公式不同。4.兩個或若干變量之間或兩組觀測量之間的關(guān)系有時也可以用相似性或不相似性來描述。相似性測度用大數(shù)值表示很相似,較小的數(shù)值表明相似性小。不相似性使用距離或不相似性來描述。大值表示相差甚遠。 5關(guān)于相關(guān)系數(shù)統(tǒng)計意義的檢驗 由于我們通常是通過抽樣方法;利用樣本研究總體的特性。由于抽樣誤差的存在,樣本中兩個變量間相關(guān)系數(shù)不為0,不能說明總體中這兩個變量間的相關(guān)系數(shù)不是0,因此必須經(jīng)過檢驗。檢驗的零假設(shè)是:總體中兩個變量
6、間的相關(guān)系數(shù)為O。SPSS的相關(guān)分析過程給出這假設(shè)成立的概率。相關(guān)分析的 SPSS過程 Correlate命令項具有三個相關(guān)分析功能的命令。對應(yīng)著相關(guān)分析、偏相關(guān)分析和相似性測度的三個SPSS過程。它們是: 1 Bivarate(相關(guān)分析)命令項調(diào)用Correlations過程和 Nonpar Corr 過程,按指定項顯示變量的描述統(tǒng)計量。計算指定的兩個變量間的相關(guān)系數(shù),可以選擇Pearson相關(guān)、Spearman和Kendalls tau-b 相關(guān);同時對相關(guān)系數(shù)進行檢驗。檢驗的零假設(shè)是:相關(guān)系數(shù)為0??梢詫z驗進行單尾或雙尾的選擇。給出相關(guān)系數(shù)為0的概率。 2 Partial(偏相關(guān)分析)
7、命令項調(diào)用Partial Corr過程,計算兩個變量間在控制了其他變量的影響下的相關(guān)系數(shù)??梢赃x擇單尾或雙尾顯著性檢驗。檢驗的零假設(shè)是:偏相關(guān)系數(shù)為零。還可以要求計算其他描述統(tǒng)計量。 3.Distance(距離分析)命令項調(diào)用Proximities 過程,對變量或觀測量進行相似性或不相似性測度。因此分析的變量可以是連續(xù)變量、表示頻數(shù)分布的變量,某些測度還可以適用于二值變量??梢詫υ紨?shù)據(jù)和計算出的距離數(shù)據(jù)進行標準化。 如果需要確定兩個變量或若干自變量與因變量具體的函數(shù)關(guān)系,使用相關(guān)分析不能達到目的,必須使用回歸分析。如果要將觀測量或變量歸到確定的類中,必須使用聚類分析中的觀測量聚類或變量聚類的
8、相應(yīng)過程。兩個變量間的相關(guān)分析 本節(jié)介紹兩變量間的相關(guān)。包括兩個連續(xù)變量間的相關(guān)和兩個等級變量間的秩相關(guān)。這兩種相關(guān)使用同一個命令項Bivarate調(diào)用,通過選擇不同的分析方法調(diào)用不同的分析過程。選擇哪一種分析方法要看具體的數(shù)據(jù)類型。對于連續(xù)變量和等級變量選擇不同的分析方法。使用系統(tǒng)默認值進行相關(guān)分析 下面以l9621988年安徽省國民收入與城鄉(xiāng)居民儲蓄存款余額兩個變量間的線性相關(guān)分析為例,說明使用系統(tǒng)默認值進行連續(xù)變量相關(guān)分析的方法。數(shù)據(jù)來源于數(shù)理統(tǒng)計與管理l990年第5期,中國現(xiàn)場統(tǒng)計研究會主辦。數(shù)據(jù)編號data1001。 變量包括:income國民收入(億元),deposit城鄉(xiāng)居民儲蓄
9、存款余額, number序號,year年份。二元變量相關(guān)分析的選擇項1 Pearson調(diào)用correlation過程計算連續(xù)變量或等間隔測量的變量間的相關(guān)系數(shù)。2 Kendalls tau-b調(diào)用Nonpar corr過程計算分類變量間的秩相關(guān)。3 Spearman調(diào)用Nonpar corr過程計算斯皮爾曼秩相關(guān)。如果參與分析的變量是連續(xù)變量,選擇Kendalls tau-b或Spearman相關(guān),則系統(tǒng)自動對連續(xù)變量的值先求秩,再計算其秩分數(shù)間的相關(guān)系數(shù)。例一:數(shù)據(jù)編號data0903。Id:編號,bdate:生日,educ:受教育水平,gender:性別,jobcat:工作分類,minor
10、ity:少數(shù)民族,prevexp:以前工作月數(shù),salary:現(xiàn)在工資,salbegin:起始工資。生成新變量:age=1999-Xdate.year(bdate)例二:數(shù)據(jù)編號data100210名運動員長拳和長兵器兩項得分,分析兩項得分是否存在相關(guān)關(guān)系。判斷兩個變量只可能是正相關(guān),或只可能是負相關(guān)時,可選擇單尾檢驗。例三:數(shù)據(jù)編號data1003偏相關(guān)分析的概念相關(guān)分析計算兩個變量間的相關(guān)系數(shù),分析兩個變量間線形關(guān)系的程度。往往因為第三個變量的作用,使相關(guān)系數(shù)不能真正反映兩個變量間線形程度。例如身高、體重與肺活量之間的關(guān)系。使用Pearson相關(guān)計算其相關(guān)系數(shù),可以得出肺活量與身高和體重均
11、存在較強的線形關(guān)系。但實際上,如果對體重相同的人,分析身高和肺活量。是否身高值越大,肺活量越大呢?結(jié)論是否定的。正是因為身高與體重有著線形關(guān)系,體重與肺活量才存在線形關(guān)系,因此,得出身高與肺活量之間存在較強的線形關(guān)系的錯誤結(jié)論。偏相關(guān)分析的任務(wù)就是在研究兩個變量之間的線形相關(guān)關(guān)系時控制可能對其產(chǎn)生影響的變量。例一:數(shù)據(jù)編號data1004分別調(diào)用bivariate和partial過程,比較其結(jié)果。Partial中:分析身高、肺活量兩個變量,體重作為控制變量。偏相關(guān)分析的結(jié)果是控制了體重的影響,肺活量與身高的相關(guān)系數(shù)只有0.098,小于0.1,p=0.691,不相關(guān)的概率很大??梢哉f,身高與肺活
12、量無關(guān)。例二:數(shù)據(jù)編號data1005(四川綿陽地區(qū)3年生中山柏的數(shù)據(jù))分析月生長量與月平均氣溫、月降雨量、月平均日照時數(shù)、月平均濕度四個氣候因素哪個因素有關(guān)。Month:月份,hgrow:生長量,temp:月平均氣溫,rain: 月降雨量,hsun: 月平均日照時數(shù),humi: 月平均濕度。分析變量:hgrow(生長量)與hsun(月平均日照時數(shù))控制變量:humi(月平均濕度)、rain(月降雨量)、temp(月平均氣溫)中山柏生長量與四個氣候因素的偏相關(guān)綜合結(jié)果hsun:humitemprainhgrow.6318( 7)p=.068.7310( 7)p=0.025.9774( 7)p=
13、0.000-0.4906( 7)p=0.180中山柏生長量與氣溫關(guān)系最密切,其次濕度;日照時間,相關(guān)系數(shù)0.6318,不相關(guān)概率p=.068,沒有顯著意義;與降雨量沒有線形關(guān)系,降雨量過大,還會影響其生長。距離分析1 關(guān)于距離分析距離分析是對觀測量之間或變量之間相似性或不相似程度的一種測度。這些相似性或距離測度可用于因子分析和聚類分析等。2 有關(guān)統(tǒng)計量(1)不相似性測度等間隔數(shù)據(jù)的不相似性(距離)測度可以使用的統(tǒng)計量:歐幾米德(歐氏)距離、歐氏距離平方等。計數(shù)數(shù)據(jù),使用卡方。二值(只有兩種取值)數(shù)據(jù),使用歐氏距離、歐氏距離平方等。(2)相似性測度等間隔數(shù)據(jù)使用統(tǒng)計量皮爾遜相關(guān)或余弦。測度二元數(shù)據(jù)的相似性使用的統(tǒng)計量有二十余種。例如:仍使用數(shù)據(jù)編號data1005操作步驟:(1)AnalyzeCorrelateDistane(2)選擇
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 臨沂科技職業(yè)學院《人力資源管理前沿專題》2023-2024學年第一學期期末試卷
- 江蘇工程職業(yè)技術(shù)學院《生命科學基礎(chǔ)》2023-2024學年第一學期期末試卷
- 華東政法大學《無機材料綜合實驗II》2023-2024學年第一學期期末試卷
- 湖北黃岡應(yīng)急管理職業(yè)技術(shù)學院《網(wǎng)絡(luò)存儲技術(shù)與實踐》2023-2024學年第一學期期末試卷
- 珠海科技學院《臨床醫(yī)學概論(內(nèi)科學)》2023-2024學年第一學期期末試卷
- 浙江同濟科技職業(yè)學院《電氣傳動與控制》2023-2024學年第一學期期末試卷
- 中南財經(jīng)政法大學《聚合過程與原理》2023-2024學年第一學期期末試卷
- 長沙理工大學城南學院《技法理論》2023-2024學年第一學期期末試卷
- 云南交通職業(yè)技術(shù)學院《醫(yī)藥市場調(diào)研與預測》2023-2024學年第一學期期末試卷
- 新一代信息技術(shù)產(chǎn)業(yè)布局
- 2020年上海市高考英語二模試卷(a卷)
- 對賬單標準模板
- 小學科學教科版四年級下冊第二單元《電路》復習教案(2023春新課標版)
- 創(chuàng)業(yè)計劃書(成人用品店)
- 電機的結(jié)構(gòu)及工作原理
- GB 6245-2006消防泵
- 空調(diào)維修保養(yǎng)服務(wù)突發(fā)事件應(yīng)急處置方案
- 東岸沖沙閘及進水閘施工方案
- 寵物入住酒店免責協(xié)議
- 2022年滬教版(全國)九年級化學下冊第6章溶解現(xiàn)象章節(jié)測試試卷(精選含答案)
- 河南省地圖含市縣地圖矢量分層地圖行政區(qū)劃市縣概況ppt模板
評論
0/150
提交評論