




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第9章spss的相關(guān)分析和線性回歸分析相關(guān)分析和回歸分析是統(tǒng)計(jì)分析方法中最重要內(nèi)容之一,是多元統(tǒng)計(jì)分析方法的基礎(chǔ)。相關(guān)分析和回歸分析主要用于研究和分析變量之間的相關(guān)關(guān)系,在變量之間尋求合適的函數(shù)關(guān)系式,特別是線性表達(dá)式。本章主要內(nèi)容:對變量之間的相關(guān)關(guān)系進(jìn)行分析(Correlate)。其中包括簡單相關(guān)分析(Bivariate)和偏相關(guān)分析(Partial)。建立因變量和自變量之間回歸模型(Regression),其中包括線性回歸分析(Linear)和曲線估計(jì)(CurveEstimation)。數(shù)據(jù)條件:參與分析的變量數(shù)據(jù)是數(shù)值型變量或有序變量。本章內(nèi)容9.1相關(guān)分析9.2偏相關(guān)分析9.3線性回歸分析9.4曲線估計(jì)9.5二項(xiàng)Logistic回歸相關(guān)分析用于測量了解變量之間的密切程度。如:教育事業(yè)的發(fā)展與科學(xué)技術(shù)的發(fā)展存在著一定的關(guān)系,學(xué)生的數(shù)學(xué)成績與物理成績存在著一定的關(guān)系,相關(guān)分析就是要分析這種密切程度。相關(guān)類型:1、直線相關(guān):兩變量呈線性共同增大,或一增一減。2、曲線相關(guān):兩變量存在相關(guān)趨勢,但非線性。此時若進(jìn)行直線相關(guān),有可能出現(xiàn)無相關(guān)性的結(jié)論,曲線相關(guān)分析是一般都先將變量進(jìn)行變量變換,以將趨勢變換為直線分析,或者采用曲線回歸方法來分析。相關(guān)的方向
依照兩種變量變動的方向分,有正相關(guān)、負(fù)相關(guān)和無相關(guān)(零相關(guān))。相關(guān)分析基本步驟:1.繪制散點(diǎn)圖2.計(jì)算相關(guān)系數(shù)3.進(jìn)行相關(guān)系數(shù)檢驗(yàn)如果兩個定量變量沒有關(guān)系,就談不上建立模型或進(jìn)行回歸。但怎樣才能發(fā)現(xiàn)兩個變量有沒有關(guān)系呢?最簡單的直觀辦法就是畫出它們的散點(diǎn)圖。下面是四組數(shù)據(jù)的散點(diǎn)圖;每一組數(shù)據(jù)表示了兩個變量x和y的樣本。第1點(diǎn)不相關(guān)正線性相關(guān)負(fù)線性相關(guān)相關(guān)但非線性相關(guān)但如何在數(shù)量上描述相關(guān)呢?下面引進(jìn)幾種對相關(guān)程度的度量。Pearson相關(guān)系數(shù)Spearman秩相關(guān)系數(shù)Kendallt
相關(guān)系數(shù)Pearson相關(guān)系數(shù)(Pearson’scorrelationcoefficient)又叫相關(guān)系數(shù)或線性相關(guān)系數(shù)。它一般用字母r表示。
它是由兩個變量的樣本取值得到,這是一個描述線性相關(guān)強(qiáng)度的量,取值于-1和1之間。當(dāng)兩個變量有很強(qiáng)的線性相關(guān)時,相關(guān)系數(shù)接近于1(正相關(guān))或-1(負(fù)相關(guān)),而當(dāng)兩個變量不那么線性相關(guān)時,相關(guān)系數(shù)就接近0。Pearson相關(guān)系數(shù)的局限性:①要求變量服從正態(tài)分布②只能度量線性相關(guān)性,對于曲線相關(guān)等更為復(fù)雜的情形,該相關(guān)系數(shù)的大小并不能代表相關(guān)性的強(qiáng)弱。如果Pearson系數(shù)很低,只能說明兩變量之間沒有線性關(guān)系,并不能說明兩者之間沒有相關(guān)關(guān)系。也就是說,該指標(biāo)只能度量線性相關(guān)性,而不是相關(guān)性。(線性相關(guān)性隱含著相關(guān)性,而相關(guān)性并不隱含著線性相關(guān)性)另外:樣本中存在的極端值對Pearson相關(guān)系數(shù)的影響極大,因此要慎重考慮和處理,必要時可以對其進(jìn)行剔出,或者加以變量變換,以避免因?yàn)橐粌蓚€數(shù)值導(dǎo)致出現(xiàn)錯誤的結(jié)論。Spearman秩相關(guān)系數(shù)
它和Pearson相關(guān)系數(shù)定義有些類似,只不過在定義中把點(diǎn)的坐標(biāo)換成各自樣本的秩(即樣本點(diǎn)大小的“座次”)。,為兩變量各自對應(yīng)的秩,為對應(yīng)的秩之差。Spearman相關(guān)系數(shù)也是取值在-1和1之間,也有類似的解釋。Spearman秩相關(guān)系數(shù)適用范圍:Spearman相關(guān)系數(shù)更多用于測量兩個有序分類變量之間的相關(guān)程度。對于適合Pearson相關(guān)系數(shù)的數(shù)據(jù)亦可計(jì)算Spearman相關(guān)系數(shù),但統(tǒng)計(jì)效能要低一些。通過它也可以進(jìn)行不依賴于總體分布的非參數(shù)檢驗(yàn)。側(cè)重于兩個分類變量均為有序分類的情況。這里的度量原理是把所有的樣本點(diǎn)配對(如果每一個點(diǎn)由x和y的秩組成的坐標(biāo)(x,y)代表,一對點(diǎn)就是諸如(x1,y1)和(x2,y2)的點(diǎn)對),然后看每一對中的x和y的的秩的觀測值是否同時增加(或減少)。比如由點(diǎn)對(x1,y1)和(x2,y2),可以算出乘積(x2-x1)(y2-y1)是否大于0;如果大于0,則說明x和y同時增長或同時下降,稱這兩點(diǎn)協(xié)同(concordant);否則就是不協(xié)同。如果樣本中協(xié)同的點(diǎn)數(shù)目多,兩個變量就更加正相關(guān)一些否則就更負(fù)相關(guān)些;如果樣本中不協(xié)同(discordant)與協(xié)同的點(diǎn)數(shù)差不過一樣多,兩個變量相關(guān)性就弱。Kendallτ
相關(guān)系數(shù)(Kendall’sτ
)Kendall’sτ統(tǒng)計(jì)量的數(shù)學(xué)定義為:Kendallτ
相關(guān)系數(shù)(Kendall’sτ
)U、V分別為協(xié)同和不協(xié)同的數(shù)目大樣本下采用的檢驗(yàn)統(tǒng)計(jì)量為:Z統(tǒng)計(jì)量近似服從標(biāo)準(zhǔn)正態(tài)分布人們可能會問,上面的三種對相關(guān)的度量都是在其值接近1或-1時相關(guān),而接近于0時不相關(guān)。到底如何才能夠稱為“接近”呢?這很難一概而論。但在計(jì)算機(jī)輸出中都有和這些相關(guān)度量相應(yīng)的檢驗(yàn)和p-值;因此可以根據(jù)這些結(jié)果來判斷是否相關(guān)畫散點(diǎn)圖Graphs→Scatter選擇散點(diǎn)圖的類型根據(jù)所選擇的散點(diǎn)圖類型,單擊Define對散點(diǎn)圖作具體定義。計(jì)算相關(guān)系數(shù)Analyze→Correlate→Bivariate選擇參加計(jì)算的變量到Variable中在CorrelationCoefficents框中選擇計(jì)算哪種相關(guān)系數(shù)在TestofSignificance框中選擇輸出單尾還是雙尾p值選擇Flagsignificancecorrelations輸出星號標(biāo)記在Options中選擇其他描述統(tǒng)計(jì)量簡單相關(guān)分析菜單簡單相關(guān)分析實(shí)例:有50個從初中升到高中的學(xué)生。有他們在初三和高一的各科平均成績(數(shù)據(jù)在highschool.sav)。要求比較初三的成績是否和高中的成績相關(guān)。練習(xí):利用數(shù)據(jù)SY-8.sav,對城鎮(zhèn)居民消費(fèi)額與人均國內(nèi)生產(chǎn)總值兩變量進(jìn)行相關(guān)分析。分析結(jié)果從運(yùn)行結(jié)果看,城鎮(zhèn)居民消費(fèi)額與人均國內(nèi)生產(chǎn)總值有很強(qiáng)的線形相關(guān)關(guān)系.本章內(nèi)容9.1相關(guān)分析9.2偏相關(guān)分析9.3線性回歸分析9.4曲線估計(jì)9.5二項(xiàng)Logistic回歸偏相關(guān)分析
簡單相關(guān)分析計(jì)算兩個變量間的相關(guān)系數(shù),分析兩個變量間線性關(guān)系的程度。往往因?yàn)榈谌齻€變量的作用,使相關(guān)系數(shù)不能真正反應(yīng)兩個變量間的線性程度。例如用簡單相關(guān)系數(shù)檢驗(yàn),可以得到肺活量與身高、體重均存在較強(qiáng)的線性關(guān)系,如果對體重相同的人,分析身高和肺活量,是否身高越高肺活量越大呢?因?yàn)樯砀吲c體重有線性關(guān)系,體重又與肺活量存在線性關(guān)系,因此,很容易得出身高與肺活量存在較強(qiáng)線性關(guān)系的錯誤結(jié)論。
偏相關(guān)分析的任務(wù)就是在研究兩個變量之間的線性相關(guān)關(guān)系時控制可能對其產(chǎn)生影響的變量。分析身高與肺活量之間的相關(guān)性,就要控制體重在相關(guān)分析中的影響。正確運(yùn)用偏相關(guān)分析,可以解釋變量間的真實(shí)關(guān)系,識別干擾變量并尋找隱含的相關(guān)性。偏相關(guān)系數(shù)的計(jì)算
控制了變量z,變量x、y之間的偏相關(guān)系數(shù)和控制了兩個變量,變量x、y之間的偏相關(guān)系數(shù)分別為
是控制了z的條件下,x、y之間的偏相關(guān)系數(shù)。是變量x、y間的簡單相關(guān)系數(shù)。偏相關(guān)系數(shù)的檢驗(yàn)
檢驗(yàn)的零假設(shè):兩個變量間的偏相關(guān)系數(shù)為0。使用t檢驗(yàn),公式如下:r是相應(yīng)的偏相關(guān)系數(shù)。n是觀測個數(shù),k是控制變量的數(shù)目,n-k-2是自由度。在SPSS的偏相關(guān)分析過程的輸出中只給出偏相關(guān)系數(shù)和假設(shè)成立的概率p值。偏相關(guān)分析的操作
與簡單相關(guān)分析操作類似,只不過菜單為Analyze→Correlate→Partial實(shí)例:利用數(shù)據(jù)相關(guān)回歸分析(高校科研研究).sav,分析發(fā)表立項(xiàng)課題數(shù)與論文數(shù)之間的偏相關(guān)關(guān)系,其中投入高級職稱的人數(shù)為控制變量。練習(xí):利用數(shù)據(jù)data10-03.sav,分析中山柏月生長量與4個氣候因素哪個因素有關(guān)。本章內(nèi)容9.1相關(guān)分析9.2偏相關(guān)分析9.3線性回歸分析9.4曲線估計(jì)9.5二項(xiàng)Logistic回歸線性回歸分析
線性回歸是統(tǒng)計(jì)分析方法中最常用的方法之一。如果所研究的現(xiàn)象有若干個影響因素,且這些因素對現(xiàn)象的綜合影響是線性的,則可以使用線性回歸的方法建立現(xiàn)象(因變量)與影響因素(自變量)之間的線性函數(shù)關(guān)系式。由于多元線性回歸的計(jì)算量比較大,所以有必要應(yīng)用統(tǒng)計(jì)分析軟件實(shí)現(xiàn)。這一節(jié)將專門介紹SPSS軟件的線性回歸分析的操作方法,包括求回歸系數(shù),給出回歸模型的各項(xiàng)檢驗(yàn)統(tǒng)計(jì)量值及相應(yīng)的概率,對輸出結(jié)果的分析等相關(guān)內(nèi)容。線性回歸模型假設(shè)條件與模型的各種檢驗(yàn)1、線性回歸的假設(shè)理論(1)正態(tài)性假設(shè):即所研究的變量均服從正態(tài)分布;(2)等方差假設(shè):即各變量總體的方差是相等的;(3)獨(dú)立性假設(shè),即各變量之間是相互獨(dú)立的;(4)殘差項(xiàng)無自相關(guān)性,即誤差項(xiàng)之間互不相關(guān),
Cov(
i,
j)=02、線性回歸模型的檢驗(yàn)項(xiàng)目(1)回歸系數(shù)的檢驗(yàn)(t檢驗(yàn))。(2)回歸方程的檢驗(yàn)(F檢驗(yàn))。(3)擬合程度判定(可決系數(shù)R2
)。(4)D.W檢驗(yàn)(殘差項(xiàng)是否自相關(guān))。(5)共線性檢驗(yàn)(多元線性回歸)。(6)殘差圖示分析(判斷異方差性和殘差序列自相關(guān))。
對初三和高一的各科平均成績這兩個變量的數(shù)據(jù)進(jìn)行線性回歸,就是要找到一條直線來適當(dāng)?shù)卮韴D中的那些點(diǎn)的趨勢。首先需要確定選擇這條直線的標(biāo)準(zhǔn)。這里介紹最小二乘回歸(leastsquaresregression)。古漢語“二乘”是平方的意思。這就是尋找一條直線,使得所有點(diǎn)到該直線的豎直距離的平方和最小。用數(shù)據(jù)尋找一條直線的過程也叫做擬合(fit)一條直線。根據(jù)計(jì)算,找到初三成績和高一成績的回歸直線。計(jì)算機(jī)輸出給出來截距(Constant)26.444和斜率(變量j3的系數(shù))0.651。截距=26.444;斜率=0.651這個直線實(shí)際上是對所假設(shè)的下面線性回歸模型的估計(jì)(這里的e
是隨機(jī)誤差):我們得到的截距和斜率(26.444和0.651)是對b0和b1的估計(jì)。由于不同的樣本產(chǎn)生不同的估計(jì),所以估計(jì)量是個隨機(jī)變量,它們也有分布,也可以用由他們構(gòu)造檢驗(yàn)統(tǒng)計(jì)量來檢驗(yàn)b0和b1是不是顯著。拿回歸主要關(guān)心的來說,假設(shè)檢驗(yàn)問題是計(jì)算機(jī)輸出也給出了這個檢驗(yàn):t檢驗(yàn)統(tǒng)計(jì)量為9.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年鎮(zhèn)江教資面試題及答案
- 2025年足球集訓(xùn)面試試題及答案
- 2025年森林管護(hù)員考試題及答案
- 2025年綜合保障面試試題及答案
- 2025年無人艇技術(shù)測試題及答案
- 2025年初訓(xùn)電焊考試試題及答案
- 2025年數(shù)獨(dú)考試試題及答案
- 2025年蛋仔搗蛋鬼試題及答案
- 2025年專題九測試題及答案
- 2025年近期口腔考試題及答案
- 2023年江蘇省無錫市中考模擬英語試卷(附答案)
- 北京市新英才學(xué)校教職員工手冊
- 金融市場學(xué)-張亦春-第三版-10
- 帶電核相試驗(yàn)報告
- 腎單位的結(jié)構(gòu)(課堂PPT)
- 春季常見傳染病預(yù)防知識PPT課件
- VDA2供貨質(zhì)量保證培訓(xùn)PPT課件
- 變壓器油現(xiàn)場取樣和試驗(yàn)要求總表
- 折疊紙盒結(jié)構(gòu)設(shè)計(jì)
- 軋機(jī)安裝方案
- 教師教學(xué)常規(guī)工作檢查記錄表
評論
0/150
提交評論