線性回歸方程中的相關(guān)系數(shù)r教學文案_第1頁
線性回歸方程中的相關(guān)系數(shù)r教學文案_第2頁
線性回歸方程中的相關(guān)系數(shù)r教學文案_第3頁
線性回歸方程中的相關(guān)系數(shù)r教學文案_第4頁
線性回歸方程中的相關(guān)系數(shù)r教學文案_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

線性回歸方程中的相

關(guān)系數(shù)r精品文檔線性回歸1.1線性回歸的基本概念線性IE歸分析是描述一個閃變量(或稱為響應(yīng)變量.dependentvfiriable)Y與一個或多個自變量向於pendentvai-iabk)X間的線性依存關(guān)系“根據(jù)目變量數(shù)目的不同可分為一九線性回歸(同有-4白變皆)和落而線性回歸(有兩個里兩個以上.的自強量K一元線性回歸;.一正線性回歸的基本概念直線回歸分析的任翳就是根據(jù)若干個觀測(如yji=l±-n找出描述兩個變心X、y之間關(guān)系的直線回歸方程,=計取,其中產(chǎn)是變量y的估計值“求直踐回歸方程y*=a+bx,實際上是用回歸有線擬臺散點圖中的各聊測點,常用的方法是最小二乘法。也就是使該苴線與各點的縱向垂直距離最小,即使實刑值y與回歸直線之差的平方和達到最小.也稱為剩余(理屋)平方和,因此求回歸方程的問題,歸根到底就是求對取得最小伙HLa和b的問題,司稱為裁距,卜為回歸宜線的斜率,也稱回歸系數(shù)。.一元線性回歸方程的假設(shè)理論德國數(shù)學冢高斯提出JF個假設(shè)理論,滿足這些假設(shè)的線性回歸模型稱為占典線性模型工(1)正態(tài)性假謾.假設(shè)隨機誤片項口:1驟從均值為零、方尤為6,的正態(tài)分布.(2)等方差件假設(shè)■:它假改對于所有的心口的條件方差同為后\且6為常數(shù)c即Vat'C£,/xi)=6工。)獨立性假設(shè)“即零均值假設(shè),它假設(shè)在給定密的條件下,Ej的條件期望值為零,即E(tA仇(4)無白相關(guān)也假設(shè)隨機誤差項t:曲逐次觀察值互不相關(guān),即dnCi,門回評小5)e與x的不相關(guān)性,假設(shè)隨機誤差項?與相應(yīng)的自變量與對因變量y的影響相互獨立,換言之,兩者對因變鼠¥的影響是可以區(qū)分的1;即Cqv(e?幻二心.一元線性網(wǎng)歸方程的檢險根據(jù)原始數(shù)據(jù),求出網(wǎng)歸方程后就需要對回歸方程進行檢臉.檢驗的假設(shè)是總體回歸系數(shù)為仇另外要檢臉回歸方程對因變量的預(yù)測效果如何口(1)回歸系數(shù)的顯著性檢胎?對敘率的槍臉,假設(shè)是:總體回歸系數(shù)為3?對裁距的椅臉,假設(shè)是:總體回歸方程截距苜=0.(QR2判定系數(shù)在判定一個線性回歸直統(tǒng)的擬合優(yōu)度的好壞時,出系數(shù)是一個重要的判定指標,從公式可以得到判定系數(shù)等于回歸平方和在總平方和中所占的比率,即屋體現(xiàn)了回歸模型所能解彈的因變量變異性的百分比,如果KM,775,則說明變量¥的變異中有77,5%是由變量K引起的。當R、1時,表示所有的規(guī)刑點全部落在回歸直線.匕當Rj時,表示自變量與因變量無線性關(guān)系.為了盡可■能準確的反應(yīng)模型的擬合度fSPSS輸出中的AdjuredRSquare是消除了白收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除精品文檔變量個數(shù)影響的好的修正值.(打方差分析體現(xiàn)因變易觀測值與均值之間的差異的偏差平方和翼t是由兩個部分組成的,即回歸平方和SS「它們反應(yīng)了百變量X的雨要程度;殘差平方和0工,它反應(yīng)了實驗誤差以及其他意外因素對賣雁結(jié)果的第響口表示為;*&=£&+£%這兩部分除以各自的自由度,得到它們的均方,統(tǒng)計呈白回回均方/殘差均方,當F值太大時,拒絕接受b=0的假設(shè).4)Diu,bui-Watson檢驗在對回歸模型的診斷中,有一個非常重要的回歸模型假設(shè)需要診斷,那就是回歸模型中的誤差項的獨立性,如果誤差師不獨立,那么對回歸模型的任何估計與假設(shè)所作出的結(jié)論都是不可靠的g其參數(shù)稱為D中或口dD的取值范闈是WD<4,它的統(tǒng)計學意義如卜:當殘差與自變量互為獨立時,D、2g當相鄰兩點的殘差為正相關(guān)時tEKK當相鄰兩點的殘卷為負相關(guān)時『D>2,⑸強差圖示法,在直角坐標系中,以預(yù)測值為區(qū)]橫軸.以y與之間區(qū)的誤差備為縱軸(或?qū)W生化殘差與擬和值或一個自變量為縱軸),繪制殘差的散點圖.如果散點呈現(xiàn)出明顯的規(guī)律性,則認為存在自相關(guān)性或者汴線性或者非常數(shù)方差的問題口這樣需要對數(shù)據(jù),因變量或門變量進行變換「如果散點呈現(xiàn)隨機分布,斜率為零,則認為門相關(guān)存在的可能性不大,獨立性假設(shè)成立.妥元線性回歸.多元線性回歸的基本概念根據(jù)多個自變量的最優(yōu)組合建立回歸方程來列I測因變量的回歸分析稱為多元回歸分折?多元回歸分析的模型為:》吊=如+5工1+電\2+…-bnXDq其中y*型為根據(jù)所有自變量X計算出的估計值.。為常數(shù)項.b1、電...上稱為¥對應(yīng)于的、X}..七的偏回歸系數(shù)。偏回歸系數(shù)表示假設(shè)在其他所有自變量不變的情況下,某一個白變量變化引起因變量變化的比率q多兀線性回回模型也必須滿足一兒線性回打中所述的假設(shè)理詒,.崟元線性回歸分析中的參數(shù)(1)夏相關(guān)系數(shù)風復(fù)相關(guān)系數(shù)表不自在量x與其他的因變量見之間線性相關(guān)密切程搜的指標,復(fù)相關(guān)系數(shù)使用字母R表示.京相關(guān)系數(shù)的取值范闈在。之間,其值越接近L表示其線性關(guān)系越強,而其值越接近以表示淺性關(guān)系越差.(分標判定系數(shù)與經(jīng)調(diào)整的判定系數(shù)與一元回歸方程相同,在多幾回歸中也使用判定系數(shù)R?來解釋回歸模型中口變量的變異在因變量變異中所占比率4但是,判定系數(shù)的值隨著進入回歸方程的自變量的個數(shù)(或樣本容量的大小加的博加而增大,因此,為了消除白變量的個數(shù)以及樣本量的大小對判定系數(shù)的影響,引進了經(jīng)調(diào)到的判定系數(shù)(AdjustedRSquare)線性回歸方程中的相關(guān)系數(shù)1r=E(Xi-X的平均數(shù))(Yi-Y平均數(shù))/根號下[£(Xi-X平均數(shù))八2*£(Yi-Y平均數(shù)廠2]收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除精品文檔1“X、"-門 e_L _--?…產(chǎn)一無產(chǎn)R2就是相關(guān)系數(shù)的平方,R在一元線性方程就直接是因變量自變量的相關(guān)系數(shù),多元則是復(fù)相關(guān)系數(shù)判定系數(shù)爐2也叫擬合優(yōu)度、可決系數(shù)。表達式是:RA2=ESS/TSS=1-RSS/TSS該統(tǒng)計量越接近于1,模型的擬合優(yōu)度越高。問題:在應(yīng)用過程中發(fā)現(xiàn),如果在模型中增加一個解釋變量,R2往往增大這就給人一個錯覺:要使得模型擬合得好,只要增加解釋變量即可?!?,現(xiàn)實情況往往是,由增加解釋變量個數(shù)引起的R2的增大與擬合好壞無關(guān),R2需調(diào)整。這就有了調(diào)整的擬合優(yōu)度:R1A2=1-(RSS/(n-k-1))/(TSS/(n-1))在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個數(shù)對擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度,n-1為總體平方和的自由度??偸莵碚f,調(diào)整的判定系數(shù)比起判定系數(shù),除去了因為變量個數(shù)增加對判定結(jié)果的影響。R=R接近于1表明Y與X1,X2,…,Xk之間的線性關(guān)系程度密切;R接近于0表明Y與X1,X2,…,Xk之間的線性關(guān)系程度不密切相關(guān)系數(shù)就是線性相關(guān)度的大小,1為(100%)絕對正相關(guān),0為0%,-1為(100%)絕對負相關(guān)相關(guān)系數(shù)絕對值越靠近1,線性相關(guān)性質(zhì)越好,根據(jù)數(shù)據(jù)描點畫出來的函數(shù)-自變量圖線越趨近于一條平直線,擬合的直線與描點所得圖線也更相近。如果其絕對值越靠近0,那么就說明線性相關(guān)性越差,根據(jù)數(shù)據(jù)點描出的圖線和擬合曲線相差越遠(當相關(guān)系數(shù)太小時,本來擬合就已經(jīng)沒有意義,如果強行擬合一條直線,再把數(shù)據(jù)點在同一坐標紙上畫出來,可以發(fā)現(xiàn)大部分的點偏離這條直線很遠,所以用這個直線來擬合是會出現(xiàn)很大誤差的或者說是根本錯誤的)。分為一元線性回歸和多元線性回歸線性回歸方程中,回歸系數(shù)的含義一元:YA=bX+ab表示X每變動(增加或減少)1個單位,Y平均變動(增加或減少)b各單位多元:YA=b1X1+b2X2+b3X3+a在其他變量不變的情況下,某變量變動1單位,引起y平均變動收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除精品文檔以b2為例:b2表示在XI、X3(在其他變量不變的情況下)不變得情況下,X2每變動1單位,y平均變動b2單位就一個reg來說y=a+bx+ea+bx的誤差稱為explainedsumofsquaree的誤差是不能解釋的是residualsumofsquare總誤差就是TSS所以TSS=RSS+ESS判定系數(shù)也叫擬合優(yōu)度、可決系數(shù)。表達式是RSSTSSTSSTSS該統(tǒng)計量越接近于1,模型的擬合優(yōu)度越高。問題:在應(yīng)用過程中發(fā)現(xiàn),如果在模型中增加一個解釋變量,R2往往增大這就給人一個錯覺:要使得模型擬合得好,只要增加解釋變量即可?!?,現(xiàn)實情況往往是,由增加解釋變量個數(shù)引起的R2的增大與擬合好壞無關(guān),R2需調(diào)整。這就有了調(diào)整的擬合優(yōu)度IT=11RSS/(n-k-l)IT=1TSS/(r?-1)在樣本容量一定的情況下,增加解釋變量必定使得自由度減少,所以調(diào)整的思路是:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個數(shù)對擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度,n-1為總體平方和的自由度。總是來說,調(diào)整的判定系數(shù)比起判定系數(shù),除去了因為變量個數(shù)增加對判定結(jié)果的影響。收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除精品文檔順便補充一下:記出SNa-可總離差平方和ESS4(工—可回歸平方和Rss=X區(qū)-工產(chǎn)剩余平方和一般做回歸的時候要求擬合優(yōu)度(實際值與擬合值相關(guān)系數(shù)的平方)越高越好,可以通過增加解釋變量來實現(xiàn),可是解釋變量多了后很多解釋變量的系數(shù)T檢驗不顯著了,而且增加很多變量后模型的自由度就減少了,這些情況狂的存在往往使得模型預(yù)測不精確;修正擬合優(yōu)度就是將殘差平方和跟總離差平方和分別除以各自的自由度,這樣就剔除了變量個數(shù)對其影響了。首先有一個恒等式:TSS=ESS+RSS即總偏差平方和=回歸平方和+殘差平方和通常情況,我們都是討論解釋變量對總效應(yīng)的貢獻,使用一個叫“擬合優(yōu)度”(或者叫“判定系數(shù)”)的指標其定義為:回歸平方和/總偏差平方和=ESS/TSS=(TSS-RSS)/TSS=(923-325)/923如果說隨機誤差對總效應(yīng)的貢獻,那可以直接RSS/TSS因為1-(TSS-RSS)/TSS就可以化為RSS/TSS收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除精品文檔0)零階相關(guān)系數(shù),部分相關(guān)與偏相關(guān)系數(shù)這里的零階相關(guān)系數(shù)gaSrd也計算所有自變量與內(nèi)變量之間的簡單相關(guān)關(guān)系■:部分相關(guān)(PE匚口1世山加]])表示:在排除了其他自變量對兩的影響后,當-一個白變量進入回歸方程模型后,復(fù)相關(guān)系數(shù)的平方增加量.偏相關(guān)系數(shù)(PartialCoirelatiw)表示;在排除了其他變量的影響后,自變量聞與因變Ry之間的和美程度,部分相關(guān)系數(shù)小于偏相關(guān)系數(shù)偏相關(guān)系數(shù)也可.以用來作為篩選自變量的指標,即通過比較偏相關(guān)系數(shù)的大小來判別哪些變量對因變呈具有較大的影響力.3.多元線性回歸分析的檢臉建立了?“回歸方程后,需要進行顯著性檢驗,以確認建立的數(shù)學模型是否很好的擬合了原始數(shù)據(jù),即該回歸方程是否有效。利用殘差分析,確定回歸方程是否違反了假設(shè)理論,對各自變喧進行檢驗,其假設(shè)是總體的月1歸方程自變用系數(shù)或常數(shù)項為必以便在回歸方程中保留對因變量y值預(yù)測更有效的自變量,以便確定數(shù)學模型是否有效。(1)方差分析與一元回歸方程的椅臉相同,多元回歸方程也采用方差分析方法對回歸方程進行檢縫,檢驗的假設(shè)是總體的回歸系數(shù)均為0或不都為去0,它是對整個回歸方程的顯著性檢驗口使用統(tǒng)計量F進行檢胺-原理與一元回歸的方程分析原理相同。(2)偏回歸系數(shù)與常數(shù)項的檢驗檢盟的假設(shè)是;各自變討回歸系數(shù)為以常數(shù)項為零■:它使用的統(tǒng)同值是Jt=偏回歸系數(shù)/偏回歸系數(shù)的標準誤。G)方差齊性檢驗,確定相關(guān)性SPSS中pearson(皮爾遜相關(guān)系數(shù))看r值還是P,確定相關(guān)性兩個值都要看,r值表示在樣本中變量間的相關(guān)系數(shù),表示相關(guān)性的大?。籶值是檢驗值,是檢驗兩變量在樣本來自的總體中是否存在和樣本一樣的相關(guān)性。SPSS回歸系數(shù)SIG在SPSS軟件統(tǒng)計結(jié)果中,不管是回歸分析還是其它分析,都會看到“SIG”,SIG=signficance,意為“顯著性”,后面的值就是統(tǒng)計出的P值,如果P值0.01<P<0.05,則為差異顯著,如果P<0.01,則差異極顯著sig是指的的顯著性水平,就是p值,一般來說接近0.00越好,過大的話只能說不顯著,sig是F檢驗的結(jié)果,<0.01代表方程通過檢驗,進行回歸分析是有效的F表示數(shù)據(jù)的方差,sig表示顯著性,也就是對F檢驗的結(jié)果,如果sig>0.05則說明模型受誤差因素干擾太大不能接受。R是復(fù)相關(guān)系數(shù),表示觀測值和模型描述值之間的線性相關(guān)系數(shù),越大越好。R方通俗的說就是解釋率,就是說你的自變量能夠解釋多少因變量的變化。具體到你這個就是模型不能接受,自變量解釋了22.1%,剩下的只能用誤差解釋。spss軟件的線性回歸分析中,輸出了一個anova表,表中的回歸■殘差、平方和、df,均方■F.sig分別代表什么收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除精品文檔回歸是方法殘差是實測與預(yù)計值的差值平方和有很多個,不同的平方和的意思不一樣df是自由度均方是方差除以自由度f是f分布的統(tǒng)計量sig是p值anova表中的“回歸平方和”表示反應(yīng)變量的變異中的回歸模式中所包含的自變量所能解釋的部分?!皻埐钇椒胶汀贝矸磻?yīng)變量的變異中沒有被回歸模型所包含的變量解釋的部分。這兩個值與樣本量及模型中自變量的個數(shù)有關(guān),樣本量越大,相應(yīng)變異就越大。df是自由度,是自由取值的變量個數(shù),F(xiàn)為F檢驗統(tǒng)計量,用于檢驗該回歸方程是否有意義,當Sig對應(yīng)的值小于0.05(當顯著性水平為0.05時)時,說明所建立的回歸方程具有統(tǒng)計學意義,即自變量和因變量之間存在線性關(guān)系。多元線性回歸分析中,1檢驗與F檢驗有何不同t檢驗常能用作檢驗回歸方程中各個參數(shù)的顯著性,而f檢驗則能用作檢驗整個回歸關(guān)系的顯著性。各解釋變量聯(lián)合起來對被解釋變量有顯著的線性關(guān)系,并不意味著每一個解釋變量分別對被解釋變量有顯著的線性關(guān)系F檢驗主要是檢驗因變量同多個自變量的整體線性關(guān)系是否顯著,在k個自變量中,只要有一個自變量同因變量的線性關(guān)系顯著,t檢驗則是對每個回歸系數(shù)分別進行單獨的檢驗,以判斷每個自變量對因變量的影響是否顯著。收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除精品文檔方差齊性是指殘差的分布是常數(shù),與預(yù)測變量或因變量無關(guān)。即殘差應(yīng)隨機的分布在一條穿過0點的水平直線的兩側(cè)“在實際應(yīng)用中,一般是繪制因變境制測值與學生.殘差的散點圖,在線性回歸Plots對話框中的源變量表中,選擇&REEID1學生氏殘差)做Y軸;選擇ZPRED(標推化預(yù)測值)做X軸就可以在執(zhí)行后的輸出信息中顯示檢臉方是齊性的散點圖《(4)回歸模型殘差的正態(tài)性檢驗檢監(jiān)的方法多種多樣,其中最直觀,最簡單的方法是殘兼的直方圖和累積概率圖c需要指出的是,希里殘差'完全服從于正態(tài)分布也是不現(xiàn)宴的,即使存在很理想的總體數(shù)據(jù),樣本的殘差的分布也只能是近似于正態(tài)分布+?殘差的官方圖。在Plas子對話椎門,選擇H說06m選擇項就可以得到殘差的直方圖.?殘差的累積概率圖(P-P圖)0P-P圖是一種概率分布圖,它是用來判斷一個變量的分布是否符合一個特定的“檢測分布'這個檢涮分布包括:Beta分布「Chi-square分布jExponential分布,Gamma分布+Half-nomial分布卜Lapki"分布/Logistic分布,L典normal分布rNonml分布,Pamo分布,StudeiH“分布,Weibull分布*Unifonii分布t如果兩種分布基本相同.那么在P?P圖中的點應(yīng)該圍繞在一條斜線的周圍,如果兩種分布完全相同,那么在P-P圖中應(yīng)讀只有一條斜線.通過觀察比較觀測數(shù)據(jù)的殘差(曲線)在假設(shè)直線(■正態(tài)分布)周圍的分布可以對兩種分?布進行比較,[5)殘差圖示法利用殘差圖可以判斷模型擬合效果。在殘差圖中,如果各點呈隨機狀,并絕大部分落在±26范圍(68%的點落在匕6之中?96%的點落在±26之中)內(nèi).說明模型對于數(shù)據(jù)的擬合效果較好,如果大部分點落在LT6范圍之外,說明模型對于數(shù)據(jù)的擬合效果不好e計算結(jié)果肺活量例子收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除

精品文檔表10T引入或剔除的變旱ModelVariablesEnteitdVariabksRemovedMethod1體重.Entera.Allreqneitidvariabk^enteredb.DupcjidcntVariahl:二月市活量表10Y模型摘要ModelRRSquareAdjustedRSquareStd.ErroroftheEsriiiiatc17491.56251£.287Sa.PTedimTS(Can§tan“體重表10-3方差分析ModelSimiof^quarc4dfMeanSqiiaieFSia.]Reare4sicuiResidualTotal1061,8281.SS9L101110618.JE-0212.S2,005aa.Pied訕體重b.DependentUmrinblc:岫活量表10-4回歸系數(shù)MocklUcist3ndardizcdCocfficiaitsStaiidardiizcdCocfificicnrstSij.BStcLEmsrBela1(Consrant)4.13OE-O4815.0011.000體重5.88SE-02.016.749J.5S0JOOSa,DtpcudciitVaiiablc沛活量結(jié)果分析如下:表1(M:引入或剔除的變量fVaTiableEntered/Reinovecl)?用強迫引入法(Emer萬變量引體重:)被弓隊。表1仇"模型摘要(M<xklSiimtnafy):相關(guān)系數(shù)出尸0:4九判定系數(shù)(RSquare,R1尸。一56,調(diào)整判定系數(shù)(Adju業(yè)dRSquare)=0L518,估計值的標準誤(Std,En-oioftheEstiniate)^0.287B)D表IO#:方差分析(ANOVA);回歸的均方fRegre由ou-MEanSqi團電戶L06L剩余的均方(ReHidiicilNfeaiiSqi]are)=O.DS28,F=12莖17、P^0,0054可認為變址X和Y之間有宜線關(guān)系.表1(M:回歸分析中的系數(shù)(Cwffiu把m$):常數(shù)項(Coa5tani)=0,000413W”I系贊但尸以05gg1回歸系?數(shù)的標準誤£11燈。=0.016、標準化回歸系數(shù)(Bga)=0;4孔回回系數(shù)t檢驗的t值=338,DO8(與方差分析一致)「可認為回歸系數(shù)有顯著意義。得直線回歸方程為:尸0,000413旬.05魂3心對數(shù)據(jù)標準化,即將原始數(shù)據(jù)減去相應(yīng)變量的均數(shù)后再除以該變量的標準差,計算得到的回歸方程稱為標準化回歸方程,相應(yīng)得回歸系數(shù)為標準化回歸系數(shù)。標準化回歸系數(shù)(Beta值)在多元回歸中被用來比較變量間的重要性收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除 精品文檔 B是指回歸系數(shù),beta是指標準回歸系數(shù),beta二B/S(B),beta是用來比較各個系數(shù)之間的絕對作用或者貢獻的大小,B值是不能判斷的絕對貢獻的。t值是對該回歸系數(shù)B做假設(shè)檢驗的結(jié)果,P值小于0.05才可以認為有意義,但是具體問題要具體分析,有的時候要考慮交互作用等常數(shù)項為負p值0.04,拒絕常數(shù)項為0的假設(shè),統(tǒng)計顯著,沒問題betacoefficient就是標準回歸系數(shù),它是首先把各個自變量進行Z轉(zhuǎn)換(數(shù)據(jù)值-數(shù)據(jù)平均值然后除以標準差)之后再進行回歸,此時得出的回歸系數(shù)稱為標準化回歸系數(shù)。Z轉(zhuǎn)換可以把各個自變量的數(shù)級、量綱統(tǒng)一標準化,也就可以根據(jù)標準化回歸系數(shù)的大小比較出各個自變量在回歸方程中的效應(yīng)大小。標準回歸系數(shù)standardizedregressioncoefficient或standardregressioncoefficient消除了因變量丫和自變量x1,x2,???xn所取單位的影響之后的回歸系數(shù),其絕對值的大小直接反映了xi對y的影響程度計算方法對數(shù)據(jù)標準化,即將原始數(shù)據(jù)減去相應(yīng)變量的均數(shù)后再除以該變量的標準差,計算得到的回歸方程稱為標準化回歸方程,相應(yīng)得回歸系數(shù)為標準化回歸系數(shù)。公式若假定回歸方程的形式如下:Y=b0+b1X1+b2X2+...+bjXj+...+bJXJ(Y是估計值)其中,回歸參數(shù)b0,b1,…,bJ通過最小二乘法求得。則標準化回歸系數(shù)bj'=bj*(Xj的標準差/Y的標準差)理解方法標準化回歸系數(shù)(Beta值)在多元回歸中被用來比較變量間的重要性。但是由于重要性這一詞意義的含糊性,這一統(tǒng)計常被誤用。有時人們說重要性,是指同樣的條件下,哪一個東西更有效。在提高教學質(zhì)量上,是硬件條重要還是師資更重要?如果是師資更重要,那么同樣的物力投在師資上就可以更快地提高教學質(zhì)量。但是這里要比較的兩者必須有同樣的測量單位,如成本(元)。如果變量的單位不同,我們不能絕對地說那個變量更重要。不同單位的兩個東西是不能絕對地比出高低輕重來。要想進行絕對地比較,就需要兩個東西有著共同的測度單位,否則無法比較。而標準化回歸系數(shù)說的重要性則與上面的意義不同,這是一種相對的重要性,與某一特定的情況下,自變量間的離散程度有關(guān)。比如說,雖然我們不能絕對地說出教育和年資在決定收入上那一個一定是重要的,但如果現(xiàn)在大家的教育程度比較相似,那么在收入的決定上,工作年數(shù)就是決定因素;反之,如果工作年數(shù)沒有太大區(qū)別,那么教育就成為了重要原因。這里的重要性是相對的,是根據(jù)不同情況而改變的。再舉一個通俗的例子,研究者研究的是遺傳因收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除精品文檔素和后天因素對于人成長的影響。那么在一個社會境遇懸殊巨大的環(huán)境中,有人在貧民窟成長,有人在貴族學校上學,那么我們會發(fā)現(xiàn)人格的大部分差異會從后天環(huán)境因素得到解釋,而遺傳的作用就相對較小;相反,如果兒童都是在一個相差不大的環(huán)境中長大的,你會發(fā)現(xiàn),遺傳會解釋大部分的人格差異。這種意義上的重要性,不僅與這一自變量的回歸系數(shù)有關(guān)系,而且還與這個自變量的波動程度有關(guān)系:如果其波動程度較大,那么就會顯得較為重要;否則,就顯得不太重要。標準化回歸系數(shù)正是測量這種重要性的。從標準化回歸系數(shù)的公式中也可看出,Beta值是與自變量的標準差與成正比的,自變量波動程度的增加,會使它在這一具體情況下的重要性增加。但是如果將兩種重要性混同,就會得到誤導性結(jié)論。如環(huán)境因素的Beta值比遺傳因素的Beta值大,就認為在個體的人格發(fā)展上應(yīng)更注意環(huán)境因素,而輕視遺傳因素,在目前對于Beta值的錯誤觀念非常流行,甚至是一些高手中。標準化回歸系數(shù)的比較結(jié)果只是適用于某一特定環(huán)境的,而不是絕對正確的,它可能因時因地而變化。舉例來說,從某一次數(shù)據(jù)中得出,在影響人格形成的因素中,環(huán)境因素的Beta值比遺傳因素的Beta值大,這只能說明數(shù)據(jù)采集當時當?shù)氐那闆r,而不能加以任何不恰當?shù)耐普摚荒芙^對地不加任何限定地說,環(huán)境因素的影響就是比遺傳因素大。事實上,如果未來環(huán)境因素的波動程度變小,很可能遺傳因素就顯得更為重要。數(shù)據(jù)的情況千差萬別,變量的相對重要性也可能完全不同但都符合當時的實際情況。F是組方差值,sig是差異性顯著的檢驗值,該值一般與0.05或0.01比較,若小于0.05或者0.01則表示差異顯著df是自由度一般的sig沒有特別注明的都是指雙側(cè)檢驗,如果特別注明有單側(cè),那就是單側(cè)的所謂雙側(cè)的意思是有可能在大于,有可能小于的,而單側(cè)的意思是只有一邊或者大于,或者小于的關(guān)于求法還是看相關(guān)統(tǒng)計學教材吧里面講起來比較復(fù)雜你的分析結(jié)果有T值,有sig值,說明你是在進行平均值的比較。也就是你在比較兩組數(shù)據(jù)之間的平均值有沒有差異。從具有t值來看,你是在進行T檢驗。T檢驗是平均值的比較方法。T檢驗分為三種方法:.單一樣本t檢驗(One-samplettest),是用來比較一組數(shù)據(jù)的平均值和一個數(shù)值有無收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除精品文檔差異。例如,你選取了5個人,測定了他們的身高,要看這五個人的身高平均值是否高于、低于還是等于1.70m,就需要用這個檢驗方法。.配對樣本t檢驗(paired-samplesttest),是用來看一組樣本在處理前后的平均值有無差異。比如,你選取了5個人,分別在飯前和飯后測量了他們的體重,想檢測吃飯對他們的體重有無影響,就需要用這個t檢驗。注意,配對樣本t檢驗要求嚴格配對,也就是說,每一個人的飯前體重和飯后體重構(gòu)成一對。.獨立樣本t檢驗(independentttest),是用來看兩組數(shù)據(jù)的平均值有無差異。比如,你選取了5男5女,想看男女之間身高有無差異,這樣,男的一組,女的一組,這兩個組之間的身高平均值的大小比較可用這種方法??傊?,選取哪種t檢驗方法是由你的數(shù)據(jù)特點和你的結(jié)果要求來決定的。t檢驗會計算出一個統(tǒng)計量來,這個統(tǒng)計量就是t值,spss根據(jù)這個t值來計算sig值。因此,你可以認為t值是一個中間過程產(chǎn)生的數(shù)據(jù),不必理他,你只需要看sig值就可以了。sig值是一個最終值,也是t檢驗的最重要的值。sig值的意思就是顯著性(signficance),它的意思是說,平均值是在百分之幾的幾率上相等的。一般將這個sig值與0.05相比較,如果它大于0.05,說明平均值在大于5%的幾率上是相等的,而在小于95%的幾率上不相等。我們認為平均值相等的幾率還是比較大的,說明差異是不顯著的,從而認為兩組數(shù)據(jù)之間平均值是相等的。如果它小于0.05,說明平均值在小于5%的幾率上是相等的,而在大于95%的幾率上不相等。我們認為平均值相等的幾率還是比較小的,說明差異是顯著的,從而認為兩組數(shù)據(jù)之間平均值是不相等的。總之,只需要注意sig值就可以了。T值表示的是t值檢驗sig是檢驗值一般不用看T值,只看sig的值是否小于0.05.如果是,說明通過檢驗了,說明兩者在總體中存在相關(guān)關(guān)系。如果你是做論文用下這樣的統(tǒng)計,只需了解這些就可以了。T值是t檢驗得出來的檢驗結(jié)果,t檢驗是一種差異性的檢驗,用于二組正態(tài)分布的數(shù)值形變量的檢驗,是一種差異性檢驗,檢驗二組是否存在差別。其值越大,差異越顯著。SIG是統(tǒng)計中用的P值,是根據(jù)T值的大小查表得出來的數(shù)值,他一般與0.05進行比較,小于0.05認為二組的差別顯著,大于0.05則差別不顯著。收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除精品文檔R表示的是擬合優(yōu)度,它是用來衡量估計的模型對觀測值的擬合程度。它的值越接近1說明模型越好。但是,你的R值太小了。T的數(shù)值表示的是對回歸參數(shù)的顯著性檢驗值,它的絕對值大于等于ta/2(n-k)(這個值表示的是根據(jù)你的置信水平,自由度得出的數(shù)值)時,就拒絕原假設(shè),即認為在其他解釋變量不變的情況下,解釋變量X對被解釋變量Y的影響是顯著的。F的值是回歸方程的顯著性檢驗,表示的是模型中被解釋變量與所有解釋變量之間的線性關(guān)系在總體上是否顯著做出推斷。若F>Fa(k-1,n-k),則拒絕原假設(shè),即認為列入模型的各個解釋變量聯(lián)合起來對被解釋變量有顯著影響,反之,則無顯著影響。單尾雙尾檢測通常假設(shè)檢驗的目的是兩總體參數(shù)是否相等,以兩樣本均數(shù)比較為例,無效假設(shè)為兩樣本所代表的總體均數(shù)相等;備擇假設(shè)為不相等(有可能甲大于乙,也有可能甲小于乙)既兩種情況都有可能發(fā)生.而研究者做這樣的假設(shè)說明(1)他沒有充分的理由判斷甲所代表的總體均數(shù)會大于乙的或甲的會小于乙的;(2)他只關(guān)心甲乙兩個樣本各自所代表的總體均數(shù)是否相等?至于哪個大不是他關(guān)心的問題.這時研究者往往會采用雙側(cè)檢驗.如果研究者從專業(yè)知識的角度判斷甲所代表的總體均數(shù)不可能大于(或小于)乙的,這時一般就采用單側(cè)檢驗.例如:要比較經(jīng)常參加體育鍛煉的中學男生心率是否低于一般中學男生的心率,就屬于單側(cè)檢驗.因為根據(jù)醫(yī)學知識知道經(jīng)常鍛煉的中學男生心率不會高于一般中學男生,因此在進行假設(shè)檢驗時應(yīng)使用單側(cè)檢驗.單尾檢驗和雙尾檢驗的區(qū)別在于他們拒絕H0的標準。單尾檢驗允許你在差異相對較小時拒絕H0,這個差異被規(guī)定了方向。另一方面,雙尾檢驗需要相對較大的差異,這個差異不依賴于方向。所有的研究者都同意單尾檢驗與雙尾檢驗不同。一些研究者認為,雙尾檢驗更為嚴格,比單尾檢驗更令人信服。因為雙尾檢驗要求更多的證據(jù)來拒絕H0,因此提供了更強的證據(jù)說明處理存在效應(yīng)。另一些研究者傾向于使用單尾檢驗,因為它更為敏感,即在單尾檢驗中相對較小的處理效應(yīng)也可能是顯著的,但是,它可能不能達到雙尾檢驗的顯著性要求。那么我們是應(yīng)該使用單尾檢驗還是雙尾檢驗??通常,雙尾檢驗被用于沒有強烈方向性期望的實驗研究中,或是存在兩個可競爭的預(yù)測時。例如,當一種理論預(yù)測分數(shù)增加,而另一種理論預(yù)測分數(shù)減少時,應(yīng)當使用雙尾檢驗。應(yīng)當使用單尾檢驗的情況包括在進行實驗前已經(jīng)有方向性預(yù)測,或強烈需要做出方向性預(yù)測時。Ho假設(shè)檢驗(HypothesisTesting)假設(shè)檢驗是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法。其基本原理是先對總體的特征作出某種假設(shè),然后通過抽樣研究的統(tǒng)計推理,對此假設(shè)應(yīng)該被拒絕還是接受作出推斷。生物現(xiàn)象的個體差異是客觀存在,以致抽樣誤差不可避免,所以我們不能僅憑個別樣本的值來下結(jié)論。當遇到兩個或幾個樣本均數(shù)(或率)、樣本均數(shù)(率)與已知總體均數(shù)(率)有大有小時,應(yīng)當考慮到造成這種差別的原因有兩種可能:一是這兩個或幾個樣本均數(shù)(或率)來自同一總體,其差別僅僅由于抽樣誤差即偶然性所造成;二是這兩個或幾個樣本均數(shù)(或率)來自不同的總體,即其差別不僅由抽樣誤差造成,而主要是由實驗因素不同所引起的。假收集于網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系管理員刪除精品文檔設(shè)檢驗的目的就在于排除抽樣誤差的影響,區(qū)分差別在統(tǒng)計上是否成立,并了解事

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論