直線相關(guān)與直線回歸分析_第1頁
直線相關(guān)與直線回歸分析_第2頁
直線相關(guān)與直線回歸分析_第3頁
直線相關(guān)與直線回歸分析_第4頁
直線相關(guān)與直線回歸分析_第5頁
已閱讀5頁,還剩66頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

直線相關(guān)與直線回歸分析1第1頁,課件共71頁,創(chuàng)作于2023年2月學(xué)習(xí)目標(biāo)1.說出直線相關(guān)與直線回歸的概念;2.說出等級(jí)相關(guān)的適用范圍;3.能計(jì)算直線相關(guān)系數(shù)與回歸系數(shù)、進(jìn)行假設(shè)檢驗(yàn);4.能從專業(yè)角度考慮相關(guān)與回歸的實(shí)際意義。2第2頁,課件共71頁,創(chuàng)作于2023年2月兩個(gè)變量之間的關(guān)系大致分為兩種:3第3頁,課件共71頁,創(chuàng)作于2023年2月1.兩個(gè)變量共同變化的,是一種相互依賴的關(guān)系例如身高與體重的關(guān)系??梢杂孟嚓P(guān)分析方法去研究這種關(guān)系。可以研究?jī)蓚€(gè)變量之間的相互關(guān)系的密切程度和變化趨勢(shì),并用恰當(dāng)?shù)慕y(tǒng)計(jì)指標(biāo)表達(dá)。4第4頁,課件共71頁,創(chuàng)作于2023年2月2.一個(gè)變量對(duì)另外一個(gè)變量有著某種依存關(guān)系例如兒子的身高與父親的身高有著某種依存關(guān)系,可以用回歸分析的方法去研究這種關(guān)系,即把兩個(gè)變量間的數(shù)量依存關(guān)系用函數(shù)形式表示出來,用一個(gè)或多個(gè)變量去推測(cè)另一個(gè)變量的估計(jì)值和波動(dòng)范圍,這就是回歸分析。5第5頁,課件共71頁,創(chuàng)作于2023年2月為了研究父親與成年兒子身高之間的關(guān)系,卡爾.皮爾遜測(cè)量了1078對(duì)父子的身高。把1078對(duì)數(shù)字表示在坐標(biāo)上,如圖。用水平軸X上的數(shù)代表父親身高,垂直軸Y上的數(shù)代表兒子的身高,1078個(gè)點(diǎn)所形成的圖形是一個(gè)散點(diǎn)圖。它的形狀象一塊橄欖狀的云,中間的點(diǎn)密集,邊沿的點(diǎn)稀少,其主要部分是一個(gè)橢圓。6第6頁,課件共71頁,創(chuàng)作于2023年2月第一節(jié)直線相關(guān)分析

LinearCorrelation7第7頁,課件共71頁,創(chuàng)作于2023年2月1.直線相關(guān)概念概念:描述和推斷兩個(gè)(事件、現(xiàn)象)正態(tài)變量(x、y)總的變化趨勢(shì)上協(xié)同變化規(guī)律性的密切程度和方向(但又非確定的函數(shù)關(guān)系)的統(tǒng)計(jì)分析方法。協(xié)同變化:同增同減,此增彼減8第8頁,課件共71頁,創(chuàng)作于2023年2月2.直線相關(guān)的特點(diǎn):兩變量同時(shí)進(jìn)入數(shù)據(jù)分析;兩變量不區(qū)別為原因變量和結(jié)果變量,是一種互為因果的數(shù)量協(xié)同變化關(guān)系;變量類型:兩變量應(yīng)同時(shí)滿足正態(tài)分布的條件(實(shí)際工作中近似正態(tài)分布)。9第9頁,課件共71頁,創(chuàng)作于2023年2月相關(guān)分析1.圖示法:有無相關(guān)、相關(guān)程度、相關(guān)方向2相關(guān)系數(shù):在求相關(guān)系數(shù)前,最好先做圖。10第10頁,課件共71頁,創(chuàng)作于2023年2月相關(guān)分析:無自變量、因變量、地位平等。回歸分析:有自變量、因變量,兩者從屬關(guān)系。11第11頁,課件共71頁,創(chuàng)作于2023年2月繪制散點(diǎn)圖分析研究?jī)蓚€(gè)變量x與y之間的關(guān)系時(shí),兩個(gè)變量的值可視為直角坐標(biāo)系的一個(gè)點(diǎn)。為直觀地判斷兩個(gè)變量間的關(guān)系,可把每對(duì)(x,y)變量值在直角坐標(biāo)系標(biāo)點(diǎn)出來,此為散點(diǎn)圖。若一個(gè)變量x由小到大(或由大變?。?,則另一變量相應(yīng)地由小到大(或由大到?。瑑蓚€(gè)變量的散點(diǎn)圖呈直線趨勢(shì),可稱這種現(xiàn)象為共變。12第12頁,課件共71頁,創(chuàng)作于2023年2月3、相關(guān)的類型★正相關(guān)★負(fù)相關(guān)★完全正相關(guān)★完全負(fù)相關(guān)★零相關(guān)

13第13頁,課件共71頁,創(chuàng)作于2023年2月一、直線相關(guān)統(tǒng)計(jì)量14第14頁,課件共71頁,創(chuàng)作于2023年2月相關(guān)系數(shù)及意義相關(guān)系數(shù):相關(guān)系數(shù)是用以衡量?jī)蓚€(gè)變量線形相關(guān)有無、強(qiáng)弱與方向的統(tǒng)計(jì)指標(biāo)??傮w參數(shù):樣本相關(guān)系數(shù):r15第15頁,課件共71頁,創(chuàng)作于2023年2月相關(guān)系數(shù)的計(jì)算公式16第16頁,課件共71頁,創(chuàng)作于2023年2月r的計(jì)算結(jié)果:說明了兩個(gè)變量X與Y之間關(guān)聯(lián)的密切程度(絕對(duì)值大?。┡c關(guān)聯(lián)的性質(zhì)(正負(fù)號(hào))。17第17頁,課件共71頁,創(chuàng)作于2023年2月r是無量剛的統(tǒng)計(jì)量;-1<r<1

r可正可負(fù)(正表正相關(guān),負(fù)表負(fù)相關(guān));r=0零相關(guān)(無線性相關(guān))r的大小表示相關(guān)的程度,越接近1,表相關(guān)性越好,越接近0,表相關(guān)性越差。相關(guān)系數(shù)的特點(diǎn):18第18頁,課件共71頁,創(chuàng)作于2023年2月二、直線相關(guān)系數(shù)的計(jì)算例15-1某醫(yī)師研究12名癲癇病人口服魯米那后兩小時(shí)唾液藥物濃度與血液藥物濃度之間的數(shù)量關(guān)系。試計(jì)算兩種體液藥物濃度間的直線相關(guān)關(guān)系。19第19頁,課件共71頁,創(chuàng)作于2023年2月1.根據(jù)原始數(shù)據(jù)做散點(diǎn)圖,從圖中各點(diǎn)的分布情況看,血液藥物濃度Y隨唾液藥物濃度X增加而增加的趨勢(shì)。2.計(jì)算相關(guān)系數(shù)(1)計(jì)算基礎(chǔ)數(shù)據(jù)根據(jù)原始數(shù)據(jù)求得20第20頁,課件共71頁,創(chuàng)作于2023年2月21第21頁,課件共71頁,創(chuàng)作于2023年2月(3)直線相關(guān)系數(shù)的假設(shè)檢驗(yàn)上例中的相關(guān)系數(shù)r等于0.9256,說明了12名癲癇病人的唾液藥物濃度與血液藥物濃度之間存在相關(guān)關(guān)系。但是,這12名癲癇病人只是總體中的一個(gè)樣本,由此得到的相關(guān)系數(shù)會(huì)存在抽樣誤差。因?yàn)?,總體相關(guān)系數(shù)()為零時(shí),由于抽樣誤差,從總體抽出的12例,其r可能不等于零。所以,要判斷該樣本的r是否有意義,需與總體相關(guān)系數(shù)=0進(jìn)行比較,看兩者的差別有無統(tǒng)計(jì)學(xué)意義。這就要對(duì)r進(jìn)行假設(shè)檢驗(yàn),判斷r不等于零是由于抽樣誤差所致,還是兩個(gè)變量之間確實(shí)存在相關(guān)關(guān)系。22第22頁,課件共71頁,創(chuàng)作于2023年2月

對(duì)相關(guān)系數(shù)的假設(shè)檢驗(yàn),常用t檢驗(yàn),選用統(tǒng)計(jì)量t的計(jì)算公式如下:

=n-2

23第23頁,課件共71頁,創(chuàng)作于2023年2月(1)建立假設(shè)H0:=0,即X與Y間無直線相關(guān)關(guān)系H1:≠0,即X與Y間有直線相關(guān)關(guān)系(2)確定檢驗(yàn)水準(zhǔn):=0.05(3)確定單雙測(cè)檢驗(yàn):本例選擇雙測(cè)檢驗(yàn)(4)計(jì)算t值:r=0.9256,n=12,代入公式=n-2=12-2=10

t=7.73,查t值表P436,上述計(jì)算t=7.73>2.228,由t所推斷的P值小于0.05,按=0.05水準(zhǔn)拒絕H0,接受H1,r為正值,說明唾液藥物濃度與血液藥物濃度存在正相關(guān)關(guān)系。24第24頁,課件共71頁,創(chuàng)作于2023年2月相關(guān)一定有內(nèi)在聯(lián)系嗎?某君喜得貴子,庭前種一小樹,每月測(cè)子高與樹高,積累了數(shù)據(jù)。統(tǒng)計(jì)計(jì)算發(fā)現(xiàn),子高與樹高具有相關(guān)性,難道兩者真有內(nèi)在聯(lián)系?原來子高與樹高均與日俱增,時(shí)間變量與兩者得潛在聯(lián)系,造成了子高與樹高的虛假聯(lián)系。25第25頁,課件共71頁,創(chuàng)作于2023年2月相關(guān)關(guān)系與因果關(guān)系是一回事嗎?相關(guān)關(guān)系可能是:(1)兩個(gè)變量之間存在依存因果關(guān)系,如由于遺傳的原因,子女的身高數(shù)值的大小在很大程度上取決于父母的身高。(2)兩個(gè)變量之間存在相互的伴隨關(guān)系,如“蛙鳴而燕至”,雖然年年如此,但蛙鳴永遠(yuǎn)也不能成為燕至的原因。26第26頁,課件共71頁,創(chuàng)作于2023年2月直線相關(guān)的應(yīng)用

相關(guān)是研究?jī)蓚€(gè)變量間的相互關(guān)系,而且這種相互關(guān)系是用相關(guān)系數(shù)反應(yīng)的。在確實(shí)存在相關(guān)關(guān)系的前提下,如果r的絕對(duì)值越大,說明兩個(gè)變量之間的關(guān)聯(lián)程度越強(qiáng),那么,已知一個(gè)變量對(duì)預(yù)測(cè)另一個(gè)變量越有幫助;如果r絕對(duì)值越小,則說明兩個(gè)變量之間的關(guān)系越弱,一個(gè)變量的信息對(duì)猜測(cè)另一個(gè)變量的值無多大幫助。一般說來,當(dāng)樣本量較大(n>100),并對(duì)r進(jìn)行假設(shè)檢驗(yàn),有統(tǒng)計(jì)學(xué)意義時(shí),r的絕對(duì)值大于0.7,則表示兩個(gè)變量高度相關(guān);r的絕對(duì)值大于0.4,小于等于0.7時(shí),則表示兩個(gè)變量之間中度相關(guān);r的絕對(duì)值大于0.2,小于等于0.4時(shí),則兩個(gè)變量低度相關(guān)。

27第27頁,課件共71頁,創(chuàng)作于2023年2月

前面我們討論了12名癲癇病人的唾液藥物濃度和血液藥物濃度之間的關(guān)系,知道了二者之間成正相關(guān)。那么,如果我們知道了一位癲癇病人的唾液藥物濃度,能推斷出血液藥物濃度的大小嗎?或血液藥物濃度可能在什么范圍內(nèi)呢?還有,唾液藥物濃度和血液藥物濃度。那么,體重每增加1微克,血液藥物濃度增加多少呢?上面的相關(guān)關(guān)系分析不能提供給我們需要的答案。這些要用直線回歸的方法來解決。28第28頁,課件共71頁,創(chuàng)作于2023年2月五、直線相關(guān)分析的注意點(diǎn)作直線相關(guān)分析時(shí),應(yīng)結(jié)合散點(diǎn)圖來判斷兩變量的數(shù)量協(xié)同變化關(guān)系是否呈直線關(guān)系,避免將某些曲線關(guān)系誤判為直線關(guān)系;應(yīng)該注意假相關(guān)情況;當(dāng)兩變量均明顯不呈正態(tài)分布時(shí),最好采用秩相關(guān)統(tǒng)計(jì)分析方法計(jì)算秩相關(guān)系數(shù)。29第29頁,課件共71頁,創(chuàng)作于2023年2月第二節(jié)直線回歸分析linearRegression30第30頁,課件共71頁,創(chuàng)作于2023年2月“回歸”一詞的來由“回歸”一詞最早由Golton在一項(xiàng)有關(guān)父親與兒子身高的研究中提出。兒子的身高(Y)與父親的身高(X)自然是相關(guān)的,他發(fā)現(xiàn)身材高大的父親所生兒子的高度不少要比其父親矮,而身材矮小的父親所生的兒子不少要比其父親高;也就是說,無論是身材高還是身材矮的父親所生兒子的身高有向人群的平均身高“回歸”的趨勢(shì),這就是“回歸”的生物學(xué)內(nèi)涵。后來人們借助“回歸”一詞來描述通過自變量的數(shù)值預(yù)測(cè)反應(yīng)變量的平均水平。31第31頁,課件共71頁,創(chuàng)作于2023年2月為了通過可測(cè)或易測(cè)的變量對(duì)未知或難測(cè)或不可測(cè)量的狀態(tài)進(jìn)行估計(jì),可以借助回歸分析。例如:我們可以用身高、體重、肺活量這些容易測(cè)得的指標(biāo)來估計(jì)心室血輸出量、體循環(huán)總血量等相對(duì)難測(cè)的指標(biāo);通過對(duì)產(chǎn)婦的尿雌三醇含量的檢測(cè)來估計(jì)腹中胎兒體重,以便采取必要的措施降低生產(chǎn)過程的難產(chǎn)風(fēng)險(xiǎn)。32第32頁,課件共71頁,創(chuàng)作于2023年2月(1)當(dāng)我們知道了兩個(gè)變量之間有直線相關(guān)關(guān)系,并且一個(gè)變量的變化會(huì)引起另一個(gè)變量的變化,這時(shí),如果它們之間存在準(zhǔn)確、嚴(yán)格的關(guān)系,它們的變化可用函數(shù)方程來表示,叫它們是函數(shù)關(guān)系,它們之間的關(guān)系式叫函數(shù)方程。(2)但在實(shí)際生活當(dāng)中,由于其它因素的干擾,許多雙變量之間的關(guān)系并不是嚴(yán)格的函數(shù)關(guān)系,不能用函數(shù)方程反映,為了區(qū)別于兩變量間的函數(shù)方程,我們稱這種關(guān)系式為直線回歸方程,這種關(guān)系為直線回歸.33第33頁,課件共71頁,創(chuàng)作于2023年2月直線回歸的定義分析兩個(gè)變量X、Y之間確切的定量關(guān)系,建立一個(gè)方程式,從而可由X變量的大小推算出Y變量的估計(jì)值。直線回歸就是用來描述一個(gè)變量如何依賴于另一個(gè)變量。34第34頁,課件共71頁,創(chuàng)作于2023年2月回歸方程

直線回歸的任務(wù)就是要找出一個(gè)變量隨另一個(gè)變量變化的直線方程,我們把這個(gè)直線方程叫做直線回歸方程。

:是由自變量X推算應(yīng)變量Y的估計(jì)值(讀作Yhat)a:是回歸直線在Y軸上的截距,即X=0時(shí)的Y值;b:為樣本的回歸系數(shù),即回歸直線的斜率,表示當(dāng)X變動(dòng)一個(gè)單位時(shí),Y平均變動(dòng)b個(gè)單位。35第35頁,課件共71頁,創(chuàng)作于2023年2月直線回歸分析的特點(diǎn):兩變量同時(shí)進(jìn)入數(shù)據(jù)分析;兩變量必須區(qū)分為自變量X和應(yīng)變量Y;要求應(yīng)變量Y為正態(tài)分布,或?qū)?yīng)同一X值的應(yīng)變量Y與直線回歸方程估計(jì)值的差值服從正態(tài)分布適用于兩變量數(shù)量協(xié)同變化關(guān)系密切的情況,否則回歸估計(jì)誤差過大,無應(yīng)用價(jià)值。36第36頁,課件共71頁,創(chuàng)作于2023年2月直線回歸分析的意義可以用來較準(zhǔn)確描述兩變量的定量關(guān)系;可以在一定自變量變化線性范圍內(nèi)由自變量預(yù)報(bào)應(yīng)變量值,給定應(yīng)變量的控制限值,利用直線方程尋找自變量的控制限值。37第37頁,課件共71頁,創(chuàng)作于2023年2月

要使是最適合的直線,

必須滿足下列條件:

(1)直線上方各點(diǎn)離回歸線的距離(以平行于Y軸計(jì)算)之和與直線下方各點(diǎn)離回歸線的距離之和絕對(duì)值相等,但方向相反,因此:38第38頁,課件共71頁,創(chuàng)作于2023年2月(2)此直線是使得誤差平方和為最小值的直線,即因變量的實(shí)際觀察值y與理論值之差的平方和取最小值。對(duì)于每一個(gè)x值來說,它所對(duì)應(yīng)實(shí)際的y值,與估計(jì)的值往往會(huì)存在差異,這個(gè)差異就是用估計(jì)值來代替實(shí)際y值所產(chǎn)生的誤差,即,誤差越小越好,由于理論上,因此要把為最小值的直線當(dāng)作回歸直線是很困難的。一個(gè)最佳且能表達(dá)同樣目的的方法,那就是將此直線定義為使得誤差平方和為最小值的直線。這個(gè)方法稱為最小二乘法。39第39頁,課件共71頁,創(chuàng)作于2023年2月根據(jù)最小二乘法原理,a和b的計(jì)算公式Lxy為離均差積和,Lxx為x的離均差平方和40第40頁,課件共71頁,創(chuàng)作于2023年2月三、直線回歸分析的方法步驟與作圖例15-2根據(jù)例15-1的資料以唾液藥物濃度作自變量X,以血藥物濃度作應(yīng)變量Y,進(jìn)行直線回歸分析,并作出回歸直線。具體過程見書P26941第41頁,課件共71頁,創(chuàng)作于2023年2月例16-3某研究人員采用不同劑量山莨菪堿測(cè)得小白鼠的擴(kuò)瞳指數(shù),試分析山莨菪堿和擴(kuò)瞳指數(shù)之間的回歸關(guān)系。1.繪制散點(diǎn)圖有相關(guān)關(guān)系,再作回歸分析2.計(jì)算回歸系數(shù)42第42頁,課件共71頁,創(chuàng)作于2023年2月(1)編制回歸系數(shù)計(jì)算表:求基礎(chǔ)數(shù)據(jù)43第43頁,課件共71頁,創(chuàng)作于2023年2月(2)計(jì)算離均差平方和及離均差積和44第44頁,課件共71頁,創(chuàng)作于2023年2月(3)計(jì)算b,a,得回歸方程:45第45頁,課件共71頁,創(chuàng)作于2023年2月=0.445+0.117X是否一定能說明山莨菪堿與擴(kuò)瞳指數(shù)之間存在回歸關(guān)系?

46第46頁,課件共71頁,創(chuàng)作于2023年2月回歸直線的描繪

根據(jù)求得的回歸方程,可以在自變量X的實(shí)測(cè)范圍內(nèi)任取兩個(gè)值,代入方程中,求得相應(yīng)的兩個(gè)Y值,以這兩對(duì)數(shù)據(jù)找出對(duì)應(yīng)的兩個(gè)坐標(biāo)點(diǎn),將兩點(diǎn)連接為一條直線,就是該方程的回歸直線?;貧w直線一定經(jīng)過(0,a),()。這兩點(diǎn)可以用來核對(duì)圖線繪制是否正確。47第47頁,課件共71頁,創(chuàng)作于2023年2月與直線相關(guān)一樣,直線回歸方程也是從樣本資料計(jì)算而得的,同樣也存在著抽樣誤差問題。所以,需要對(duì)樣本的回歸系數(shù)b進(jìn)行假設(shè)檢驗(yàn),以判斷b是否從回歸系數(shù)為零的總體中抽得。為了判斷抽樣誤差的影響,需對(duì)回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)。總體的回歸系數(shù)一般用β表示。

48第48頁,課件共71頁,創(chuàng)作于2023年2月1.方差分析F=MS組間/MS組內(nèi)2.t檢驗(yàn)

回歸系數(shù)的假設(shè)檢驗(yàn)H0:β=0H1:β≠0α=0.05選擇合適的假設(shè)檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量計(jì)算概率值P做出推論:統(tǒng)計(jì)學(xué)結(jié)論和專業(yè)結(jié)論當(dāng)變量Y服從正態(tài)分布時(shí),回歸系數(shù)得顯著性檢驗(yàn)可用t檢驗(yàn),也可用方差分析49第49頁,課件共71頁,創(chuàng)作于2023年2月1.采用方差分析

(了解)50第50頁,課件共71頁,創(chuàng)作于2023年2月1.平方和與自由度的分解因變量Y得變化規(guī)律:y值的變異可用離均差平方和來反映:51第51頁,課件共71頁,創(chuàng)作于2023年2月52第52頁,課件共71頁,創(chuàng)作于2023年2月是回歸值與平均數(shù)之差的平方和,根據(jù)回歸方程,回歸值因此可以把看做是由于x的變化而引起的y值的變化,所有這些量的平方和

反映了在y總的變異中由于x與y的線性關(guān)系而引起y變化的部分,稱它為回歸平方和,用SS回表示,y的這部分變異是由x解釋的。因此回歸平方和也就是考慮了x與y的線性關(guān)系,或者說作了回歸后能使總平方和減少的部分,所以越大,說明回歸效果越好。53第53頁,課件共71頁,創(chuàng)作于2023年2月是所有觀察點(diǎn)距回歸直線的剩余的平方和,根據(jù)前述的最小二乘法原理,這個(gè)量是在所有類似的直線中與觀測(cè)點(diǎn)距離平方和最小的一個(gè),它除了x對(duì)y的線性影響之外的一切因素對(duì)y變異的作用,稱為剩余平方和(或殘差平方和)用SS剩表示,也就是在總平方和中無法用x解釋的部分。在散點(diǎn)圖中,各實(shí)測(cè)點(diǎn)與回歸直線越近,也就越小,說明直線回歸的估計(jì)誤差越小。54第54頁,課件共71頁,創(chuàng)作于2023年2月為y的離均差平方和,又稱總平方和,用SS總表示,說明未考慮x與y的回歸關(guān)系時(shí)y的變異,三者之間的關(guān)系:SS總=SS回+SS剩V總=v回+v剩V總=N-1,N為樣本含量V回:對(duì)應(yīng)于自變量的個(gè)數(shù),因此v回=1,v剩=N-2以離均差平方和除以自由度可得均方,即MS回=SS回/v回MS=SS回/v回如果回歸均方顯著地大于剩余均方,則說明回歸是顯著的,因此可用方差分析的方法來檢驗(yàn)回歸方程是否有顯著性意義。55第55頁,課件共71頁,創(chuàng)作于2023年2月2.采用t檢驗(yàn)方法將除以它的自由度n-2,即得估計(jì)值的方差,稱為剩余方差,開方即得剩余標(biāo)準(zhǔn)差,其中Sy.x為各觀察值y到回歸直線的距離的標(biāo)準(zhǔn)差,它的意義是指當(dāng)x對(duì)y的影響被扣除后,y仍有剩余變異,其變異的程度可用來衡量,故用來反映y的剩余變異。56第56頁,課件共71頁,創(chuàng)作于2023年2月自由度=5-2=3,查t值表,t0.05(3)=3.182,6.573>3.182,P<0.05,按=0.05檢驗(yàn)水準(zhǔn),拒絕H0,說明擴(kuò)瞳指數(shù)與山莨菪堿之間存在直線回歸關(guān)系。57第57頁,課件共71頁,創(chuàng)作于2023年2月六、直線回歸分析中應(yīng)注意的問題1、作直線回歸分析適合在兩變量數(shù)量協(xié)同變化直線關(guān)系較為密切時(shí)進(jìn)行,否則直線回歸方程預(yù)報(bào)誤差過大,無實(shí)用價(jià)值。2、直線回歸方程原則上只適用于樣本資料提供的自變量線性范圍內(nèi),不能任意外延。自變量線性范圍以外尚不知道兩變量是否存在直線關(guān)系。58第58頁,課件共71頁,創(chuàng)作于2023年2月3.直線回歸分析只要求應(yīng)變量Y或?qū)?yīng)同一X值的Y-Yhat值呈正態(tài)分布,對(duì)數(shù)值型自變量X無正態(tài)分布要求。4.應(yīng)用直線回歸分析方法制作實(shí)驗(yàn)方法的工作曲線時(shí),由于工作曲線應(yīng)用屬于“逆預(yù)報(bào)”,是通過應(yīng)變量Y推X值,故必須滿足X與Y呈近似直線函數(shù)關(guān)系時(shí),才能這樣做。為此,要求作為樣本資料中自變量的各標(biāo)準(zhǔn)液濃度應(yīng)重復(fù)測(cè)定幾次,取對(duì)應(yīng)每一標(biāo)準(zhǔn)液濃度的Y的均值,建立直線回歸方程并繪出工作曲線。59第59頁,課件共71頁,創(chuàng)作于2023年2月七、直線相關(guān)與直線回歸分析的比較60第60頁,課件共71頁,創(chuàng)作于2023年2月(一)聯(lián)系兩種分析方法都是研究?jī)勺兞繑?shù)量協(xié)同變化直線關(guān)系的統(tǒng)計(jì)方法;關(guān)系:

能進(jìn)行回歸分析的變量之間存在相關(guān)關(guān)系。所以,對(duì)于兩組新數(shù)據(jù)(兩個(gè)變量)可先做散點(diǎn)圖,求出它們的相關(guān)系數(shù),對(duì)于確有相關(guān)關(guān)系的變量再進(jìn)行回歸分析,求出回歸方程。61第61頁,課件共71頁,創(chuàng)作于2023年2月相關(guān)系數(shù)r與回歸系數(shù)b

r與b的符號(hào)一致。r為正時(shí),b也為正,表示兩變量是正相關(guān),是同向變化。r為負(fù)時(shí),b也為負(fù),表示兩變量是負(fù)相關(guān),是反向變化。r與b的假設(shè)檢驗(yàn)結(jié)果一致,可用r的顯著檢驗(yàn)代替b的顯著性檢驗(yàn)。

62第62頁,課件共71頁,創(chuàng)作于2023年2月同一資料直線相關(guān)系數(shù)與直線回歸系數(shù)假設(shè)檢驗(yàn)的結(jié)果和水平一致,即tr=tb同一資料r2=byx.bxy63第63頁,課件共71頁,創(chuàng)作于2023年2月相關(guān)與回歸的區(qū)別

1.意義:相關(guān)反映兩變量的相互關(guān)系,即在兩個(gè)變量中,任何一個(gè)的變化都會(huì)引起另一個(gè)的變化,是一種雙向變化的關(guān)系?;貧w是反映兩個(gè)變量的依存關(guān)系,一個(gè)變量的改變會(huì)引起另一個(gè)變量的變化,是一種單向的關(guān)系。2.應(yīng)用:研究?jī)蓚€(gè)變量的相互關(guān)系用相關(guān)分析。研究?jī)蓚€(gè)變量的依存關(guān)系用回歸分析。64第64頁,課件共71頁,創(chuàng)作于2023年2月3.研究性質(zhì):相關(guān)是對(duì)兩個(gè)變量之間的關(guān)系進(jìn)行描述,看兩個(gè)變量是否有關(guān),關(guān)系是否密切,關(guān)系的性質(zhì)是什么,是正相關(guān)還是負(fù)相關(guān)?;貧w是對(duì)兩個(gè)變量做定量描述,研究?jī)蓚€(gè)變量的數(shù)量關(guān)系,已知一個(gè)變量值可以預(yù)測(cè)出另一個(gè)變量值,可以得到定量結(jié)果。4.相關(guān)系數(shù)r與回歸系數(shù)b:r與b的絕對(duì)值反映的意義不同。r的絕對(duì)值越大,散點(diǎn)圖中的點(diǎn)越趨向于一條直線,表明兩變量的關(guān)系越密切,相關(guān)程度越高。b的絕對(duì)值越大,回歸直線越陡,說明當(dāng)X變化一個(gè)單位時(shí),Y的平均變化就越大。反之也是一樣。

65第65頁,課件共71頁,創(chuàng)作于2023年2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論