研究生統(tǒng)計學(xué)講義第11講相關(guān)與回歸_第1頁
研究生統(tǒng)計學(xué)講義第11講相關(guān)與回歸_第2頁
研究生統(tǒng)計學(xué)講義第11講相關(guān)與回歸_第3頁
研究生統(tǒng)計學(xué)講義第11講相關(guān)與回歸_第4頁
研究生統(tǒng)計學(xué)講義第11講相關(guān)與回歸_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第六章第六章 一元線性相關(guān)與回歸一元線性相關(guān)與回歸 變量間的關(guān)系有確定性關(guān)系變量間的關(guān)系有確定性關(guān)系(函數(shù)關(guān)系函數(shù)關(guān)系)和隨機性關(guān)和隨機性關(guān)系。函數(shù)關(guān)系是指對于一個變量的每個可能取值,另系。函數(shù)關(guān)系是指對于一個變量的每個可能取值,另外的變量都有完全確定的值與之對應(yīng)。隨機性關(guān)系是外的變量都有完全確定的值與之對應(yīng)。隨機性關(guān)系是指變量間的關(guān)系以非確定性形式出現(xiàn)的情況。指變量間的關(guān)系以非確定性形式出現(xiàn)的情況。 例如兒童身高與體重的關(guān)系;隨著身高的增長例如兒童身高與體重的關(guān)系;隨著身高的增長,體重也增加,一般說,身高高的兒童,體重也重一,體重也增加,一般說,身高高的兒童,體重也重一些,兩者之間確實存在著

2、某種關(guān)系,但顯然不是函數(shù)些,兩者之間確實存在著某種關(guān)系,但顯然不是函數(shù)關(guān)系,因為身高相同的人體重也有的重,有的輕,身關(guān)系,因為身高相同的人體重也有的重,有的輕,身高和體重之間的客觀聯(lián)系存在于隨機背景中,不能說高和體重之間的客觀聯(lián)系存在于隨機背景中,不能說某一身高的兒童,其體重一定是多少。某一身高的兒童,其體重一定是多少。 第一節(jié)第一節(jié) 直線相關(guān)直線相關(guān) 相關(guān)分析用于測量觀察到的任何一對變量之間的聯(lián)相關(guān)分析用于測量觀察到的任何一對變量之間的聯(lián)合強度,我們主要關(guān)心兩個變量是否互相依賴或共同變合強度,我們主要關(guān)心兩個變量是否互相依賴或共同變化這里我們沒有把變量表示成為其它函數(shù),像回歸分化這里我們沒有

3、把變量表示成為其它函數(shù),像回歸分析一樣并未暗示析一樣并未暗示y依賴于依賴于x x和和y二者測量有誤差并二者測量有誤差并且我們希望估計這些變量共同變化的程度見圖且我們希望估計這些變量共同變化的程度見圖 相關(guān)與回歸分析的種類很多,按變量個數(shù)劃分,相關(guān)與回歸分析的種類很多,按變量個數(shù)劃分,有一個有一個 x 一個一個 y 的簡單相關(guān)與回歸分析,多個的簡單相關(guān)與回歸分析,多個 x 和和一個一個 y 的多元相關(guān)與回歸分析,以及多個的多元相關(guān)與回歸分析,以及多個 x 多個多個 y的典型相關(guān)。本章介紹最簡單的兩變量間的直線相的典型相關(guān)。本章介紹最簡單的兩變量間的直線相關(guān)與回歸,稱為一元線性相關(guān)與回歸關(guān)與回歸,

4、稱為一元線性相關(guān)與回歸1.散點圖散點圖 圖圖7.1 a) 圖說明圖說明x 和和y 之間具有正相關(guān)之間具有正相關(guān)b) 圖說明圖說明 x 和和 y 之間之間具有負相關(guān)具有負相關(guān). c) 圖和圖和d)圖說明圖說明 x 和和 y 之間沒有相關(guān)關(guān)系之間沒有相關(guān)關(guān)系 雙變量相關(guān)分析步驟是先作原始數(shù)據(jù)的散點圖,根雙變量相關(guān)分析步驟是先作原始數(shù)據(jù)的散點圖,根據(jù)散點圖的提示再作恰當(dāng)分析,如兩變量有直線趨勢,據(jù)散點圖的提示再作恰當(dāng)分析,如兩變量有直線趨勢,則作直線相關(guān)分析。從散點圖可初步看出變量分布非則作直線相關(guān)分析。從散點圖可初步看出變量分布非正態(tài)時,應(yīng)考慮作等級相關(guān)而不宜作積矩相關(guān)。正態(tài)時,應(yīng)考慮作等級相關(guān)而

5、不宜作積矩相關(guān)。 并非任何有聯(lián)系的兩個變量都是直線聯(lián)系。例如,并非任何有聯(lián)系的兩個變量都是直線聯(lián)系。例如,血壓很高的人和很低的人死亡率均較高,而中等血壓血壓很高的人和很低的人死亡率均較高,而中等血壓的人死亡率較低,死亡率和血壓之間有如圖的人死亡率較低,死亡率和血壓之間有如圖7-1(h)所示所示曲線關(guān)系,不適合作直線相關(guān)分析。曲線關(guān)系,不適合作直線相關(guān)分析。 2. 積矩相關(guān)系數(shù)積矩相關(guān)系數(shù):pearson積差積差相關(guān)系數(shù)相關(guān)系數(shù), , 簡稱相關(guān)系數(shù)。簡稱相關(guān)系數(shù)。表示兩個變量間直線關(guān)系密切程度和方向的統(tǒng)計指標(biāo)。表示兩個變量間直線關(guān)系密切程度和方向的統(tǒng)計指標(biāo)。 用用 r 表示,總體相關(guān)系數(shù)用表示,

6、總體相關(guān)系數(shù)用表示,表示,r 是是的點估計。的點估計??紤]考慮 x 和和 y 的標(biāo)準(zhǔn)正態(tài)離差的標(biāo)準(zhǔn)正態(tài)離差: xisxx yisyy 和和 把相應(yīng)的離差同時相乘并求和時把相應(yīng)的離差同時相乘并求和時, , 得到一個聯(lián)合得到一個聯(lián)合指標(biāo)指標(biāo): : yxiiyixiss)y)(yx(xsyysxx 這個指標(biāo)具有下面的性質(zhì)這個指標(biāo)具有下面的性質(zhì): : 1如果大的如果大的x 值與大的值與大的y 值相聯(lián)系,小的值相聯(lián)系,小的x 值與小的值與小的y 值相聯(lián)系,那么值相聯(lián)系,那么 和和 二者符號相二者符號相同,在公式中它們的乘積為正同,在公式中它們的乘積為正 x 和和 y 之間有正相關(guān)之間有正相關(guān) )x(xi

7、 )y(yi 2如果大的如果大的x 值與小的值與小的y 值相聯(lián)系,小的值相聯(lián)系,小的x 值與大的值與大的y 值相聯(lián)系,那么值相聯(lián)系,那么 和和 二者符號相二者符號相反,在公式里符號為負反,在公式里符號為負. 于是我們就說這種于是我們就說這種情形里情形里 x 和和 y 之間有之間有負相關(guān)負相關(guān))x(xi )y(yi 如果我們用如果我們用 n1 除公式除公式, 就得到一個新指標(biāo)就得到一個新指標(biāo), 用用 r 表示表示 , 首先它滿足兩個條件且范圍從首先它滿足兩個條件且范圍從1到到+1(我們將(我們將在隨后驗證)在隨后驗證). 有有 yyxxxynynxnyxyxiilllyxxyssnyyxxr 2

8、222) 1()(即即 r 是是 x 和和 y 的修正積差除的修正積差除以以 x 和和 y 的修正平方和乘積的修正平方和乘積的平方根注意的平方根注意 r 是參數(shù)是參數(shù)的的估計值,參數(shù)估計值,參數(shù)定義為定義為 :.yyxxxylllr yxxy 希臘字母希臘字母(“rho”) 表示變量表示變量 x 和和 y 之間真實的之間真實的總體關(guān)系總體關(guān)系 相關(guān)系數(shù)無單位相關(guān)系數(shù)無單位, 取值范圍為取值范圍為1r1,r 的符號表的符號表示相關(guān)方向,示相關(guān)方向,r0稱為正相關(guān),稱為正相關(guān),rr,(df),則則p, 可按可按檢驗水準(zhǔn)拒絕檢驗水準(zhǔn)拒絕h0, 認為認為 x 與與 y 之間有直線之間有直線相關(guān)關(guān)系相關(guān)

9、關(guān)系, 0. 反之反之r越小越小, p值越大值越大, 若若r, 按按檢驗水準(zhǔn)不能拒絕檢驗水準(zhǔn)不能拒絕h0, 從而認為從而認為x、y之間無之間無直線相關(guān)關(guān)系。直線相關(guān)關(guān)系。 例例6.1 測得某地測得某地10名三歲兒童的體重與體表面積如下,名三歲兒童的體重與體表面積如下,試計算樣本相關(guān)系數(shù)試計算樣本相關(guān)系數(shù)r,并檢驗其是否來自,并檢驗其是否來自0的總體的總體體重體重x(kg): 11.0 11.8 12.0 12.3 13.1 13.7 14.4 14.9 15.2 16.0面積面積y(10-1m2): 5.283 5.299 5.358 5.602 5.292 6.014 5.830 6.102

10、 6.075 6.411 h0:總體相關(guān)系數(shù):總體相關(guān)系數(shù)0,體重與體表面積間無直線相,體重與體表面積間無直線相關(guān)關(guān)系;關(guān)關(guān)系;h1:0。0.05。 在直角坐標(biāo)系上畫出散點圖在直角坐標(biāo)系上畫出散點圖, 有直線趨勢有直線趨勢, 故進行直故進行直線相關(guān)分析線相關(guān)分析. 使用程序型計算器時使用程序型計算器時, 在線性回歸在線性回歸(lr)工工作方式下作方式下, 成對地輸入成對地輸入x 與與y 后后, 可直接輸出可直接輸出r= 0.9568。無程序型計算器和計算機時無程序型計算器和計算機時, 用一般計算器可求出用一般計算器可求出n對對x與與y 的乘積之和的乘積之和xy=775.6606, =13.44

11、0, = 5.7272,x、y 的樣本標(biāo)準(zhǔn)差的樣本標(biāo)準(zhǔn)差sx=1.6635、sy= 0.4136, 按公式計算相按公式計算相關(guān)系數(shù)關(guān)系數(shù) r: xyyxniiissnyxnyxr)1()(1 =(775.6606-1013.4405.7272)/ (10-1)1.66350.4136=5.92492/6.1922= 0.9568。 以以r0.9572作統(tǒng)計作統(tǒng)計量量, 用自由度用自由度df10-28, 查附表查附表16得界值得界值r0.01(8)0.765, 統(tǒng)計量統(tǒng)計量r r0.01, p0.01, 按按0.05水準(zhǔn)拒絕水準(zhǔn)拒絕h0, 接受接受h1, 可以認為某地三歲可以認為某地三歲兒童體重

12、兒童體重(kg)與體表面與體表面積積(101m2)呈正向直呈正向直線相關(guān)。線相關(guān)。 使用使用spss11.5統(tǒng)計軟件統(tǒng)計軟件(3)進行直線相關(guān)分析)進行直線相關(guān)分析 cross-product deviations and covarlances; 輸出結(jié)果:體重與體表面積的輸出結(jié)果:體重與體表面積的pearson相關(guān)系數(shù)相關(guān)系數(shù)r=0.923,雙側(cè),雙側(cè) p 值值=0.000,可認為直線相關(guān)有統(tǒng)計學(xué),可認為直線相關(guān)有統(tǒng)計學(xué)意義。意義。 三、直線相關(guān)分析應(yīng)注意的問題三、直線相關(guān)分析應(yīng)注意的問題 1判斷兩個變量間是否存在相關(guān)關(guān)系,不能僅根據(jù)判斷兩個變量間是否存在相關(guān)關(guān)系,不能僅根據(jù)樣本相關(guān)關(guān)系的

13、大小下結(jié)論,必須進行假設(shè)檢驗。樣本相關(guān)關(guān)系的大小下結(jié)論,必須進行假設(shè)檢驗。2正相關(guān)或負相關(guān)并不一定表示一個變量的改變是正相關(guān)或負相關(guān)并不一定表示一個變量的改變是引起另一個變量變化的原因,可能同受另一個因素的影引起另一個變量變化的原因,可能同受另一個因素的影響。因此,事物間有相關(guān)關(guān)系,不一定是因果關(guān)系;但響。因此,事物間有相關(guān)關(guān)系,不一定是因果關(guān)系;但如果兩事物之間存在因果關(guān)系,則兩者必然是相關(guān)的。如果兩事物之間存在因果關(guān)系,則兩者必然是相關(guān)的。3當(dāng)樣本含量不大時當(dāng)樣本含量不大時(如如nr 0.4(中度相關(guān)中度相關(guān))或或r0.7(高度相關(guān)高度相關(guān)),都有,都有作回歸分析的必要。作回歸分析的必要。

14、 0.4r0.2(低度相關(guān)低度相關(guān)),是否有作回歸分析的必,是否有作回歸分析的必要,有不同的看法。要,有不同的看法。4相關(guān)分析中對變量的選擇及統(tǒng)計結(jié)果的解釋要結(jié)相關(guān)分析中對變量的選擇及統(tǒng)計結(jié)果的解釋要結(jié)合專業(yè)背景。不要把合專業(yè)背景。不要把p值大小誤解為相關(guān)程度,樣本相值大小誤解為相關(guān)程度,樣本相關(guān)系數(shù)有統(tǒng)計學(xué)意義并不一定反映相關(guān)就很密切,需關(guān)系數(shù)有統(tǒng)計學(xué)意義并不一定反映相關(guān)就很密切,需要考慮專業(yè)意義或進一步結(jié)合決定系數(shù)來作實際意義要考慮專業(yè)意義或進一步結(jié)合決定系數(shù)來作實際意義解釋。牢記:統(tǒng)計上顯著性水平的高低,不能代表實解釋。牢記:統(tǒng)計上顯著性水平的高低,不能代表實際相關(guān)水平的高低。際相關(guān)水平

15、的高低。 第三節(jié)第三節(jié) 直線回歸直線回歸 一、直線回歸的模型一、直線回歸的模型-簡單線性回歸簡單線性回歸 在線性回歸里,一個變量的變化(因變量在線性回歸里,一個變量的變化(因變量y)是)是由于另一個變量(自變量由于另一個變量(自變量x)的變化所致明確地,)的變化所致明確地,我們將尋找直線或?qū)ふ矣晌覀儗ふ抑本€或?qū)ふ矣蓌的變化而引起的變化而引起y的線性變的線性變化回歸分析通常所處的位置是已經(jīng)控制了變量化回歸分析通常所處的位置是已經(jīng)控制了變量x并并且基本上能夠準(zhǔn)確測量它當(dāng)變量之間有曲線關(guān)系的且基本上能夠準(zhǔn)確測量它當(dāng)變量之間有曲線關(guān)系的時候,也就是指數(shù),拋物線或多項式,但我們限定所時候,也就是指數(shù),

16、拋物線或多項式,但我們限定所考慮的是線性情形我們考慮簡單線性回歸考慮的是線性情形我們考慮簡單線性回歸 分析目標(biāo)是描述兩變量之間的函數(shù)關(guān)系,這里分析目標(biāo)是描述兩變量之間的函數(shù)關(guān)系,這里 x 是自變量而是自變量而 y 是應(yīng)變量是應(yīng)變量. 假定假定 x 可測量而沒有誤差可測量而沒有誤差, 而且是可以重復(fù)測量的因為而且是可以重復(fù)測量的因為y 是應(yīng)變量是應(yīng)變量, 它是自由它是自由多變的多變的. 當(dāng)我們把數(shù)據(jù)畫圖時當(dāng)我們把數(shù)據(jù)畫圖時, 如果數(shù)據(jù)表現(xiàn)出有線性如果數(shù)據(jù)表現(xiàn)出有線性關(guān)系關(guān)系, 希望了解這個線性方程性質(zhì)的真實參數(shù)希望了解這個線性方程性質(zhì)的真實參數(shù) 二、直線回歸方程的建立與檢驗二、直線回歸方程的建立

17、與檢驗 回歸分析的內(nèi)容包括三個方面:回歸分析的內(nèi)容包括三個方面:(1)建立回歸方程,是根據(jù)樣本數(shù)據(jù)判定回歸方程)建立回歸方程,是根據(jù)樣本數(shù)據(jù)判定回歸方程的類型,建立回歸方程的估計式。的類型,建立回歸方程的估計式。(2)檢驗回歸方程,是判斷建立的回歸方程能否使)檢驗回歸方程,是判斷建立的回歸方程能否使用。用。(3)使用回歸方程,是在樣本數(shù)據(jù)范圍內(nèi),由自變)使用回歸方程,是在樣本數(shù)據(jù)范圍內(nèi),由自變量數(shù)據(jù)推算因變量的估計值(稱預(yù)測),或由因變量量數(shù)據(jù)推算因變量的估計值(稱預(yù)測),或由因變量數(shù)據(jù)推算自變量的估計值(稱控制數(shù)據(jù)推算自變量的估計值(稱控制)。1直線回歸方程的建立直線回歸方程的建立 補充例題

18、補充例題: 一名學(xué)生想要確定溫度與中國林蛙心律之間一名學(xué)生想要確定溫度與中國林蛙心律之間的關(guān)系的關(guān)系, 調(diào)節(jié)溫度范圍從調(diào)節(jié)溫度范圍從2到到18, 紀錄每個溫度下的紀錄每個溫度下的心律心律.數(shù)據(jù)如下表所示數(shù)據(jù)如下表所示 編號編號 1 2 3 4 5 6 7 8 9 對兩變量之間的關(guān)系怎樣進行處理描述呢對兩變量之間的關(guān)系怎樣進行處理描述呢?顯然兩顯然兩個變量有函數(shù)依賴個變量有函數(shù)依賴隨著溫度的增加隨著溫度的增加, 心律也就增加心律也就增加. 這里溫度由學(xué)生控制這里溫度由學(xué)生控制, 且在使用不同蛙的其它實驗里且在使用不同蛙的其它實驗里能夠準(zhǔn)確測得相同值能夠準(zhǔn)確測得相同值(見下圖見下圖)溫度是自變量或

19、溫度是自變量或“預(yù)預(yù)報報”變量變量. 心律由溫度確定心律由溫度確定, 因此它是應(yīng)變量或因此它是應(yīng)變量或“反應(yīng)反應(yīng)”變量變量. 以不同溫度下心律預(yù)測為目標(biāo)以不同溫度下心律預(yù)測為目標(biāo), 回歸分析能夠正回歸分析能夠正確地分析這些資料確地分析這些資料 x(溫度溫度) 2 4 6 8 10 12 14 16 18y(心律心律) 5 11 11 14 22 23 32 29 32圖圖6.5 溫度和心律數(shù)據(jù)用表示溫度和心律數(shù)據(jù)用表示, 這些數(shù)據(jù)接近所顯示這些數(shù)據(jù)接近所顯示的直線的直線, 在相同溫度下在相同溫度下, 如果重復(fù)如果重復(fù)7次實驗次實驗, 數(shù)據(jù)是相似數(shù)據(jù)是相似的的, 但是并非都一樣但是并非都一樣(見

20、空心見空心 ) .在實驗運行中在實驗運行中, 因為因為研究者控制了溫度研究者控制了溫度, 所以這些點排列在垂線上所以這些點排列在垂線上 線性模型的假定線性模型的假定1. x 固定且測量無誤差固定且測量無誤差2. 對所給的對所給的x,變量,變量 y 的期望值(或平均值)用一的期望值(或平均值)用一個線性函數(shù)來描述個線性函數(shù)來描述: e (y)= y|x=+x這里的這里的和和是實常數(shù),且是實常數(shù),且0 y的期望值取決于的期望值取決于x 和參數(shù)和參數(shù)和和.注意這些注意這些和和與與前面使用的前面使用的型錯誤和型錯誤和型錯誤值不同型錯誤值不同.它們代表的它們代表的是截矩是截矩 intercept 和斜率

21、和斜率slope , 分別表示分別表示 y 和和 x 之間之間的線性關(guān)系的線性關(guān)系3. 對任何固定的對任何固定的x值值, 能夠測量相應(yīng)的變量能夠測量相應(yīng)的變量y的一些的一些值值.(例如固定一個溫度例如固定一個溫度, 測量一些蛙的心律值測量一些蛙的心律值) 然而,我然而,我們假定對任何的們假定對任何的x i ,y i 彼此獨立而且服從正態(tài)分布,彼此獨立而且服從正態(tài)分布,(見圖見圖10.1垂直排列的數(shù)據(jù)垂直排列的數(shù)據(jù)) 能夠把每一個能夠把每一個yi 值表示為值表示為y i =+x i +i 或或 y i 被描述為期望值(被描述為期望值(+x i )加上一個來自于期望)加上一個來自于期望值的偏差值的

22、偏差i 我們假定我們假定i 是具有均值為是具有均值為 0 的正態(tài)分布的的正態(tài)分布的誤差項誤差項 4對不同的對不同的x 值值, 假定假定 y 的分布的方差相等的分布的方差相等. 統(tǒng)計學(xué)統(tǒng)計學(xué)家說它們是等方差!家說它們是等方差!為了描述為了描述 y 和和x 之間的實驗回歸關(guān)系,需要執(zhí)行下之間的實驗回歸關(guān)系,需要執(zhí)行下列步驟:列步驟:iiix|y 1畫散點圖借以發(fā)現(xiàn)明顯存在的線性關(guān)系畫散點圖借以發(fā)現(xiàn)明顯存在的線性關(guān)系2為數(shù)據(jù)集尋找一條最合適的直線為數(shù)據(jù)集尋找一條最合適的直線3檢驗這條擬合的直線是否能解釋檢驗這條擬合的直線是否能解釋 y 的變化的重要的變化的重要部分,也就是檢驗線性關(guān)系是否真實部分,也

23、就是檢驗線性關(guān)系是否真實 作一個初步的散點圖以獲得兩變量之間是否有存在作一個初步的散點圖以獲得兩變量之間是否有存在任何聯(lián)系的印象任何聯(lián)系的印象, 如果是這樣如果是這樣, 兩變量或許可能有聯(lián)系兩變量或許可能有聯(lián)系下面下面 a)圖表示在圖表示在 x 和和 y 之間不存在有意義的關(guān)系大之間不存在有意義的關(guān)系大的的y值與既大又小的兩個值與既大又小的兩個 x 值相聯(lián)系值相聯(lián)系圖圖b),c)和)和d)表示在變量之間有關(guān)系,但不是直線關(guān)表示在變量之間有關(guān)系,但不是直線關(guān)系如果它們能夠通過數(shù)學(xué)函數(shù)轉(zhuǎn)換為直線圖形,回系如果它們能夠通過數(shù)學(xué)函數(shù)轉(zhuǎn)換為直線圖形,回歸分析就能夠?qū)D(zhuǎn)換的數(shù)據(jù)進行描述歸分析就能夠?qū)D(zhuǎn)換的

24、數(shù)據(jù)進行描述 圖圖e) 顯示顯示 y 和和 x 之間有負的線性關(guān)系(即之間有負的線性關(guān)系(即 x 增加增加時,時,y減少)而數(shù)據(jù)點不一定恰好在直線上,它們減少)而數(shù)據(jù)點不一定恰好在直線上,它們給我們一個線性的印象圖給我們一個線性的印象圖10.3 f)表示變量之間有很)表示變量之間有很強的正線性關(guān)系(即強的正線性關(guān)系(即 x 增加,增加,y 增加),與直線偏差增加),與直線偏差小線性回歸只適合最后兩種情形小線性回歸只適合最后兩種情形a)表示在表示在 x 和和 y 之間不存在有意之間不存在有意義的關(guān)系義的關(guān)系b),c)和)和d)表示表示在變量之間有關(guān)在變量之間有關(guān)系,但不是直線系,但不是直線關(guān)系關(guān)

25、系e) 顯示顯示 y 和和 x 之間有負的線性之間有負的線性關(guān)系關(guān)系f)表示變量之)表示變量之間有很強的正間有很強的正線性關(guān)系線性關(guān)系圖圖6.6 數(shù)據(jù)數(shù)據(jù)最佳直線擬合最佳直線擬合一旦確定適合作回歸分析一旦確定適合作回歸分析, 就是要確定哪一條直線最就是要確定哪一條直線最能擬合數(shù)據(jù)能擬合數(shù)據(jù). 在下圖擬合了在下圖擬合了a,b,c三條直線三條直線. 很明顯很明顯, c 擬合數(shù)據(jù)比擬合數(shù)據(jù)比a 和和b 更好更好. 這些數(shù)據(jù)有正的傾向這些數(shù)據(jù)有正的傾向: 隨隨x的的增加增加, y也增加也增加. 而直線而直線 b 完全不能夠反映完全不能夠反映 y 和和 x 之間之間的關(guān)系的關(guān)系, 而且這條線暗指不存在關(guān)

26、系而且這條線暗指不存在關(guān)系 圖圖6.7 如何確定哪條線最好擬合這些數(shù)據(jù)呢?如何確定哪條線最好擬合這些數(shù)據(jù)呢? 在圖在圖6.8 里,考慮相同數(shù)據(jù)和兩條直線里,考慮相同數(shù)據(jù)和兩條直線c與與d這個時候兩條這個時候兩條直線都順著直線的正向為討論這些直線哪條最能擬合數(shù)據(jù)直線都順著直線的正向為討論這些直線哪條最能擬合數(shù)據(jù)或者是否有一些其它直線能更好地擬合或者是否有一些其它直線能更好地擬合需要某些我們能夠判需要某些我們能夠判斷其擬合的準(zhǔn)則為了產(chǎn)生最滿意的直線,下面我們制定這個斷其擬合的準(zhǔn)則為了產(chǎn)生最滿意的直線,下面我們制定這個準(zhǔn)則和方法準(zhǔn)則和方法 回歸的目的是預(yù)測回歸的目的是預(yù)測 y 的值開始瞬間,忽略變量

27、的值開始瞬間,忽略變量 x,按照,按照前面單樣本分析進行思考前面單樣本分析進行思考y的預(yù)測值將是的預(yù)測值將是e (y)=y ,通過使,通過使用樣本平均值用樣本平均值 進行估計該直線有方程進行估計該直線有方程 .見圖見圖7.9,我們使用記號我們使用記號 (念作(念作“y hat ”)而不是用)而不是用y去表示它的預(yù)測去表示它的預(yù)測值,預(yù)測值不是精確值或觀察值直線值,預(yù)測值不是精確值或觀察值直線 的斜率為的斜率為0,即它,即它平行于平行于x 軸作為軸作為 ,它意味著,它意味著y 和和x 之間沒有關(guān)系,因之間沒有關(guān)系,因為為y的值不依賴(隨著變化的)的值不依賴(隨著變化的)x 值值 yyy yyy

28、yy yy 圖圖6.9 對數(shù)據(jù)擬合對數(shù)據(jù)擬合 yy 然而在下面,我們認為然而在下面,我們認為y的值不依賴的值不依賴 x 的取值,而且我們能夠的取值,而且我們能夠度量度量 y 的精確值的精確值yi 和和 y 的預(yù)測值的預(yù)測值 之間的差值從每一數(shù)據(jù)之間的差值從每一數(shù)據(jù)點向直線點向直線 畫一節(jié)垂線任何一段的長度都是畫一節(jié)垂線任何一段的長度都是見圖見圖7.10,如果對這些離差平方求和,有,如果對這些離差平方求和,有 yy )y(yi ),(iiyxyy 圖圖6.10 從數(shù)據(jù)點向直線畫垂線從數(shù)據(jù)點向直線畫垂線 yy 2ii)y(y y 的總離差平方和的總離差平方和=y)y(yi ),(iiyxbxay

29、iiiibxayyx ),(這這里里現(xiàn)在畫一條斜線現(xiàn)在畫一條斜線 bxay 去擬合數(shù)據(jù)再從每一個去擬合數(shù)據(jù)再從每一個數(shù)據(jù)點向斜線畫垂線段數(shù)據(jù)點向斜線畫垂線段 )(iiyy 如果我們對這個離差求如果我們對這個離差求平方和,就得到:平方和,就得到:2)( iiiyy,比從圖比從圖7.10計算計算 2)( iiyy要小,因線段短些要小,因線段短些. 畫出畫出“擬合擬合”數(shù)據(jù)直線后數(shù)據(jù)直線后, 這個剩余變化被這個剩余變化被認為是系統(tǒng)殘差或無法解釋的變化認為是系統(tǒng)殘差或無法解釋的變化 圖圖7.11)(iiyy 最佳直線是這樣的一條直線,它的截矩最佳直線是這樣的一條直線,它的截矩a 和斜率和斜率 b 同時

30、使這同時使這個殘差減至最小與第個殘差減至最小與第 8 章一樣,我們能劃分平方和以確定殘章一樣,我們能劃分平方和以確定殘差數(shù)量如圖差數(shù)量如圖7.12, 每一個每一個 yi 都能夠表示為都能夠表示為 )()(yyyyyyiii )()()(yyyyyyiii 移項得移項得 x),(iiyxyyi iiiyyixy xxiyyi (7.15)圖圖7.12對公式對公式7.15兩邊平方并且求和,我們得到兩邊平方并且求和,我們得到 22)()()(yyyyyyiiii 22)()(2)(yyyyyyyyiiiii公式公式7.15 總的平方和是總的平方和是 222)()()(yyyyyyiii 總平方和總平

31、方和 = 回歸平方和回歸平方和 + 殘差平方和殘差平方和 ss總總 = ss回回 + sse 使使 ss回回 達到最大值,而使達到最大值,而使 sse 達到最小值達到最小值 要使要使sse達到最小值,就要使得圖達到最小值,就要使得圖10.8里作出的垂線里作出的垂線段盡可能地短,擬合直線:段盡可能地短,擬合直線: bxayxy | 是樣本回歸方程,用來估計前面給出的參數(shù)關(guān)系:是樣本回歸方程,用來估計前面給出的參數(shù)關(guān)系:y|x=+x這里的這里的 a 是真實截矩是真實截矩的估計值,而的估計值,而 b 是是真實斜率真實斜率的估計值在公式的估計值在公式10.1里,因為這條直線使里,因為這條直線使誤差平方

32、和達到最小,它就是眾所周知的誤差平方和達到最小,它就是眾所周知的 xbya bxxbyyxy )(| )(xxbyy 由上式,對由上式,對 a 作代換得到作代換得到它能表示為(見它能表示為(見p109公式公式7.11)截矩的最優(yōu)估計)截矩的最優(yōu)估計:最小二乘回歸直線最小二乘回歸直線 要得到使要得到使 sse 取得最小值的斜率取得最小值的斜率b,需要最小二乘法技,需要最小二乘法技巧最小二乘回歸方程是巧最小二乘回歸方程是 )(|xxbyyxy 或或斜率斜率 b 由最小二乘回歸法確定由最小二乘回歸法確定: 作為斜率作為斜率b 的方程離差的基本計算是解方程的方程離差的基本計算是解方程7.11然而然而,

33、 斜率斜率 b 是由最小二乘法來確定是由最小二乘法來確定, 是修正的交叉積是修正的交叉積 lxy 除以修正的除以修正的lxx .值得重復(fù)的是值得重復(fù)的是, 利用公式利用公式7.14, 這個方程對一組線性數(shù)據(jù)集會產(chǎn)這個方程對一組線性數(shù)據(jù)集會產(chǎn)生最佳斜率生最佳斜率, 產(chǎn)生的誤差平方項是最小的產(chǎn)生的誤差平方項是最小的 , 而產(chǎn)生的回歸平方而產(chǎn)生的回歸平方和是最大的和是最大的 xxxy22llxxybnxnyx 公式公式7.14 如果公式如果公式7.14給出的是最優(yōu)擬合回歸方程,我們需要檢驗方給出的是最優(yōu)擬合回歸方程,我們需要檢驗方程的統(tǒng)計顯著性程的統(tǒng)計顯著性. 要明白為什么要明白為什么, 考慮圖考慮

34、圖7.13里的數(shù)據(jù),因為用箭里的數(shù)據(jù),因為用箭頭指出了數(shù)據(jù)點頭指出了數(shù)據(jù)點, 所以能夠用一條斜率為正的回歸直線來擬合它所以能夠用一條斜率為正的回歸直線來擬合它們們. 這條回歸直線能證明這條回歸直線能證明x 和和y 之間有真實的線性關(guān)系嗎?或許之間有真實的線性關(guān)系嗎?或許不是因為方程有意義就必須解釋由不是因為方程有意義就必須解釋由x 的改變而引起的改變而引起y 的主要變的主要變異異 正的斜率能夠象征這組數(shù)據(jù)嗎正的斜率能夠象征這組數(shù)據(jù)嗎? 變量變量x 和和y 之間有線性關(guān)系嗎之間有線性關(guān)系嗎?圖圖6.13 222)()()(yyyyyyiii ss總總 = ss回回 + sse 22r)()(ss

35、yxxbyyyii xx.22222)()(lbxxbxxbiixxxyllb xyxx2xyxx2xxxy)(,sslblllll 回回因為因為所以所以2.直線回歸中變異的分析直線回歸中變異的分析 公式公式6.16 總的平方和是總的平方和是 nyyyyiii222)()(ss總總由回歸引起的平方和是由回歸引起的平方和是: : xy2ssbllbxx 回回殘差的平方和是殘差的平方和是: :2e)(ss iiyy = ss總總ss回回= ss總總b*lxy ss回回是由是由 x 不同引起的線性效應(yīng)不同引起的線性效應(yīng), 它反應(yīng)在它反應(yīng)在y 的總變的總變異中異中, 由于由于x 與與y 的直線關(guān)系而使

36、的直線關(guān)系而使 y 變異減小的部分變異減小的部分, 為為y 的總變異的總變異ss總總lyy中可以用自變量中可以用自變量 x 來解釋的變來解釋的變異異. ss回回越大越大, 說明回歸效果越好。說明回歸效果越好。 ss剩余剩余表示散點圖中各實測點關(guān)于回歸直線的偏離情表示散點圖中各實測點關(guān)于回歸直線的偏離情況,況,ss剩剩越小,說明各實測點離回歸直線越接近,直越小,說明各實測點離回歸直線越接近,直線回歸的誤差越小,反映除自變量線回歸的誤差越小,反映除自變量x對因變量對因變量y線性影線性影響之外的一切因素對響之外的一切因素對y變異的作用,也就是在總平方和變異的作用,也就是在總平方和中,無法用自變量解釋

37、的作用,即隨機誤差作用。中,無法用自變量解釋的作用,即隨機誤差作用。ss剩剩 的大小與自由度的大小與自由度df剩剩 有關(guān),因為有關(guān),因為 中的中的 a 和和 b 都是都是由樣本值算得的,所以由樣本值算得的,所以df剩剩n-2 。 yx 和和 y 的樣本相關(guān)系數(shù)的樣本相關(guān)系數(shù) r 及及 y的方差的方差 已知時:已知時: 2ysss剩剩(y )2(n-1)(1-r2) ,df剩剩n-2 。 y3.剩余標(biāo)準(zhǔn)差與決定系數(shù)剩余標(biāo)準(zhǔn)差與決定系數(shù) 剩余標(biāo)準(zhǔn)差和決定系數(shù)都是描述回歸方程擬合效果剩余標(biāo)準(zhǔn)差和決定系數(shù)都是描述回歸方程擬合效果的指標(biāo)。的指標(biāo)。 (1)剩余標(biāo)準(zhǔn)差)剩余標(biāo)準(zhǔn)差(standard devi

38、ation about residual) 剩余標(biāo)準(zhǔn)差表示各實測值剩余標(biāo)準(zhǔn)差表示各實測值y關(guān)于回歸直線關(guān)于回歸直線 縱向距離縱向距離的離散程度。因的離散程度。因 = a+bx 系由系由x推斷推斷y,所以其剩余標(biāo),所以其剩余標(biāo)準(zhǔn)差記為準(zhǔn)差記為syx :. yy2)(22. nyynsssexy (7.20) (2)決定系數(shù))決定系數(shù)(determining coefficient,r2) 回歸平回歸平方和在總平方和中所占的比例稱為決定系數(shù):方和在總平方和中所占的比例稱為決定系數(shù): 22222)()(1)()(yyyyssssssyyyyssssre總總總總總總回回在直線回歸中在直線回歸中, 將將

39、ss回回= 代入式代入式(7.25) 得得: xxxyll/22222/rlllllllssryyxxxyyyxxxyyy 回回 當(dāng)當(dāng)ss總總 不變時不變時, ss回回的大小決定的大小決定 r 的大小的大小. ss回回 越大越大, 則則 r 越接近越接近1。如。如 r=0.2 , n=100, 則則 02. 20989. 02 . 0982 . 012 . 02 rt)98(984. 105. 0t 拒絕拒絕h0 ,認為變量之間存在相關(guān)關(guān)系認為變量之間存在相關(guān)關(guān)系.但是但是, r2=0.04, 表示表示ss回回僅占僅占ss總總 的的4% . 兩變量之間相關(guān)程度不大。兩變量之間相關(guān)程度不大。 如

40、下圖中如下圖中ss剩剩 相同時相同時, 但相關(guān)系數(shù)相差很大但相關(guān)系數(shù)相差很大, r 隨隨 b 的增大而增大的增大而增大, 所以所以 r 的大小與的大小與ss剩剩 與與 b 有關(guān)有關(guān), r 不能用不能用來作為回歸估計精度的指標(biāo)。來作為回歸估計精度的指標(biāo)。 對對r2的要求隨研究領(lǐng)域而不同的要求隨研究領(lǐng)域而不同. 在一些臨床研究中在一些臨床研究中,因因病人之間的個體差異較大病人之間的個體差異較大, r2 達到達到0.7 認為回歸效果不認為回歸效果不錯錯. 而在一些高精度的醫(yī)藥實驗室研究中而在一些高精度的醫(yī)藥實驗室研究中, 要求要求r2 較大,較大,例如,標(biāo)準(zhǔn)線的配制要求例如,標(biāo)準(zhǔn)線的配制要求 r2

41、在在0.95以上以上 回歸的顯著性檢驗是回歸的顯著性檢驗是anova表表.假設(shè)假設(shè) h0: y的主要變化不能用線性模型解釋的主要變化不能用線性模型解釋, 即即=0 h1: y的主要變化能用線性模型解釋的主要變化能用線性模型解釋, 即即0 期望值列在表期望值列在表7.1里,這里無需證明,只是為假設(shè)檢里,這里無需證明,只是為假設(shè)檢驗提供直接值驗提供直接值4直線回歸方程的檢驗直線回歸方程的檢驗 (1)直線回歸方程的方差分析)直線回歸方程的方差分析 對直線回歸方程對直線回歸方程作方差分析的目的是檢驗所建立的直線回歸方程是作方差分析的目的是檢驗所建立的直線回歸方程是否有統(tǒng)計學(xué)意義。否有統(tǒng)計學(xué)意義。 1)

42、(22 yyfe 假設(shè)假設(shè)h0為真為真:表表6.1 回歸分析的方差分析表回歸分析的方差分析表 方差來源方差來源 ss df ms e(ms) f c.v. 回歸回歸 ssr 1 msr 誤差誤差 sse n-2 mse xyss22 ermsms見附表見附表7 7 2y 總總 ss總總 n-1 假設(shè)假設(shè)h1為真為真: 1)(222 yxxylfe 2lxx 永遠為正或永遠為正或 0(在(在h0下為下為0而在而在h 1下為正)下為正) 回到前例回到前例, 對中國林蛙對中國林蛙(哈士蟆哈士蟆)心律和溫度之間的心律和溫度之間的關(guān)系進行回歸分析我們開初使用數(shù)據(jù)散點圖關(guān)系進行回歸分析我們開初使用數(shù)據(jù)散點

43、圖(見圖見圖6.14), 它表示心律和溫度之間存在明顯的線性關(guān)系它表示心律和溫度之間存在明顯的線性關(guān)系 圖圖6.14 中國林蛙心律和溫度的散點圖中國林蛙心律和溫度的散點圖 下一步對回歸分析進行初步計算下一步對回歸分析進行初步計算 n=9 x=90 y=179 x2=1140 y2=4365 xy=2316現(xiàn)在我們能夠計算回歸系數(shù)或斜率現(xiàn)在我們能夠計算回歸系數(shù)或斜率0 .10 x9 .19 y 78. 1240426114022169)90(9)179)(90(222 nxnyxxxxyxxyllb在圖在圖6.14 里數(shù)據(jù)的最優(yōu)二乘擬合方程是里數(shù)據(jù)的最優(yōu)二乘擬合方程是 )0 .10(78. 19

44、 .19)(| ixyxxxbyy 或或 為畫這條直線,在研究的范圍值內(nèi)利用兩點溫度求兩點值,為畫這條直線,在研究的范圍值內(nèi)利用兩點溫度求兩點值,我們使用我們使用x=5和和x=15: 5 |y =19.9+1.78(5-10.0)=11.0 15|y =19.9+1.78(15-10.0)=28.8 ),(yx 圖圖6.15 最小二乘回歸線通過兩點最小二乘回歸線通過兩點(5, ) 和和(15, ) 延長延長, 坐標(biāo)是由回歸方程確定的坐標(biāo)是由回歸方程確定的 5 |y 15|y 作出回歸方程后,我們需要檢驗它是否能夠解釋作出回歸方程后,我們需要檢驗它是否能夠解釋 y 的主要變的主要變化假設(shè)化假設(shè)

45、h0:=0 ha:0利用最初的計算結(jié)果,我們有利用最初的計算結(jié)果,我們有 89.80491794365222 nyyss總總ssr=b2lxx=(1.78)2(240)=760.42 sse=ss 總總ssr=804.89760.42=44.47 方差來源方差來源 ss df ms f c.v. 回歸回歸 760.42 1 760.42 119.75 5.59 誤差誤差 44.47 7 6.35 總總 804.89 8 因為因為119.755.59,我們確信心律的主要變化能通過溫度,我們確信心律的主要變化能通過溫度的回歸進行解釋的回歸進行解釋 (2)回歸系數(shù)的假設(shè)檢驗)回歸系數(shù)的假設(shè)檢驗: 根

46、據(jù)樣本回歸系數(shù)根據(jù)樣本回歸系數(shù)blxy / lxx , 由正態(tài)分布性質(zhì)可知由正態(tài)分布性質(zhì)可知:樣本回歸系數(shù)樣本回歸系數(shù) b 是一個正態(tài)變量是一個正態(tài)變量; b 的總體均數(shù)為的總體均數(shù)為. b的的方差為方差為 : 2xx21ybl 估計值是估計值是 :xxeexx2bms2ss1slnl )2(/. ntlsbsbtxxxybb服從服從 h0:=0 ha:0xyxxbbslbsbt.0 可以檢驗樣本回歸系數(shù)可以檢驗樣本回歸系數(shù) b 是否來自是否來自 = 0的總體。的總體。 (3) 直線回歸方程、回歸系數(shù)、相關(guān)系數(shù)假設(shè)檢驗的關(guān)直線回歸方程、回歸系數(shù)、相關(guān)系數(shù)假設(shè)檢驗的關(guān)系系 eexyxyxxxxx

47、yxyxxbssssnnssblslllslbt回回)2()2/()/(.2.22 = f , 同樣可推導(dǎo)出同樣可推導(dǎo)出 tr2 = tb2 = f 因為線性回歸中只有一個自變量因為線性回歸中只有一個自變量, 所以所以, 對同一資料,對同一資料,回歸系數(shù)的假設(shè)檢驗、相關(guān)系數(shù)的假設(shè)檢驗、回歸方回歸系數(shù)的假設(shè)檢驗、相關(guān)系數(shù)的假設(shè)檢驗、回歸方程的方差分析都是一致的程的方差分析都是一致的, 當(dāng)相關(guān)系數(shù)有統(tǒng)計學(xué)意義時當(dāng)相關(guān)系數(shù)有統(tǒng)計學(xué)意義時, 回歸系數(shù)與回歸方程也一定有意義回歸系數(shù)與回歸方程也一定有意義, 反之亦然反之亦然. 由于相由于相關(guān)系數(shù)的計算及檢驗比較方便關(guān)系數(shù)的計算及檢驗比較方便, 故常用相關(guān)

48、系數(shù)的假設(shè)故常用相關(guān)系數(shù)的假設(shè)檢驗代替回歸系數(shù)、回歸方程的假設(shè)檢驗。檢驗代替回歸系數(shù)、回歸方程的假設(shè)檢驗。 5. 回歸系數(shù)的可信區(qū)間回歸系數(shù)的可信區(qū)間 由式由式(7.25),按,按 t 分布的規(guī)律分布的規(guī)律,推導(dǎo)出回歸系數(shù),推導(dǎo)出回歸系數(shù)的的(1)可信區(qū)間計算公式可信區(qū)間計算公式(縮寫縮寫)為:為: bbstbstb22 xxebmsls 例例7.3 由圖由圖7-4可見例可見例7.1資料三歲兒童體重與體表面積資料三歲兒童體重與體表面積資料的散點圖有直線趨勢資料的散點圖有直線趨勢, 故適于作回歸直線分析。故適于作回歸直線分析。 第四節(jié)第四節(jié) 直線回歸與相關(guān)的區(qū)別和聯(lián)系直線回歸與相關(guān)的區(qū)別和聯(lián)系

49、1區(qū)別區(qū)別 (1) 在資料要求上在資料要求上, 回歸要求因變量回歸要求因變量 y 服從正態(tài)分布服從正態(tài)分布;x是可以精確測量和嚴格控制的變量是可以精確測量和嚴格控制的變量, 一般稱為一般稱為 i 型回歸型回歸相關(guān)要求兩個變量相關(guān)要求兩個變量 x、y 都服從正態(tài)分布都服從正態(tài)分布, 稱為雙變量稱為雙變量正態(tài)分布正態(tài)分布. 這種資料若進行回歸分析這種資料若進行回歸分析, 稱為稱為ii型回歸型回歸(1) 已知已知x、y 的標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)差sx、sy時,相關(guān)系數(shù)時,相關(guān)系數(shù)r 與回歸系與回歸系數(shù)數(shù) b 可以相互推算:可以相互推算: r = b sx / sy , b = r sy / sx (7.31)

50、 同一組數(shù)據(jù)的同一組數(shù)據(jù)的r與與b的正負號是一致的。的正負號是一致的。r為正號,說為正號,說明兩變量間的相互關(guān)系是同向變化的;明兩變量間的相互關(guān)系是同向變化的;b為正,說明自為正,說明自變量變量 x 增增(減減)一個單位,因變量一個單位,因變量y 平均增平均增(減減)b個單位。個單位。 (2) r 和和 b 的假設(shè)檢驗是等價的。對同一樣本,二者假的假設(shè)檢驗是等價的。對同一樣本,二者假設(shè)檢驗的設(shè)檢驗的t值相等。由于值相等。由于r的假設(shè)檢驗可直接查表,較的假設(shè)檢驗可直接查表,較為方便,故在實際應(yīng)用中常以前者代替后者。為方便,故在實際應(yīng)用中常以前者代替后者。 (3) 回歸強度和相關(guān)強度可以互相解釋。

51、回歸強度和相關(guān)強度可以互相解釋。 第五節(jié)第五節(jié) 回歸分析的應(yīng)用回歸分析的應(yīng)用 1. 描述變量間的數(shù)量變化關(guān)系描述變量間的數(shù)量變化關(guān)系 2. 預(yù)測(預(yù)測(x=x0時,求時,求y0 估計值的容許區(qū)間)估計值的容許區(qū)間) 3. 控制(控制(y=y0時,求時,求x0估計值的容許區(qū)間)估計值的容許區(qū)間) (1)ii型回歸資料型回歸資料; ;(2)i 型回歸資料時,型回歸資料時, 4. 估計(估計(x= x0時,求時,求的可信區(qū)間)的可信區(qū)間) y0的的1-預(yù)測區(qū)間預(yù)測區(qū)間 xxlxxnnssty2020)(112 剩剩 的的1-預(yù)測區(qū)間預(yù)測區(qū)間 0y )(122020 xxlxxnnssty 剩剩 例例

52、6.8 用顯微定量法測定生產(chǎn)二陳丸的甘草濃度用顯微定量法測定生產(chǎn)二陳丸的甘草濃度(x)與與鏡檢晶纖維的數(shù)目鏡檢晶纖維的數(shù)目(y),得表,得表7-5資料試預(yù)測甘草濃度資料試預(yù)測甘草濃度x0 = 4mg/ml時,晶纖維數(shù)目總體均數(shù)時,晶纖維數(shù)目總體均數(shù)90%可信區(qū)間可信區(qū)間 使用使用spss 統(tǒng)計軟件:統(tǒng)計軟件:甘草濃度甘草濃度(x)2.073.104.145.176.20晶纖數(shù)目晶纖數(shù)目(y)128194273372454第六節(jié)第六節(jié) 曲線回歸曲線回歸 1曲線回歸的意義曲線回歸的意義 2曲線擬合曲線擬合 第六節(jié)第六節(jié) 曲線回歸曲線回歸 1曲線回歸的意義曲線回歸的意義直線回歸可分析呈直線變化趨直線

53、回歸可分析呈直線變化趨勢的變量之間的數(shù)量依存關(guān)系,但在實踐中,很多變勢的變量之間的數(shù)量依存關(guān)系,但在實踐中,很多變量之間并不是直線關(guān)系,而呈曲線關(guān)系,如服藥后的量之間并不是直線關(guān)系,而呈曲線關(guān)系,如服藥后的血藥濃度與時間的關(guān)系;毒物劑量與毒性反應(yīng)的關(guān)系;血藥濃度與時間的關(guān)系;毒物劑量與毒性反應(yīng)的關(guān)系;年齡與血紅蛋白平均濃度的關(guān)系;細菌繁殖與培養(yǎng)時年齡與血紅蛋白平均濃度的關(guān)系;細菌繁殖與培養(yǎng)時間的關(guān)系;等等,都不是簡單的直線關(guān)系,即使在不間的關(guān)系;等等,都不是簡單的直線關(guān)系,即使在不太大的范圍內(nèi),仍不能以直代曲。對呈曲線關(guān)系的資太大的范圍內(nèi),仍不能以直代曲。對呈曲線關(guān)系的資料,需要用曲線回歸(料

54、,需要用曲線回歸(curve linear regression)的方)的方法進行分析,根據(jù)樣本資料找出能夠反映變量間關(guān)系法進行分析,根據(jù)樣本資料找出能夠反映變量間關(guān)系的曲線回歸方程。的曲線回歸方程。 2曲線擬合曲線擬合求曲線回歸方程的過程或方法叫曲線擬合求曲線回歸方程的過程或方法叫曲線擬合(curve fitting)。進行曲線回歸分析的要點是選擇合適的曲線)。進行曲線回歸分析的要點是選擇合適的曲線類型。一般,需要采用幾種最可能的曲線類型分別擬合同一個類型。一般,需要采用幾種最可能的曲線類型分別擬合同一個資料,先對每種擬合結(jié)果進行擬合優(yōu)度檢驗,然后對它們進行資料,先對每種擬合結(jié)果進行擬合優(yōu)度

55、檢驗,然后對它們進行擬合優(yōu)度比較。從而挑選出擬合得最好的曲線模型。如使用統(tǒng)擬合優(yōu)度比較。從而挑選出擬合得最好的曲線模型。如使用統(tǒng)計軟件,一組資料可同時擬合多種模型,可在計軟件,一組資料可同時擬合多種模型,可在r square(決定決定系數(shù)系數(shù))接近)接近1和標(biāo)準(zhǔn)估計誤差和標(biāo)準(zhǔn)估計誤差sy較小者中篩選。如果進行預(yù)測,較小者中篩選。如果進行預(yù)測,則在上述基礎(chǔ)上,對擬合度較好(一般認為,一組資料同時適則在上述基礎(chǔ)上,對擬合度較好(一般認為,一組資料同時適用的模型不只一條)的模型進行回代,依預(yù)測值評判模型的適用的模型不只一條)的模型進行回代,依預(yù)測值評判模型的適用程度,其條件是預(yù)測值(尤其是外推值)盡

56、可能接近實際情用程度,其條件是預(yù)測值(尤其是外推值)盡可能接近實際情況,然后再以況,然后再以“最適合最適合”的模型評價結(jié)果,若同時滿足上述條的模型評價結(jié)果,若同時滿足上述條件的模型有數(shù)條,則以變量數(shù)最小,結(jié)構(gòu)最簡單的模型為首選。件的模型有數(shù)條,則以變量數(shù)最小,結(jié)構(gòu)最簡單的模型為首選。 例例6.7 研究板藍根注射液含量的穩(wěn)定性,在研究板藍根注射液含量的穩(wěn)定性,在ph = 6.28,溫度為,溫度為78下,測得保溫時間與含量破壞百分比的下,測得保溫時間與含量破壞百分比的結(jié)果如下,作保溫時間結(jié)果如下,作保溫時間t與含量破壞百分比與含量破壞百分比p間的曲線間的曲線擬合。擬合。 保溫時間保溫時間t t(h

57、 h)323264649696128128含量破壞百分比含量破壞百分比p p4.554.5512.2712.2715.4515.4518.1818.18使用使用spss統(tǒng)計軟件,故統(tǒng)計軟件,故s曲線擬合有統(tǒng)計學(xué)意義。曲線擬合有統(tǒng)計學(xué)意義。s模型的決定系數(shù)模型的決定系數(shù)r square=0 .997,s曲線曲線方程為:方程為: p =exp(b0+b1 / t)= exp(3.376653-59.080663/t) 第七節(jié)第七節(jié) 半數(shù)致死量半數(shù)致死量ld50 一、一、ld50的意義的意義 1.最小致死量和絕對致死量最小致死量和絕對致死量: 在進行毒力實驗觀察時在進行毒力實驗觀察時, 由于動物的個

58、體差異由于動物的個體差異, 每個動物對毒物的反應(yīng)不盡相每個動物對毒物的反應(yīng)不盡相同。藥物劑量較小時同。藥物劑量較小時, 動物不死動物不死, 當(dāng)劑量逐漸增加當(dāng)劑量逐漸增加, 動動物開始死亡物開始死亡, 能使一只動物死亡的劑量能使一只動物死亡的劑量, 稱為最小致死稱為最小致死劑量(劑量(minimum lethal dose); 劑量增加到一定程度劑量增加到一定程度, 動物全部死亡動物全部死亡, 稱為絕對致死量稱為絕對致死量(lethal dose)。 2.半數(shù)致死量半數(shù)致死量ld50 使一組試驗動物死亡一半的藥物使一組試驗動物死亡一半的藥物劑量稱為半數(shù)致死量劑量稱為半數(shù)致死量ld50 (leth

59、al dose 50%) 以劑量作橫軸以劑量作橫軸 , 死亡率作縱軸作圖死亡率作縱軸作圖, 即得死亡率即得死亡率p=f(x)關(guān)于劑量關(guān)于劑量 d 的分布函數(shù)圖的分布函數(shù)圖 , 稱為劑量稱為劑量-死亡率曲線。死亡率曲線。 二、半數(shù)致死量二、半數(shù)致死量ld50的實驗設(shè)計要求的實驗設(shè)計要求 1.給藥劑量的確定:參考有關(guān)資料或作預(yù)備試驗,找出給藥劑量的確定:參考有關(guān)資料或作預(yù)備試驗,找出動物全部不死或全部死亡的劑量范圍,并加以分組動物全部不死或全部死亡的劑量范圍,并加以分組(一般(一般58組)。要求組)。要求50%死亡率的上下各有一半組數(shù)。死亡率的上下各有一半組數(shù)。劑量分組一般按等比級數(shù)排列,對數(shù)轉(zhuǎn)換

60、劑量間等距。劑量分組一般按等比級數(shù)排列,對數(shù)轉(zhuǎn)換劑量間等距。相鄰高低劑量之比一般為相鄰高低劑量之比一般為1:0.8左右,或按左右,或按 )組組數(shù)數(shù)最最低低劑劑量量最最高高劑劑量量1lglg(lg1 的比值作等比級數(shù)分組的比值作等比級數(shù)分組, , 從最低量組開始乘以比值從最低量組開始乘以比值, ,即得相鄰組的劑量。即得相鄰組的劑量。 注意:劑量間距的大小與藥物劑量反應(yīng)關(guān)系直線的斜注意:劑量間距的大小與藥物劑量反應(yīng)關(guān)系直線的斜率有關(guān),斜率較大時,間距可小一些。率有關(guān),斜率較大時,間距可小一些。 2.動物實驗選擇與分組:根據(jù)實驗的性質(zhì)合理地選擇動動物實驗選擇與分組:根據(jù)實驗的性質(zhì)合理地選擇動物的種屬

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論