版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2023/9/19第九章直線相關(guān)與回歸1第九章
雙變量回歸與相關(guān)2023/9/19第九章直線相關(guān)與回歸2第九章雙變量回歸與相關(guān)
研究兩個(gè)數(shù)值變量間的數(shù)量關(guān)系第一節(jié)直線回歸第二節(jié)直線相關(guān)第三節(jié)秩相關(guān)第四節(jié)加權(quán)直線回歸第五節(jié)兩條回歸直線的比較2023/9/19第九章直線相關(guān)與回歸3歷史背景2023/9/19第九章直線相關(guān)與回歸4“回歸”現(xiàn)象
F.GaltonK.Pearson2023/9/19第九章直線相關(guān)與回歸5直線回歸分析與相關(guān)分析步驟作散點(diǎn)圖,觀察點(diǎn)子是否呈直線趨勢作直線回歸分析和相關(guān)分析直線趨勢結(jié)束是否2023/9/19第九章直線相關(guān)與回歸6例9-1P182~184某地方病研究所調(diào)查了8名正常兒童的尿肌酐含量(mmol/24h)。
X為選定變量,Y為隨機(jī)變量。8名正常兒童的年齡X歲與尿肌酐含量(mmol/24h)編號(hào)12345678年齡X131196810127尿肌酐含量Y3.543.013.092.482.563.363.182.65散點(diǎn)圖2023/9/19第九章直線相關(guān)與回歸7繪制散點(diǎn)圖以橫軸為年齡X,縱軸為尿肌酐Y,將隨機(jī)樣本的n對(duì)變量值(X1,Y1),…,(Xn,Yn),即(13,3.54),(11,3.01),…,(7,2.65)
(表9-1數(shù)據(jù),共8個(gè)記錄),繪于圖中,得散點(diǎn)圖。散點(diǎn)圖2023/9/19第九章直線相關(guān)與回歸8觀察散點(diǎn)的分布趨勢若有直線趨勢,可進(jìn)行線性回歸或相關(guān)分析。尿肌酐含量Y隨年齡X增加而增大,且呈直線趨勢。異常點(diǎn),outlier。明顯遠(yuǎn)離主體的數(shù)據(jù)。年齡141210864尿肌酐3.63.43.23.02.82.62.4散點(diǎn)圖2023/9/19第九章直線相關(guān)與回歸9例9-1簡單散點(diǎn)圖SimpleScatterplotGraphs
Scatter/Dot…散點(diǎn)圖2023/9/19第九章直線相關(guān)與回歸10例9-1簡單散點(diǎn)圖Simple散點(diǎn)圖12435①選擇Simple(簡單);②單擊Define(定義)。③YAxis:y④XAxis:x⑤單擊OK。Simple:簡單散點(diǎn)圖,顯示一對(duì)變量。Overlay:重疊散點(diǎn)圖,顯示多對(duì)變量。SetMakersby:分組變量,用不同顏色表示,如性別。LabelCasesby:標(biāo)記變量,用此變量值標(biāo)記,如序號(hào)。2023/9/19第九章直線相關(guān)與回歸11例9-1SimpleScatterplot散點(diǎn)圖2023/9/19第九章直線相關(guān)與回歸12有直線趨勢型正確注意:不一定是因果關(guān)系,應(yīng)根據(jù)專業(yè)知識(shí)判定是否有實(shí)際意義。散點(diǎn)圖2023/9/19第九章直線相關(guān)與回歸13無直線趨,模型不正確有曲線趨勢,應(yīng)進(jìn)一步擬合曲線關(guān)系。散點(diǎn)圖2023/9/19第九章直線相關(guān)與回歸14散點(diǎn)圖大部分觀測值有直線趨勢,模型不正確有一離群點(diǎn)(outlier),會(huì)對(duì)分析結(jié)果帶來了嚴(yán)重的影響,應(yīng)對(duì)該離群點(diǎn)進(jìn)行認(rèn)真核查與深入分析。參閱P159(2.進(jìn)行相關(guān)、回歸分析前應(yīng)繪制散點(diǎn)圖)。2023/9/19第九章直線相關(guān)與回歸15散點(diǎn)圖不一定有直線趨勢,模型不正確有一個(gè)觀測值對(duì)分析結(jié)果帶來了嚴(yán)重的影響,應(yīng)增加對(duì)不同的自變量x增加一定的觀測值再進(jìn)行認(rèn)真分析。2023/9/19第九章直線相關(guān)與回歸16第一節(jié)直線回歸
linearregression回歸概念分析步驟直線回歸方程的求導(dǎo)統(tǒng)計(jì)推斷估計(jì)與預(yù)測2023/9/19第九章直線相關(guān)與回歸17回歸(regression)分析事物或現(xiàn)象間的數(shù)量依存關(guān)系。直線回歸,linearregression。簡單回歸,simpleregression。兩連續(xù)性變量X與Y之間的線性數(shù)量依存關(guān)系。X為自變量,independentvariable;Y為因變量,dependentvariable?;貧w關(guān)系是數(shù)量關(guān)系,并不是一一對(duì)應(yīng)的函數(shù)關(guān)系。子女身高y與父親身高x之間的關(guān)系;體重y與身高x1、胸圍x2之間的關(guān)系體表面積y與體重x之間的關(guān)系2023/9/19第九章直線相關(guān)與回歸18回歸分析的步驟繪制散點(diǎn)圖求回歸方程:回歸系數(shù)和常數(shù)項(xiàng)假設(shè)檢驗(yàn):方程、回歸系數(shù)和常數(shù)項(xiàng)回歸方程的解釋與應(yīng)用2023/9/19第九章直線相關(guān)與回歸19直線回歸方程2023/9/19第九章直線相關(guān)與回歸20最小二乘法2023/9/19第九章直線相關(guān)與回歸21例9-1P150某地方病研究所調(diào)查了8名正常兒童的尿肌酐含量(mmol/24h)。估計(jì)尿肌酐含量(Y)對(duì)其年齡(X)的回歸方程。根據(jù)變量間的關(guān)系,確定自變量和因變量。年齡X為自變量,independentvariable;尿肌酐含量Y為因變量,dependentvariable。8名正常兒童的年齡X歲與尿肌酐含量(mmol/24h)編號(hào)12345678年齡X131196810127尿肌酐含量Y3.543.013.092.482.563.363.182.652023/9/19第九章直線相關(guān)與回歸22例9-1直線回歸方程年齡131211109876尿肌酐3.63.43.23.02.82.62.4(X,Y)2023/9/19第九章直線相關(guān)與回歸23例9-1線性回歸LinearRegressionAnalyze
Regression
Linear...Dependent因變量Independent(s)自變量2023/9/19第九章直線相關(guān)與回歸24例9-1SPSS的直線回歸方程Coefficients,系數(shù):DependentVariable,因變量Model:模型;Constant:常數(shù)項(xiàng)。UnstandardizedCoefficients,未標(biāo)化系數(shù)。B:對(duì)應(yīng)系數(shù)。此處含“常數(shù)項(xiàng)a”,和變量“年齡”的“回歸系數(shù)b”。Std.Error:對(duì)應(yīng)系數(shù)的標(biāo)準(zhǔn)誤。Coefficientsa1.664(a).2975.602.001.139(b).0304.571.004(Constant)年齡Model1BStd.ErrorUnstandardizedCoefficientstSig.DependentVariable:尿肌酐a.2023/9/19第九章直線相關(guān)與回歸25總體均數(shù)mX|Y年齡131211109876尿肌酐3.63.43.23.02.82.62.4(X,Y)2023/9/19第九章直線相關(guān)與回歸26常數(shù)項(xiàng)a,constantterm截距,intercept,回歸直線在Y軸的交點(diǎn)。a=0,交點(diǎn)在原點(diǎn)上;a>0,交點(diǎn)在原點(diǎn)的上方;a<0,交點(diǎn)在原點(diǎn)的下方。統(tǒng)計(jì)意義:當(dāng)X=0時(shí),
相應(yīng)Y的均數(shù)估計(jì)值。去掉此選項(xiàng)方程不含常數(shù)項(xiàng)方程必過原點(diǎn)2023/9/19第九章直線相關(guān)與回歸27回歸系數(shù)b,Coefficientofregression斜率,slope,直線越陡,斜率b
=
tg
越大。不考慮其它變量的影響,表示任何兩變量間的數(shù)量(依存)關(guān)系。b=0:回歸直線與x軸平行,即X與Y無直線關(guān)系;b>0:直線從左下方走向右上方;b<0:直線從左上方走向右下方;b=0,即回歸方程不存在。統(tǒng)計(jì)意義:當(dāng)X變化一個(gè)
單位,Y平均
改變的估計(jì)值
(b個(gè)單位)。2023/9/19第九章直線相關(guān)與回歸28例9-1回歸線根據(jù)已求得的回歸方程,取兩點(diǎn)(X1,^Y1)和
(X2,^Y2)用直線連接。在X實(shí)測值的范圍內(nèi)取X1(較小值)和X2(較大值);把X1和X2代入回歸方程,求出^Y1和^Y2;將
(X1,^Y1)和
(X2,^Y2)
兩坐標(biāo)點(diǎn)描繪在散點(diǎn)圖中;用直線連接這兩個(gè)坐標(biāo)
點(diǎn),得到方程的回歸直線。繪圖時(shí)注意,兩坐標(biāo)點(diǎn)
之間要隔開一定的距離,
以減少回歸線的誤差。年齡131211109876尿肌酐3.63.43.23.02.82.62.42023/9/19第九章直線相關(guān)與回歸29例9-1用SPSS制作含散點(diǎn)圖的回歸線1234若去掉此選項(xiàng),則回歸方程不含常數(shù)項(xiàng),方程過原點(diǎn)2023/9/19第九章直線相關(guān)與回歸30例9-1SPSS回歸線:添加回歸方程2023/9/19第九章直線相關(guān)與回歸31直線回歸中的統(tǒng)計(jì)推斷回歸方程的檢驗(yàn):H0:b=0,H1:b<>0,a=0.05。對(duì)回歸方程的檢驗(yàn):方差分析。對(duì)回歸系數(shù)的檢驗(yàn):t檢驗(yàn)。一元直線回歸(即一個(gè)自變量,一個(gè)因變量)中,上面兩個(gè)檢驗(yàn)等價(jià)??傮w回歸系數(shù)(含常數(shù)項(xiàng))的可信區(qū)間:總體回歸系數(shù)b的可信區(qū)間。總體常數(shù)項(xiàng)a的可信區(qū)間。利用回歸方程的估計(jì)和預(yù)測:總體均數(shù)mY|X的可信區(qū)間。個(gè)體值Y的預(yù)測區(qū)間。2023/9/19第九章直線相關(guān)與回歸32例9-1回歸方程檢驗(yàn)—方差分析表2023/9/19第九章直線相關(guān)與回歸33例9-1
SPSS回歸方程的方差分析H0:b=0,H1:b<>0,a=0.05。F=20.892,P=0.004<0.05,按a=0.05檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,認(rèn)為方程有統(tǒng)計(jì)學(xué)意義。回歸的剩余標(biāo)準(zhǔn)差bANOVA.8101.81020.892.004a.2336.0391.0437RegressionResidualTotalModel1SumofSquaresdfMeanSquareFSig.Predictors:(Constant),年齡a.DependentVariable:尿肌酐b.2023/9/19第九章直線相關(guān)與回歸34方差分析,ANOVAa.Predictors:(Constant),年齡預(yù)測:常數(shù)、年齡,即回歸方程中含常數(shù)項(xiàng)和年齡。b.DependentVariable:尿肌酐因變量:尿肌酐Model,模型Regression,回歸Residual,殘差Total,總計(jì),總變異SumofSquares,SS,平方和df,degreeoffreedom,自由度MeanSquare,MS,圴方2023/9/19第九章直線相關(guān)與回歸35例9-1回歸方程的回歸系數(shù)檢驗(yàn)2023/9/19第九章直線相關(guān)與回歸36例9-1SPSS回歸方程的回歸系數(shù)檢驗(yàn)回歸系數(shù)檢驗(yàn)—t檢驗(yàn)H0:b=0,H1:b<>0,a=0.05。回歸系數(shù)的tb=4.571,P=0.004<0.05,按a=0.05檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,認(rèn)為b不為零,方程存在。F=t2:直線回歸中,F(xiàn)檢驗(yàn)與t檢驗(yàn)等價(jià)。Coefficientsa1.664(a).2975.602.001.139(b).030(Sb)4.571.004(Constant)年齡Model1BStd.ErrorUnstandardizedCoefficientstSig.DependentVariable:尿肌酐a.2023/9/19第九章直線相關(guān)與回歸37例9-1SPSS回歸方程的常數(shù)項(xiàng)檢驗(yàn)常數(shù)項(xiàng)檢驗(yàn)—t檢驗(yàn)H0:a=0,H1:a<>0,a=0.05。常數(shù)項(xiàng)的ta=5.602,P=0.001<0.05,按a=0.05檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,認(rèn)為回歸方程過原點(diǎn)。Coefficientsa1.664(a).2975.602.001.139(b).030(Sb)4.571.004(Constant)年齡Model1BStd.ErrorUnstandardizedCoefficientstSig.DependentVariable:尿肌酐a.2023/9/19第九章直線相關(guān)與回歸38總體回歸系數(shù)b的可信區(qū)間2023/9/19第九章直線相關(guān)與回歸39例9-1SPSS的統(tǒng)計(jì)量子對(duì)話框123操作:①在主對(duì)話框中單擊[Statistics],②選擇Confidenceintervals,③單擊[Continue]。Estimates:估計(jì),默認(rèn)項(xiàng)。Modelfit:模型配合,默認(rèn)項(xiàng)。Confidenceintervals:回歸系數(shù)B的95%可信區(qū)間Statistics統(tǒng)計(jì)量2023/9/19第九章直線相關(guān)與回歸40例9-1SPSS系數(shù)的可信區(qū)間在Statistics子對(duì)話框中選擇Confidenceintervals(可信區(qū)間),則其結(jié)果顯示在“Coefficients(系數(shù))”表的右側(cè)。Constant,常數(shù)。常數(shù)項(xiàng)a的95%可信區(qū)間為(0.937,2.391)。回歸系數(shù)b的95%可信區(qū)間為(0.065,0.213)。Coefficientsa.9372.391.065.213(Constant)年齡Model1LowerBoundUpperBound95%ConfidenceIntervalforBDependentVariable:尿肌酐a.2023/9/19第九章直線相關(guān)與回歸41估計(jì):總體均數(shù)mY|X的可信區(qū)間(例9-4)2023/9/19第九章直線相關(guān)與回歸42預(yù)測:個(gè)體Y值的預(yù)測區(qū)間(例9-4)2023/9/19第九章直線相關(guān)與回歸43可信區(qū)間與預(yù)測區(qū)間示意圖尿肌酐X16.0014.0012.0010.008.006.004.002.00.005.04.03.02.01.00.0X16.0014.0012.0010.008.006.004.002.00.005.04.03.02.01.00.0X16.0014.0012.0010.008.006.004.002.00.005.04.03.02.01.00.0X16.0014.0012.0010.008.006.004.002.00.005.04.03.02.01.00.0X16.0014.0012.0010.008.006.004.002.00.005.04.03.02.01.00.0預(yù)測區(qū)間可信區(qū)間回歸方程2023/9/19第九章直線相關(guān)與回歸44例9-1可信區(qū)間與預(yù)測區(qū)間的計(jì)算1操作:①在主對(duì)話框中單擊[Save],②選擇Unstandardized,S.E.ofmeanpredictions,mean,individual,
③單擊[Continue]。[Save保存]:在DataView中新產(chǎn)生相應(yīng)的變量,并計(jì)算其數(shù)值。123222023/9/19第九章直線相關(guān)與回歸45例9-1可信區(qū)間與預(yù)測區(qū)間的計(jì)算212342023/9/19第九章直線相關(guān)與回歸46例9-1可信區(qū)間與預(yù)測區(qū)間計(jì)算結(jié)果運(yùn)行LinearRegression過程后,SPSS會(huì)在DataView中新產(chǎn)生的數(shù)據(jù)。當(dāng)X0=12時(shí):=3.33079。預(yù)測值均數(shù)的標(biāo)準(zhǔn)誤(Sep_1)為=0.10306;總體均數(shù)的95%可信區(qū)間為3.07860~3.58297;個(gè)體Y值的95%預(yù)測區(qū)間為2.78685~3.87473。2023/9/19第九章直線相關(guān)與回歸47回歸的主要用途描述兩個(gè)變量之間的數(shù)量依存關(guān)系。利用回歸方程進(jìn)行預(yù)測。將年齡X代入回歸方程可預(yù)測尿肌酐含量。適用范圍一般不應(yīng)超出樣本中自變量的取值范圍,此預(yù)測值稱為內(nèi)插,interpolation;超出自變量取值范圍所得預(yù)測值稱為外延,extrapolation。利用回歸方程進(jìn)行控制。用回歸方程進(jìn)行逆估計(jì)。但不是Y推X的回歸方程。欲控制大氣中二氧化氮的濃度在^y=0.05mg/L以下,須將汽車流量控制在x=1183輛/小時(shí)以下。2023/9/19第九章直線相關(guān)與回歸48例9-1利用SPSS進(jìn)行預(yù)測2023/9/19第九章直線相關(guān)與回歸49利用SPSS進(jìn)行預(yù)測的DataView圖示2023/9/19第九章直線相關(guān)與回歸50第二節(jié)直線相關(guān)
linearcorrelation直線相關(guān)概念相關(guān)系數(shù)r的意義r的假設(shè)檢驗(yàn)2023/9/19第九章直線相關(guān)與回歸51相關(guān)分析的步驟繪制散點(diǎn)圖計(jì)算相關(guān)系數(shù)對(duì)總體相關(guān)系數(shù)進(jìn)行假設(shè)檢驗(yàn)2023/9/19第九章直線相關(guān)與回歸52例9-52023/9/19第九章直線相關(guān)與回歸53例9-5散點(diǎn)圖2023/9/19第九章直線相關(guān)與回歸54直線相關(guān)概念相關(guān),correlation。研究兩變量互相依賴的關(guān)系,但不是函數(shù)關(guān)系。研究兩變量共同變化的關(guān)系:身高和體重。直線相關(guān),linearcorrelation。簡單相關(guān),simplecorrelation。用于雙變量正態(tài)分布(bivariatenormaldistribution)資料。研究兩個(gè)變量X,Y數(shù)量上的依存(或相關(guān))關(guān)系。2023/9/19第九章直線相關(guān)與回歸55相關(guān)系數(shù)Pearson相關(guān)系數(shù),積差相關(guān)系數(shù),簡單相關(guān)系數(shù)。英國統(tǒng)計(jì)學(xué)家KarlPearson于20世紀(jì)初提出的。描述變量之間直線的密切程度和方向的指標(biāo)。不考慮其它變量的影響,表示任何兩變量間的相關(guān)程度和方向。相關(guān)系數(shù)沒有單位,其取值范圍:[-1,1]。符號(hào)r表示樣本相關(guān)系數(shù);符號(hào)r(音:Rho,洛)表示其總體相關(guān)系數(shù)。2023/9/19第九章直線相關(guān)與回歸56相關(guān)系數(shù)的意義r=0,零相關(guān),zerocorrelation。無相關(guān)關(guān)系,無直線關(guān)系,并不能說無任何關(guān)系。1.非線性相關(guān):可能是某曲線關(guān)系,但不是線性的。2.無任何關(guān)系。r=1,完全正/負(fù)相關(guān),完全直線關(guān)系。perfectpositive/negativecorrelation。-1<r<0,positivecorrelation,負(fù)相關(guān);0<r<1,negativecorrelation,正相關(guān);|r|愈接近1,相關(guān)愈密切;|r|愈接近0,相關(guān)愈不密切。2023/9/19第九章直線相關(guān)與回歸57相關(guān)系數(shù)的幾何意義r=0,零相關(guān)。r=1,完全正/負(fù)相關(guān)。-1<r<0,負(fù)相關(guān)。0<r<1,正相關(guān)。|r|從0到1變化時(shí),散點(diǎn)從散開逐漸聚到一直線上。2023/9/19第九章直線相關(guān)與回歸58例9-1BivariateCorrelationsAnalyze
Correlate
Bivariate...x,y
Variables2023/9/19第九章直線相關(guān)與回歸59例9-1BivariateCorrelationsCorrelationCoelficients:相關(guān)系數(shù),Pearson為默認(rèn)選項(xiàng)。Kendall’stau-b,秩相關(guān)系數(shù)。Spearman,秩相關(guān)系數(shù)。TestofSignificance,檢驗(yàn)意義。Two-tailed,雙側(cè)檢驗(yàn)。One-tailed,單側(cè)檢驗(yàn)。Flagsignificancecorrelation,標(biāo)識(shí)有意義的相關(guān)系數(shù)。*:P<=0.05。**:P<=0.01。2023/9/19第九章直線相關(guān)與回歸60**:P<0.01,雙側(cè)檢驗(yàn)。尿肌酐含量和其年齡的相關(guān)系數(shù)r=0.881。H0:ρ=0,H1:ρ≠0,a=0.05。p=0.004,按a=0.05檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,認(rèn)為總體相關(guān)系數(shù)不為零,可認(rèn)為尿肌酐與年齡間有正的直線相關(guān)關(guān)系。Correlations1.881**..00488.881**1.004.88PearsonCorrelationSig.(2-tailed)NPearsonCorrelationSig.(2-tailed)N年齡尿肌酐年齡尿肌酐Correlationissignificantatthe0.01level(2-tailed).**.例9-1相關(guān)結(jié)果2023/9/19第九章直線相關(guān)與回歸61例9-1
r的假設(shè)檢驗(yàn)H0:ρ=0,H1:ρ≠0,a=0.05。sr為相關(guān)系數(shù)的標(biāo)準(zhǔn)誤。按a=0.05檢驗(yàn)水準(zhǔn),拒絕H0,接受H1,可認(rèn)為…。相關(guān)程度說明相關(guān)的實(shí)際意義。
┏━<0.4低┓│r│┃0.4≤│r│<0.8中┃度相關(guān)┗━≥0.8高┛2023/9/19第九章直線相關(guān)與回歸62例9-1r的可信區(qū)間(SPSS沒有提供計(jì)算)tanh的計(jì)算:在計(jì)算機(jī)上的計(jì)算器輸入0.3185,選擇Hyp,單擊tan按鈕,即得0.30812023/9/19第九章直線相關(guān)與回歸63例9-1tanh的計(jì)算tanh為雙曲正切函數(shù);tanh-1為反雙曲正切函數(shù)。開始
附件
計(jì)算器。查看
科學(xué)型。tanh-1:輸入0.8818,選擇Inv與Hyp,單擊tan按鈕,即得1.3838。tanh:輸入0.5073,選擇Hyp,單擊tan按鈕,即得0.4678。2023/9/19第九章直線相關(guān)與回歸64例9-1決定系數(shù)coefficientofdetermination。反映回歸貢獻(xiàn)的相對(duì)程度。在Y的總變異中回歸關(guān)系所能解釋的百分比。SS總不變時(shí),回歸平方和的大小決定了|r|的大小。R2=0.7775,年齡可解釋77.75%尿肌酐含量變異性,但有22.25%的變異不能解釋。注意:R與r的區(qū)別。2023/9/19第九章直線相關(guān)與回歸65例9-1SPSS的回歸方程的概述a.預(yù)測:(常數(shù)),年齡。復(fù)相關(guān)系數(shù)R=0.881決定系數(shù)R2=0.777調(diào)整決定系數(shù)=0.740剩余標(biāo)準(zhǔn)誤sy.x=0.19696。ModelSummary.881a.777.740.19696Model1RRSquareAdjustedRSquareStd.ErroroftheEstimatePredictors:(Constant),年齡a.2023/9/19第九章直線相關(guān)與回歸66例9-1樣本回歸系數(shù)標(biāo)準(zhǔn)誤sb擴(kuò)大X的取值范圍可減少,使b的估計(jì)更穩(wěn)定。Coefficientsa1.664(a).2975.602.001.139(b).030(Sb)4.571.004(Constant)年齡Model1BStd.ErrorUnstandardizedCoefficientstSig.DependentVariable:尿肌酐a.2023/9/19第九章直線相關(guān)與回歸67直線回歸和相關(guān)
應(yīng)用的注意事項(xiàng)根據(jù)分析目的選擇變量及統(tǒng)計(jì)方法回歸與相關(guān)說明的問題不同,但又有聯(lián)系進(jìn)行相關(guān)回歸分析前應(yīng)繪制散點(diǎn)圖用殘差圖考察數(shù)據(jù)是否符合模型假設(shè)條件結(jié)果的解釋及正確應(yīng)用2023/9/19第九章直線相關(guān)與回歸68直線回歸:兩變量間的依存關(guān)系;X和Y
~N(m,s)。X:選定變量(自變量)、Y
~N(m,s)。(建議選擇)根據(jù)專業(yè)要求選擇因變量。直線相關(guān):兩變量間的互依關(guān)系。X和Y
~N(m,s):無主次之分。均不服從正態(tài)分布時(shí),宜用等級(jí)相關(guān)。因果關(guān)系相關(guān)關(guān)系;反之不成立。回歸與相關(guān)的不同之處2023/9/19第九章直線相關(guān)與回歸69X為選定變量或隨機(jī)變量X為選定變量(建議選擇)X:年齡,以1歲作間距;
Y:身高,在X處Y服從正態(tài)分布。X:
服藥后時(shí)間,1小時(shí)、2小時(shí)、…;
Y:血中藥物的濃度,各X值處的Y服從正態(tài)分布。X為隨機(jī)變量它隨著實(shí)驗(yàn)結(jié)果的不同而變化,當(dāng)實(shí)驗(yàn)結(jié)果確定后,它的值也就相應(yīng)被確定。某人群的體重X與肺活量Y,服從雙變量正態(tài)分布。2023/9/19第九章直線相關(guān)與回歸70對(duì)r和b的假設(shè)檢驗(yàn)等價(jià):tr=tb;兩者符號(hào)相同;兩者的絕對(duì)值大小無直接關(guān)系。|r|越大,表示X與Y相關(guān)越緊密,各散點(diǎn)越靠近回歸直線。|b|越大,表示Y隨X變化越快,回歸直線越陡。R2說明X與Y直線比例。回歸與相關(guān)之間的聯(lián)系
2023/9/19第九章直線相關(guān)與回歸71殘差圖,residualplot條件:應(yīng)變量與自變量關(guān)系為線性關(guān)系。誤差服從均數(shù)為0的正態(tài)分布且方差相等。各觀測獨(dú)立。殘差圖可作為檢查方法:簡單有效??v軸:殘差;橫軸:^Y。圖9-7a:數(shù)據(jù)較為理想;圖9-7b:有一個(gè)點(diǎn)的殘差較大;圖9-7c:曲線關(guān)系;圖9-7d:方差不齊;圖9-7e:與時(shí)間有關(guān)。2023/9/19第九章直線相關(guān)與回歸72殘差圖的直觀分析無特殊的分布趨勢,理想的殘差分布;所建立的回歸方程對(duì)資料的信息概括不全面,需增加非線性回歸項(xiàng);呈扇形,反映方差有隨估計(jì)值的增大而增大的趨勢。2023/9/19第九章直線相關(guān)與回歸73利用殘差圖觀察特異點(diǎn)檢查是否有異常數(shù)據(jù)——特異點(diǎn),outlier。預(yù)報(bào)效果較差的點(diǎn)。采用殘差置信帶判斷異常數(shù)據(jù),如果發(fā)現(xiàn)異常數(shù)據(jù)可考慮給予刪除。殘差置信帶:Y-Y^=2(或3)SYX,Y為觀察值。SPSS是以標(biāo)化
殘差標(biāo)準(zhǔn)差的
倍數(shù)作為殘差
置信帶。2023/9/19第九章直線相關(guān)與回歸74利用殘差圖觀察周期性的變化
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 含子女撫養(yǎng)的離婚協(xié)議書模板
- 企業(yè)運(yùn)營管理咨詢協(xié)議樣本
- 2024工程挖掘機(jī)租賃合同標(biāo)準(zhǔn)范文
- 新住宅按揭貸款合同樣本
- 2024錄制合同模板
- 2024廣告刊登協(xié)議范本
- 動(dòng)物醫(yī)院聘用合同2024年
- 省級(jí)代理合作協(xié)議書的注意事項(xiàng)
- 我國自學(xué)考試網(wǎng)上輔導(dǎo)協(xié)議書樣本大全
- 2023年高考地理第一次模擬考試卷-(河北A卷)(全解全析)
- 空調(diào)安裝施工方案及空調(diào)安裝現(xiàn)場管理辦法
- 甘肅省黃金礦產(chǎn)資源概況
- 診所消防安全應(yīng)急方案
- 譯林版一年級(jí)上冊英語全冊課件
- 中小學(xué)德育工作指南考核試題及答案
- 凈現(xiàn)值NPV分析和總結(jié)
- 國網(wǎng)基建各專業(yè)考試題庫大全-質(zhì)量專業(yè)-中(多選題匯總)
- LTC流程介紹完整版
- 飼料加工系統(tǒng)粉塵防爆安全規(guī)程
- 一年級(jí)上冊美術(shù)課件-第11課-花兒寄深情-▏人教新課標(biāo)
- 植物的象征意義
評(píng)論
0/150
提交評(píng)論