線性回歸與相關(guān)性分析_第1頁(yè)
線性回歸與相關(guān)性分析_第2頁(yè)
線性回歸與相關(guān)性分析_第3頁(yè)
線性回歸與相關(guān)性分析_第4頁(yè)
線性回歸與相關(guān)性分析_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、,本科學(xué)生實(shí)驗(yàn)報(bào)告學(xué)號(hào): # 姓名: ¥ 學(xué)院: 生命科學(xué)學(xué)院 專業(yè)、班級(jí):11級(jí)應(yīng)用生物教育A班實(shí)驗(yàn)課程名稱: 生物統(tǒng)計(jì)學(xué)實(shí)驗(yàn) 教 師: 孟麗華(教授) 開(kāi) 課 學(xué) 期: 2012 至 2013 學(xué)年 下 學(xué)期 填 報(bào) 時(shí) 間: 2013 年 5 月 22 日云南師范大學(xué)教務(wù)處編印一實(shí)驗(yàn)設(shè)計(jì)方案實(shí)驗(yàn)序號(hào)及名稱:實(shí)驗(yàn)十: 線性回歸與相關(guān)性分析實(shí)驗(yàn)時(shí)間2013-05-17實(shí)驗(yàn)室睿智樓3幢326(一)、實(shí)驗(yàn)?zāi)康模?、能夠熟練的使用SPSS軟件對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行線性回歸分析和相關(guān)性分析;2、掌握線性回歸與相關(guān)性分析的基本思想和具體操作,能夠讀懂分析結(jié)果,并寫出回歸方程, 對(duì)回歸方程進(jìn)行各種統(tǒng)計(jì)檢驗(yàn);3、

2、進(jìn)一步熟悉SPSS軟件的應(yīng)用。(二)、實(shí)驗(yàn)設(shè)備及材料:微機(jī)、SPSS for Windows V 18.0統(tǒng)計(jì)軟件包及相應(yīng)的要統(tǒng)計(jì)的數(shù)據(jù)(三)、實(shí)驗(yàn)原理:1、統(tǒng)計(jì)學(xué)上采用相關(guān)分析(correlation analysis)研究呈平行關(guān)系的相關(guān)變量之間的關(guān)系。 2、對(duì)兩個(gè)變量間的直線關(guān)系進(jìn)行相關(guān)分析稱為簡(jiǎn)單相關(guān)分析(也叫直線相關(guān)分析); 對(duì)多個(gè)變量進(jìn)行相關(guān)分析時(shí),研究一個(gè)變量與多個(gè)變量間的線性相關(guān)稱為復(fù)相關(guān)分析; 研究其余變量保持不變的情況下兩個(gè)變量間的線性相關(guān)稱為偏相關(guān)分析;3、相關(guān)性分析是考察兩個(gè)變量之間線性關(guān)系的一種統(tǒng)計(jì)分析方法。更精確地說(shuō),當(dāng)一個(gè)變量發(fā)生變化時(shí),另一個(gè)變量如何變化,此時(shí)就

3、需要通過(guò)計(jì)算相關(guān)系數(shù)來(lái)做深入的定量考察。P值是針對(duì)原假設(shè)H0:假設(shè)兩變量無(wú)線性相關(guān)而言的。一般假設(shè)檢驗(yàn)的顯著性水平為0.05,你只需要拿p值和0.05進(jìn)行比較:如果p值小于0.05,就拒絕原假設(shè)H0,說(shuō)明兩變量有線性相關(guān)的關(guān)系,他們無(wú)線性相關(guān)的可能性小于0.05;如果大于0.05,則一般認(rèn)為無(wú)線性相關(guān)關(guān)系,至于相關(guān)的程度則要看相關(guān)系數(shù)R值,r越大,說(shuō)明越相關(guān)。越小,則相關(guān)程度越低。而偏相關(guān)分析是指當(dāng)兩個(gè)變量同時(shí)與第三個(gè)變量相關(guān)時(shí),將第三個(gè)變量的影響剔除,只分析另外兩個(gè)變量之間相關(guān)程度的過(guò)程,其檢驗(yàn)過(guò)程與相關(guān)分析相似;4、對(duì)于兩個(gè)相關(guān)變量,一個(gè)變量用x表示,另一個(gè)變量用y表示,如果通過(guò)試驗(yàn)或調(diào)查

4、獲得兩個(gè)變量的n對(duì)觀測(cè)值:(x1,y1),(x2,y2),(xn,yn);為了直觀地看出x和y間的變化趨勢(shì),可將每一對(duì) 觀 測(cè) 值 在 平 面直角坐標(biāo)系描點(diǎn),作出散點(diǎn)圖;5、從散點(diǎn)圖可以看出:兩個(gè)變量間有關(guān)或無(wú)關(guān);若有關(guān),兩個(gè)變量間關(guān)系類型,是直線型還是曲線型;兩個(gè)變量間直線關(guān)系的性質(zhì)(是正相關(guān)還是負(fù)相關(guān))和程度(是相關(guān)密切還是不密切);散點(diǎn)圖直觀地、定性地表示了兩個(gè)變量之間的關(guān)系。為了探討它們之間的規(guī)律性,還必須根據(jù)觀測(cè)值將其內(nèi)在關(guān)系定量地表達(dá)出來(lái);6、利用直線回歸方程進(jìn)行預(yù)測(cè)或控制時(shí),一般只適用于原來(lái)研究的范圍,不能隨意把范圍擴(kuò)大,因?yàn)樵谘芯康姆秶鷥?nèi)兩變量是直線關(guān)系,這并不能保證在這研究范

5、圍之外仍然是直線關(guān)系。若需要擴(kuò)大預(yù)測(cè)和控制范圍,則要有充分的理論依據(jù)或進(jìn)一步的實(shí)驗(yàn)依據(jù)。利用直線回歸方程進(jìn)行預(yù)測(cè)或控制 ,一 般只能內(nèi)插,不要輕易外延;7、進(jìn)行直線相關(guān)分析的基本任務(wù)在于根據(jù)x、y 的實(shí)際觀測(cè)值,計(jì)算表示兩個(gè)相關(guān)變量x、y 間線性相關(guān)程度和性質(zhì)的統(tǒng)計(jì)量相關(guān)系數(shù)r并進(jìn)行顯著性檢驗(yàn);8、根據(jù)實(shí)際觀測(cè)值計(jì)算得來(lái)的相關(guān)系數(shù)r是樣本相關(guān)系數(shù),它是雙變量正態(tài)總體中的總體相關(guān)系數(shù)的估計(jì)值。樣本相關(guān)系數(shù)r是否來(lái)自0的總體,還須對(duì)樣本相關(guān)系數(shù)r 進(jìn)行顯著性檢驗(yàn)。此時(shí)無(wú)效假設(shè)、備擇假設(shè)為:HO: =0,HA: 0。與直線回歸關(guān)系顯著性檢驗(yàn)一樣,可采用t 檢驗(yàn)法與F檢驗(yàn)法對(duì)相關(guān)系數(shù)r 的顯著性進(jìn)行檢

6、驗(yàn);9、 直線回歸分析將二個(gè)相關(guān)變量區(qū)分為自變量和依變量,側(cè)重于尋求它們之間的聯(lián)系形式直線回歸方程;直線相關(guān)分析不區(qū)分自變量和依變量,側(cè)重于揭示它們之間的聯(lián)系程度和性質(zhì)計(jì)算出相關(guān)系數(shù)。兩種分析所進(jìn)行的顯著性檢驗(yàn)都是解決y與x間是否存在直線關(guān)系。因而二者的檢驗(yàn)是等價(jià)的。即相關(guān)系數(shù)顯著 ,回歸系數(shù)亦顯著;相關(guān)系數(shù)不顯著,回歸系數(shù)也必然不顯著; 10、應(yīng)用直線回歸與相關(guān)的注意事項(xiàng):直線回歸分析與相關(guān)分析在生物科學(xué)研究領(lǐng)域中已得到了廣泛的應(yīng)用,但在實(shí)際工作中卻很容易被誤用或作出錯(cuò)誤的解釋。為了正確地應(yīng)用直線回歸分析和相關(guān)分析這一工具,必須注意以下幾點(diǎn):1)、變量間是否存在相關(guān) ;2)、其余變量盡量保持

7、一致;3)、觀測(cè)值要盡可能的多;4)、外推要謹(jǐn)慎;5)、正確理解回歸或相關(guān)顯著與否的含義 ;6)、一個(gè)顯著的回歸方程并不一定具有實(shí)踐上的預(yù)測(cè)意義 ; (四)、實(shí)驗(yàn)內(nèi)容: 內(nèi)容:生物統(tǒng)計(jì)學(xué)(第四版)138頁(yè)第七章習(xí)題 7.4和習(xí)題7.6實(shí)驗(yàn)方法步驟(一)、習(xí)題7.4 1、啟動(dòng)spss軟件:開(kāi)始所有程序SPSSspss for windowsspss 18.0 for windows,直接進(jìn)入SPSS數(shù)據(jù)編輯窗口進(jìn)行相關(guān)操作;2、定義變量,輸入數(shù)據(jù)。點(diǎn)擊“變量視圖”定義變量工作表,用“name”命令定義變量“X”(小數(shù)點(diǎn)零位),標(biāo)簽:“4月下旬平均氣溫/”;變量“Y”(小數(shù)點(diǎn)零位),標(biāo)簽:“5月上

8、旬50株棉蚜蟲數(shù)/頭” ,點(diǎn)擊“變量視圖工作表”,一一對(duì)應(yīng)將不同“X”氣溫與“Y”棉蚜蟲數(shù)的數(shù)據(jù)依次輸入到單元格中; 3、設(shè)置分析變量。數(shù)據(jù)輸入完后,點(diǎn)菜單欄:“分析(A)”“回歸(R)”“線性(L)”,將“5月上旬50株棉蚜蟲數(shù)(Y)”移到因變量列表(D)中,將“4月下旬平均氣溫(X)”移入自變量列表(I)中進(jìn)行分析;1)、點(diǎn)“統(tǒng)計(jì)量(S)”, 回歸系數(shù):在“估計(jì)(E)”、“置信區(qū)間 水平(%)95”前打鉤,“模型擬合性(M)”、“描述性”前打鉤,殘差:個(gè)案診斷(C)前打鉤,點(diǎn)“所有個(gè)案”,點(diǎn)“繼續(xù)”;2)、點(diǎn)“繪制(T)”,將“DEPENDNP”移入“Y(Y)”列表中,將“ZPRED”移入

9、“X2(X)”中,標(biāo)準(zhǔn)化殘差圖:在“直方圖(H)”、“正太概率圖(R)”前打鉤,點(diǎn)“繼續(xù)”;3)、點(diǎn)“保存(S)”,所有的默認(rèn),點(diǎn)“繼續(xù)”;4)、點(diǎn) “選項(xiàng)(O)”,所有的都默認(rèn),點(diǎn)“繼續(xù)”,然后點(diǎn)擊“確定”便出結(jié)果;統(tǒng)計(jì)量(S) 選項(xiàng)(O)(默認(rèn)) 繪制(T)保存(S)(默認(rèn)) (二)、習(xí)題7.61、啟動(dòng)spss軟件:開(kāi)始所有程序SPSSspss for windowsspss 18.0 for windows,直接進(jìn)入SPSS數(shù)據(jù)編輯窗口進(jìn)行相關(guān)操作;2、定義變量,輸入數(shù)據(jù)。點(diǎn)擊“變量視圖”定義變量工作表,用“name”命令定義變量“維生素C的含量”(小數(shù)點(diǎn)兩位);變量“受凍情況”(小數(shù)點(diǎn)

10、零位),“未受凍”賦值為“1”,“受凍”賦值為“2” ,點(diǎn)擊“變量視圖工作表”,一一對(duì)應(yīng)將不同“未受凍”與“受凍”的維生素C的含量數(shù)據(jù)依次輸入到單元格中; 3、設(shè)置分析變量。數(shù)據(jù)輸入完后,點(diǎn)菜單欄:“分析(A)”“相關(guān)(C)”“雙變量(B)”,將“維生素C含量”、“受凍情況”變量(V)列表中,相關(guān)系數(shù):“Pearson”前打鉤,顯著性檢驗(yàn):雙側(cè)檢驗(yàn)(T)前打鉤,“標(biāo)記顯著性相關(guān)(F)前打鉤”,點(diǎn) “選項(xiàng)(O)”,統(tǒng)計(jì)量:在“均值和標(biāo)準(zhǔn)差(M)”前打鉤,缺失值:在“按對(duì)排除個(gè)案(P)”前打鉤,點(diǎn)“繼續(xù)”,然后點(diǎn)擊“確定”便出結(jié)果。 選項(xiàng)(O) “ 圖形(G)”“舊對(duì)話框(L)”“散點(diǎn)/點(diǎn)狀(S)

11、” 散點(diǎn)圖/點(diǎn)圖 簡(jiǎn)單散點(diǎn)圖4、表格繪制出來(lái)后,進(jìn)行檢查修改,將其復(fù)制到實(shí)驗(yàn)報(bào)告中,將虛框隱藏等; 5、將所求的描述性統(tǒng)計(jì)指標(biāo)數(shù)據(jù)表格保存,對(duì)其所求得的結(jié)果進(jìn)行分析,書寫實(shí)驗(yàn)報(bào)告。(五)、實(shí)驗(yàn)結(jié)果:回歸表1描述性統(tǒng)計(jì)量均值標(biāo)準(zhǔn) 偏差N5月上旬棉蚜蟲數(shù)56.6457.113114月下旬平均氣溫18.8552.681911表2相關(guān)性5月上旬棉蚜蟲數(shù)4月下旬平均氣溫Pearson 相關(guān)性5月上旬棉蚜蟲數(shù)1.000.8584月下旬平均氣溫.8581.000Sig. (單側(cè))5月上旬棉蚜蟲數(shù).0004月下旬平均氣溫.000.N5月上旬棉蚜蟲數(shù)11114月下旬平均氣溫1111表3輸入移去的變量b模型輸入的

12、變量移去的變量方法14月下旬平均氣溫.輸入a. 已輸入所有請(qǐng)求的變量。b. 因變量: 5月上旬棉蚜蟲數(shù)表4模型匯總b模型RR 方調(diào)整 R 方標(biāo)準(zhǔn) 估計(jì)的誤差1.858a.737.70730.903a. 預(yù)測(cè)變量: (常量), 4月下旬平均氣溫。b. 因變量: 5月上旬棉蚜蟲數(shù)表5Anovab模型平方和df均方FSig.1回歸24023.684124023.68425.156.001a殘差8594.8629954.985總計(jì)32618.54510a. 預(yù)測(cè)變量: (常量), 4月下旬平均氣溫。b. 因變量: 5月上旬棉蚜蟲數(shù)表6系數(shù)a模型非標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)系數(shù)tSig.B 的 95.0% 置信區(qū)間

13、B標(biāo)準(zhǔn) 誤差試用版下限上限1(常量)-287.94369.331-4.153.002-444.780-131.1064月下旬平均氣溫18.2763.644.8585.016.00110.03326.518a. 因變量: 5月上旬棉蚜蟲數(shù)表7殘差統(tǒng)計(jì)量a極小值極大值均值標(biāo)準(zhǔn) 偏差N預(yù)測(cè)值20.92198.1956.6449.01411殘差-49.12252.705.00029.31711標(biāo)準(zhǔn) 預(yù)測(cè)值-.7292.888.0001.00011標(biāo)準(zhǔn) 殘差-1.5901.706.000.94911a. 因變量: 5月上旬棉蚜蟲數(shù)表8案例診斷a案例數(shù)目標(biāo)準(zhǔn) 殘差5月上旬棉蚜蟲數(shù)預(yù)測(cè)值殘差1.687866

14、4.7821.2232-.038197198.19-1.1903-1.128842.85-34.8474-.0342930.05-1.0545-.1262831.88-3.8816.0672320.922.0847-1.5901261.12-49.1228-.8151439.19-25.19191.0396431.8832.11910.2315042.857.153111.70611259.2952.705a. 因變量: 5月上旬棉蚜蟲數(shù)圖表相關(guān)性表9描述性統(tǒng)計(jì)量均值標(biāo)準(zhǔn)差N維生素c含量34.05534.9432132受凍情況1.50.50832表10相關(guān)性維生素c含量受凍情況維生素c含量Pe

15、arson 相關(guān)性1.192顯著性(雙側(cè)).293N3232受凍情況Pearson 相關(guān)性.1921顯著性(雙側(cè)).293N3232圖表實(shí)驗(yàn)結(jié)果分析:習(xí)題7.4:由表4得出:擬合優(yōu)度系數(shù)為0.858,接近1,說(shuō)明擬合好。存在多重線性。由表6得,回歸方程的p值<0.05,說(shuō)明顯著線性?;貧w系數(shù)p值<0.05,說(shuō)明顯著線性。(1)、線性回歸方程:Y=-287.943+18.276X;(2)、s y/x =29.4143,F=28.510*; (3) y/x 的 95% 置信區(qū)間: (22.1998 , 61.4500) ,單個(gè) y 的 95% 置信區(qū)間: ( 26.5856 , 110

16、.2354) ;習(xí)題7.6:從實(shí)驗(yàn)結(jié)果可以得出 :(1)、相關(guān)系數(shù)與決定系數(shù)分別為:r1=0.5930 , r 2 =0.3516 , (2)、r 的 95% 置信區(qū)間: (0.1378 , 0.8414) 。 r=0.5930,r2=0.3516,r的95%置信區(qū)間:(0.1378,0.8414)。(六)、實(shí)驗(yàn)總結(jié)分析:1、相關(guān)性分析是考察兩個(gè)變量之間線性關(guān)系的一種統(tǒng)計(jì)分析方法,利用直線回歸方程進(jìn)行預(yù)測(cè)或控制 ,一 般只能內(nèi)插,不要輕易外延;2、直線回歸相關(guān)分析的注意事項(xiàng):1)、相關(guān)分析只是以相關(guān)系數(shù)來(lái)描述兩個(gè)變量間線性相關(guān)的程度和方向,并不闡明事物間存在聯(lián)系的本質(zhì),也不是兩事物間存在聯(lián)系的

17、證據(jù)。要闡明兩事物間的本質(zhì)聯(lián)系,必須憑專業(yè)知識(shí)從理論上加以論證。因此,把兩個(gè)毫無(wú)關(guān)系的事物放在一起作相關(guān)分析是毫無(wú)意義的。同樣,作回歸分析也要有實(shí)際意義;2)、在進(jìn)行直線回歸前應(yīng)繪制散點(diǎn)圖,有直線趨勢(shì)時(shí),才適宜作直線回歸分析。散點(diǎn)圖還能提示資料有無(wú)異常點(diǎn);3)、直線回歸方程的適用范圍一般以自變量的取值范圍為限;4)、對(duì)同一組資料作回歸和相關(guān)分析,其相關(guān)系數(shù)和回歸系數(shù)的顯著性檢驗(yàn)結(jié)果完全相同。由于相關(guān)系數(shù)的顯著性檢驗(yàn)結(jié)果可直接查表,比較方便;而回歸系數(shù)的顯著性檢驗(yàn)計(jì)算復(fù)雜,故在實(shí)際應(yīng)用中常用相關(guān)系數(shù)的顯著性檢驗(yàn)結(jié)果代替回歸系數(shù)的顯著性檢驗(yàn)。5)、在資料要求:相關(guān)分析要求兩個(gè)變量服從雙變量正態(tài)分布?;貧w分析要求因變量服

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論