




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、例題2:從某大學(xué)中隨機選取8名女大學(xué)生,其身高和體重數(shù)據(jù)如表所示回歸分析與獨立性檢驗知識要點及解析1. 函數(shù)關(guān)系與相關(guān)關(guān)系的區(qū)別 ?函數(shù)關(guān)系是一種確定性關(guān)系,而相關(guān)關(guān)系是一種非確定性關(guān)系nnZ (Xi x)(yi y) z Xi% nxy2. 回歸公式b?=斗峙? = y_bX<y = bx a、 (Xj _X)2、 x2 -nX2i 4y3. 回歸分析的步驟?回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法,其步驟:收集數(shù)據(jù)'作散點圖 '求回歸直線方程 、利用方程進行預(yù)報4. 回歸直線的性質(zhì)、二敢a回歸直線 ? = bx a應(yīng)樣本點的中心X, y1 n1 n
2、其中解釋變量X的平均數(shù)為:xxi 預(yù)報變量y的平均數(shù)為:yyin i 4n y回歸直線的斜率的估計值b?的意義:解釋變量x每增加一個單位,預(yù)報變量y就增加b?個單位.5. 求線性回歸方程的五個步驟:nn計算X、y、x2、xy計算xiyi計算7 X:代入系數(shù)公式求b?代入公式計算 ai Ai d例題1:下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的能耗y(噸標準煤)的幾組數(shù)據(jù):畫出散點圖;求出線性回歸方程 ? = bX ?已知該廠技改前100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標準煤,試根據(jù)問求出的線性回歸方程預(yù)測(估計)生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標準煤?X
3、3456y2.5344.5求出根據(jù)身高預(yù)報體重的回歸方程? = bX a?根據(jù)以上回歸方程預(yù)測一名身高為172cm的女大學(xué)生的體重例題3:下表是某廠14月份用水量(單位:百噸)的一組數(shù)據(jù),由散點圖可知:用水量 y與月份x之間有較好的線性相關(guān)關(guān)系,其線性回歸方程為?= -0.7x?,請你預(yù)測該廠5月份的用水量大約為多少百噸?月份x1234用水量y4.5432.56. 線性回歸模型y=bx+a+e中隨機誤差e產(chǎn)生的原因?選用的函數(shù)模型不恰當(dāng)引起的誤差忽略了某些因素的影響存在觀測誤差7. 如何發(fā)現(xiàn)數(shù)據(jù)中的錯誤 ?先分別計算出殘差 ?= yj - ? = %-!?x-a?然后選取橫坐標為編號或解釋變量
4、x或預(yù)報變量y,縱坐標為殘差,作出殘差圖;最后觀察:如果樣本點的殘差較大(落在帶狀區(qū)域外),說 明數(shù)據(jù)的采集有可能錯誤。8. 如何衡量模型的擬合效果 ?方法1:在殘差圖中,殘差點比較均勻落在帶狀水平區(qū)域內(nèi),說明選用的模型比較合適;帶 狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預(yù)報精度越高例題1:根據(jù)一位母親記錄兒子 39歲身高數(shù)據(jù),建立兒子身高(單位:cm)對年齡(單位:歲)的線性回歸方程? = 7.19x 73.93,若用此方程預(yù)測兒子10歲時的身高,下列有關(guān)敘述正確的是()A .身高一定為 145. 83cm;C .身高小于145. 83cm;B .身高大于145. 83cm;D
5、.身高在145. 83cm左右4回歸分析與獨立性檢驗例2用兩個模型分別去擬合某組數(shù)據(jù),這兩個模型的殘差圖(以樣本編號為橫坐標)分別如圖1、圖2,試判斷這兩個模型哪一個的擬合效果更好,為什么?O-1-23 2 15回歸分析與獨立性檢驗例3下表是某產(chǎn)品的廣告費 x與銷售額y的統(tǒng)計數(shù)據(jù)由散點圖可知廣告費 x與銷售額y 之間有較好的線性相關(guān)關(guān)系,其線性回歸方程為y9.4x a , 根據(jù)此模型,請你預(yù)測廣告費為 6萬元時,銷售額大約為多少萬元 ?廣告費用x/萬兀4235銷售額y /萬兀49263954方法2:殘差平方和:殘差e的平方和越小,回歸模型擬合效果越好n送 W -? 2方法3:相關(guān)指數(shù)R2 :R
6、2 =1 -丄n1其中0豈R2豈1i J.在線性回歸模型中,R2表示解釋變量對于預(yù)報變量變化的貢獻率,相關(guān)指數(shù)R2越接近于1(越大),回歸模型擬合效果越好。例題:在兩個變量 y與x的回歸模型中,分別選擇了 4個不同的模型,它們的相關(guān)指數(shù) R2如下,其中擬合效果最好的模型是()2 2 2 2A.模型1的R =0.98 B .模型2的R =0.80 C .模型3的R =0.50 D .模型4的R =0.259. 用線性回歸模型進行預(yù)報時應(yīng)注意的幾個問題:樣本數(shù)據(jù)來自哪個總體,預(yù)報時也僅適用這個總體模型的時效性,利用不同時間段的樣本數(shù)據(jù)建立的模型,只能用來對那段時間范圍的數(shù)據(jù)進行預(yù)報建立模型時,變量
7、的取值范圍決定了預(yù)報時模型的適用范圍,通常不能超出太多在回歸模型中,因變量的值不能由自變量完全確定.10. 建立回歸模型的基本步驟:確定研究對象,明確哪個是解釋變量,哪個是預(yù)報變量畫出散點圖,觀察兩個變量之間的關(guān)系由經(jīng)驗確定回歸方程的類型按一定規(guī)則(如最小二乘法)估算回歸方程中的參數(shù)回歸分析殘差圖是否異常、數(shù)據(jù)是否有誤、所選模型是否合適等;最后才利用回歸方程進行預(yù)報。例題:調(diào)查顯示某地若干戶家庭的年收入x(單位:萬元)與年飲食支出y(單位:萬元)具有線性相關(guān)關(guān)系,其回歸方程0.254X +0.321,利用回歸方程,求家庭年收入每增加1萬元,年飲食支出平均增加多少萬元?11. 用換元法求非線性回
8、歸方程例題1 :在一次抽樣調(diào)查中測得樣本的5組數(shù)據(jù),試建立y與x之間的回歸方程y=b a 令貝 y y = bt aXX7回歸分析與獨立性檢驗#回歸分析與獨立性檢驗畫出y關(guān)于t的散點圖知y與t呈近似的線性相關(guān)關(guān)系,可設(shè)線性回歸方程為:?=b?t ?5遲(ti -£)2 - y) 得.I? =為(ti -t)i =138.459.34.1344自二 y-bt = 7.2-4.1344 1.55 : 0.8#回歸分析與獨立性檢驗#回歸分析與獨立性檢驗4 1344.y-4.1344t 0.8 / y與x之間的回歸方程為 ?0.8x例題2:下表記錄了籃球愛好者小明某月1號到5號每天打籃球時間
9、 x(單位:小時)與當(dāng)天投籃命中率y之間的關(guān)系。求投籃命中率y關(guān)于打籃球時間x之間的線性回歸方程預(yù)測小明該月6號打6小時籃球的命中率x12345y0.40.50.60.60.4例題2:為了研究某種細菌隨時間 x變化,繁殖的個數(shù),收集數(shù)據(jù)如下:天數(shù)x/天123456繁殖個數(shù)y/個612254995190用天數(shù)作解釋變量,繁殖個數(shù)作預(yù)報變量,作出這些數(shù)據(jù)的散點圖;試求出預(yù)報變量對解釋變量的回歸方程.(所求非線性回歸方程為?=e0.69x 1.112.)12. 分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量13. 2 X 2列聯(lián)表與等高條形圖:例題1:某學(xué)校對高三學(xué)生作了
10、一次調(diào)查發(fā)現(xiàn):在平時的模擬考試中,性格內(nèi)向?qū)W生426人中有332人在考前心情緊張;性格外向?qū)W生594人中有213人在考前心情緊張先作出2 X 2列聯(lián)表,然后作出等高條形圖;利用等高條形圖判斷考前心情緊張與性格類別是否有關(guān)例題2:下表是某地區(qū)的一種傳染病與飲用水的調(diào)查統(tǒng)計表:得病不得病總計飲用干凈水52人466人飲用不干凈水94人218人總計先填表,后計算飲用干凈水得傳染病的頻率,以及飲用不干凈水得傳染病的頻率作出等高條形圖利用等高條形圖判斷得傳染病是否與飲用水有關(guān)14. 獨立性檢驗的定義:利用隨機變量K2來判斷“兩個分類變量有關(guān)系”的方法稱為獨立性檢驗2n(ad -be)(a b)(e d)(
11、a e)(b d)制定判別規(guī)則:根據(jù)實際問題的需要,確定容許推斷“兩個分類變量有關(guān)系”犯錯誤概率的15. 獨立性檢驗的步驟:上界a,然后查表確定臨界值 k0利用公式計算隨機變量 K2的觀測值k如果K2的觀測值k很大,說明“ X與Y有關(guān)系”,觀測值k很小,說明“ X與Y沒有關(guān)系”如果k> k°,就推斷“X與Y有關(guān)系”,這種推斷犯錯誤的概率不超過 ,即有1 -:的把握認為“ X與Y有關(guān)系”例題:針對某地區(qū)的一種傳染病與飲用水進行抽樣調(diào)查發(fā)現(xiàn):飲用干凈水得病5人,不得病50人;飲用不干凈水得病 9人,不得病22人。作出2X 2列聯(lián)表能否有90%的把握認為該地區(qū)中得傳染病與飲用水有關(guān)?
12、得病不得病總計飲用干凈水'5'5055飲用不干凈水92231總計147286分析:作出2X2列聯(lián)表計算隨機變量K2的觀測值k =86 (5 22 -50 9)255 31 14 72:-5.785查表知5.785 > 2.70611回歸分析與獨立性檢驗#回歸分析與獨立性檢驗且P(K 2 > 2.706)=0.10 在犯錯誤的概率不超過0.10的前提下,可以認為“該地區(qū)中得傳染病與飲用水有關(guān)”,即有90%的把握認為該地區(qū)中得傳染病與飲用水有關(guān)16. 如何判斷兩個分類變量之間有關(guān)系?方法1:觀察等高條形圖,若發(fā)現(xiàn)小矩形的高相差很大,就可以粗略判斷兩個分類變量之間有關(guān) 系方法2:計算|ad-bc|若|ad-bc越大貝曲明兩個分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 經(jīng)典技術(shù)協(xié)議合同書
- 認證委托服務(wù)協(xié)議書
- 個人合伙退伙協(xié)議書
- 水電施工總承包合同
- 建筑水電勞務(wù)安裝合同
- 電商行業(yè)退換貨服務(wù)免責(zé)協(xié)議
- 借款擔(dān)保合同合同
- 動遷房房屋買賣合同
- 房建勞務(wù)分包施工合同
- 企業(yè)經(jīng)營承包合同
- Unit 1 Lesson 1語法-過去完成時態(tài)-高中英語北師大版必修第一冊
- 小學(xué)語文人教四年級上冊(統(tǒng)編2023年更新)第四單元-教學(xué)設(shè)計《神話中的“偷竊者”》
- 班組培訓(xùn)教材
- 變應(yīng)性真菌性鼻竇炎的影像表現(xiàn)
- 一例燙傷病人傷口護理個案分享
- 鋼棧橋設(shè)計計算書
- 貿(mào)易術(shù)語案例討論題匯總
- 建筑工地緊急事件處理流程圖
- 中山市培養(yǎng)引進緊缺適用人才導(dǎo)向目錄(2011-2012年)
- 小學(xué)三年級下冊開學(xué)語文老師家長會發(fā)言
- 對講機測試報告
評論
0/150
提交評論