線性回歸方程教案(二)_第1頁
線性回歸方程教案(二)_第2頁
線性回歸方程教案(二)_第3頁
線性回歸方程教案(二)_第4頁
線性回歸方程教案(二)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、2、 3、 2 線性回歸方程講義編寫者:數(shù)學教師孟凡洲某小賣部為了了解熱茶銷售量與氣溫之間的關(guān)系,隨機統(tǒng)計并制作了某6 天賣出熱茶的杯數(shù)與當天氣溫的對照表:氣溫 /261813104-1杯數(shù)202434385064如果某天的氣溫是-5 , 你能根據(jù)這些數(shù)據(jù)預測這天小賣部賣出熱茶的杯數(shù)嗎?為解決這個問題我們接著學習兩個變量的線性相關(guān)回歸直線及其方程.一、【學習目標】1、理解相關(guān)關(guān)系,能判斷兩個變量之間是否是相關(guān)關(guān)系;2、會求線性回歸方程,理解其真正含義(估計).【教學效果】 :教學目標的給出有利于學生整體把握課堂.二、【自學內(nèi)容和要求及自學過程】閱讀教材86 89 頁內(nèi)容,回答問題(回歸直線方程

2、) 請你說出作散點圖的步驟和方法. 請你說出正、負相關(guān)的概念. 什么是線性相關(guān)? 看人體的脂肪百分比和年齡的散點圖,當人的年齡增加時,體內(nèi)脂肪含量到底是以什么方式增加的呢? 什么叫做回歸直線? 如何求回歸直線的方程?什么是最小二乘法?它有什么樣的思想?結(jié)論 : 建立相應(yīng)的平面直角坐標系,將各數(shù)據(jù)在平面直角坐標中的對應(yīng)點畫出來, 得到表示兩個變量的一組數(shù)據(jù)的圖形,這樣的圖形叫做散點圖(. a.如果所有的樣本點都落在某一函數(shù)曲線上,就用該函數(shù)來描述變量之間的關(guān)系 ,即變量之間具有函數(shù)關(guān)系b.如果所有的樣本點都落在某一函數(shù)曲線附近 ,變量之間就有相關(guān)關(guān)系.c. 如果所有的樣本點都落在某一直線附近 ,

3、 變量之間就有線性相關(guān)關(guān)系) 如果散點圖中的點散布在從左下角到右上角的區(qū)域內(nèi),稱為正相關(guān) .如果散點圖中的點散布在從左上角到右下角的區(qū)域內(nèi),稱為負相關(guān) . 如果所有的樣本點都落在某一直線附近,變量之間就有線性相關(guān)的關(guān)系 . 大體上來看 , 隨著年齡的增加,人體中脂肪的百分比也在增加,呈正相關(guān)的趨勢 ,我們可以從散點圖上來進一步分析. 如下圖;從散點圖上可以看出 , 這些點大致分布在通過散點圖中心的一條直線附近 .如果散點圖中點的分布從整體上看大致在一條直線附近, 我們就稱這兩個變量之間具有線性相關(guān)關(guān)系 ,這條直線叫做回歸直線(regressionline). 如果能夠求出這條回歸直線的方程(簡

4、稱回歸方程 ), 那么我們就可以比較清楚地了解年齡與體內(nèi)脂肪含量的相關(guān)性.就像平均數(shù)可以作為一個變量的數(shù)據(jù)的代表一樣,這條直線可以作為兩個變量具有線性相關(guān)關(guān)系的代表. 從散點圖上可以發(fā)現(xiàn), 人體的脂肪百分比和年齡的散點圖, 大致分布在通過散點圖中心的一條直線.那么 ,我們應(yīng)當如何具體求出這個回歸方程呢?有的同學可能會想,我可以采用測量的方法,先畫出一條直線,測量出各點與它的距離,然后移動直線 ,到達一個使距離的和最小的位置,測量出此時的斜率和截距,就可得到回歸方程了.但是 ,這樣做可靠嗎?有的同學可能還會想,在圖中選擇這樣的兩點畫直線,使得直線兩側(cè)的點的個數(shù)基本相同.同樣地 ,這樣做能保證各點

5、與此直線在整體上是最接近的嗎 ?還有的同學會想,在散點圖中多取幾組點,確定出幾條直線的方程,再分別求出各條直線的斜率、截距的平均數(shù) , 將這兩個平均數(shù)當成回歸方程的斜率和截距 .同學們不妨去實踐一下,看看這些方法是不是真的可行?(學生討論:1.選擇能反映直線變化的兩個點.2.在圖中放上一根細繩,使得上面和下面點的個數(shù)相同或基本相同.3. 多取幾組點對,確定幾條直線方程 .再分別算出各個直線方程斜率、截距的算術(shù)平均值,作為所求直線的斜率、截距 .)教師:分別分析各方法的可靠性.如下圖:上面這些方法雖然有一定的道理,但總讓人感到可靠性不強.實際上 ,求回歸方程的關(guān)鍵是如何用數(shù)學的方法來刻畫“從整體

6、上看,各點與此直 的距離最小”.人 期的 踐與研究,已 得出了 算回 方程的斜率與截距的一般公式nn(xi x)( yi y)xi yinx ybi1i 1,(1)nn(xi x ) 2xi2nx 2i 1i 1a ybx.其中, b 是回 方程的斜率, a 是截距 .推 公式的 算比 復 , 里不作推 .但是 ,我 可以解 一下得出它的原理 .假 我 已 得到兩個具有 性相關(guān)關(guān)系的 量 (x1,y1),(x 2,y 2), ,(xn,yn ),且所求回 方程是y =bx+a, 其中 a、 b 是待定參數(shù) .當 量 x 取 xi(i=1,2, ,n) 可以得到y(tǒng) =bx i+a(i=1,2,

7、,n), 它與 收集到的yi 之 的偏差是yi- y =y i-(bx i+a)(i=1,2, ,n). ,用 n 個偏差的和來刻畫“各點與此直 的整體偏差”是比 合適的.n由于( yi- y )可正可 , 了避免相互抵消,可以考 用| yiy i | 來i 1代 替 , 但 由 于 它 含 有 絕 對 值 , 運 算 不 太 方 便 , 所 以 改 用q=(y 1-bx 1-a) 2+(y 2-bx 2-a) 2+ +(y n -bx n-a) 2來刻畫n 個點與回 直 在整體上的偏差. , 就 :當 a,b 取什么 q 最小,即 體偏差最小.經(jīng)過數(shù)學上求最小值的運算,a,b 的值由公式給出

8、.通過求式的最小值而得出回歸直線的方法,即求回歸直線, 使得樣本數(shù)據(jù)的點到它的距離的平方和最小,這一方法叫做最小二乘法( methodofleast square ) .【教學效果】 :理解線性回歸的真正內(nèi)涵.三、【綜合練習與思考探索】例 1有一個同學家開了一個小賣部,他為了研究氣溫對熱飲銷售的影響,經(jīng)過統(tǒng)計,得到一個賣出的熱飲杯數(shù)與當天氣溫的對比表:溫度 /-504712151923273136熱飲杯數(shù)15615013212813011610489937654( 1)畫出散點圖;( 2)從散點圖中發(fā)現(xiàn)氣溫與熱飲銷售杯數(shù)之間關(guān)系的一般規(guī)律;( 3)求回歸方程;( 4)如果某天的氣溫是 2 ,預

9、測這天賣出的熱飲杯數(shù) .結(jié)論 :( 1)散點圖如下圖所示:( 2)從上圖看到,各點散布在從左上角到右下角的區(qū)域里,因此,氣溫與熱飲銷售杯數(shù)之間呈負相關(guān),即氣溫越高, 賣出去的熱飲杯數(shù)越少 .( 3)從散點圖可以看出,這些點大致分布在一條直線的附近,因此,可 用 公 式 求 出 回 歸 方 程 的 系 數(shù) . 利 用 計 算 器 容 易 求 得 回 歸 方 程y =-2.352x+147.767.(4) 當 x=2 時, y =143.063. 因此,某天的氣溫為2 時,這天大約可以賣出 143 杯熱飲 .思考 :氣溫為2 時,小賣部一定能夠賣出143 杯左右熱飲嗎?為什么?這里的答案是小賣部不

10、一定能夠賣出143 杯左右熱飲,原因如下:1.線性回歸方程中的截距和斜率都是通過樣本估計出來的,存在隨機誤差,這種誤差可以導致預測結(jié)果的偏差.2.即使截距和斜率的估計沒有誤差,也不可能百分之百地保證對應(yīng)于x 的預報值,能夠與實際值y 很接近 .我們不能保證點(x,y )落在回歸直線上,甚 至 不 能 百 分 之 百 地 保 證 它 落 在 回 歸 直 線 的 附 近 , 事 實 上 ,y=bx+a+e=y +e.這里 e 是隨機變量, 預報值 y 與實際值y 的接近程度由隨機變量e 的標準差所決定.一些學生可能會提出問題:既然不一定能夠賣出143 杯左右熱飲,那么為什么我們還以“這天大約可以賣

11、出143 杯熱飲”作為結(jié)論呢?這是因為這個結(jié)論出現(xiàn)的可能性最大.具體地說, 假如我們規(guī)定可以選擇連續(xù)的3 個非負整數(shù)作為可能的預測結(jié)果,則我們選擇142 , 143 和 144 能夠保證預測成功(即實際賣出的杯數(shù)是這3 個數(shù)之一)的概率最大 .例 2下表為某地近幾年機動車輛數(shù)與交通事故數(shù)的統(tǒng)計資料.機動車輛數(shù)95110112120129135150180x千臺交通事故數(shù)6.27.57.78.58.79.810.213y千件(1) 請判斷機動車輛數(shù)與交通事故數(shù)之間是否有線性相關(guān)關(guān)系,如果不具有線性相關(guān)關(guān)系 ,說明理由;(2) 如果具有線性相關(guān)關(guān)系 ,求出線性回歸方程 .結(jié)論 :( 1)在直角坐標

12、系中畫出數(shù)據(jù)的散點圖,如下圖 .直觀判斷散點在一條直線附近, 故具有線性相關(guān)關(guān)系(2) 計算相應(yīng)的數(shù)據(jù)之和:8888xi=1 031,yi=71.6,xi2=137 835,xi yi=9 611.7.i 1i1i 1i1將它們代入公式計算得b 0.077 4,a=-1.024 1,所以 ,所求線性回歸方程為=0.077 4x-1.024 1.【教學效果】 :通過練習鞏固新知.四、【作業(yè)】1、必做題 :習題 2.3a 組 3、 4,b2、選做題 :完成課后練習.組1、2;五、【小結(jié)】本節(jié)課主要學習了兩個內(nèi)容1o 求線性回歸方程的步驟: ( 1)計算平均數(shù) x, y ; (2)計算 x與 y 的

13、積,求 x22,iiiyi; (3)計算 xi, yinn( xix)( yi y)xi yinx ybi1i 1,nn(4) 將上述有關(guān)結(jié)果代入公式( xi x ) 2xi2nx 2i 1i 1a ybx求 b,a,寫出回歸直線方程2o 經(jīng)歷用不同估算方法描述兩個變量線性相關(guān)的過程. 知道最小二乘法的思想 , 能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程.六、【教學反思】因材施教說起來很容易,事實上很難. 教師要認識自己的學生,真正的認識自己的學生,才能使你的學生進步.七、【課后練習】1、下列兩個變量之間的關(guān)系哪個不是函數(shù)關(guān)系()a. 角度和它的余弦值b.正方形邊長和面積c. 正邊形的邊

14、數(shù)和它的內(nèi)角和d.人的年齡和身高答案: 2、三點 (3,10),(7,20),(11,24)的線性回歸方程是()a. y =5.75-1.75xb.y=1.75+5.75xc. y =1.75-5.75xd. y =5.75+1.75x答案: 3、已知關(guān)于某設(shè)備的使用年限x 與所支出的維修費用y(萬元) , 有如下統(tǒng)計資料:使用年限23456x維修費用223 85 56 57 0y設(shè) y 對 x 呈線性相關(guān)關(guān)系試求:( 1)線性回歸方程y =bx+a 的回歸系數(shù) a,b ;( 2)估計使用年限為 10 年時 , 維修費用是多少?答案:( 1)b=1.23,a=0.08 ;(2) 12.38.4

15、、我們考慮兩個表示變量x 與 y 之間的關(guān)系的模型 , 為誤差項 , 模型如下:模型 1: y=6+4x;模型 2:y=6+4x+e ( 1)如果 x=3,e=1, 分別求兩個模型中 y 的值;( 2)分別說明以上兩個模型是確定性模型還是隨機模型解:( 1)模型 1:y=6+4x=6+43=18;模型 2: y=6+4x+e=6+43+1=19.( 2)模型 1 中相同的 x 值一定得到相同的y 值 , 所以是確定性模型;模型2 中相同的 x 值 , 因 的不同 , 所得 y 值不一定相同 , 且 為誤差項是隨機的 , 所以模型2 是隨機性模型5、以下是收集到的新房屋銷售價格y 與房屋大小x

16、的數(shù)據(jù):房屋大小x80105110115135( m2)銷售價格 (y 萬18.422元)21.624.829.2( 1)畫出數(shù)據(jù)的散點圖;( 2)用最小二乘法估計求線性回歸方程.解:( 1)散點圖如下圖.55( 2) n=5,xi =545, x =109,yi =116, y =23.2,i1i155xi2 =60 952,xi yi =12 952,i 1i 1b= 5 12952545 116 0.199,a=23.2 - 0.199 1091.509,5609525452所以 , 線性回歸方程為 y=0.199x+1.509 6、下列關(guān)系中,是帶有隨機性相關(guān)關(guān)系的是正方形的邊長面積之

17、間的關(guān)系;水稻產(chǎn)量與施肥量之間的關(guān)系人的身高與年齡之間的關(guān)系降雪量與交通事故的發(fā)生率之間的關(guān)系.答案:兩變量之間的關(guān)系有兩種:函數(shù)關(guān)系與帶有機性的相關(guān)關(guān)系. 正方形的邊長與面積之間的關(guān)系是函數(shù)關(guān)系. 水稻產(chǎn)量與施肥量之間的關(guān)系不是嚴格的函數(shù)關(guān)系, 但是具有相關(guān)性, 因而是相關(guān)關(guān)系 . 人的身高與年齡之間的關(guān)系既不是函數(shù)關(guān)系,也不是相關(guān)關(guān)系,因為人的年齡達到一定時期身高就不發(fā)生明顯變化了,因而他們不具備相關(guān)關(guān)系. 降雪量與交通事故的發(fā)生率之間具有相關(guān)關(guān)系,因此填、.7、現(xiàn)隨機抽取某校10 名學生在入學考中的數(shù)學成績x 與入學后的第一次數(shù)學考試成績 y,數(shù)據(jù)如下:學號12345678910x12010911710410311010410599108y84648468696869465771問這 10 名同學的兩次數(shù)學考試成績是否具有相關(guān)關(guān)系?答案 :應(yīng)用散點圖分析, (圖略)這 10名同學的兩次數(shù)學考試成績具有相關(guān)關(guān)系 .8、在下列各圖中,每個圖的兩個變量具有相關(guān)關(guān)系的圖是()a、( 1)( 2)b 、(1)( 3)c 、( 2)(4)d、( 2)( 3)9、線性回歸方程ybxa 必過 a、( 0, 0)點b、(x , 0)點c、( 0,y )點心d 、(x, y )點10、設(shè)有一個直線回歸方程為y=2 1.5x,則變量 x 增加一個單位時a、 y 平均增加1.5 個單位于b、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論