人教版數(shù)學(xué)高二A版選修2-3教案3.1回歸分析的基本思想及其初步應(yīng)用第二課時_第1頁
人教版數(shù)學(xué)高二A版選修2-3教案3.1回歸分析的基本思想及其初步應(yīng)用第二課時_第2頁
人教版數(shù)學(xué)高二A版選修2-3教案3.1回歸分析的基本思想及其初步應(yīng)用第二課時_第3頁
人教版數(shù)學(xué)高二A版選修2-3教案3.1回歸分析的基本思想及其初步應(yīng)用第二課時_第4頁
人教版數(shù)學(xué)高二A版選修2-3教案3.1回歸分析的基本思想及其初步應(yīng)用第二課時_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

高中數(shù)學(xué)打印版第課教學(xué)目標知識與技能從相關(guān)指數(shù)和殘差分析角度探討回歸模型的擬合效果,以及建立回歸模型的基本步驟.過程與方法在發(fā)現(xiàn)直接求回歸直線方程存在缺陷的基礎(chǔ)上學(xué)生去發(fā)現(xiàn)解決問題的新思—進行回歸分析,進而介紹殘差分析的方法和利用R獻率.

來表示解釋變量對于預(yù)報變量變化的貢情感、態(tài)度與價值觀通過本節(jié)課的學(xué)習數(shù)與實生活的聯(lián)系學(xué)態(tài)度評價兩個變量的相關(guān)性,掌握處理問題的方法成謹治學(xué)態(tài)度和鍥而不舍的求學(xué)精神養(yǎng)生運用所學(xué)知識解決實際問題的能力教學(xué)中適地利用學(xué)生的合作與交流學(xué)生在學(xué)習的同時體與他人合作的重要性.重點難點教學(xué)重點從殘差分析相關(guān)指數(shù)角度探討回歸模型的擬合效果及建立回歸模型的基本步驟;教學(xué)難點:了解評價回歸效果的兩個統(tǒng)計量:相關(guān)指數(shù)、殘差和殘差平方和.教過引入新課(幻燈片)編號身高/

體重/

54646143上表是上一節(jié)課我們從某大學(xué)選取名大學(xué)生其身高和體重數(shù)據(jù)組成的數(shù)據(jù)表一節(jié)課中我們通過數(shù)據(jù)建立了回歸直線方程,并根據(jù)方程預(yù)測了身高為72的大學(xué)生的體重.當時們提到根據(jù)回歸直線方程求得的體重數(shù)據(jù)僅是一個估計值,其與真實值之間存在著誤差,為了綜合分析身高和體重的關(guān)系,我們引入了線性回歸模型y=bx+來表示兩變量之間的關(guān)系,其中隨機變量,又稱隨機誤差.線性回歸模型y=bx+ae增加了隨機誤差項e,因變量y的由自變量x和機誤差同確定.假設(shè)隨機誤差對體重沒有影響也就是說體僅身高的影響那么散點圖中所有的點將完全落在回歸直線上.但是,在圖中,數(shù)據(jù)點并沒有完全落在回歸直線上.這些點散布在回歸直線附近,所以一定是隨機誤差把這些點從回歸直線推”開了,自變量x能解釋部分的化.同學(xué)們考慮一下,隨機變量e的均值是多少?差又是多少?活動設(shè)計:學(xué)生思考回答問題.學(xué)情預(yù)測:學(xué)生回答E(e),D(e)σ教師提問:能否通過D(e)來刻畫線性回歸模型的合程度?學(xué)情預(yù)測隨誤差的方差越小通回歸直線預(yù)報真實值y的度高隨誤差是引起預(yù)報值與真實值y之的誤差原因之一,其大小取決于隨機誤差的方差.設(shè)計意圖說研究隨機誤差的要性通過研究隨機誤差以分析預(yù)報值的可信度.提出問題:既然可以用隨機變量的方差來衡量隨機誤差的大小,即通過方差2

來刻畫預(yù)報變量體重)的變化在多大程度上與隨機誤差有關(guān),那么如何獲得方差σ學(xué)生活動:學(xué)生獨立思考,小組合作交流討論.

呢?活動結(jié)果:可以采用抽樣統(tǒng)計的思想,通過隨機變量e的本來估計σ精心校對版本

的大?。?/p>

^^^^^^^12nn^^iiii^^^^^^^12nn^^iiiiiiin^iii^^設(shè)計目的:復(fù)習抽樣統(tǒng)計思想,以便通過隨機變量e的本來估計總體.探究新知提出問題既然表了解釋變量以外其他各種影響預(yù)報值的因素帶來的誤差么如何獲得e的樣本來計算σ

呢?學(xué)生活動:分組合作討論交流.學(xué)情預(yù)測:由函數(shù)模y=bx+a和歸模型y=bx++可=y(tǒng)y,樣根據(jù)圖表中女大學(xué)生的身高求出預(yù)報值,再與真實值作差,即可求得e的一個估計值.教師由在計算回歸直線方程利用公式求得和為斜率和截距的估計值它們與真實值間存在誤差,因y是計值,所e=y(tǒng)-y也一個估計值.由上可知,對于樣本(x,),(x,y),,(x,)而言,它們的隨機誤差為e=y(tǒng)-bx-,i,,稱其估計值=y(tǒng)-

i

為相應(yīng)于點x)的差.將所有殘差的平方加起來,即i

2這個和稱作殘差平方和.i類比樣本方差估計總體方差的思想,可以用^σ

^12(y-y)-n-ii

2

作為2

的估計量,通常σ

越小,預(yù)報精度越高.這樣當們求得回歸直線方程以通過殘差來判斷模型擬合程度的效果判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),這方面的分析工作稱為殘差分析.設(shè)計目的:通過問題誘思,引入殘差概念.理解新知提出問題對照女大學(xué)生的身高體重的原始數(shù)據(jù)合求出的回歸直線方程求出相應(yīng)的殘差數(shù)據(jù).學(xué)生活動:獨立完成.活動結(jié)果:編號身高(體重kg)殘差e

提出問題根據(jù)表格中的數(shù)據(jù)樣本編號為橫坐標差值為縱坐標出點圖這樣的散點圖稱作殘差.學(xué)生活動:分組合作,共同完成.活動結(jié)果:殘差圖精心校對版本

^^^n^iiiiiii高中數(shù)學(xué)打印版^^^n^iiiiiii提出問題觀察上面的殘差圖認哪幾個樣本點在采集時可能存在人為的錯誤?為什么?學(xué)生活動:分組討論.活動結(jié)果第一個和第六個樣本在采集過程中可能存在錯誤為他的樣本點基本都集中在一個區(qū)域內(nèi)只有這兩樣本點的殘差比較大對其他樣本點來說分得較為分散.提出問題:如何從殘差圖來判斷模型的擬合程度?學(xué)生活動:獨立思考也可相互討論.活動結(jié)果:因

越小,預(yù)報精度越高,即模型的擬合程度越高,2小的值越集中故殘差點比較均勻落在水平的帶狀區(qū)域內(nèi)明選用的模型比較合適且?guī)顓^(qū)域的寬度越窄,說明擬合精度越高,回歸直線的預(yù)報精度越高.教師:在統(tǒng)計學(xué)上,人們經(jīng)常用相關(guān)指數(shù)(y-2

來刻畫回歸的效果,其計算公式是:R

=1-

1n(y21提出問題:分析上面計算相關(guān)指數(shù)R

的公式,如何根據(jù)R2

來判斷模型的擬合效果?學(xué)生活動:獨立思考也可相互討論,教師加以適當?shù)囊龑?dǎo)提示.n活動結(jié)果:因為對于確定的樣本數(shù)據(jù)而言,(y-y)21意味著殘差平方和越小,也就是說模型的擬合效果越好.

是一個定值,故R2

取值越大,提出問題:在線性回歸模型中R

表示解釋變量對于預(yù)報變量變化的貢獻率

越接近1,表示回歸的效果越好,即解釋變量和預(yù)報量的線性相關(guān)性越強,試計算關(guān)于女大學(xué)生身高與體重問題中的相關(guān)指數(shù)R

學(xué)生活動:學(xué)生獨立計算獲得數(shù)據(jù).活動結(jié)果:2≈0.64.根據(jù)R≈0.64就得出“女大學(xué)生的身高解釋了64%體重變”,或者說“大學(xué)生的體重差異有64%由身高引起的就難理解為什么預(yù)報體重和真實值之間有差距了.設(shè)計目的結(jié)合圖象讓生直觀感受殘差圖在刻畫回歸模型擬合效果方面的應(yīng)用會殘差分析和相關(guān)指數(shù)的意義.提出問題根據(jù)前面得到的回歸程否預(yù)測一名美國女大學(xué)生的體重?建立回歸模型后能否一勞永逸,在若干年后還可以使用,或者適用于多年以前的女大學(xué)生體重預(yù)測?精心校對版本

^^^12n^高中數(shù)學(xué)^^^12n^學(xué)生活動:討論交流總結(jié)發(fā)言.活動結(jié)果:在使用回歸方程進行預(yù)報時要注意:(1)回歸方程只適用于我們所研究樣本的總體;(2)我們建立的回歸方程一般都有間性;(3)樣本取值的范圍會影響回歸方的適用范圍;(4)不能期望回歸方程得到的預(yù)報就是預(yù)報變量的精確值.提出問題:結(jié)合我們剛學(xué)習的概念,現(xiàn)在能否將建立回歸模型的步驟補充完整?學(xué)生活動:討論交流,合作完成.活動結(jié)果:一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個變量解釋變量,哪個變量是預(yù)報變量.(2)畫出確定好的解釋變量和預(yù)報量的散點圖,觀察它們之間的關(guān)如是否存在線性關(guān)系等).(3)由經(jīng)驗確定回歸方程的類如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方.(4)按一定規(guī)則如最小二乘)估計回歸方程中的參數(shù).(5)得出結(jié)果后分析殘差圖是否有(如個別數(shù)據(jù)對應(yīng)殘差過大,殘差呈現(xiàn)不隨機的規(guī)律性,等).若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.設(shè)計意圖設(shè)問題,讓學(xué)生討分析出用回歸方程進行預(yù)報需注意的問題,并讓學(xué)生完善建立回歸模型的步驟.在這個過程中師宜做太多引導(dǎo),要放手給學(xué)生,讓學(xué)生討論,充分參與進來.運用新知例1個車間為了規(guī)定工時定額,需確定加工零件所花費的時間,為此進行了0次試驗,測得的數(shù)據(jù)如下:編號零件數(shù)x/個

加工時間y/

68758189102115122(1)建立零件數(shù)為解釋變量,加工間為預(yù)報變量的回歸模型,并計算殘差;(2)你認為這個模型能較好地刻畫件數(shù)和加工時間的關(guān)系嗎?分:先根據(jù)散點圖粗略判斷變量是否具線性相關(guān)性斷是否可以用線性回歸模型來擬合數(shù)據(jù),然后通過殘ee來判斷模型擬合的效果,判斷原始數(shù)據(jù)是否存在可疑數(shù)據(jù).解:(1)根據(jù)表中數(shù)據(jù)作出散點圖下:散點圖由散點圖可知變量之間具有線性相關(guān)關(guān)系,可以通過求線性回歸方程來擬合數(shù)據(jù).根據(jù)公式可求得加工時間對零件數(shù)的線性回歸方程y=0.668x+精心校對版本

^^^^^^ii5^5iii高中數(shù)學(xué)打印版^^^^^^ii5^5iii殘差數(shù)據(jù)如下表:編號

10殘差e

-0.65

-0.37

-0.05

(2)畫出殘差圖殘差圖由圖可知殘點分布較均勻即用上述回歸模型擬合數(shù)據(jù)效果很好但需注意由差圖也可以看出4個本和第樣本點殘差較大要認在采集這兩個樣本點的過程中是否有人為的錯誤.點評由點圖判斷兩個變量的性相關(guān)關(guān)系差較大利殘差圖可以較好地評價模型的擬合程度,并能發(fā)現(xiàn)樣本點中的可疑數(shù)據(jù).【變練演編】例一段時間內(nèi),某種商品的價格元)和需求量y()之間的一組數(shù)據(jù)為:價格元需求量y/

161820504341求出y對x的歸方程,并說明擬合效果的好壞.思分:根據(jù)散點圖判斷兩個變量是否線性相關(guān)若相關(guān),求出回歸直線方程后通過相關(guān)指數(shù)的大小來評價擬合效果的好壞.解:作出散點圖:從作出的散點圖可以看出這些點在一條直線附近用線性回歸模型來擬合數(shù)據(jù)由數(shù)據(jù)可得=,y=,由計算公式=,=y(tǒng)-bx=故yx的歸方程y=2.35x+,列表yy

i

1.2

-0.14.6

--

0.3-4.4

-8.4所以(y-)2=8.3,(y-2229.2.i

i1精心校對版本

5^iiiii高中數(shù)學(xué)打印版5^iiiii(y-2相關(guān)指數(shù)R2

=1-

1

≈0.946.5(y-y)

1因為很近1所以該模型的擬合效果很好.變式:若要分析是否在上述樣本的采集過程中存在可疑數(shù)據(jù),應(yīng)如何分析?活動設(shè)計:學(xué)生分組討論,回顧課本解答問題.活動成果:可以畫出殘差圖來進行分析.變式:既然利用殘差圖和相關(guān)指數(shù)都能夠評價回歸模型的擬合效果,能否總結(jié)一下兩種方法各自的特點?活動成果利用殘差圖可以直觀示擬合的效果且可以發(fā)現(xiàn)樣本數(shù)據(jù)中的可疑數(shù)據(jù)而關(guān)指數(shù)是把對擬合效果的評價轉(zhuǎn)換為數(shù)值大小的判斷于化處理并能在數(shù)量上表現(xiàn)解釋變量對于預(yù)報變量變化的貢獻率.設(shè)計意圖:進一步熟悉判斷擬合效果的方法以及各自的特點.【達標檢測】.分析下列殘差圖,所選用的回歸模型效果最好的()ABC

D.下列說法正確的()①回歸直線方程適用于一切樣本和總體回直線方程一般都有時間性樣本的取值范圍會影響回歸直線方程的適用范圍據(jù)回歸直線方程得到的預(yù)測值是預(yù)測變量的精確值.A①③④B.③C.①②D.④.在研究氣溫和熱茶銷售杯數(shù)的關(guān)系時,若求得相關(guān)指數(shù)2,氣溫解釋了85%熱茶銷售杯數(shù)變化或說熱銷售杯數(shù)差異有是由氣溫引起的.答案:1.D2.B3.0.85.精心校對版本

n^iii^^5^ii11i221高中數(shù)學(xué)打印版n^iii^^5^ii11i221課堂小結(jié)學(xué)生回顧本節(jié)課學(xué)習的內(nèi)容嘗總結(jié)然后不充分的地方由學(xué)生相互補充后老師的引導(dǎo)下,用精煉的語言進行概括:.判斷變量是否線性相關(guān)的方法以及各自的特點;.在運用回歸模型時需注意的事項;.建立回歸模型的基本步驟.設(shè)計意圖學(xué)自己小結(jié)是一個多維整合的過程一個高層次的自我認識過程.補充練習【基礎(chǔ)練習】.有下列說法:①在殘差圖中,殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi),說明選的模型比較合適.②用相關(guān)指數(shù)來畫回歸的效果,2值接近于,說明模型的擬效果越好③較兩個模型的擬效果以比較殘差平方和的大小殘差平方和越小的模型,擬合效果越好.正確的是()A①②B.②③.①③D①②③.甲、乙、丙、丁四位同學(xué)各自對AB兩量做回歸分析,分別得到散點圖與殘差平方和(y-y)

如下表

1甲

丁散點圖殘差平方和

哪位同學(xué)的實驗結(jié)果體現(xiàn)擬合AB兩量關(guān)系的模型擬精度高(A甲B乙.D丁.關(guān)于x與y有下數(shù)據(jù):xy

為了對xy兩個變量進行統(tǒng)計分析有下兩種線性模型y=+17.5乙:y=+試較哪一個模型擬合效果更好.答案或提示2.D(yy)2.析:設(shè)甲模型相關(guān)指數(shù)為R2則R2=-

i=1-5(y)2

=0.845設(shè)乙i模型的相關(guān)指數(shù)為R

,則可求得R

=,因為R2>R

,所以甲模型的擬合效果更好.【拓展練習】假設(shè)某種農(nóng)作物本苗數(shù)與有效穗之存在相關(guān)關(guān)系測得5數(shù)據(jù)如下:精心校對版本

^^^^^^^^^^^^123455^iii5^i^^^^^^^^^^^^123455^iii5^iiix36.644.4y43.149.2(1)以x為釋變量y為報變量,作出散點圖;(2)求y與x之的回歸方程,對于基本苗數(shù)56.7預(yù)有效穗數(shù).(3)計算各組殘差;(4)求2并說明隨機誤差對有效穗數(shù)的影響占百分之幾?解:(1)散點圖如圖:由可以看出,樣本點呈條狀分布,有比較好的線性相關(guān)關(guān)系,因此可用線性回歸方程來建立兩個變量之間的關(guān)系.設(shè)線性回歸方程y=bx+a,數(shù)據(jù)可以求得:≈0.291a=y(tǒng)-x=34.67.故所求的線性回歸方程為y=+當x=時,=0.291×56.7+=51.1697.估計有效穗數(shù)為51.169(3)各組數(shù)據(jù)的殘差分別≈0.37e,≈-,≈-2.22e≈1.61.(4)殘差平方和:(y-y)

5=,又(y-y)250.18,∴

=1-

i1(y-)i8.425=1≈0.832.5(y2

ii即解釋變量(農(nóng)作物基本苗數(shù)對有效穗數(shù)的影響約占了83.2%所以隨機誤差對有效穗數(shù)的影響約占1=16.8%.設(shè)說本課時從上一節(jié)課的案例出發(fā),通過分析隨機誤差產(chǎn)生的原因,引入隨機變量、殘差、殘差平方和指的有關(guān)概念關(guān)數(shù)和殘差分析等角度探討回歸模型擬合的效果,并通過案例說明利用所建立的回歸模型進行預(yù)報時需要注意的問題結(jié)建立回歸模型的基本步驟.在教學(xué)過程中以問題為引導(dǎo)思考的動機重學(xué)生合作意識的培養(yǎng)過案例的分析,培養(yǎng)學(xué)生對數(shù)據(jù)的處理能力,讓學(xué)生初步了解回歸分析思想在實際生活中的運用.精心校對版本

iin^ii^^^n^iin^n^iiiin^^iiiiiii=)+(y-y)+2n^^iiiiiin^iin^ii^^^n^iin^n^iiiin^^iiiiiii=)+(y-y)+2n^^iiiiiin^^n^^^iiiiiiin^[^^]iiii=b(x-x)(y-y)b(x)i備資有關(guān)總偏差平方和、回歸平方和、殘差平方和以及相關(guān)指數(shù)等概念的說明n.總偏差平方和SST(y)2刻畫了預(yù)報變量y的化劇烈程度.

1.回歸平方和:SSR=(y-y2i1

,公式中所有預(yù)測值的平均值也等于,故^1^^^^^^=x+a=x+=x+y-bx=y(tǒng),iii

1因此回歸平方和又可以寫成從而回歸平方和刻畫了估計量ya+x的化程度由估計量由解釋變量所決定以歸方和刻畫了預(yù)報變量的變化中由解釋變量通過線性回歸模型引起的那一部分的變化程度..殘差平方和:SSE=(y-y2

,刻畫了殘差變量變化的程度.i.偏差平方和分解:即指公式(y-y2(y-y2-y2,i

i

i稱為平方和分解公式,用文字表示為:總偏差平方和=回歸平方和+殘差平方和.公式證明如下:假設(shè)觀測數(shù)據(jù)為(,),i,…,n,則(y-)2=(y-y+y-ynn^22iii

1(y-)(y-y).

i1

1

1

1而-y)(y-)=(b-bx--bx)

1i

1=(x-x--x--)

1^[]iii

1

精心校對版本

^ii

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論