人教版高數(shù)選修2-3第7講:獨立性檢驗與回歸分析(教師版)_第1頁
人教版高數(shù)選修2-3第7講:獨立性檢驗與回歸分析(教師版)_第2頁
人教版高數(shù)選修2-3第7講:獨立性檢驗與回歸分析(教師版)_第3頁
人教版高數(shù)選修2-3第7講:獨立性檢驗與回歸分析(教師版)_第4頁
人教版高數(shù)選修2-3第7講:獨立性檢驗與回歸分析(教師版)_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

獨立性檢驗與回歸分析____________________________________________________________________________________________________________________________________________________________________1.了解變量間的相關(guān)關(guān)系,能根據(jù)給出的線性回歸方程系數(shù)建立線性回歸方程.2.了解獨立性檢驗(只要求2×2列聯(lián)表)的基本思想、方法及其簡單應(yīng)用.3.了解回歸分析的基本思想、方法及其簡單應(yīng)用.1.獨立性檢驗(1)概念:用統(tǒng)計量研究獨立性問題的檢驗的方法稱為獨立性檢驗.(2)m×n列聯(lián)表指有m行n列的列聯(lián)表(3)必備公式2.統(tǒng)計量中的四個臨界值經(jīng)過對統(tǒng)計量分布的研究,已經(jīng)得到了四個經(jīng)常用到的臨界值:2.706、3.841、6.635、10.828.由2×2列聯(lián)表計算出,然后與相應(yīng)的臨界值進(jìn)行比較,當(dāng)>2.706時,有90%的把握說事件A與B有關(guān).當(dāng)>3.841時,有95%的把握說事件A與B有關(guān).當(dāng)>6.635時,有99%的把握說事件A與B有關(guān).當(dāng)>10.828時,有99.9%的把握說事件A與B有關(guān).當(dāng)≤2.706時,認(rèn)為事件A與B是無關(guān)的.3.回歸分析(1)線性回歸模型是指方程,其中稱為確定性函數(shù),稱為隨機(jī)誤差.(2)線性回歸方程是指直線方程,其中回歸截距、回歸系數(shù)公式如下:==.(3)參數(shù)r檢驗線性相關(guān)的程度,計算公式為r=,即r=化簡后r=,其中表示數(shù)據(jù)(i=1,2,…,n)的標(biāo)準(zhǔn)差,這個r稱為y與x的樣本相關(guān)系數(shù),簡稱相關(guān)系數(shù),其中-1≤r≤1.若r>0,則x與y是正相關(guān),若r<0,則x與y是負(fù)相關(guān),若r=0,則x與y不相關(guān),r=1或r=-1時,x與y為完全線性相關(guān).類型一.獨立性檢驗例1:為考察高中生的性別與是否喜歡數(shù)學(xué)課程之間的關(guān)系,在某城市的某校高中生中隨機(jī)抽取300名學(xué)生,得到如下列聯(lián)表:喜歡數(shù)學(xué)課程不喜歡數(shù)學(xué)課程合計男生3785122女生35143178合計72228300判斷性別與是否喜歡數(shù)學(xué)課程有關(guān)嗎?[解析]假設(shè):性別與是否喜歡數(shù)學(xué)課程無關(guān),由卡方計算公式得所以我們可以拒絕從而有95%的把握認(rèn)為性別與是否喜歡數(shù)學(xué)課程有關(guān)系.練習(xí)1:為了研究子女吸煙與父母吸煙的關(guān)系,調(diào)查了一千多名青少年及其家長,數(shù)據(jù)如下:父母吸煙父母不吸煙合計子女吸煙23783320子女不吸煙6785221200合計9156051520用獨立性檢驗方法判斷父母吸煙對子女是否吸煙有影響.[解析]提出假設(shè):父母吸煙對子女是否吸煙沒有影響,由列聯(lián)表中的數(shù)據(jù)得到:所以有99.9%的把握認(rèn)為:父母吸煙對子女是否吸煙有影響.類型二.變量間的相關(guān)關(guān)系及線性回歸方程例2:下列關(guān)系中,是帶有隨機(jī)性相關(guān)關(guān)系的是______.①正方形的邊長與面積之間的關(guān)系;②水稻產(chǎn)量與施肥量之間的關(guān)系;③人的身高與年齡之間的關(guān)系;④降雪量與交通事故的發(fā)生率之間的關(guān)系.[答案]②④[解析]兩變量之間的關(guān)系有兩種:函數(shù)關(guān)系與帶有隨機(jī)性的相關(guān)關(guān)系.①正方形的邊長與面積之間的關(guān)系是函數(shù)關(guān)系.②水稻產(chǎn)量與施肥量之間不是嚴(yán)格的函數(shù)關(guān)系,但是具有相關(guān)性,因而是相關(guān)關(guān)系.③人的身高與年齡之間的關(guān)系既不是函數(shù)關(guān)系,也不是相關(guān)關(guān)系,因為人的年齡達(dá)到一定時期身高就不發(fā)生明顯變化了,因而他們不具有相關(guān)關(guān)系.④降雪量與交通事故的發(fā)生率之間具有相關(guān)關(guān)系.例3:某工業(yè)部門進(jìn)行一項研究,分析該部門的產(chǎn)量與生產(chǎn)費用的關(guān)系,從這個工業(yè)部門內(nèi)隨機(jī)抽選了10個企業(yè)作樣本,資料如下表:產(chǎn)量x(千克)40424855657988100120140生產(chǎn)費用y(千克)150140160170150162185165190185根據(jù)表格求出回歸直線方程.[解析]∴回歸直線方程為練習(xí)1:下列兩個變量之間的關(guān)系哪個不是函數(shù)關(guān)系()(A)角度和它的余弦值(B)正方形邊長和面積(C)正n邊形的邊數(shù)和頂點角度之和(D)人的年齡和身高[答案]D[解析]人的身高與年齡只具有相關(guān)性類型三.相關(guān)檢驗與回歸分析例3:某工業(yè)部門進(jìn)行一項研究,分析該部門的產(chǎn)量與生產(chǎn)費用之間的關(guān)系.從這個工業(yè)部門內(nèi)隨機(jī)抽選了10個企業(yè)作樣本,有如下資料:產(chǎn)量x(千克)40424855657988100120140生產(chǎn)費用y(千克)150140160170150162185165190185完成下列問題:(1)計算x與y的相關(guān)系數(shù);(2)對這兩個變量之間是否線性相關(guān)進(jìn)行相關(guān)性檢驗;(3)設(shè)線性回歸方程為求系數(shù)[解析]由表可計算得:(1)(2)因為0.808>=0.632,所以認(rèn)為x與y之間具有線性相關(guān)關(guān)系.(3)代入公式得練習(xí)1:某運動員訓(xùn)練次數(shù)與運動成績之間的數(shù)據(jù)關(guān)系如下:次數(shù)(x)3033353739444650成績(y)3034373942464851試預(yù)測該運動員訓(xùn)練47次以及55次的成績.[解析](1)可求得所以所以回歸直線方程為(2)計算相關(guān)系數(shù)將上述數(shù)據(jù)代入得r≈0.992704,查表可知0.707,而故y與x之間存在顯著的線性相關(guān)關(guān)系.(3)作出預(yù)報:由上述分析可知,我們可用回歸方程1.0415x-0.00386作為該運動員成績的預(yù)測值,將x=47和x=55分別代入該方程得和故預(yù)測該運動員訓(xùn)練47次和55次成績分別為49和57.1.在調(diào)查中學(xué)生近視情況中,某校男生150名中有80名近視,女生140名中有70名近視,在檢驗這些中學(xué)生眼睛近視是否與性別有關(guān)時用什么方法最有說服力()A.期望與方差 B.排列與組合 C.獨立性檢驗 D.概率[答案]C2.通過對統(tǒng)計量的研究,得到了若干臨界值,當(dāng)≤2.706時,我們認(rèn)為事件A與B()A.有90%的把握認(rèn)為A與B有關(guān)系B.有95%的把握認(rèn)為A與B有關(guān)系C.沒有充分理由說明事件A與B有關(guān)系D.不能確定[答案]C3.下列關(guān)于的說法中正確的是()A.在任何相互獨立問題中都可以用來檢驗有關(guān)還是無關(guān)B.的值越大,兩個事件的相關(guān)性就越大C.是用來判斷兩個分類變量是否有關(guān)系的隨機(jī)變量,只對于兩個分類變量適合D.的觀測值的計算公式為[答案]C4.下列兩個變量之間的關(guān)系是相關(guān)關(guān)系的是()A.角度和它的余弦值 B.正方形邊長和面積C.正n邊形的邊數(shù)和頂點數(shù) D.人的年齡和身高[答案]D5.由一組樣本數(shù)據(jù)得到的回歸方程為下面說法不正確的是()A.直線必經(jīng)過點B.直線至少經(jīng)過點中的一個點C.直線的斜率為D.直線和各點的偏差平方和是該坐標(biāo)平面上所有直線與這些點的偏差平方和中最小的直線[答案]B6.有甲、乙兩個班級進(jìn)行數(shù)學(xué)考試,按照大于等于85分為優(yōu)秀,85分以下非優(yōu)秀統(tǒng)計成績,得到如下所示的列聯(lián)表:優(yōu)秀非優(yōu)秀總計甲班10b乙班c30合計已知在全部105人中隨機(jī)抽取1人,成績優(yōu)秀的概率為eq\f(2,7),則下列說法正確的是()A.列聯(lián)表中c的值為30,b的值為35B.列聯(lián)表中c的值為15,b的值為50C.根據(jù)列聯(lián)表中的數(shù)據(jù),若按97.5%的可靠性要求,能認(rèn)為“成績與班級有關(guān)系”D.根據(jù)列聯(lián)表中的數(shù)據(jù),若按97.5%的可靠性要求,不能認(rèn)為“成績與班級有關(guān)系”[答案]C7.為了判斷高中三年級學(xué)生是否選修文科與性別的關(guān)系,現(xiàn)隨機(jī)抽取50名學(xué)生,得到如下2×2列聯(lián)表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根據(jù)表中數(shù)據(jù),得到K2=eq\f(50×(13×20-10×7)2,23×27×20×30)≈4.844.則認(rèn)為選修文科與性別有關(guān)系出錯的可能性為________.[答案]5%8.某數(shù)學(xué)老師身高176cm,他爺爺、父親和兒子的身高分別是173cm、170cm和182cm.因兒子的身高與父親的身高有關(guān),該老師用線性回歸分析的方法預(yù)測他孫子的身高為________cm.[答案]185__________________________________________________________________________________________________________________________________________________________________基礎(chǔ)鞏固1.(2014重慶卷)已知變量x與y正相關(guān),且由觀測數(shù)據(jù)算得樣本平均數(shù)x=3,y=3.5,則由該觀測數(shù)據(jù)算得的線性回歸方程可能是()A.y^=0.4x+2.3 B.y^=2x-2.4C.y^=-2x+9.5 D.y^=-0.3x+4.4[答案]A2.(2014湖北卷)根據(jù)如下樣本數(shù)據(jù):x345678y4.02.5-0.50.5-2.0-3.0得到的回歸方程為eq\o(y,\s\up6(^))=bx+a,則()A.a>0,b>0 B.a>0,b<0 C.a<0,b>0 D.a<0,b<0[答案]B3.(2014江西卷)某人研究中學(xué)生的性別與成績、視力、智商、閱讀量這4個變量的關(guān)系,隨機(jī)抽查52名中學(xué)生,得到統(tǒng)計數(shù)據(jù)如表1至表4,則與性別有關(guān)聯(lián)的可能性最大的變量是()成績性別不及格及格總計男61420女102232總計163652視力性別好差總計男41620女122032總計163652智商性別偏高正??傆嬆?1220女82432總計163652閱讀量性別豐富不豐富總計男14620女23032總計163652A.成績 B.視力 C.智商 D.閱讀量[答案]D4.下列兩個變量之間的關(guān)系是相關(guān)關(guān)系的是()A.正方體的棱長和體積 B.角的弧度數(shù)和它的正弦值C.單產(chǎn)為常數(shù)時,土地面積和總產(chǎn)量 D.日照時間與水稻的畝產(chǎn)量[答案]D5.(2015福建)為了解某社區(qū)居民的家庭年收入所年支出的關(guān)系,隨機(jī)調(diào)查了該社區(qū)5戶家庭,得到如下統(tǒng)計數(shù)據(jù)表:收入(萬元)8.28.610.011.311.9支出(萬元)6.27.58.08.59.8根據(jù)上表可得回歸直線方程,其中,據(jù)此估計,該社區(qū)一戶收入為15萬元家庭年支出為()A.11.4萬元 B.11.8萬元 C.12.0萬元 D.12.2萬元[答案]B6.“回歸”一詞是在研究子女的身高與父母的身高之間的遺傳關(guān)系時,由高爾頓提出的.他的研究結(jié)果是子代的平均身高向中心回歸.根據(jù)他的結(jié)論,在兒子的身高y與父親的身高x的回歸方程中,()A.在(-1,0)內(nèi) B.等于0 C.在(0,1)內(nèi) D.在[1,+∞)[答案]C7.線性回歸方程中,回歸系數(shù)的含義是________________.[答案]x每增加一個單位,y相應(yīng)地平均變化個單位8.在一項打鼾與患心臟病是否有關(guān)的調(diào)查中,共調(diào)查了1978人,經(jīng)過計算28.63,根據(jù)這一數(shù)據(jù)分析,我們有理由認(rèn)為打鼾與患心臟病是________的.(填“有關(guān)”、“無關(guān)”)[答案]有關(guān)能力提升1.下列說法:①將一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上或減去同一個常數(shù)后,方差不變;②設(shè)有一個線性回歸方程eq\o(y,\s\up6(^))=3-5x,變量x增加1個單位時,y平均增加5個單位;③設(shè)具有相關(guān)關(guān)系的兩個變量x,y的相關(guān)系數(shù)為r,則|r|越接近于0,x和y之間的線性相關(guān)程度越強(qiáng);④在一個2×2列聯(lián)表中,由計算得K2的值,則K2的值越大,判斷兩個變量間有關(guān)聯(lián)的把握就越大.其中錯誤的個數(shù)是()A.0 B.1 C.2 D.3[答案]C2.已知x與y之間的幾組數(shù)據(jù)如下表:x123456y021334假設(shè)根據(jù)上表數(shù)據(jù)所得線性回歸直線方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),若某同學(xué)根據(jù)上表中的前兩組數(shù)據(jù)(1,0)和(2,2)求得的直線方程為y=b′x+a′,則以下結(jié)論正確的是()A.eq\o(b,\s\up6(^))>b′,eq\o(a,\s\up6(^))>a′ B.eq\o(b,\s\up6(^))>b′,eq\o(a,\s\up6(^))<a′C.eq\o(b,\s\up6(^))<b′,eq\o(a,\s\up6(^))>a′ D.eq\o(b,\s\up6(^))<b′,eq\o(a,\s\up6(^))<a′[答案]C3.對相關(guān)系數(shù)r,下列說法正確的是()A.越大,相關(guān)程度越小 B.越小,相關(guān)程度越大C.越大,相關(guān)程度越小,越小,相關(guān)程度越大D.≤1且越接近1,相關(guān)程度越大,越接近0,相關(guān)程度越小[答案]D4.假設(shè)關(guān)于某設(shè)備的使用年限x(年)與所支出的維修費用y(萬元)有如下統(tǒng)計資料:x23456y2.23.85.56.57.0若由資料知,y對x呈線性相關(guān)關(guān)系,試求:(1)線性回歸方程;(2)估計設(shè)備的使用年限為10年時,維修費用約是多少?[答案](1)i12345xi23456yi2.23.85.56.57.0xiyi4.411.422.032.542.0所以線性回歸方程是1.23x+0.08.(2)當(dāng)x=10時,1.23×10+0.08=12.38(萬元),即估計設(shè)備用10年時,維修費用約是12.38萬元.5.假設(shè)關(guān)于某設(shè)備的使用年限x(年)和所支出的維修費用y(萬元)有如下表的統(tǒng)計資料:使用年限x(年)23456維修費用y(萬元)2.23.85.56.57.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論