變量間的相關(guān)關(guān)系與統(tǒng)計案例(教師版).docx_第1頁
變量間的相關(guān)關(guān)系與統(tǒng)計案例(教師版).docx_第2頁
變量間的相關(guān)關(guān)系與統(tǒng)計案例(教師版).docx_第3頁
變量間的相關(guān)關(guān)系與統(tǒng)計案例(教師版).docx_第4頁
變量間的相關(guān)關(guān)系與統(tǒng)計案例(教師版).docx_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

變量間的相關(guān)關(guān)系與統(tǒng)計案例【知識要點】1.相關(guān)關(guān)系的判斷(1)如果散點圖中點的分布從整體上看大致在一條直線的附近,我們說變量和具有線性相關(guān)關(guān)系(2)樣本數(shù)據(jù)(i1,2,n)的相關(guān)系數(shù) 當(dāng)時,兩變量正相關(guān),當(dāng)時,兩變量負相關(guān),當(dāng)且越接近于,相關(guān)程度越高,當(dāng)且越接近于,相關(guān)程度越低 2.回歸方程的求法求回歸方程的方法是最小二乘法,即使得樣本數(shù)據(jù)的點到回歸直線的距離的平方和最小若變量x與y具有線性相關(guān)關(guān)系,有n個樣本數(shù)據(jù)(i1,2,n),則回歸方程中斜率和截距的最小二乘估計公式分別為: 其中,稱為樣本點的中心【重點】 回歸直線必過樣本點的中心,這個結(jié)論既是檢驗所求回歸直線方程是否準確的依據(jù),也是求參數(shù)的一個依據(jù)3獨立性檢驗0050001000013841663510828設(shè)X,Y為兩個變量,它們的取值分別為和,其樣本頻數(shù)列聯(lián)表(22列聯(lián)表)如下:y1y2總計x1ababx2cdcd總計acbdabcd利用隨機變量(其中為樣本容量)來判斷“兩個變量有關(guān)系”的方法稱為獨立性檢驗【例題解析】題型一變量間的相關(guān)關(guān)系【例1】對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是()Ar2r40r3r1 Br4r20r1r3 Cr4r20r3r1 Dr2r40r1r3解析:選A易知題中圖(1)與圖(3)是正相關(guān),圖(2)與圖(4)是負相關(guān),且圖(1)與圖(2)中的樣本點集中分布在一條直線附近,則r2r40r3r1.【變式1】四名同學(xué)根據(jù)各自的樣本數(shù)據(jù)研究變量x,y之間的相關(guān)關(guān)系,并求得回歸直線方程,分別得到以下四個結(jié)論:y與x負相關(guān)且2.347x6.423;y與x負相關(guān)且3.476x5.648;y與x正相關(guān)且5.437x8.493;y與x正相關(guān)且4.326x4.578.其中一定不正確的結(jié)論的序號是()A B C D解析:選D正相關(guān)指的是y隨x的增大而增大,負相關(guān)指的是y隨x的增大而減小,故不正確的為,故選D.相關(guān)關(guān)系的直觀判斷方法就是作出散點圖,若散點圖呈帶狀且區(qū)域較窄,說明兩個變量有一定的線性相關(guān)性,若呈曲線型也是有相關(guān)性,若呈圖形區(qū)域且分布較亂則不具備相關(guān)性【例2】(2014湖北高考)根據(jù)如下樣本數(shù)據(jù)x345678y4.02.50.50.52.03.0得到的回歸方程為bxa,則()Aa0,b0 Ba0,b0 Ca0 Da0,b0解析:選B由表中數(shù)據(jù)畫出散點圖,如圖,由散點圖可知b0,選B.【例3】對于下列表格所示五個散點,已知求得的線性回歸方程為0.8x155,則實數(shù)m的值為()x196197200203204y1367mA.8 B8.2 C8.4 D8.5解析:選A200,.樣本中心點為,將樣本中心點代入0.8x155,可得m8.故A正確題型二回歸方程的求法【例4】某城市理論預(yù)測2011年到2015年人口總數(shù)與年份的關(guān)系如下表所示請根據(jù)上表提供的數(shù)據(jù),求最小二乘法求出關(guān)于的線性回歸方程;據(jù)此估計2016年該城市人口總數(shù).參考公式: 解:(1), 2分 = 05+17+28+311+419=132,= 故y關(guān)于x的線性回歸方程為=3.2x+3.6 (2)當(dāng)x=5時,=3.2*5+3.6即=19.6 據(jù)此估計2016年該城市人口總數(shù)約為196萬. 【例5】某保險公司有一款保險產(chǎn)品的歷史戶獲益率(獲益率=獲益保費收入)的頻率分布直方圖如圖所示:()試估計平均獲益率;()根據(jù)經(jīng)驗若每份保單的保費在元的基礎(chǔ)上每增加元,對應(yīng)的銷量(萬份)與(元)有較強線性相關(guān)關(guān)系,從歷史銷售記錄中抽樣得到如下組與的對應(yīng)數(shù)據(jù):(元)銷量(萬份)()根據(jù)數(shù)據(jù)計算出銷量(萬份)與(元)的回歸方程為;()若把回歸方程當(dāng)作與的線性關(guān)系,用()中求出的平均獲益率估計此產(chǎn)品的獲益率,每份保單的保費定為多少元時此產(chǎn)品可獲得最大獲益,并求出該最大獲益.參考公示: 解析:()區(qū)間中值依次為:0.05,0.15,0.25,0.35,0.45,0.55,取值概率依次為:0.1,0.2,0.25,0.3,0.1,0.05,平均獲益率為()(i)則即(ii)設(shè)每份保單的保費為元,則銷量為,則保費獲益為萬元, 當(dāng)元時,保費收入最大為萬元,保險公司預(yù)計獲益為萬元.題型三獨立性檢驗【例6】為考察棉花種子經(jīng)過處理跟生病之間的關(guān)系得到下表數(shù)據(jù):種子處理種子未處理總計得病32101133不得病61213274總計93314407根據(jù)以上數(shù)據(jù),則種子經(jīng)過處理與是否生病_(填“有”或“無”)關(guān)解析:在假設(shè)無關(guān)的情況下,根據(jù)題意K20.16,可以得到無關(guān)的概率大于50%,所以種子經(jīng)過處理跟是否生病有關(guān)的概率小于50%,所以可以認為種子經(jīng)過處理與是否生病無關(guān)答案:無【例7】某高校為調(diào)查學(xué)生喜歡“應(yīng)用統(tǒng)計”課程是否與性別有關(guān),隨機抽取了選修課程的55名學(xué)生,得到數(shù)據(jù)如下表:喜歡“應(yīng)用統(tǒng)計”課程不喜歡“應(yīng)用統(tǒng)計”課程總計男生20525女生102030總計302555(1)判斷是否有99.5%的把握認為喜歡“應(yīng)用統(tǒng)計”課程與性別有關(guān)?(2)用分層抽樣的方法從喜歡統(tǒng)計課程的學(xué)生中抽取6名學(xué)生做進一步調(diào)查,將這6名學(xué)生作為一個樣本,從中任選2人,求恰有1個男生和1個女生的概率下面的臨界值表供參考:P(K2k)0.150.100.050.250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828(參考公式:K2,其中nabcd)解:(1)由公式K211.9787.879,所以有99.5%的把握認為喜歡“應(yīng)用統(tǒng)計”課程與性別有關(guān)(2)設(shè)所抽樣本中有m個男生,則,得m4,所以樣本中有4個男生,2個女生,分別記作B1,B2,B3,B4,G1,G2.從中任選2人的基本事件有(B1,B2),(B1,B3),(B1,B4),(B1,G1),(B1,G2),(B2,B3),(B2,B4),(B2,G1),(B2,G2),(B3,B4),(B3,G1),(B3,G2),(B4,G1),(B4,G2),(G1,G2),共15個,其中恰有1個男生和1個女生的事件有(B1,G1),(B1,G2),(B2,G1),(B2,G2),(B3,G1),(B3,G2),(B4,G1),(B4,G2),共8個所以恰有1個男生和1個女生的概率為.【變式1】經(jīng)過對計量的研究,得到了若干個臨界值如下:當(dāng)?shù)挠^測值時,我們( A )A. 在犯錯誤的概率不超過0.05的前提可認為A與B有關(guān) B. 在犯錯誤的概率不超過0.05的前提可認為A與B無關(guān) C. 在犯錯誤的概率不超過0.01的前提可認為A與B有關(guān) D. 沒有充分理由說明事件A與B有關(guān)系 【變式2】某校高三子啊一次模擬考試后,為了解數(shù)學(xué)成績是否與班級有關(guān),對甲乙兩個班數(shù)學(xué)成績(滿分150分)進行分析,按照不小于120分為優(yōu)秀,120分以下為非優(yōu)秀的標準統(tǒng)計成績,已知從全班100人中隨機抽取1人數(shù)學(xué)成績優(yōu)秀的概率為,調(diào)查結(jié)果如下表所示.(1)請完成上面的列聯(lián)表; (2)根據(jù)列聯(lián)表的數(shù)據(jù),問是否有95%的把握認為“數(shù)學(xué)成績與班級有關(guān)系”;(3)若按下面的方法從甲班數(shù)學(xué)成績優(yōu)秀的學(xué)生中抽取1人:把甲班數(shù)學(xué)成績優(yōu)秀的10名學(xué)生從2到11進行編號,先后兩次拋擲一枚均勻的骰子,出現(xiàn)的點數(shù)和被記為抽取人的編號,求抽到的編號為6或10的概率.【變式3】為了解人們對新頒布的“生育二孩放開”政策的熱度,現(xiàn)在某市進行調(diào)查對歲的人群隨機抽取了人,得到如下統(tǒng)計表和各年齡段抽取人數(shù)的頻率分布直方圖:()求,的值,并由頻率分布直方圖估計被調(diào)查人群的平均年齡;()根據(jù)以上統(tǒng)計數(shù)據(jù)填下面22列聯(lián)表,并根據(jù)列聯(lián)表的獨立性檢驗,判斷能否有99%的把握認為以45歲為分界點的不同人群對“生育二孩放開”政策的支持度有關(guān)系?年齡不低于45歲的人數(shù)年齡低于45歲的人數(shù)合計支持不支持合計0050001000013841663510828參考數(shù)據(jù):,其中解:()從歲這一年齡組中抽取的人數(shù)為,且頻率為, ; 2分又第二組的頻率為,則第二組人數(shù)為10人, 4分平均數(shù)(歲) 6分() 列聯(lián)表如下:年齡不低于45歲的人數(shù)年齡低于45歲的人數(shù)合計支持32932不支持71118合計104050,沒有99%的把握認為以45歲為分界點的不同人群對“生育二孩放開”政策的支持度有關(guān)系?!纠?】為研究患肺癌與是否吸煙有關(guān),做了一次相關(guān)調(diào)查,其中部分數(shù)據(jù)丟失,但可以確定的是不吸煙人數(shù)與吸煙人數(shù)相同,吸煙患肺癌人數(shù)占吸煙總?cè)藬?shù)的;不吸煙的人數(shù)中,患肺癌與不患肺癌的比為(1) 若吸煙不患肺癌的有人,現(xiàn)從患肺癌的人中用分層抽樣的方法抽取人,再從這人中隨機抽取人進行調(diào)查,求這兩人都是吸煙患肺癌的概率;(2)若研究得到在犯錯誤概率不超過的前提下,認為患肺癌與吸煙有關(guān),則吸煙的人數(shù)至少有多少?附:,其中解:(1)設(shè)吸煙人數(shù)為,依題意有,所以吸煙的人有人,故有吸煙患肺癌的有人,不患肺癌的有人用分層抽樣的方法抽取人,則應(yīng)抽取吸煙患肺癌的人,記為,不吸煙患肺癌的人,記為從人中隨機抽取人,所有可能的結(jié)果有,共種,則這兩人都是吸煙患肺癌的情形共有種,即這兩人都是吸煙患肺癌的概率為 .6分 (2)方法一:設(shè)吸煙人數(shù)為,由題意可得列聯(lián)表如下:患肺癌不患肺癌合計吸煙不吸煙總計由表得,由題意,為整數(shù),的最小值為則,即吸煙人數(shù)至少為人方法二:設(shè)吸煙人數(shù)為,由題意可得列聯(lián)表如下:患肺癌不患肺癌合計吸煙不吸煙總計由表得,由題意,為整數(shù)且為的倍數(shù),的最小值為即吸煙人數(shù)至少為人 【高考真題】【1】【2017課標1,文19】為了監(jiān)控某種零件的一條生產(chǎn)線的生產(chǎn)過程,檢驗員每隔30 min從該生產(chǎn)線上隨機抽取一個零件,并測量其尺寸(單位:cm)下面是檢驗員在一天內(nèi)依次抽取的16個零件的尺寸:抽取次序12345678零件尺寸995101299699610019929981004抽取次序910111213141516零件尺寸10269911013100292210041005995經(jīng)計算得,其中為抽取的第個零件的尺寸,(1)求的相關(guān)系數(shù),并回答是否可以認為這一天生產(chǎn)的零件尺寸不隨生產(chǎn)過程的進行而系統(tǒng)地變大或變小(若,則可以認為零件的尺寸不隨生產(chǎn)過程的進行而系統(tǒng)地變大或變小)(2)一天內(nèi)抽檢零件中,如果出現(xiàn)了尺寸在之外的零件,就認為這條生產(chǎn)線在這一天的生產(chǎn)過程可能出現(xiàn)了異常情況,需對當(dāng)天的生產(chǎn)過程進行檢查()從這一天抽檢的結(jié)果看,是否需對當(dāng)天的生產(chǎn)過程進行檢查?()在之外的數(shù)據(jù)稱為離群值,試剔除離群值,估計這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的均值與標準差(精確到001)附:樣本的相關(guān)系數(shù),【答案】(1),可以;(2)()需要;()均值與標準差估計值分別為1002,009【解析】試題分析:(1)依公式求;(2)(i)由,得抽取的第13個零件的尺寸在以外,因此需對當(dāng)天的生產(chǎn)過程進行檢查;(ii)剔除第13個數(shù)據(jù),則均值的估計值為1002,方差為009(ii)剔除離群值,即第13個數(shù)據(jù),剩下數(shù)據(jù)的平均數(shù)為,這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的均值的估計值為1002,剔除第13個數(shù)據(jù),剩下數(shù)據(jù)的樣本方差為,這條生產(chǎn)線當(dāng)天生產(chǎn)的零件尺寸的標準差的估計值為【2】【2017課標II,文19】海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg), 其頻率分布直方圖如下:(1) 記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50kg”,估計A的概率;(2) 填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān):箱產(chǎn)量50kg箱產(chǎn)量50kg舊養(yǎng)殖法新養(yǎng)殖法(3) 根據(jù)箱產(chǎn)量的頻率分布直方圖,對兩種養(yǎng)殖方法的優(yōu)劣進行較。附:P()0.0500.0100.001k3.8416.63510.828 【答案】(1)0.62.(2)有把握(3)新養(yǎng)殖法優(yōu)于舊養(yǎng)殖法【解析】(2)根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表箱產(chǎn)量50kg箱產(chǎn)量50kg舊養(yǎng)殖法6238新養(yǎng)殖法3466K2= 由于15.7056.635,故有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān).(3)箱產(chǎn)量的頻率分布直方圖平均值(或中位數(shù))在45kg到50kg之間,且新養(yǎng)殖法的箱產(chǎn)量分布集中程度較舊養(yǎng)殖法的箱產(chǎn)量分布集中程度高,因此,可以認為新養(yǎng)殖法的箱產(chǎn)量較高且穩(wěn)定,從而新養(yǎng)殖法優(yōu)于舊養(yǎng)殖法.【3】(2016年全國III卷高考)下圖是我國2008年至2014年生活垃圾無害化處理量(單位:億噸)的折線圖()由折線圖看出,可用線性回歸模型擬合y與t的關(guān)系,請用相關(guān)系數(shù)加以說明;()建立y關(guān)于t的回歸方程(系數(shù)精確到0.01),預(yù)測2016年我國生活垃圾無害化處理量.附注:參考數(shù)據(jù):,2.646.參考公式:相關(guān)系數(shù) 回歸方程 中斜率和截距的最小二乘估計公式分別為:()由及()得,所以,關(guān)于的回歸方程為:. .10分將2016年對應(yīng)的代入回歸方程得:.所以預(yù)測2016年我國生活垃圾無害化處理量將約1.82億噸. .12分【4】【2015高考新課標1,文19】某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響,對近8年的宣傳費和年銷售量數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.46.656.36.8289.81.61469108.8表中= , =(I)根據(jù)散點圖判斷,與,哪一個適宜作為年銷售量y關(guān)于年宣傳費x的回歸方程類型(給出判斷即可,不必說明理由);(II)根據(jù)(I)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;(III)已知這種產(chǎn)品的年利潤z與x,y的關(guān)系為 ,根據(jù)(II)的結(jié)果回答下列問題:(i)當(dāng)年宣傳費時,年銷售量及年利潤的預(yù)報值時多少?(ii)當(dāng)年宣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論