版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人教A版
數(shù)學(xué)
選擇性必修第三冊(cè)期末復(fù)習(xí)課第3課時(shí)成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析知識(shí)梳理構(gòu)建體系【知識(shí)網(wǎng)絡(luò)】
【要點(diǎn)梳理】一、成對(duì)數(shù)據(jù)的統(tǒng)計(jì)相關(guān)性1.相關(guān)關(guān)系、散點(diǎn)圖(1)兩個(gè)變量有關(guān)系,但又沒(méi)有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這種關(guān)系稱為
相關(guān)關(guān)系
.(2)每一個(gè)序號(hào)下的成對(duì)樣本數(shù)據(jù)都可用直角坐標(biāo)系中的點(diǎn)表示出來(lái),由這些點(diǎn)組成了統(tǒng)計(jì)圖.我們把這樣的統(tǒng)計(jì)圖叫做
散點(diǎn)圖
.(3)如果從整體上看,當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值也呈現(xiàn)增加的趨勢(shì),我們就稱這兩個(gè)變量正相關(guān);如果當(dāng)一個(gè)變量的值增加時(shí),另一個(gè)變量的相應(yīng)值呈現(xiàn)減少的趨勢(shì),則稱這兩個(gè)變量
負(fù)相關(guān).(4)一般地,如果兩個(gè)變量的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點(diǎn)落在一條直線附近,我們就稱這兩個(gè)變量線性相關(guān).一般地,如果兩個(gè)變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個(gè)變量非線性相關(guān)或曲線相關(guān).2.樣本相關(guān)系數(shù)(2)當(dāng)r>0時(shí),變量x與y正相關(guān);當(dāng)r<0時(shí),變量x與y負(fù)相關(guān).(3)樣本相關(guān)系數(shù)r的取值范圍為[-1,1].樣本相關(guān)系數(shù)r的絕對(duì)值的大小可以反映成對(duì)數(shù)據(jù)之間線性相關(guān)的程度:當(dāng)|r|越接近1時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);當(dāng)|r|越接近0時(shí),成對(duì)樣本數(shù)據(jù)的線性相關(guān)程度越弱.二、一元線性回歸模型及其應(yīng)用1.一元線性回歸模型及經(jīng)驗(yàn)回歸方程(1)用x表示父親身高,Y表示兒子身高,e表示隨機(jī)誤差.假定隨機(jī)誤差e的均值為0,方差為與父親身高無(wú)關(guān)的定值σ2,則它們之間的關(guān)系可以表示為
我們稱此式為Y關(guān)于x的一元線性回歸模型,其中,Y稱為因變量或響應(yīng)變量,x稱為自變量或解釋變量;a和b為模型的未知參數(shù),a稱為截距參數(shù),b稱為斜率參數(shù);e是Y與bx+a之間的隨機(jī)誤差.2.線性回歸分析
三、列聯(lián)表與獨(dú)立性檢驗(yàn)1.列聯(lián)表(1)我們經(jīng)常會(huì)使用一種特殊的隨機(jī)變量,以區(qū)別不同的現(xiàn)象或性質(zhì),這類隨機(jī)變量稱為分類變量.(2)按研究問(wèn)題的需要,將數(shù)據(jù)分類統(tǒng)計(jì),并做成表格加以保存.這種形式的數(shù)據(jù)統(tǒng)計(jì)表稱為2×2列聯(lián)表,關(guān)于分類變量X和Y的抽樣數(shù)據(jù)的2×2列聯(lián)表如下:XY合計(jì)Y=0Y=1X=0aba+bX=1cdc+d合計(jì)a+cb+dn=a+b+c+d2.獨(dú)立性檢驗(yàn)(2)基于小概率值α的檢驗(yàn)規(guī)則是:當(dāng)χ2≥xα?xí)r,我們就推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯(cuò)誤的概率不超過(guò)α;當(dāng)χ2<xα?xí)r,我們沒(méi)有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立.(3)χ2獨(dú)立性檢驗(yàn)中常用的小概率值和相應(yīng)的臨界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828(4)應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問(wèn)題大致應(yīng)包括以下幾個(gè)主要環(huán)節(jié):①提出零假設(shè)H0:X和Y相互獨(dú)立,并給出在問(wèn)題中的解釋.②根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計(jì)算χ2的值,并與臨界值xα比較.③根據(jù)檢驗(yàn)規(guī)則得出推斷結(jié)論.④在X和Y不獨(dú)立的情況下,根據(jù)需要,通過(guò)比較相應(yīng)的頻率,分析X和Y間的影響規(guī)律.【思考辨析】
判斷下列說(shuō)法是否正確,正確的在后面的括號(hào)內(nèi)畫“√”,錯(cuò)誤的畫“×”.(1)殘差平方和越小,經(jīng)驗(yàn)回歸方程的擬合效果越好.(
√
)(2)決定系數(shù)R2越接近于1,經(jīng)驗(yàn)回歸方程的擬合效果越好.(
√
)(3)經(jīng)驗(yàn)回歸直線不一定過(guò)點(diǎn)
.(
×)(4)獨(dú)立性檢驗(yàn)得到的結(jié)論一定是正確的.(×)(5)經(jīng)驗(yàn)回歸直線可以不過(guò)(xi,yi)中的每一個(gè)點(diǎn).(
√
)(6)χ2的值大就說(shuō)明兩個(gè)分類變量有關(guān).(×)專題歸納核心突破
專題整合專題一
回歸分析的基本思想及其應(yīng)用【例1】
對(duì)于x與y有如下觀測(cè)數(shù)據(jù):(1)作出散點(diǎn)圖;(2)對(duì)x與y作回歸分析;(3)求出y對(duì)x的經(jīng)驗(yàn)回歸方程;(4)根據(jù)經(jīng)驗(yàn)回歸方程,預(yù)測(cè)當(dāng)y=20時(shí)x的值.x1825303941424952y356788910解:(1)散點(diǎn)圖如圖.解決經(jīng)驗(yàn)回歸分析問(wèn)題的一般步驟(1)畫散點(diǎn)圖.根據(jù)已知數(shù)據(jù)畫出散點(diǎn)圖.(2)判斷變量的相關(guān)性并求出回歸方程.通過(guò)觀察散點(diǎn)圖,直觀感知兩個(gè)變量是否具有相關(guān)關(guān)系,在此基礎(chǔ)上,利用最小二乘法求回歸系數(shù),然后寫出經(jīng)驗(yàn)回歸方程.(3)實(shí)際應(yīng)用.依據(jù)求得的經(jīng)驗(yàn)回歸方程解決問(wèn)題.【變式訓(xùn)練1】
一臺(tái)機(jī)器雖使用時(shí)間較長(zhǎng),但還可以使用,它按不同的轉(zhuǎn)速生產(chǎn)出來(lái)的某機(jī)械零件有一些會(huì)有缺點(diǎn),每小時(shí)生產(chǎn)有缺點(diǎn)的零件的多少隨機(jī)器運(yùn)轉(zhuǎn)的速度而變化,下表為抽樣試驗(yàn)的結(jié)果:轉(zhuǎn)速x/(轉(zhuǎn)/秒)1614128每小時(shí)生產(chǎn)有缺點(diǎn)的零件數(shù)y/件11985(1)對(duì)變量y與x進(jìn)行相關(guān)性檢驗(yàn);(2)如果y與x有線性相關(guān)關(guān)系,求經(jīng)驗(yàn)回歸方程;(3)若實(shí)際生產(chǎn)中,允許每小時(shí)生產(chǎn)的產(chǎn)品中有缺點(diǎn)的零件最多為10個(gè),則機(jī)器的運(yùn)轉(zhuǎn)速度應(yīng)控制在什么范圍內(nèi)?專題二
獨(dú)立性檢驗(yàn)【例2】
某校共有100名學(xué)生參加考試,其中語(yǔ)文考試成績(jī)低于130的占95%,數(shù)學(xué)成績(jī)的頻率分布直方圖如圖所示.(1)若成績(jī)不低于130的為特別優(yōu)秀,語(yǔ)文和數(shù)學(xué)兩科都特別優(yōu)秀的共有3人,如果從兩科都特別優(yōu)秀或一科特別優(yōu)秀的同學(xué)中隨機(jī)抽取2人,求這兩人兩科成績(jī)都特別優(yōu)秀的概率.(2)根據(jù)以上數(shù)據(jù),完成列聯(lián)表,試根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),分析語(yǔ)文特別優(yōu)秀與數(shù)學(xué)特別優(yōu)秀是否相關(guān).數(shù)學(xué)是否特別優(yōu)秀語(yǔ)文是否特別優(yōu)秀合計(jì)語(yǔ)文特別優(yōu)秀語(yǔ)文不特別優(yōu)秀數(shù)學(xué)特別優(yōu)秀
數(shù)學(xué)不特別優(yōu)秀
合計(jì)
α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解:(1)該校共有100名學(xué)生參加考試,其中語(yǔ)文考試成績(jī)低于130的有95%,語(yǔ)文成績(jī)特別優(yōu)秀的概率為P1=1-0.95=0.05,語(yǔ)文特別優(yōu)秀的同學(xué)有100×0.05=5人,數(shù)學(xué)成績(jī)特別優(yōu)秀的概率為P2=0.002×20=0.04,數(shù)學(xué)特別優(yōu)秀的同學(xué)有100×0.04=4人.語(yǔ)文、數(shù)學(xué)兩科都優(yōu)秀的有3人,單科優(yōu)秀的有3人,記兩科都優(yōu)秀的3人分別為A1,A2,A3,單科優(yōu)秀的3人分別為B1,B2,B3,從中隨機(jī)抽取2人,共有(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(A3,B1),(A3,B2),(A3,B3),(B1,B2),(B1,B3),(B2,B3)15種,其中這兩人兩科成績(jī)都優(yōu)秀的有(A1,A2),(A1,A3),(A2,A3)3種,這兩人兩科成績(jī)都優(yōu)秀的概率(2)2×2列聯(lián)表如下:數(shù)學(xué)是否特別優(yōu)秀語(yǔ)文是否特別優(yōu)秀合計(jì)語(yǔ)文特別優(yōu)秀語(yǔ)文不特別優(yōu)秀數(shù)學(xué)特別優(yōu)秀314數(shù)學(xué)不特別優(yōu)秀29496合計(jì)595100零假設(shè)為H0:語(yǔ)文特別優(yōu)秀與數(shù)學(xué)特別優(yōu)秀無(wú)關(guān).根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),有充分證據(jù)推斷H0不成立,即語(yǔ)文特別優(yōu)秀與數(shù)學(xué)特別優(yōu)秀有關(guān),此判斷犯錯(cuò)誤的概率不超過(guò)0.001.獨(dú)立性檢驗(yàn)問(wèn)題的求解方法(1)等高堆積條形圖法:依據(jù)題目信息畫出等高堆積條形圖,依據(jù)頻率差異來(lái)粗略地判斷兩個(gè)變量的相關(guān)性.(2)χ2統(tǒng)計(jì)量法:通過(guò)公式
,先計(jì)算χ2值,再與臨界值表進(jìn)行比較,最后得出結(jié)論.【變式訓(xùn)練2】
某電視臺(tái)為了解某地區(qū)電視觀眾對(duì)某類體育節(jié)目的收視情況,隨機(jī)抽取了100名觀眾進(jìn)行調(diào)查,下面是根據(jù)調(diào)查結(jié)果繪制的觀眾日均收看該體育節(jié)目時(shí)間的頻率分布直方圖,將日均收看該體育節(jié)目時(shí)間不低于40分鐘的觀眾稱為“體育迷”.(1)根據(jù)已知條件完成下面的2×2列聯(lián)表,試根據(jù)小概率值α=0.1的獨(dú)立性檢驗(yàn),分析“體育迷”是否與性別有關(guān).(2)將上述調(diào)查所得到的頻率視為概率,現(xiàn)在從該地區(qū)大量電視觀眾中,采用隨機(jī)抽樣方法每次抽取1名觀眾,抽取3次,記被抽取的3名觀眾中的“體育迷”人數(shù)為X,若每次抽取的結(jié)果是相互獨(dú)立的,求X的分布列、均值E(X)和方差D(X).性別是否為體育迷合計(jì)非體育迷體育迷男
女
1055合計(jì)
解:(1)由題中頻率分布直方圖可知,在抽取的100人中“體育迷”有(0.020+0.005)×10×100=25(人).由獨(dú)立性檢驗(yàn)的知識(shí)得2×2列聯(lián)表如下:性別是否為體育迷合計(jì)非體育迷體育迷男301545女451055合計(jì)7525100零假設(shè)為H0:“體育迷”與性別無(wú)關(guān).將2×2列聯(lián)表中的數(shù)據(jù)代入公式計(jì)算,根據(jù)小概率值α=0.1的獨(dú)立性檢驗(yàn),有充分證據(jù)推斷H0不成立,即“體育迷”與性別有關(guān),此推斷犯錯(cuò)誤的概率不超過(guò)0.1.(2)由頻率分布直方圖知抽到“體育迷”的頻率為(0.020+0.005)×10=0.25,將頻率視為概率,即從觀眾中抽取1名,此人為“體育迷”的概率為
.X的分布列為
高考體驗(yàn)考點(diǎn)一
線性回歸分析1.(2020·全國(guó)Ⅰ高考)某校一個(gè)課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度x(單位:℃)的關(guān)系,在20個(gè)不同的溫度條件下進(jìn)行種子發(fā)芽實(shí)驗(yàn),由實(shí)驗(yàn)數(shù)據(jù)(xi,yi)(i=1,2,…,20)得到下面的散點(diǎn)圖:由此散點(diǎn)圖,在10℃至40℃之間,下面四個(gè)回歸方程類型中最適宜作為發(fā)芽率y和溫度x的回歸方程類型的是(
)A.y=a+bx
B.y=a+bx2C.y=a+bex
D.y=a+blnx解析:由題中散點(diǎn)圖分布可知,散點(diǎn)圖分布在一個(gè)對(duì)數(shù)函數(shù)的圖象附近,因此,最適合作為發(fā)芽率y和溫度x的回歸方程類型的是y=a+bln
x,故選D.答案:D2.(2020·全國(guó)Ⅱ高考)某沙漠地區(qū)經(jīng)過(guò)治理,生態(tài)系統(tǒng)得到很大改善,野生動(dòng)物數(shù)量有所增加,為調(diào)查該地區(qū)某種野生動(dòng)物的數(shù)量,將其分成面積相近的200個(gè)地塊,從這些地塊中用簡(jiǎn)單隨機(jī)抽樣的方法抽取20個(gè)作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個(gè)樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動(dòng)物的數(shù)量,并計(jì)算得(1)求該地區(qū)這種野生動(dòng)物數(shù)量的估計(jì)值(這種野生動(dòng)物數(shù)量的估計(jì)值等于樣區(qū)這種野生動(dòng)物數(shù)量的平均數(shù)乘以地塊數(shù));(2)求樣本(xi,yi)(i=1,2,…,20)的相關(guān)系數(shù)(精確到0.01);(3)根據(jù)現(xiàn)有統(tǒng)計(jì)資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì),請(qǐng)給出一種你認(rèn)為更合理的抽樣方法.并說(shuō)明理由.(3)分層隨機(jī)抽樣:根據(jù)植物覆蓋面積的大小對(duì)地塊分層,再對(duì)200個(gè)地塊進(jìn)行分層抽樣.理由如下:由(2)知各樣區(qū)的這種野生動(dòng)物數(shù)量與植物覆蓋面積有很強(qiáng)的正相關(guān).由于各地塊間植物覆蓋面積差異很大,從而各地塊間這種野生動(dòng)物數(shù)量差異也很大,采用分層隨機(jī)抽樣的方法較好地保持了樣本結(jié)構(gòu)與總體結(jié)構(gòu)的一致性,提高了樣本的代表性,從而可以獲得該地區(qū)這種野生動(dòng)物數(shù)量更準(zhǔn)確的估計(jì).考點(diǎn)二
獨(dú)立性檢驗(yàn)3.(2022·全國(guó)新高考Ⅰ)一醫(yī)療團(tuán)隊(duì)為研究某地的一種地方性疾病與當(dāng)?shù)鼐用竦男l(wèi)生習(xí)慣(衛(wèi)生習(xí)慣分為良好和不夠良好兩類)的關(guān)系,在已患該疾病的病例中隨機(jī)調(diào)查了100例(稱為病例組),同時(shí)在未患該疾病的人群中隨機(jī)調(diào)查了100人(稱為對(duì)照組),得到如下數(shù)據(jù):小組衛(wèi)生習(xí)慣不夠良好良好病例組4060對(duì)照組1090(1)依據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),能否認(rèn)為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異?(2)從該地的人群中任選一人,A表示事件“選到的人衛(wèi)生習(xí)慣不夠良好”,B表示事件“選到的人患有該疾病”,的比值是衛(wèi)生習(xí)慣不夠良好對(duì)患該疾病風(fēng)險(xiǎn)程度的一項(xiàng)度量指標(biāo),記該指標(biāo)為R.②利用該調(diào)查數(shù)據(jù),給出P(A|B),P(A|)的估計(jì)值,并利用①的結(jié)果給出R的估計(jì)值.α0.0500.0100.001xα3.8416.63510.828解:(1)零假設(shè)為H0:患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣無(wú)差異.由題意可知n=200,根據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),有充分證據(jù)推斷H0不成立,即認(rèn)為患該疾病群體與未患該疾病群體的衛(wèi)生習(xí)慣有差異.4.(2021·全國(guó)Ⅱ高考)甲、乙兩臺(tái)機(jī)床生產(chǎn)同種產(chǎn)品,產(chǎn)品按質(zhì)量分為一級(jí)品和二級(jí)品,為了比較兩臺(tái)機(jī)床產(chǎn)品的質(zhì)量,分別用兩臺(tái)機(jī)床各生產(chǎn)了200件產(chǎn)品,產(chǎn)品的質(zhì)量情況統(tǒng)計(jì)如下表:機(jī)床產(chǎn)品質(zhì)量合計(jì)一級(jí)品二級(jí)品甲機(jī)床15050200乙機(jī)床12080200合計(jì)270130400(1)甲機(jī)床、乙機(jī)床生產(chǎn)的產(chǎn)品中一級(jí)品的頻率分別是多少?(2)依據(jù)小概率值α=0.01的χ2獨(dú)立性檢驗(yàn),能否認(rèn)為甲機(jī)床的產(chǎn)品質(zhì)量與乙機(jī)床的產(chǎn)品質(zhì)量有差異
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 智能硬件CTO實(shí)習(xí)合同
- 房地產(chǎn)貴陽(yáng)售樓處租賃合同
- 2024版商業(yè)采光井建造協(xié)議模板一
- 風(fēng)景區(qū)道路擴(kuò)建工程打路施工合同
- 媒體租賃田地合同
- 交通安全設(shè)施招投標(biāo)廉政合同
- 智能旅游系統(tǒng)工程委托施工合同
- 水上樂(lè)園租賃合同協(xié)議書(shū)
- 2024甲乙雙方食堂商鋪?zhàn)赓U合同
- 正規(guī)聘用合同范本
- 2025年度愛(ài)讀書(shū)學(xué)長(zhǎng)定制化閱讀計(jì)劃合同2篇
- 2025年首都機(jī)場(chǎng)集團(tuán)公司招聘筆試參考題庫(kù)含答案解析
- 保健品購(gòu)銷合同2025年
- 2024版光伏發(fā)電項(xiàng)目承包經(jīng)營(yíng)權(quán)轉(zhuǎn)讓合同范本3篇
- 實(shí)習(xí)終止及解除協(xié)議書(shū)
- 河南省信陽(yáng)市浉河區(qū)9校聯(lián)考2024-2025學(xué)年八年級(jí)上學(xué)期12月月考地理試題(含答案)
- 中國(guó)冠心病康復(fù)循證實(shí)踐指南(2024版)解讀
- 2024-2030年中國(guó)再生水行業(yè)發(fā)展前景預(yù)測(cè)規(guī)劃分析報(bào)告
- GB/T 44823-2024綠色礦山評(píng)價(jià)通則
- GB/T 44679-2024叉車禁用與報(bào)廢技術(shù)規(guī)范
- 初三畢業(yè)班后期管理措施
評(píng)論
0/150
提交評(píng)論