18統(tǒng)計案例剖解_第1頁
18統(tǒng)計案例剖解_第2頁
18統(tǒng)計案例剖解_第3頁
18統(tǒng)計案例剖解_第4頁
18統(tǒng)計案例剖解_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計案例一、一周知識概述統(tǒng)計案例是在概率統(tǒng)計內(nèi)容的基礎(chǔ)上, 通過典型案例進(jìn)一步介紹回歸分析的基本思 想、方法及其初步應(yīng)用; 通過典型案例介紹獨(dú)立性檢驗(yàn)的基本思想、 方法及其初步應(yīng)用, 使同學(xué)們認(rèn)識統(tǒng)計方法在決策中的應(yīng)用回歸分析的部分內(nèi)容在必修3 中已出現(xiàn)過,在此基礎(chǔ)上, 本章通過典型案例 “女大學(xué)生身高和體重的關(guān)系 ”進(jìn)一步討論一元線性回歸模 型,分析產(chǎn)生模型中隨機(jī)誤差項的原因還介紹了一元線性回歸模型的殘差平方和分解 的思想在獨(dú)立性檢驗(yàn)中,如何結(jié)合例題介紹獨(dú)立性檢驗(yàn)的思想是重點(diǎn)內(nèi)容二、重難點(diǎn)知識歸納1回歸分析的基本思想及其初步應(yīng)用(1) 回歸分析:對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的一種常用

2、方法(2) 線性回歸模型與一次函數(shù)的區(qū)別線性回歸模型方程為 y=bx a e,e 稱為隨機(jī)誤差(或?yàn)闅埐钭兞?,在實(shí)際問題 中,線性回歸模型適用的范圍要比一次函數(shù)大得多當(dāng)殘差變量恒等于時,線性回歸 模型就變?yōu)橐淮魏瘮?shù)模型 因此一次函數(shù)模型是線性回歸模型的特殊形式, 線性回歸模 型是一次函數(shù)模型的一般形式(3) 總偏差平方和、殘差平方和、回歸平方和偏差平方和分解公式: 其中 稱為總偏差平方和, 稱為回歸平方和, 稱 為殘差平方和偏差平方和分解公式也可以表示為:總的偏差平方和回歸平方和殘差平方和相關(guān)指數(shù)公式:又可表示為(4) 殘差分析利用殘差圖進(jìn)行殘差分析的具體步驟如下: 計算每組觀測數(shù)據(jù)的殘差

3、,即殘差等于觀測值減預(yù)測 值 畫殘差圖殘差圖的縱坐標(biāo)為殘差,橫坐標(biāo)通常可以是觀測樣本的編號、自變量 x、或因變量的預(yù)測值等,殘差圖是一種散點(diǎn)圖 分析殘差圖 找異常值根據(jù)計算的殘差值和殘差圖,觀察是否存在殘差特別大的點(diǎn),即遠(yuǎn)離 橫坐標(biāo)軸的點(diǎn),如果存在遠(yuǎn)離坐標(biāo)軸的點(diǎn),就要研究它出現(xiàn)的原因,如是否在數(shù)據(jù)收集 和錄入中發(fā)生了錯誤,如果有錯誤,改正后重新建立回歸模型2獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用(1) 分類變量與定量變量分類變量:也稱為屬性變量或定性變量,它們的取值一定是離散的,而且不同的取 值僅表示個體所屬的類別定量變量:定量變量的取值一定是實(shí)數(shù),它們的取值大小有特定的含義,不同取值 之間的運(yùn)算也

4、有特定的含義(2) 列聯(lián)表列聯(lián)表一般為兩個以上分類變量的匯總統(tǒng)計表, 書中僅限于研究兩個分類變量的列 聯(lián)表,并且每個分類變量只取兩個值,這樣的列聯(lián)表稱為22 的列聯(lián)表(3) 應(yīng)用假設(shè)檢驗(yàn)方法解決實(shí)際問題把兩個分類變量獨(dú)立性檢驗(yàn)的基本思想表述為:當(dāng)很大時,就把假設(shè)檢驗(yàn)的基本思想具體化到獨(dú)立性檢驗(yàn)中,就可以通過隨機(jī)變量認(rèn)為所涉及的兩個分類變量有關(guān)系;否則,就認(rèn)為沒有充分的證據(jù)顯示這兩個變量有關(guān) 系三、典型例題剖析 例 1一位母親記錄了兒子 39歲的身高, 數(shù)據(jù)如下表 由此建立的身高與年齡的回歸 模型為 用這個模型預(yù)測這個孩子 10 歲時的身高,則正確的敘述是 ()年齡歲3456789身高 cm94

5、.8104.2108.7117.8124.3130.8139.0A 身高一定是 145.83 cmB 身高在 145.83 cm 以上C身高在 145.83 cm 左右D身高在 145.83 cm 以下解析例 2 若有一組數(shù)據(jù)的總偏差平方和為120,相關(guān)指數(shù)為 0.6,則回歸平方和為(B72D120A60C48解析例 3若一組觀測值( x1,y1)( x2,y2)(xn,yn)之間滿足 yi=bxi+a+ei (i=1,2, ,n若), ei 恒為 0,則 R2 為.解析例 4 某廠為了研究生產(chǎn)率與廢品率之間的關(guān)系,記錄了7 天的數(shù)據(jù),試根據(jù)以下數(shù)據(jù)建立廢品率與生產(chǎn)率的回歸模型生產(chǎn)率個 周11

6、000200030003500400045005000廢品率 /%5.26.56.88.110.210.313解析例 5 在對人們的休閑方式的一次調(diào)查中,共調(diào)查了124 人,其中女性 70 人,男性 54人女性中有 43人主要的休閑方式是看電視,另外 27 人主要的休閑方式是運(yùn)動;男性 中有 21人主要的休閑方式是看電視,另外 33 人主要休閑方式是運(yùn)動(1)根據(jù)以上數(shù)據(jù)建立一個 22 的列聯(lián)表;(2)判斷性別與休閑方式是否有關(guān)系例一 解析:回歸方程得出的并不是其精確身高,而只是其預(yù)報身高一般身高還要 受到隨機(jī)誤差的影響 故并不能確定身高的具體數(shù)據(jù)或范圍,只能根據(jù)回歸模型得到其 大約數(shù)值故選

7、C.例二 解析:根據(jù)公式有 ,則可得殘差平方和 48,又總的偏差平方和回歸平方和殘差平方和,故可得回歸平方和 12048=72故選.例三 解析: ei 恒為 0,則說明殘差變量為 0,那么有殘差平方和為 0,則有1例四解析:用 y 表示廢品率,用 x 表示生產(chǎn)率那么廢品率和生產(chǎn)率的關(guān)系可以用以下的線性回歸模型來表示:,y=bxa e利用最小二乘法公式:那么可算得則線性回歸方程為 例五解析: (1)2 2 的列聯(lián)表為(2) 假設(shè)“休閑方式與性別無關(guān)”,計算因?yàn)?,所以有理由認(rèn)為假設(shè) “休閑方式與性別無關(guān)是” 是不合理的, 即有 97.5%的把握認(rèn)為“休閑方式與性別有關(guān)” 在線測試一、選擇題 1在

8、畫兩個變量的散點(diǎn)圖時,下面哪個敘述是正確的()A 預(yù)報變量在 x 軸上,解釋變量在 y 軸上B解釋變量在 x 軸上,預(yù)報變量在 y 軸上C可以選擇兩個變量中任意一個變量在x 軸上D可以選擇兩個變量中任意一個變量在y 軸上2煉鋼時鋼水的含碳量與冶煉時間有()A確定性關(guān)系B相關(guān)關(guān)系C函數(shù)關(guān)系)分析來分析D無任何關(guān)系3身高與體重有關(guān)系可以用(A殘差B回歸C二維條形圖D獨(dú)立檢驗(yàn)4.在兩個變量 y與 x的回歸模型中,分別選擇了 4個不同的模型,它們的相關(guān)指數(shù)R2如下,其中擬合效果最好的模型是( )A模型 1的相關(guān)指數(shù) R2為 0.98B模型 2的相關(guān)指數(shù) R2為 0.80C模型 3 的相關(guān)指數(shù)R2 為

9、0.50D模型 4 的相關(guān)指數(shù)Ay 平均增加 2.5 個單位Cy 平均減少 2.5 個單位D y 平均減少 2 個單位R2 為 0.25 5設(shè)有一個回歸方程為 y=22.5x,則變量 x 增加一個單位時( )B y 平均增加 2 個單位6已知 x 與 y 之間的一組數(shù)據(jù):x0123y1357則 y 與 x 的線性回歸方程為 y=bx a 必過點(diǎn)( )A2,2)B( 1.5,0)C1,2)D( 1.5,4)7在三維柱形圖中,主對角線上兩個柱形高度的乘積與副對角線上的兩個柱形的高度的乘積相差越大兩個變量有關(guān)系的可能性就( )A越大B越小D以上都不對C無法判斷8下列結(jié)論正確的是()函數(shù)關(guān)系是一種確定

10、性關(guān)系;相關(guān)關(guān)系是一種非確定性關(guān)系;回歸關(guān)系是對具有函數(shù)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的一種方法;回歸分析是對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的一種常用方法ABCD9有下列說法:在殘差圖中,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),說明選用的模型比較合適;相關(guān)指數(shù) R2 來刻畫回歸的效果, R2值越大,說明模型的擬合效果越好;比較兩個模型的擬合效果,可以比較殘差平方和的大小,殘差平方和越小的模型,擬 合效果越好其中錯誤命題的個數(shù)是( )A0B1C2D310在吸煙與患肺病這兩個分類變量的計算中,下列說法正確的是()A若 K 2的觀測值為 k=6.635,我們有 99%的把握認(rèn)為吸煙與患肺病有關(guān)系,那么

11、在10 個吸煙的人中必有 99人患有肺??;B從獨(dú)立性檢驗(yàn)可知有 99%的把握認(rèn)為吸煙與患肺病有關(guān)系時,我們說某人吸煙 那么他有 99%的可能患有肺病;C若從統(tǒng)計量中求出有 95% 的把握認(rèn)為吸煙與患肺病有關(guān)系, 是指有 5% 的可能性使得推判出現(xiàn)錯誤;D以上三種說法都不正確B卷、填空題11有下列關(guān)系:( 1)人的年齡與他(她)擁有的財富之間的關(guān)系;(2)曲線上的點(diǎn)與該點(diǎn)的坐標(biāo)之間的關(guān)系;( 3)蘋果的產(chǎn)量與氣候之間的關(guān)系;( 4)森林中的同一種 樹木,其斷面直徑與高度之間的關(guān)系;( 5)學(xué)生與他(她)的學(xué)號之間的關(guān)系,其中 有相關(guān)關(guān)系的是 12回歸直線方程為 y=0.5x 0.81,則 x=2

12、5時, y的估計值為 13許多因素都會影響貧窮,教育也許是其中之一在研究這兩個因素的關(guān)系時,收集 了美國 50 個州的成年人受過 9 年或更少教育的百分比( x)和收入低于官方規(guī)定的貧困 線的人數(shù)占本州人數(shù)的百分比 (y)的數(shù)據(jù),建立的回歸方程為 y 0.8x4.6斜率的估計 等于 0.8說明 ,成年人受過 9年或更少教育的百分比 (x)和收入低于官方的貧困線的人數(shù)占本州人數(shù)的百分比(y)之間的相關(guān)系數(shù) (填充“大于 0”或 “小于 0”)14若由一個 22 列聯(lián)表中的數(shù)據(jù)計算得 k2=4.013,那么有把握認(rèn)為兩個 變量有關(guān)系答案三、解答題15.一臺機(jī)器使用的時間較長, 但還可以使用, 它按

13、不同的轉(zhuǎn)速生產(chǎn)出來的某機(jī)械零件有 一些會有缺點(diǎn),每小時生產(chǎn)有缺點(diǎn)零件的多少,隨機(jī)器的運(yùn)轉(zhuǎn)的速度而變化,下表為抽 樣試驗(yàn)的結(jié)果:轉(zhuǎn)速 x(轉(zhuǎn) /秒 )1614128每小時生產(chǎn)有缺點(diǎn)的零件數(shù) y (件)119851)變量 y 對 x 能否進(jìn)行相關(guān)性檢驗(yàn);(2)如果 y對 x有線性相關(guān)關(guān)系,求回歸直線方程;(3)若實(shí)際生產(chǎn)中,允許每小時的產(chǎn)品中有缺點(diǎn)的零件最多為10 個,那么機(jī)器的運(yùn)轉(zhuǎn)速度應(yīng)控制在什么范圍內(nèi)?答案16為了研究患慢性氣管炎與吸煙量的關(guān)系, 調(diào)查了 228 人,其中每天的吸煙支數(shù)在 10 支以上的 20支以下的調(diào)查者中,患者人數(shù)有 98 人,非患者人數(shù)有 89 人,每天的吸煙 支數(shù)在 2

14、0支以上的調(diào)查者中,患者人數(shù)有 25人,非患者人數(shù)有 16 人(1) 根據(jù)以上數(shù)據(jù)建立一個 22 的列聯(lián)表;(2) 試問患慢性氣管炎是否與吸煙量相互獨(dú)立?答案第 1 題答案錯誤 !正確答案為B第 2 題答案錯誤 !正確答案為B第 3 題答案錯誤 !正確答案為B第 4 題答案錯誤 !正確答案為A第 5 題答案錯誤 !正確答案為C第 6 題答案錯誤 !正確答案為D第 7 題答案錯誤 !正確答案為A第 8 題答案錯誤 !正確答案為C第 9 題答案錯誤 !正確答案為A第 10 題答案錯誤 !正確答案為C提示:1根據(jù)散點(diǎn)圖的特征可以得出,解釋變量在x軸上,預(yù)報變量在 y 軸上4根據(jù)相關(guān)指數(shù)含義,相關(guān)指數(shù)

15、越高,擬合效果越好5是斜率估計值,因?yàn)槭且粋€負(fù)值,就說明當(dāng) x 每增加一個單位時, y就減少 2.5 個單位y=2x1,6根據(jù)表中數(shù)據(jù)作出的散點(diǎn)圖為一直線,可求得線形回歸方程為 那么此圖象必過點(diǎn)( 1.5,4)11 (1)(3)(4)1211.6913一個地區(qū)受過 9 年或更少教育的百分比每增加 1%,收入低于官方規(guī)定的貧困 線的人數(shù)占本州人數(shù)的百分比將增加0.8%左右,大于 01495%15解: (1)可算得 r 0.995 ,r 接近與 1,所以 y與 x 有線性性相關(guān)關(guān)系(2) 可以把 y 與 x 的關(guān)系用下面的線形回歸模型來表示:y=bxa e根據(jù)最小二乘法,可算得 ,故線形回歸方程為

16、 y=0.7286x 0.8571 (3) 由 0.7286x0.8571 10,可算得 x 14.901316解:( 1)根據(jù)已知數(shù)據(jù)建立 22 的列聯(lián)表如下:2)假設(shè)“患慢性氣管炎與吸煙量無關(guān)”,則又 ,有 40%的把握認(rèn)為患慢性氣管炎與吸煙相互獨(dú)立(或作答:沒有充分證據(jù)認(rèn)為患慢性氣管炎與吸煙有關(guān))高考解析例 1、 (2009 年遼寧文 )某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在( 29.94,30.06)的零件為優(yōu)質(zhì)品從兩個分廠生產(chǎn)的零件中各抽出500 件,量其內(nèi)徑尺寸的結(jié)果如下表:甲廠:分組29.86,29.90 )29.90,29.94)29.94,29.9

17、8)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14)頻數(shù)12638618292614乙廠:分組29.86,29.90 )29.90,29.94)29.94,29.98)29.98,30.02)30.02,30.06)30.06,30.10)30.10,30.14)頻數(shù)2971851597662181)試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質(zhì)品率;(2)由以上統(tǒng)計數(shù)據(jù)填下面 22 列聯(lián)表,并問是否有 99%的把握認(rèn)為 “兩個分廠生 產(chǎn)的零件的質(zhì)量有差異 ”甲廠乙廠合計優(yōu)質(zhì)品非優(yōu)質(zhì)品合計解析:1)甲廠抽查的產(chǎn)品中有 360 件優(yōu)質(zhì)品,從而甲廠生產(chǎn)的零件的優(yōu)

18、質(zhì)品率估計為乙廠抽查的產(chǎn)品中有 320 件優(yōu)質(zhì)品,從而乙廠生產(chǎn)的零件的優(yōu)質(zhì)品率估計為2)甲廠乙廠合計優(yōu)質(zhì)品360320680非優(yōu)質(zhì)品140180320合計5005001000x、y 有觀測數(shù)據(jù)( xi ,yi )( i=1 , 2, , 10), vi)( i=1 ,2,10),得散點(diǎn)圖 2.由這所以有 99%的把握認(rèn)為 “兩個分廠生產(chǎn)的零件的質(zhì)量有差異例 2 、( 2009 年寧夏海南卷)對變量 得散點(diǎn)圖 1:對變量 u,v 有觀測數(shù)據(jù)( ui, 兩個散點(diǎn)圖可以判斷( )A變量 x與y正相關(guān), u與 v正相關(guān)B 變量 x 與 y 正相關(guān), u 與 v 負(fù)相關(guān)C變量 x 與 y 負(fù)相關(guān), u 與 v 正相關(guān)D變量 x 與 y 負(fù)相關(guān), u 與 v 負(fù)相關(guān)答案: C解析:由題圖 1 可知,各點(diǎn)整體呈遞減趨勢, x 與 y 負(fù)相關(guān)由題圖 2 可知,各點(diǎn)整體呈 遞增趨勢, u 與 v 正相關(guān)例 4 、下列有關(guān)線性回歸的說法不正確的是()A變量取值一定時,因變量的取值帶有一定隨機(jī)性的兩個變量之間的關(guān)系叫做相關(guān)關(guān) 系B在平面直角坐標(biāo)系中用描點(diǎn)的方法得到具有相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)的圖形

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論