統(tǒng)計(jì)案例 全國(guó)一等獎(jiǎng)-完整版獲獎(jiǎng)?wù)n件_第1頁(yè)
統(tǒng)計(jì)案例 全國(guó)一等獎(jiǎng)-完整版獲獎(jiǎng)?wù)n件_第2頁(yè)
統(tǒng)計(jì)案例 全國(guó)一等獎(jiǎng)-完整版獲獎(jiǎng)?wù)n件_第3頁(yè)
統(tǒng)計(jì)案例 全國(guó)一等獎(jiǎng)-完整版獲獎(jiǎng)?wù)n件_第4頁(yè)
統(tǒng)計(jì)案例 全國(guó)一等獎(jiǎng)-完整版獲獎(jiǎng)?wù)n件_第5頁(yè)
已閱讀5頁(yè),還剩68頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 三 章 統(tǒng)計(jì)案例章 末 高 效 整 合知能整合提升1兩個(gè)基本思想(1)回歸分析的基本思想回歸分析包括線性回歸分析和非線性回歸分析兩種,而非線性回歸分析往往可以通過(guò)變量代換轉(zhuǎn)化為線性回歸分析,因此,回歸分析的思想主要是指線性回歸分析的思想注意理解以下幾點(diǎn):確定線性相關(guān)關(guān)系線性相關(guān)關(guān)系有兩層含義:一是具有相關(guān)關(guān)系,如廣告費(fèi)用與銷售量的關(guān)系等在一定條件下具有相關(guān)關(guān)系,而氣球的體積與半徑的關(guān)系是函數(shù)關(guān)系,而不是相關(guān)關(guān)系;二是具有線性相關(guān)關(guān)系判斷是否線性相關(guān)的依據(jù)是觀察樣本點(diǎn)的散點(diǎn)圖;引起預(yù)報(bào)誤差的因素對(duì)于線性回歸模型ybxae,引起預(yù)報(bào)變量y的誤差的因素有兩個(gè):一個(gè)是解釋變量x,另一個(gè)是隨機(jī)誤差e

2、;回歸方程的預(yù)報(bào)精度判斷回歸方程的預(yù)報(bào)精度是通過(guò)計(jì)算殘差平方和來(lái)進(jìn)行的,殘差平方和越小,方程的預(yù)報(bào)精度越高簡(jiǎn)單來(lái)說(shuō),線性回歸分析就是通過(guò)建立回歸直線方程對(duì)變量進(jìn)行預(yù)報(bào),用回歸方程預(yù)報(bào)時(shí),需對(duì)函數(shù)值明確理解,它表示當(dāng)x取值時(shí),真實(shí)值在函數(shù)值附近或平均值在函數(shù)值附近,不能認(rèn)為就是真實(shí)值;回歸模型的擬合效果判斷回歸模型的擬合效果的過(guò)程也叫殘差分析,殘差分析的方法有兩種,一是通過(guò)殘差圖直觀判斷,二是通過(guò)計(jì)算相關(guān)指數(shù)R2的大小判斷(2)獨(dú)立性檢驗(yàn)的基本思想獨(dú)立性檢驗(yàn)的基本思想類似于反證法要確認(rèn)兩個(gè)分類變量有關(guān)系的可信程度,先假設(shè)兩個(gè)分類變量沒(méi)有關(guān)系,再計(jì)算隨機(jī)變量K2的觀測(cè)值,最后由K2的觀測(cè)值很大在一

3、定程度上說(shuō)明兩個(gè)分類變量有關(guān)系進(jìn)行獨(dú)立性檢驗(yàn)要注意理解以下三個(gè)問(wèn)題:獨(dú)立性檢驗(yàn)適用于兩個(gè)分類變量;兩個(gè)分類變量是否有關(guān)系的直觀判斷:一是根據(jù)22列聯(lián)表計(jì)算|adbc|,值越大關(guān)系越強(qiáng);二是觀察等高條形圖,兩個(gè)深色條的高度相差越大關(guān)系越強(qiáng)獨(dú)立性檢驗(yàn)是對(duì)兩個(gè)分類變量有關(guān)系的可信程度的判斷,而不是對(duì)其是否有關(guān)系的判斷獨(dú)立性檢驗(yàn)的結(jié)論只能是有多大的把握確認(rèn)兩個(gè)分類變量有關(guān)系,而不能是兩個(gè)分類變量一定有關(guān)系或沒(méi)有關(guān)系2兩個(gè)重要參數(shù)(1)相關(guān)指數(shù)R2相關(guān)指數(shù)R2是用來(lái)刻畫回歸模型的回歸效果的,其值越接近1,殘差平方和越小,模型的擬合效果越好(2)隨機(jī)變量K2隨機(jī)變量K2是用來(lái)判斷兩個(gè)分類變量在多大程度上相

4、關(guān)的變量獨(dú)立性檢驗(yàn)即計(jì)算K2的觀測(cè)值,并與教材中所給表格中的數(shù)值進(jìn)行比較,從而得到兩個(gè)分類變量在多大程度上相關(guān)3兩種重要圖形(1)散點(diǎn)圖散點(diǎn)圖是進(jìn)行線性回歸分析的主要手段,其作用如下:一是判斷兩個(gè)變量是否具有線性相關(guān)關(guān)系,如果樣本點(diǎn)呈條狀分布,則可以斷定兩個(gè)變量有較好的線性相關(guān)關(guān)系;二是判斷樣本中是否存在異常(2)殘差圖殘差圖可以用來(lái)判斷模型的擬合效果,其作用如下:一是判斷模型的精度,殘差點(diǎn)所分布的帶狀區(qū)域越窄,說(shuō)明模型的擬合精度越高,回歸方程的預(yù)報(bào)精度越高;二是確認(rèn)樣本點(diǎn)在采集中是否有人為的錯(cuò)誤熱點(diǎn)考點(diǎn)例析線性回歸分析的應(yīng)用點(diǎn)撥:回歸分析的基本步驟為:(1)確定研究對(duì)象,明確哪個(gè)變量是解釋變

5、量,哪個(gè)變量是預(yù)報(bào)變量;(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系;(3)由經(jīng)驗(yàn)確定回歸方程的類型;(4)按一定規(guī)則估計(jì)回歸方程中的參數(shù);(5)得檢查回歸模型的擬合程度,如分析殘差圖、求相關(guān)指數(shù)R2等一個(gè)車間為了規(guī)定工時(shí)定額,需確定加工零件所花費(fèi)的時(shí)間,為此進(jìn)行了10次試驗(yàn),測(cè)得的數(shù)據(jù)如下表:零件數(shù)x(個(gè))102030405060708090100加工時(shí)間y(min)627275818595103108112127(1)畫出散點(diǎn)圖,并初步判斷是否線性相關(guān);(2)若線性相關(guān),求回歸直線方程;(3)求出相關(guān)指數(shù);(4)作出殘差圖;(5)進(jìn)行殘差分析;(6)試制訂加工200個(gè)零

6、件的用時(shí)規(guī)定 思維點(diǎn)擊明確各相關(guān)概念求出回歸直線方程是解題關(guān)鍵注意正確使用公式和準(zhǔn)確計(jì)算(1)散點(diǎn)圖如圖所示由圖可知,x,y線性相關(guān)將數(shù)據(jù)代入相應(yīng)公式可得數(shù)據(jù)表: (3)利用所求回歸方程求出下列數(shù)據(jù):1為了研究3月下旬的平均氣溫(x)與4月20日前棉花害蟲(chóng)化蛹高峰日(y)的關(guān)系,某地區(qū)觀察了2007年至2011年的情況得到下面數(shù)據(jù):年份200620072008200920102011x(C)24.429.632.728.730.328.9y(天)19611018點(diǎn)撥:非線性回歸問(wèn)題的處理技巧一般地,有些非線性回歸模型通過(guò)變換可以轉(zhuǎn)化為線性回歸模型,即借助于線性回歸模型研究呈非線性回歸關(guān)系的兩個(gè)

7、變量之間的關(guān)系(1)如果散點(diǎn)圖中的點(diǎn)分布在一個(gè)直線狀帶形區(qū)域,可以選用線性回歸模型來(lái)建模;(2)如果散點(diǎn)圖中的點(diǎn)的分布在一個(gè)曲線狀帶形區(qū)域,要先對(duì)變量作適當(dāng)?shù)淖儞Q,再利用線性回歸模型來(lái)建模非線性回歸問(wèn)題xi0.050.060.250.310.070.10yi0.100.141.001.120.230.37xi0.380.430.140.200.47yi1.191.250.590.791.29ui20.00016.6674.0003.22614.28610.000vi2.3031.96600.1131.4700.994ui2.6322.3267.1435.0002.128vi0.1740.223

8、0.5280.2360.2552電容器充電后,電壓達(dá)到100 V,然后開(kāi)始放電,由經(jīng)驗(yàn)知道,此后電壓U隨時(shí)間t變化的規(guī)律公式UAebt(b0)表示,觀測(cè)得時(shí)間t(s)時(shí)的電壓U(V)如下表所示:試求電壓U對(duì)時(shí)間t的回歸方程t012345678910U100755540302015101055解析:對(duì)UAebt兩邊取自然對(duì)數(shù)得ln Uln Abt,令yln U,aln A,即ybta,由所給數(shù)據(jù)可得t012345678910ln U(y)4.64.34.03.73.43.02.72.32.31.61.6其散點(diǎn)圖為:點(diǎn)撥:1.獨(dú)立性檢驗(yàn)的一般步驟:(1)提出假設(shè)H0:和沒(méi)有關(guān)系;(2)根據(jù)22列聯(lián)

9、表計(jì)算K2的觀測(cè)值;(3)根據(jù)K2的觀測(cè)值與臨界值的大小關(guān)系作統(tǒng)計(jì)推斷獨(dú)立性檢驗(yàn)2可以用反證法的原理來(lái)解釋獨(dú)立性檢驗(yàn)原理.反證法原理獨(dú)立性檢驗(yàn)原理在一個(gè)已知假設(shè)下,如果推出一個(gè)矛盾,就證明了這個(gè)假設(shè)不成立在一個(gè)已知假設(shè)下,如果出現(xiàn)一個(gè)與該假設(shè)矛盾的小概率事件發(fā)生,就推斷這個(gè)假設(shè)不成立,且該推斷犯錯(cuò)誤的概率不超過(guò)這個(gè)小概率從上述對(duì)比中可以看出,假設(shè)檢驗(yàn)的原理和反證法原理類似不同之處:一是獨(dú)立性檢驗(yàn)中用有利于H0的小概率事件的發(fā)生代替了反證法中的矛盾;二是獨(dú)立性檢驗(yàn)中接受原假設(shè)的結(jié)論相當(dāng)于反證法中沒(méi)有找到矛盾把獨(dú)立性檢驗(yàn)的基本思想具體化到獨(dú)立性檢驗(yàn)中,就可以通過(guò)隨機(jī)變量K2的值的大小來(lái)研究?jī)蓚€(gè)分類

10、變量是否有相關(guān)關(guān)系調(diào)查某醫(yī)院某段時(shí)間內(nèi)嬰兒出生的時(shí)間與性別的關(guān)系,得到下面的數(shù)據(jù)表,試問(wèn)嬰兒的性別與出生的時(shí)間是否有關(guān)系?出生時(shí)間性別晚上白天總計(jì)男嬰153146女嬰82634總計(jì)235780思維點(diǎn)擊根據(jù)列聯(lián)表,將相應(yīng)數(shù)據(jù)代入公式求K2.3為了探究患慢性氣管炎是否與吸煙有關(guān),調(diào)查了339名50歲以上的人,調(diào)查如下表所示:試問(wèn):50歲以上的人患慢性氣管炎與吸煙習(xí)慣是否有關(guān)系?患慢性氣管炎未患慢性氣管炎合計(jì)吸煙43162205不吸煙13121134合計(jì)56283339解析:5是斜率的估計(jì)值,說(shuō)明x每增加一個(gè)單位,y平均減少5個(gè)單位答案:B4若由一個(gè)22列聯(lián)表中的數(shù)據(jù)計(jì)算得K26.630,則判斷“這

11、兩個(gè)分類變量有關(guān)系”時(shí),犯錯(cuò)誤的最大概率是()A0.025B0.01C0.005D0.001解析:P(K25.024)0.025,又K26.6305.024,犯錯(cuò)誤的最大概率為0.025.答案:A5若由一個(gè)22列聯(lián)表中的數(shù)據(jù)計(jì)算得K24.073,那么在犯錯(cuò)誤的概率不超過(guò)_的前提下認(rèn)為兩變量有關(guān)系,已知P(K23.841)0.05,P(K25.024)0.025.解析:查表可知K2的觀測(cè)值k4.0733.841,因此在犯錯(cuò)誤的概率不超過(guò)5%的前提下認(rèn)為兩變量有關(guān)系答案:5%7某產(chǎn)品的廣告費(fèi)支出x與銷售額y(單位:百萬(wàn)元)之間有如下對(duì)應(yīng)數(shù)據(jù):請(qǐng)畫出散點(diǎn)圖并用散點(diǎn)圖粗略地判斷x,y是否線性相關(guān)x24

12、568y3040605070解析:散點(diǎn)圖如圖從散點(diǎn)圖可以看出散點(diǎn)呈條狀分布,所以x,y具有較強(qiáng)的線性相關(guān)關(guān)系8某研究者欲考察某一高考試題的得分情況是否與性別有關(guān)系,統(tǒng)計(jì)結(jié)果如下:及格的人中男生有290人,女生有100人;不及格的人中男生有160人,女生有350人試根據(jù)這些數(shù)據(jù)判斷這一高考試題的得分情況與性別是否有關(guān)系解析:根據(jù)題中數(shù)據(jù)得如下列聯(lián)表:及格不及格總計(jì)男生290160450女生100350450總計(jì)390510900其中一定不正確的結(jié)論的序號(hào)是()ABCD解析:中y與x負(fù)相關(guān)而斜率為正,不正確;中y與x正相關(guān)而斜率為負(fù),不正確答案:D3(2014全國(guó)卷)某地區(qū)2007年至2013年農(nóng)

13、村居民家庭人均純收入y(單位:千元)的數(shù)據(jù)如下表:(1)求y關(guān)于t的線性回歸方程;(2)利用(1)中的回歸方程,分析2007年至2013年該地區(qū)農(nóng)村居民家庭人均純收入的變化情況,并預(yù)測(cè)該地區(qū)2015年農(nóng)村居民家庭人均純收入年份2007200820092010201120122013年份代號(hào)t1234567人均純收入y2.93.33.64.44.85.25.94(2014安徽卷)某高校共有學(xué)生15 000人,其中男生10 500人,女生4 500人,為調(diào)查該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的情況,采用分層抽樣的方法,收集300位學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的樣本數(shù)據(jù)(單位:小時(shí))(1)應(yīng)收集多少位女生的樣本數(shù)據(jù)?(2)根據(jù)這300個(gè)樣本數(shù)據(jù),得到學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的頻率分布直方圖(如圖所示),其中樣本數(shù)據(jù)的分組區(qū)間為:0,2,(2,4,(4,6,(6,8,(8,10,(10,12,估計(jì)該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí)的概率;(3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí),請(qǐng)完成每周平均體育運(yùn)動(dòng)時(shí)間與性別列聯(lián)表,并判斷是否有95%的把握認(rèn)為“該校學(xué)生的每周平均體育運(yùn)動(dòng)時(shí)間與性別有關(guān)”.P(K2k0)0.100.050.0100.005k02.7

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論