




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
11.2成對數(shù)據(jù)的統(tǒng)計分析考點1變量間的相關(guān)關(guān)系1.相關(guān)關(guān)系兩個變量有關(guān)系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)
系稱為相關(guān)關(guān)系.溫馨提示
相關(guān)關(guān)系與函數(shù)關(guān)系均是指兩個變量的關(guān)系,但函數(shù)關(guān)系是一種確定的關(guān)
系,相關(guān)關(guān)系是一種非確定的關(guān)系.2.散點圖將各數(shù)據(jù)在平面直角坐標系中的對應點畫出來,得到表示兩個變量的一組數(shù)據(jù)的圖形,
這樣的圖形叫做散點圖.利用散點圖,可以判斷兩個變量是否相關(guān),相關(guān)時是正相關(guān)還是
負相關(guān).3.正相關(guān)和負相關(guān)(1)正相關(guān):從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現(xiàn)增加的趨
勢,我們就稱這兩個變量正相關(guān).(2)負相關(guān):從整體上看,當一個變量的值增加時,另一個變量的相應值呈現(xiàn)減少的趨勢,
則稱這兩個變量負相關(guān).4.線性相關(guān)和非線性相關(guān)(1)一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負相關(guān),而且散點落在一條直線附近,我
們就稱這兩個變量線性相關(guān).(2)一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線
性相關(guān)或曲線相關(guān).5.樣本相關(guān)系數(shù)(1)r=
=
,稱r為變量x和變量y的樣本相關(guān)系數(shù).(2)樣本相關(guān)系數(shù)r是一個描述成對樣本數(shù)據(jù)的數(shù)字特征,它的正負性和絕對值的大小可
以反映成對樣本數(shù)據(jù)的變化特征:①當r>0時,稱成對樣本數(shù)據(jù)正相關(guān);②當r<0時,稱成對樣本數(shù)據(jù)負相關(guān).(3)樣本相關(guān)系數(shù)r的取值范圍為[-1,1],樣本相關(guān)系數(shù)r的絕對值大小可以反映成對數(shù)據(jù)
之間線性相關(guān)的程度:①當|r|越接近1時,成對數(shù)據(jù)的線性相關(guān)程度越強;②當|r|越接近0時,成對數(shù)據(jù)的線性相關(guān)程度越弱.6.一元線性回歸模型(1)經(jīng)驗回歸方程我們將
=
x+
稱為Y關(guān)于x的經(jīng)驗回歸方程,其中
提醒
1.根據(jù)經(jīng)驗回歸方程進行預測,得到的僅是一個估計值,而不一定是真實發(fā)生的
值.2.經(jīng)驗回歸直線一定過樣本點的中心,即必過點(
,
).(2)判斷模型擬合效果的方式①利用殘差平方和:
(yi-
)2,殘差平方和越小,擬合效果越好.②利用殘差圖:若殘差比較均勻地分布在以取值為0的橫軸為對稱軸的水平帶狀區(qū)域
內(nèi),該區(qū)域越窄,說明擬合效果越好.(殘差:觀測值減去預測值)③利用決定系數(shù)R2:R2=1-
,R2越大,擬合效果越好.考點2獨立性檢驗1.2×2列聯(lián)表假設兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其2×2列聯(lián)表為XY合計y1y2x1aba+bx2cdc+d合計a+cb+da+b+c+d2×2列聯(lián)表給出了成對分類變量數(shù)據(jù)的交叉分類頻數(shù).可構(gòu)造一個隨機變量χ2=
,其中n=a+b+c+d為樣本容量.2.獨立性檢驗利用χ2的取值推斷分類變量X和Y是否獨立的方法稱為χ2獨立性檢驗,讀作“卡方獨立
性檢驗”,簡稱獨立性檢驗.即練即清1.判斷正誤.(對的打“√”,錯的打“?”)(1)散點圖是判斷兩個變量相關(guān)關(guān)系的一種重要方法和手段.
(
)(2)殘差平方和越大,模型的擬合效果越好.
(
)(3)經(jīng)驗回歸直線
=
x+
至少經(jīng)過點(x1,y1),(x2,y2),…,(xn,yn)中的一個點.
(
)(4)若分類變量X,Y關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的χ2的觀測值越小.
(
)√×××2.某食品研究部門為了解一種酒品的儲藏年份與芳香度之間的相關(guān)關(guān)系,在市場上收
集到了一部分不同儲藏年份的該酒品,并測定了其芳香度(如表).儲藏年份x014568芳香度y1.31.85.6
7.49.3由最小二乘法得到經(jīng)驗回歸方程
=1.03x+1.13,但不小心在檢測后滴到表格上一滴檢測液,污損了一個數(shù)據(jù),則推斷該數(shù)據(jù)為
.6.1題型一變量間的相關(guān)關(guān)系及回歸方程典例1
(2025屆河南省實驗中學開學考,17)為實施鄉(xiāng)村振興,科技興農(nóng),某村建起了田
園綜合體,并從省城請來專家進行技術(shù)指導.根據(jù)統(tǒng)計,該田園綜合體西紅柿畝產(chǎn)量的增
加量y(千克)與某種液體肥料每畝使用量x(千克)之間的對應數(shù)據(jù)如下.x/千克24568y/千克300400400400500(1)由上表數(shù)據(jù)可知,可用線性回歸模型擬合y與x的關(guān)系,請計算相關(guān)系數(shù)r并加以說明
(若|r|>0.75,則線性相關(guān)程度很高,可用線性回歸模型擬合);(2)求y關(guān)于x的經(jīng)驗回歸方程,并預測當液體肥料每畝使用量為20千克時,西紅柿畝產(chǎn)量
的增加量約為多少千克.附:對于一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸直線的斜率和截距的最小二乘估計公式,
相關(guān)系數(shù)r的公式分別為
=
,
=
-
,r=
.參考數(shù)據(jù):
≈3.16.解析
(1)由已知數(shù)據(jù)可得
=
=5,
=
=400,
(xi-
)(yi-
)=600,
(xi-
)2=20,
(yi-
)2=20000,∴相關(guān)系數(shù)r=
=
≈0.95.∵|r|>0.75,∴可用線性回歸模型擬合y與x的關(guān)系.(2)由(1)知
=
=
=30,∴
=400-30×5=250,∴經(jīng)驗回歸方程為
=30x+250,當x=20時,
=30×20+250=850,即當液體肥料每畝使用量為20千克時,西紅柿畝產(chǎn)量的增加量約為850千克.方法總結(jié)
求經(jīng)驗回歸方程的步驟1.計算出
、
、
+
+…+
、x1y1+x2y2+…+xnyn;2.計算
、
;3.寫出經(jīng)驗回歸方程
=
x+
.變式訓練1-1
(關(guān)鍵元素變式)某工廠生產(chǎn)一種產(chǎn)品測得數(shù)據(jù)如下:尺寸x/mm384858687888質(zhì)量y/g16.818.820.722.42425.5(1)若按照檢測標準,合格產(chǎn)品的質(zhì)量y(g)與尺寸x(mm)之間近似滿足關(guān)系式y(tǒng)=c·xd(c,d為
大于0的常數(shù)),求y關(guān)于x的經(jīng)驗回歸方程;(2)已知產(chǎn)品的收益z(單位:千元)與產(chǎn)品尺寸和質(zhì)量的關(guān)系為z=2y-0.32x,根據(jù)(1)中經(jīng)驗
回歸方程分析,當產(chǎn)品的尺寸x約為何值時(結(jié)果用整數(shù)表示),收益z的預報值最大?附:①參考數(shù)據(jù):
(lnxi·lnyi)≈75.3,
lnxi≈24.6,
lnyi≈18.3,
(lnxi)2≈101.4.②參考公式:對于樣本數(shù)據(jù)(vi,ui)(i=1,2,…,n),其經(jīng)驗回歸直線
=
v+
的斜率和截距的最小二乘估計公式分別為
=
=
,
=
-
,e≈2.7182.解析
(1)第一步:兩邊取自然對數(shù),將非線性關(guān)系轉(zhuǎn)化為線性關(guān)系.對y=c·xd(c,d>0)兩邊取自然對數(shù)得lny=lnc+dlnx.令vi=lnxi,ui=lnyi,則
=
v+
,其中
=lnc.第二步:利用公式求出經(jīng)驗回歸方程.根據(jù)所給統(tǒng)計量及最小二乘估計公式得
=
=
≈
=
=
,
=
-
=
-
·
≈
-
×
=1,又
=lnc=1,所以c=e,所以y關(guān)于x的經(jīng)驗回歸方程為
=e·
.(2)由(1)得y=e·
,(2)由(1)得y=e·
,所以z=2e
-0.32x=-0.32(
)2+2e
.令t=
,則當t=
時,z取得最大值,此時x=t2≈72,所以當產(chǎn)品的尺寸x約為72mm時,收益z的預報值最大.歸納總結(jié)
求非線性回歸模型的步驟
題型二獨立性檢驗典例2
(2025屆海南海口摸底,17)制訂適合自己的學習計劃并在學習過程中根據(jù)自己
的實際情況有效地安排和調(diào)整學習方法是一種有效的學習策略.某教師為研究學生制
訂學習計劃并堅持實施和數(shù)學成績之間的關(guān)系,得到如下數(shù)據(jù):
成績>120分成績≤120合計制訂學習計劃并堅持實施14620沒有制訂學習計劃22830合計163450(1)依據(jù)小概率值α=0.001的獨立性檢驗,能否認為制訂學習計劃并堅持實施和數(shù)學成績
高于120分有關(guān)聯(lián)?(2)若該校高三年級每月進行一次月考,該校學生小明在高三開學初認真制訂了學習計
劃,其中一項要求自己每天要把錯題至少重做一遍,做對為止,以下為小明堅持實施計劃
的月份和他在學校數(shù)學月考成績的校內(nèi)名次數(shù)據(jù):月考時間11月初12月初次年1月初次年2月初次年3月初時間代碼x12345月考校內(nèi)名次y881857729569475參考數(shù)據(jù):
xiyi=9433,
=702.2.(i)求月考校內(nèi)名次y與時間代碼x的經(jīng)驗回歸方程
=
x+
;(ii)該校教師給出了上一年該校學生高考(6月初考試)數(shù)學成績在校內(nèi)的名次和在全省
名次的部分數(shù)據(jù):校內(nèi)名次w5100200300全省名次u202576662780利用數(shù)據(jù)分析軟件,根據(jù)以上數(shù)據(jù)得出了兩個回歸模型和決定系數(shù)R2:模型①模型②
=9.5
-449
=28
R2=0.7927R2≈0.9973在以上兩個模型中選擇“較好”模型(說明理由),并結(jié)合問題(i)的回歸方程,依據(jù)“較
好”模型預測小明如果能堅持實施學習計劃,他在次年高考中數(shù)學成績的全省名次(名
次均保留整數(shù)).(參考數(shù)據(jù):e2.272≈9.7,e2.432≈11.4,e0.672≈2.0)附:(1)χ2=
,其中n=a+b+c+d.α0.050.010.0050.001xα3.8416.6357.87910.828(2)對于一組數(shù)據(jù)(xi,yi)(i=1,2,3,…,n),其經(jīng)驗回歸直線
=
x+
的斜率和截距的最小二乘估計公式分別為
=
=
,
=
-
.解析
(1)零假設為H0:制訂學習計劃并堅持實施和數(shù)學成績高于120分沒有關(guān)聯(lián).由題中數(shù)據(jù)得χ2=
=
≈22.120>10.828=x0.001,依據(jù)小概率值α=0.001的獨立性檢驗,我們推斷H0不成立,即制訂學習計劃并堅持實施和
數(shù)學成績高于120分有關(guān)聯(lián).(2)(i)由題知:
=
×(1+2+3+4+5)=3,
=12+22+32+42+52=55,所以
=
=
=-110,
=
-
=702.2-(-110)×3=1032.2,所以月考校內(nèi)名次y與時間代碼x的經(jīng)驗回歸方程為
=-110x+1032.2.(ii)模型②為“較好”模型,因為模型②的決定系數(shù)大于模型①的決定系數(shù).高考對應的時間代碼為8,預測小明高考數(shù)學成績的校內(nèi)名次為
=-110×8+1032.2=152.2≈152,全省名次為
=28e0.016×152=28e2.432=28×11.4=319.2≈319.所以預測小明高考數(shù)學成績的全省名次為319名.歸納總結(jié)
應用獨立性檢驗解決實際問題的基本步驟1.提出零假設H0:X和Y相互獨立,并給出在問題中的解釋;2.根據(jù)抽樣數(shù)據(jù)整理出2×2列聯(lián)表,計算χ2的值;3.查表確定臨界值xα;α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.8284.得出推斷結(jié)論.當χ2≥xα時,我們就推斷H0不成立,即認為X和Y不獨立,該推斷犯錯誤的概率不超過α;當χ2<xα時,我們沒有充分證據(jù)推斷H0不成立,可以認為X和Y獨立.變式訓練2-1
(設問條件
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 弟子出師考試題及答案
- 東莞醫(yī)院面試題及答案
- 福州美工面試題及答案
- 小兒面部皮疹的臨床護理
- 農(nóng)村載人車輛安全協(xié)議書
- 常州鍋爐拆除回收協(xié)議書
- 抵押貸款解除合同范本
- 關(guān)于樓上漏水維修協(xié)議書
- T/CADBM 30-2020步入式浴缸
- 劇本殺店股份合同范本
- DB22∕T 3181-2020 公路水路行業(yè)安全生產(chǎn)風險分級管控和隱患排查治理雙重預防機制建設通用規(guī)范
- GB/T 36713-2018能源管理體系能源基準和能源績效參數(shù)
- GB/T 25068.1-2020信息技術(shù)安全技術(shù)網(wǎng)絡安全第1部分:綜述和概念
- “二級甲等婦幼保健院”評審匯報材料
- 《狼王夢》讀書分享PPT
- 三年級美術(shù)下冊第10課《快樂的節(jié)日》優(yōu)秀課件1人教版
- 電力市場交易模式
- 第四課《單色版畫》 課件
- 門診手術(shù)麻醉原則課件
- 自動噴水滅火系統(tǒng)質(zhì)量驗收項目缺陷判定記錄
- 提高腸鏡患者腸道準備合格率課件
評論
0/150
提交評論