版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1.1回歸分析的基本思想及其初步應(yīng)用eq\x(基)eq\x(礎(chǔ))eq\x(梳)eq\x(理)1.相關(guān)關(guān)系是一種非確定性關(guān)系,回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法,函數(shù)關(guān)系是一種確定性關(guān)系.2.在線性回歸模型y=bx+a+e中,最小二乘法估計eq\o(a,\s\up6(^))和eq\o(b,\s\up6(^))就是未知參數(shù)a和b的最好估計,其計算公式如下:eq\o(b,\s\up6(^))=,eq\o(a,\s\up6(^))=,其中,eq\o(x,\s\up6(-))=eq\f(1,n)eq\i\su(i=1,n,x)i,eq\o(y,\s\up6(-))=eq\f(1,n)eq\i\su(i=1,n,y)i.另外,稱為樣本點的中心,回歸直線一定過樣本點中心.3.衡量模型擬合效果.(1)殘差:對于樣本點(x1,y1),(x2,y2),…,(xn,yn)而言,它們的隨機誤差為ei=y(tǒng)i-bxi-a,i=1,2,3,…,n,其估計值為eq\o(e,\s\up6(^))i=y(tǒng)i-eq\o(y,\s\up6(^))i=y(tǒng)i-eq\o(b,\s\up6(^))xi-eq\o(a,\s\up6(^)),i=1,2,…,n,eq\o(e,\s\up6(^))i稱為相應(yīng)于點(xi,yi)的殘差.(2)殘差圖:我們可以利用圖形來分析殘差特性,作圖時縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號、身高數(shù)據(jù)或體重估計值等,這樣作出的圖形稱為殘差圖.殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適.這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高.(3)殘差分析:可以通過殘差發(fā)現(xiàn)原始數(shù)據(jù)中的可疑數(shù)據(jù),判斷所建立模型的擬合效果.(4)相關(guān)指數(shù):計算公式是R2=.其中殘差平方和為總偏差平方和為R2的值越大說明殘差平方和越小,也就是說模型的擬合效果越好,R2的值表示解釋變量對預(yù)報變量變化的貢獻率,R2的值越接近于1,表示回歸的效果越好.,eq\x(基)eq\x(礎(chǔ))eq\x(自)eq\x(測)1.下列結(jié)論正確的是(C)①函數(shù)關(guān)系是一種確定性關(guān)系;②相關(guān)關(guān)系是一種非確定性關(guān)系;③回歸分析是對具有函數(shù)關(guān)系的兩個變量進行統(tǒng)計分析的一種方法;④回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法.A.①②B.①②③C.①②④D.①②③④解析:根據(jù)函數(shù)關(guān)系、相關(guān)關(guān)系、回歸分析的概念可知選C.2.下列有關(guān)回歸直線方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的敘述:①反映eq\o(y,\s\up6(^))與x之間的函數(shù)關(guān)系;②反映y與x之間的函數(shù)關(guān)系;③表示eq\o(y,\s\up6(^))與x之間不確定關(guān)系;④表示最接近y與x之間真實關(guān)系的一條直線.其中正確的是(D)A.①②B.②③C.③④D.①④解析:eq\o(y,\s\up6(^))=bx+eq\o(a,\s\up6(^))表示eq\o(y,\s\up6(^))與x之間的函數(shù)關(guān)系,而不是y與x之間的函數(shù)關(guān)系,但它反映的關(guān)系最接近y與x之間的真實關(guān)系.故選D.3.已知回歸方程eq\o(y,\s\up6(^))=2x+1,而試驗得到一組數(shù)據(jù)是(2,,(3,,(4,,則殘差平方和是(C)A.B.C.D.解析:-5)2+-7)2+-9)2=.故選C.4.有下列數(shù)據(jù):x123y3下列四個函數(shù)中,模擬效果最好的為(A)A.y=3×2x-1B.y=log2xC.y=3xD.y=x2解析:當(dāng)x=1,2,3時,分別代入求y值,離y最近的值模擬效果最好,知A模擬效果最好.故選A.eq\a\vs4\al((一)重點)通過實際操作進一步理解建立兩相關(guān)變量的線性回歸模型的思想,求線性回歸方程,判斷回歸模型擬合的好壞.eq\a\vs4\al((二)難點)殘差變量的解釋與分析及指標(biāo)R2的理解.eq\a\vs4\al((三)知識結(jié)構(gòu)圖)eq\a\vs4\al((四)思維總結(jié))(1)求回歸直線方程的一般方法.①作出散點圖,將問題所給的數(shù)據(jù)在平面直角坐標(biāo)系中描點,這樣表示出的具有相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)的圖形就是散點圖,從散點圖中我們可以看出樣本點是否呈條狀分布,從而判斷兩個變量是否線性相關(guān).②求回歸系數(shù)eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)),其中稱為殘差平方和,殘差平方和在一定程度上反映了所選回歸模型的擬合效果.殘差平方和越小,說明模型的擬合效果越好;殘差平方和越大,說明擬合效果越差.③通過殘差分析判斷模型擬合效果:先計算出殘差eq\o(e,\s\up6(^))i=y(tǒng)i-eq\o(y,\s\up6(^))i=y(tǒng)i-eq\o(b,\s\up6(^))xi-eq\o(a,\s\up6(^)),i=1,2,…,n,然后橫坐標(biāo)選取為樣本編號、解釋變量或預(yù)報變量,縱坐標(biāo)為殘差,作出殘差圖.通過圖形分析,如果樣本點的殘差較大,就要分析樣本數(shù)據(jù)的采集是否有錯誤;另一方面,可以通過殘差點分布的水平帶狀區(qū)域的寬窄說明模型擬合效果,反映回歸方程的預(yù)報精度.帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高,回歸方程的預(yù)報精度越高.(3)相關(guān)指數(shù)R2.①相關(guān)指數(shù)的計算公式是R2=其中為殘差平方和.相關(guān)指數(shù)用來刻畫回歸模型擬合的效果,R2的值越大,說明模型的擬合效果越好;R2的值越小,說明擬合效果越差.②如果某組樣本數(shù)據(jù)可以采取幾種不同的回歸模型進行回歸分析,則可以通過比較R2的值來作出選擇,即選擇R2值大的模型作為這組數(shù)據(jù)的回歸模型.③在線性回歸模型中R2是刻畫回歸效果的量,即表示回歸模型的擬合效果,也表示解釋變量和預(yù)報變量的線性相關(guān)關(guān)系.R2表示解釋變量對預(yù)報變量變化的貢獻率.1.建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個變量是解釋變量,哪個變量是預(yù)報變量.(2)畫出解釋變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等).(3)由經(jīng)驗確定回歸方程的類型(如觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程).(4)按一定規(guī)則(如最小二乘法)估計回歸方程中的參數(shù).(5)得出結(jié)果后分析殘差圖是否有異常(如個別數(shù)據(jù)對應(yīng)殘差過大,殘差呈現(xiàn)不隨機的規(guī)律性等).若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.2.分析兩個變量相關(guān)關(guān)系的常用方法有:(1)利用散點圖進行判斷:把樣本數(shù)據(jù)表示的點在平面直角坐標(biāo)系中作出,從而得到散點圖,如果這些點大致分布在通過散點圖中心的一條直線附近,那么就說這兩個變量之間具有線性相關(guān)關(guān)系.(2)利用相關(guān)指數(shù)R2進行判斷.3.對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析時,首先進行相關(guān)性檢驗,在確認(rèn)具有線性相關(guān)關(guān)系后,再求回歸直線方程.對于非線性回歸問題,可以轉(zhuǎn)化為線性回歸問題去解決.1.在回歸分析中,代表了數(shù)據(jù)點和它在回歸直線上相應(yīng)位置的差異的是(B)A.總偏差平方和B.殘差平方和C.回歸平方和D.相關(guān)指數(shù)R22.下列說法正確的有(C)①回歸方程適用于一切樣本和總體;②回歸方程一般都有時間性;③樣本取值的范圍會影響回歸方程的使用范圍;④回歸方程得到的預(yù)報值是預(yù)報變量的精確值.A.①②B.①③C.②③D.③④解析:①回歸方程只適用于我們研究的樣本和總體.②我們所建立的回歸方程一般都有時間性.③樣本取值的范圍會影響回歸方程的適用范圍.④回歸方程得到的預(yù)報值是預(yù)報變量的可能取值的平均值,并非準(zhǔn)確值,故②③正確.3.已知回歸直線方程中斜率的估計值為,樣本點的中心(4,5),則回歸直線方程為(A)\o(y,\s\up6(^))=+\o(y,\s\up6(^))=+\o(y,\s\up6(^))=+4\o(y,\s\up6(^))=+5解析:回歸直線方程過樣本點的中心,把點(4,5)代入A項成立.4.某調(diào)查者從調(diào)查中獲知某公司近年來科研費用支出(xi)萬元與公司所獲得利潤(yi)萬元的統(tǒng)計資料如下表:序號科研費用支出xi利潤yixiyixeq\o\al(2,i)1531155252114044012134301201645341702553257596220404合計301801000200則利潤(yi)對科研費用支出(xi)的線性回歸方程為________.解析:把表中數(shù)據(jù)代入公式求解得線性回歸方程為eq\o(y,\s\up6(^))=2x+20.1.一項研究要確定是否能夠根據(jù)施肥量預(yù)測作物的產(chǎn)量,這里的解釋變量是(B)A.作物的產(chǎn)量B.施肥量C.試驗者D.降雨量或其他解釋產(chǎn)量的變量解析:作物的產(chǎn)量為預(yù)報變量,故施肥量為解釋變量.2.對兩個變量x和y進行回歸分析,得到一組樣本數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn),則下列說法中不正確的是(C)A.由樣本數(shù)據(jù)得到的回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必過樣本點的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))B.殘差平方和越小的模型,擬合的效果越好C.用R2來刻畫回歸效果,R2的值越小,說明模型擬合的效果越好D.在研究身高和體重關(guān)系時,求得R2=,可以敘述為“身高解釋了64%的體重變化,而隨機誤差貢獻了剩余的36%,”所以身高對體重的效應(yīng)比隨機誤差的效應(yīng)大解析:R2的值越大,說明殘差平方和越小,也就是說模型的擬合程度效果越好.3.下表是某工廠6~9月份電量(單位:萬度)的一組數(shù)據(jù):月份x6789用電量y6532由散點圖可知,用電量y與月份x間有較好的線性相關(guān)關(guān)系,其線性回歸直線方程是eq\o(y,\s\up6(^))=-+a,則a等于(D)A.B.C.D.解析:由題知eq\o(x,\s\up6(-))=,eq\o(y,\s\up6(-))=4,代入方程解得a=,故選D.4.已知回歸直線方程中斜率的估計值為,樣本點的中心(1,2),則回歸直線在y軸上截距為(A)A.-3,43B.3,43C.1D.2解析:回歸直線方程過樣本點的中心,把點(1,2)代入求得y軸上截距為-.5.某考察團對全國10大城市進行職工人均工資水平x(千元)與居民人均消費水平y(tǒng)(千元)統(tǒng)計調(diào)查,y與x具有相關(guān)關(guān)系,回歸方程為eq\o(y,\s\up6(^))=+.若某城市居民人均消費水平為千元,估計該城市人均消費額占人均工資收入的百分比約為(A)A.83%B.72%C.67%D.66%解析:將y=代入回歸方程,可計算得x≈,所以該城市人均消費額占人均工資收入的百分比約為÷≈,即約為83%.6.設(shè)(x1,y1),(x2,y2),…,(xn,yn)是變量x和y的n個樣本點,直線l是由這些樣本點通過最小乘法得到的線性回歸直線(如右圖),以下結(jié)論正確的是(A)A.直線l過點(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))B.x和y的相關(guān)系數(shù)為直線l的斜率C.x和y的相關(guān)系數(shù)在0到1之間D.當(dāng)n為偶數(shù)時,分布在l兩側(cè)的樣本點的個數(shù)一定相同7.下列關(guān)系:①人的年齡與他(她)擁有的財富之間的關(guān)系;②曲線上的點與該點的坐標(biāo)之間的關(guān)系;③蘋果的產(chǎn)量與氣候之間的關(guān)系;④森林中的同一種樹木,其斷面直徑與高度之間的關(guān)系;⑤學(xué)生與他(她)的學(xué)號之間的關(guān)系,其中有相關(guān)關(guān)系的是________.(填序號)答案:①③④8.若施肥量x與水稻產(chǎn)量y的回歸直線方程為eq\o(y,\s\up6(^))=5x+250,當(dāng)施肥量為80kg時,預(yù)報水稻產(chǎn)量為________.解析:當(dāng)x=80kg時,eq\o(y,\s\up6(^))=5×80+250=650kg.答案:650kg9.已知方程eq\o(y,\s\up6(^))=-是根據(jù)女大學(xué)生的身高預(yù)報她的體重的回歸方程,其中x的單位是cm,eq\o(y,\s\up6(^))的單位是kg,那么針對某個體(160,53)的殘差是________.解析:將x=160代入eq\o(y,\s\up6(^))=-,得eq\o(y,\s\up6(^))=×160-=,所以殘差eq\o(e,\s\up6(^))=y(tǒng)-eq\o(y,\s\up6(^))=53-=-.答案:-10.下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸標(biāo)準(zhǔn)煤)的幾組對照數(shù)據(jù).x3456y34(1)請畫出上表數(shù)據(jù)的散點圖.(2)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)).(3)已知該廠技改前100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標(biāo)準(zhǔn)煤.試根據(jù)(2)求出的線性回歸方程,預(yù)測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標(biāo)準(zhǔn)煤.(參考數(shù)值:3×+4×3+5×4+6×=解析:(1)所求散點圖如下圖所示:(2)eq\i\su(i=1,4,x)iyi=3×+4×3+5×4+6×=,eq\o(x,\s\up6(-))=eq\f(3+4+5+6,4)=,eq\o(y,\s\up6(-))=eq\f+3+4+,4)=,故所求線性回歸方程為eq\o(y,\s\up6(^))=+.(3)根據(jù)回歸方程的預(yù)測,現(xiàn)在生產(chǎn)100噸產(chǎn)品消耗的標(biāo)準(zhǔn)煤的數(shù)量為×100+=,故耗能減少了90-=噸標(biāo)準(zhǔn)煤.?品味高考1.(2023·湖北卷)四名同學(xué)根據(jù)各自的樣本數(shù)據(jù)研究變量x,y之間的相關(guān)關(guān)系,并求得回歸直線方程,分別得到以下四個結(jié)論:①y與x負(fù)相關(guān)且eq\o(y,\s\up6(^))=-;②y與x負(fù)相關(guān)且eq\o(y,\s\up6(^))=-+;③y與x正相關(guān)且eq\o(y,\s\up6(^))=+;④y與x正相關(guān)且eq\o(y,\s\up6(^))=--.其中一定不正確的結(jié)論的序號是(D)A.①②B.②③C.③④D.①④解析:由回歸直線方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),知當(dāng)eq\o(b,\s\up6(^))>0時,y與x正相關(guān);當(dāng)eq\o(b,\s\up6(^))<0時,y與x負(fù)相關(guān).∴①④一定錯誤.故選D.2.(2023·福建卷)已知x與y之間的幾組數(shù)據(jù)如下表:x123456y021334假設(shè)根據(jù)上表數(shù)據(jù)所得線性回歸直線方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),若某同學(xué)根據(jù)上表中的前兩組數(shù)據(jù)(1,0)和(2,2)求得的直線方程為y′=b′x+a′,則以下結(jié)論正確的是(C)\o(b,\s\up6(^))>b′,eq\o(a,\s\up6(^))>a′\o(b,\s\up6(^))>b′,eq\o(a,\s\up6(^))<a′\o(b,\s\up6(^))<b′,eq\o(a,\s\up6(^))>a′\o(b,\s\up6(^))<b′,eq\o(a,\s\up6(^))<a′解析:eq\o(x,\s\up6(-))=eq\f(21,6)=eq\f(7,2),eq\o(y,\s\up6(-))=eq\f(13,6),代入公式求得eq\o(b,\s\up6(^))=eq\f(58-6×\f(7,2)×\f(13,6),91-6×\b\lc\(\rc\)(\a\vs4\al\co1(\f(7,2)))\s\up12(2))=eq\f(5,7),eq\o(a,\s\up6(^)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建師范大學(xué)《環(huán)境監(jiān)測實驗》2022-2023學(xué)年第一學(xué)期期末試卷
- 在線教育直播平臺宣傳推廣案
- 安全監(jiān)管副經(jīng)理在安全事故反思會上的講話稿件
- 2024年陽江客運模擬考試
- 2024年宿遷客運從業(yè)資格證試題答案
- 試駕安全培訓(xùn)課件
- 2024年煙臺客運考試題庫
- 2024年天津客運車資格證考試題庫及答案
- 云南昆明市黃岡實驗學(xué)校2025屆高二上數(shù)學(xué)期末考試試題含解析
- 黑龍江省大慶十中2025屆數(shù)學(xué)高一上期末監(jiān)測試題含解析
- 部編版語文五年級上冊八單元集體備課
- 江蘇省常州市各縣區(qū)鄉(xiāng)鎮(zhèn)行政村村莊村名居民村民委員會明細(xì)
- XX二中校園LED顯示屏應(yīng)急預(yù)案
- 2022憲法及民法典知識競賽題庫及答案
- 象棋社團活動教案小學(xué)象棋社團活動教案
- 罪犯的權(quán)利與義務(wù)
- 部編版八年級語文上冊《回憶我的母親》導(dǎo)學(xué)案(集體備課;定稿)
- 四年級上語文記敘文閱讀理解復(fù)習(xí)ppt課件
- 公司安全生產(chǎn)檢查表格
- 印尼語常用語
- 家具廠首件檢驗記錄表
評論
0/150
提交評論