第十章第三節(jié)變量的相關性與一元線性回歸模型_第1頁
第十章第三節(jié)變量的相關性與一元線性回歸模型_第2頁
第十章第三節(jié)變量的相關性與一元線性回歸模型_第3頁
第十章第三節(jié)變量的相關性與一元線性回歸模型_第4頁
第十章第三節(jié)變量的相關性與一元線性回歸模型_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第三節(jié)變量的相關性與一元線性回歸模型【課程標準】1.結合實例,了解樣本相關系數的統(tǒng)計含義,了解樣本相關系數與標準化數據向量夾角的關系.2.結合實例,會通過相關系數比較多組成對數據的相關性.3.結合具體實例,了解一元線性回歸模型的含義,了解模型參數的統(tǒng)計意義,了解最小二乘原理,掌握一元線性回歸模型參數的最小二乘估計方法,會使用相關的統(tǒng)計軟件.4.針對實際問題,會用一元線性回歸模型進行預測.【考情分析】考點考法:高考命題常以現實生活為載體,考查樣本相關系數、一元線性回歸方程、非線性回歸方程;一元線性回歸方程是高考熱點,三種題型都會出現.核心素養(yǎng):數學抽象、數據分析、數學運算【必備知識·逐點夯實】【知識梳理·歸納】1.變量的相關關系(1)相關關系:兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為相關關系.(2)相關關系的分類:正相關和負相關.(3)線性相關:一般地,如果兩個變量的取值呈現正相關或負相關,而且散點落在一條直線附近,我們就稱這兩個變量線性相關.【微點撥】散點圖是描述成對數據之間關系的一種直觀方法,觀察散點圖可以大致看出兩個變量的相關關系.2.樣本相關系數(1)樣本相關系數(2)樣本相關系數r的取值范圍為[1,1],是一個描述成對樣本數據的數字特征,它的正負性可以反映成對樣本數據的變化特征,它的絕對值大小可以反映成對樣本數據之間線性相關的程度:①當r>0時,成對樣本數據正相關;②當r<0時,成對樣本數據負相關.③當|r|越接近1時,成對樣本數據的線性相關程度越強;④當|r|越接近0時,成對樣本數據的線性相關程度越弱.3.經驗回歸模型我們將=x+稱為Y關于x的經驗回歸方程,其中=yx.4.對模型刻畫數據效果的分析(1)殘差圖法在殘差圖中,如果殘差比較均勻地集中在以橫軸為對稱軸的水平帶狀區(qū)域內,則說明經驗回歸方程較好地刻畫了兩個變量的關系.(2)殘差平方和法殘差平方和越小,模型的擬合效果越好.(3)決定系數R2法可以用決定系數來比較兩個模型的擬合效果,R2越大,模型的擬合效果越好,R2越小,模型的擬合效果越差.【基礎小題·自測】類型辨析改編易錯題號12,341.(多維辨析)(多選題)下列結論正確的有 ()A.相關關系是一種非確定性關系B.散點圖是判斷兩個變量相關關系的一種重要方法和手段C.經驗回歸直線=x+至少經過點(x1,y1),(x2,y2),…,(xn,yn)中的一個點D.樣本相關系數的絕對值越接近1,成對樣本數據的線性相關程度越強【解析】選ABD.由相關關系的定義可知:相關關系是一種非確定性關系,所以選項A正確;因為散點圖是描述成對數據之間關系的一種直觀方法,觀察散點圖可以大致看出兩個變量的相關關系,所以選項B正確;由經驗回歸方程=x+過點(x,y)知,不一定過樣本數據,所以選項C錯誤;由相關系數的大小與樣本相關關系可知,選項D正確.2.(選修第三冊P101例1改編)對于x,y兩個變量,有四組成對樣本數據,分別算出它們的樣本相關系數r如下,則線性相關性最強的是 ()A.0.82 B.0.78 C.0.69 D.0.87【解析】選D.由樣本相關系數的絕對值|r|越接近1,變量間的線性相關性越強知,各選項中r=0.87的絕對值最接近1.3.(選修第三冊P103習題1改編)根據所示的散點圖,下列說法正確的是 ()A.身高越高,體重越大B.身高越高,體重越小C.身高和體重呈正相關D.身高和體重呈負相關【解析】選C.根據散點圖的分布可得:身高和體重呈正相關.4.(誤認為經驗回歸直線過樣本點)某互聯(lián)網公司借助某平臺推廣自己的產品,對今年前5個月的月平臺推廣費用x(單位:百萬元)與月利潤額y(單位:百萬元)進行了初步統(tǒng)計,得到下列表格中的數據:x24568y304060p70經計算,月平臺推廣費用x與月利潤額y滿足經驗回歸方程=6.5x+17.5,則p的值為 ()A.50 B.56.5 C.60 D.70【解析】選A.由于經驗回歸直線過樣本點的中心,x=5,y=200+p5,代入經驗回歸方程得200+p5=6.5×5+17.5,【核心考點·分類突破】考點一成對數據的相關性[例1](1)(2023·天津高考)調查某種花萼長度和花瓣長度,所得數據如圖所示,其中相關系數r=0.8245,下列說法正確的是 ()A.花瓣長度和花萼長度沒有相關性B.花瓣長度和花萼長度呈現負相關C.花瓣長度和花萼長度呈現正相關D.若從樣本中抽取一部分,則這部分的相關系數一定是0.8245【解析】選C.因為相關系數r=0.8245>0.75,且題中散點圖呈左下角到右上角的帶狀分布,所以花瓣長度和花萼長度呈現正相關.若從樣本中抽取一部分,則這部分的相關系數不一定是0.8245.(2)(多選題)對于樣本相關系數,下列說法正確的有 ()A.樣本相關系數可以用來判斷成對樣本數據相關的正負性B.樣本相關系數可以是正的,也可以是負的C.樣本相關系數r∈[1,1]D.樣本相關系數越大,成對樣本數據的線性相關程度也越強【解析】選ABC.因為樣本相關系數大于0,說明成對樣本數據正相關,樣本相關系數小于0,說明成對樣本數據負相關,所以選項A正確;由樣本相關系數公式可知:樣本相關系數r∈[1,1],所以選項B,C正確;樣本相關系數的絕對值越接近1,成對樣本數據的線性相關程度越強,故D錯誤.【解題技法】判斷相關關系的兩種方法(1)散點圖法:如果所有的樣本點都落在某條曲線附近,變量之間就有相關關系.如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系.(2)相關系數法:利用相關系數判定,|r|越趨近于1,相關性越強.【對點訓練】1.對四組不同的數據進行統(tǒng)計,獲得如圖所示的散點圖,關于其樣本相關系數的比較,下列正確的是 ()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3【解析】選A.由題中散點圖可知圖①與圖③中的兩個變量是正相關,故r1>0,r3>0,圖②與圖④中的兩個變量是負相關,故r2<0,r4<0,又圖①與圖②中的樣本點集中在一條直線附近,所以r2<r4<0<r3<r1.2.若已知是的4倍,是的1.5倍,則相關系數r的值為________.

【解析】由,得r=34.答案:3【加練備選】1.某商家今年上半年各月的人均銷售額(單位:千元)與利潤率統(tǒng)計表如下:月份123456人均銷售額658347利潤率(%)12.610.418.53.08.116.3根據表中數據,下列說法正確的是 ()A.利潤率與人均銷售額呈現正相關關系B.利潤率與人均銷售額呈現負相關關系C.利潤率與人均銷售額成正比例函數關系D.利潤率與人均銷售額成反比例函數關系【解析】選A.由題中統(tǒng)計表可得利潤率與人均銷售額不是正比例關系,也不是反比例關系,排除C,D;其屬于正相關關系,A正確,B錯誤.2.為研究語文成績和英語成績之間是否具有線性相關關系,統(tǒng)計某班學生的兩科成績得到如圖所示的散點圖(x軸、y軸的單位長度相同),用經驗回歸方程=x+近似地刻畫其相關關系,根據圖形,以下結論最有可能成立的是 ()A.線性相關關系較強,的值為1.25B.線性相關關系較強,的值為0.83C.線性相關關系較強,的值為0.87D.線性相關關系較弱,無研究價值【解析】選B.由題中散點圖可以看出兩個變量所構成的點在一條直線附近,所以線性相關關系較強,且應為正相關,所以經驗回歸方程的斜率應為正數,且從散點圖觀察,經驗回歸方程的斜率應該比直線y=x的斜率要小一些,綜上可知應選B.考點二回歸模型及其應用角度1一元線性回歸模型及其應用[例2]為保證新能源汽車的推廣,某市逐漸加大充電基礎設施的建設,該市統(tǒng)計了近五年新能源汽車充電站的數量(單位:個),得到如下數據:年份編號x12345年份20182019202020212022數量y/個37104147196226(1)已知可用線性回歸模型擬合y與x的關系,請用相關系數加以說明;(2)求y關于x的經驗回歸方程,并預測2026年該市新能源汽車充電站的數量.參考數據:參考公式:相關系數經驗回歸直線=x+中斜率和截距的最小二乘估計公式分別為=yx.【解析】(1)由已知數據得x=15×(1+2+3+4+5)=3,y=1所以r≈4703.16×149.因為y與x的相關系數近似為0.99,接近1,說明y與x的線性相關程度相當高,從而可以用線性回歸模型擬合y與x的關系.(2)由(1)得=yx=14247×3=1,故所求經驗回歸方程為=47x+1,將2026年對應的年份編號x=9代入經驗回歸方程得=47×9+1=424,故預測2026年該市新能源汽車充電站的數量為424個.【解題技法】求經驗回歸方程的步驟【對點訓練】1.(2023·保定模擬)已知兩個變量x和y之間有線性相關關系,經調查得到如下樣本數據:x34567y3.52.41.10.21.3根據表格中的數據求得經驗回歸方程為=x+,則下列說法中正確的是 ()A.>0,>0 B.>0,<0C.<0,>0 D.<0,<0【解析】選B.由已知數據可知y隨著x的增大而減小,則變量x和y之間存在負相關關系,所以<0.又x=15×(3+4+5+6+7)=5,y=15×(3.5+2.4+1.10.21.3)=1.1,即1.1=5+,所以=1.15>0.2.某智能機器人的廣告費用x(萬元)與銷售額y(萬元)的統(tǒng)計數據如表所示:廣告費用x(萬元)2356銷售額y(萬元)28314148根據此表可得經驗回歸方程為=5x+,據此模型預測廣告費用為8萬元時,銷售額為________萬元.

【解析】由題中表格,得x=2+3+5+64y=28+31+41+484所以37=5×4+,即=17,所以預測當廣告費用為8萬元時,銷售額為5×8+17=57(萬元).答案:57角度2非線性回歸模型及其應用[例3]某企業(yè)新研發(fā)了一種產品,產品的成本由原料成本及非原料成本組成,每件產品的非原料成本y(元)與生產該產品的數量x(千件)有關,經統(tǒng)計得到如下數據:x12345678y1126144.53530.5282524根據以上數據,繪制了散點圖.參考數據:(其中ui=1x參考公式:對于一組數據(u1,v1),(u2,v2),…,(un,vn),其經驗回歸方程=+u的斜率和截距的最小二乘估計分別為(1)觀察散點圖判斷,y=a+bx與y=c+dx哪一個適宜作為非原料成本y與生產該產品的數量x的回歸方程類型?(給出判斷即可,不必說明理由(2)根據(1)的判斷結果及表中數據,建立y與x的回歸方程.(3)試預測生產該產品10000件時每件產品的非原料成本.【解析】(1)由散點圖可知,y=a+bx適宜作為非原料成本y與生產該產品的數量x的回歸方程類型(2)令u=1x,則y=a+bu=yu=3608100×0.34=11,所以=11+100u=11+100x;(3)當x=10(千件)時,=11+10010=21(元).故預測生產該產品10000件時每件產品的非原料成本為21元.【解題技法】非線性回歸分析的步驟【對點訓練】1.(2023·鄭州模擬)用模型y=aebx+1(a>0)擬合一組數據時,令z=lny,將其變換后得到經驗回歸方程=2x+,則ba= (A.e B.1e C.12 D【解析】選D.對y=aebx+1(a>0)兩邊同時取對數,則lny=ln(aebx+1)=lna+bx+1,令z=lny,則z=bx+lna+1,所以b=2,2.已知具有相關關系的兩個隨機變量的一組觀測數據的散點圖分布在函數y=2e2x+1的圖象附近,設z=lny,將其變換后得到經驗回歸方程為=x+,則mn=________.

【解析】由z=lny,則lny=ln2e2x+1,即z=ln2+lne2x+1=ln2+2x+1,則z=2x+ln2+1,故答案:2ln2+2考點三殘差分析[例4](1)(多選題)下列說法正確的是 ()A.在經驗回歸方程=0.85x+2.3中,當解釋變量x每增加1個單位時,響應變量平均減少2.3個單位B.在經驗回歸方程=0.85x+2.3中,相對于樣本點(1,1.2)的殘差為0.25C.在殘差圖中,殘差分布的水平帶狀區(qū)域的寬度越窄,其模型的擬合效果越好D.若兩個變量的決定系數R2越大,表示殘差平方和越小,即模型的擬合效果越好【解析】選BCD.對于A,根據經驗回歸方程,當解釋變量x每增加1個單位時,響應變量平均減少0.85個單位,故A錯誤;對于B,當解釋變量x=1時,響應變量=1.45,則樣本點(1,1.2)的殘差為0.25,故B正確;對于C,在殘差圖中,殘差分布的水平帶狀區(qū)域的寬度越窄,說明擬合精度越高,即擬合效果越好,故C正確;對于D,由決定系數R2的意義可知,R2越大,表示殘差平方和越小,即模型的擬合效果越好,故D正確.(2)新能源汽車的核心部件是動力電池,電池占了新能源整車成本的很大一部分,而其中的原材料碳酸鋰又是電池的主要成分.從2020年底開始,碳酸鋰的價格不斷升高,下表是2022年某企業(yè)的前5個月碳酸鋰的價格與月份的統(tǒng)計數據:月份代碼x

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論