2025高考數學專項講義第09講統(tǒng)計與統(tǒng)計案例(學生版+解析)_第1頁
2025高考數學專項講義第09講統(tǒng)計與統(tǒng)計案例(學生版+解析)_第2頁
2025高考數學專項講義第09講統(tǒng)計與統(tǒng)計案例(學生版+解析)_第3頁
2025高考數學專項講義第09講統(tǒng)計與統(tǒng)計案例(學生版+解析)_第4頁
2025高考數學專項講義第09講統(tǒng)計與統(tǒng)計案例(學生版+解析)_第5頁
已閱讀5頁,還剩140頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第09講統(tǒng)計與統(tǒng)計案例(13類核心考點精講精練)1.5年真題考點分布5年考情考題示例考點分析關聯考點2024年新Ⅱ卷,第4題,5分計算幾個數的中位數計算幾個數的平均數計算幾個數據的極差/2023年新I卷,第9題,5分計算幾個數的中位數計算幾個數的平均數計算幾個數據的極差、方差標準差/2023年新Ⅱ卷,第19題,12分頻率分布直方圖的實際應用總體百分位數的估計/2023年全國甲卷(理),第19題,12分獨立性檢驗解決實際問題計算幾個數的中位數超幾何分布的均值超幾何分布的分布列2023年全國乙卷(理),第17題,12分計算幾個數的平均數計算幾個數據的極差、方差、標準差統(tǒng)計新定義2022年新I卷,第20題,12分獨立性檢驗解決實際問題計算條件概率2022年新Ⅱ卷,第19題,12分頻率分布直方圖的實際應用由頻率分布直方圖估計平均數利用對立事件的概率公式求概率計算條件概率2022年全國甲卷(理),第2題,5分眾數、平均數、中位數的比較計算幾個數據的極差、方差、標準差/2022年全國乙卷(理),第19題,12分相關系數的計算根據樣本中心點求參數計算幾個數的平均數2021年新I卷,第9題,5分眾數、平均數、中位數的比較計算幾個數據的極差、方差、標準差/2021年新Ⅱ卷,第9題,5分計算幾個數的眾數計算幾個數的中位數計算幾個數的平均數計算幾個數據的極差、方差、標準差/2021年全國乙卷(理),第17題,10分獨立性檢驗解決實際問題/2021年全國甲卷(理),第2題,5分由頻率分布直方圖計算頻率、頻數、樣本容量、總體容量由頻率分布直方圖估計平均數/2021年全國甲卷(理),第17題,10分計算幾個數的平均數計算幾個數據的極差、方差、標準差/2020年新I卷,第19題,12分完善列聯表獨立性檢驗/2020年新Ⅱ卷,第19題,12分完善列聯表獨立性檢驗/2020年全國甲卷(理),第5題,5分由散點圖畫求近似回歸直線/2020年全國乙卷(理),第18題,12分相關系數的計算/2020年全國丙卷(理),第18題,12分獨立性檢驗解決實際問題/2020年新Ⅱ卷,第9題,5分根據折線統(tǒng)計圖解決實際問題/2.命題規(guī)律及備考策略【命題規(guī)律】本節(jié)內容是新高考卷的??純热?,設題不定,難度中等或偏難,分值為5-15分【備考策略】1.理解、掌握簡單隨機抽樣、分層抽樣定義及計算2.理解、掌握總體樣本估計的定義及計算3.理解、掌握線性回歸的定義及計算4.理解、掌握獨立性檢驗的定義及計算【命題預測】本節(jié)內容是新高考卷的??純热?,一般給在大題中結合前面的的概率及分布列一起考查,需重點強化復習知識講解1.簡單隨機抽樣(1)定義:一般地,設一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(n≤N),如果每次抽取時總體內的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣.這樣抽取的樣本,叫做簡單隨機樣本.(2)常用方法:抽簽法和隨機數法.2.分層抽樣(1)在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是一種分層抽樣.(2)分層抽樣的應用范圍當總體是由差異明顯的幾個部分組成時,往往選用分層抽樣.3.頻率分布直方圖(1)縱軸表示eq\f(頻率,組距),即小長方形的高=eq\f(頻率,組距);(2)小長方形的面積=組距×eq\f(頻率,組距)=頻率;(3)各個小方形的面積總和等于1.頻率分布直方圖中的常見結論(1)眾數的估計值為最高矩形的中點對應的橫坐標.(2)平均數的估計值等于頻率分布直方圖中每個小矩形的面積乘以小矩形底邊中點的橫坐標之和.(3)中位數的估計值的左邊和右邊的小矩形的面積和是相等的.4.頻率分布表的畫法第一步:求極差,決定組數和組距,組距=eq\f(極差,組數);第二步:分組,通常對組內數值所在區(qū)間取左閉右開區(qū)間,最后一組取閉區(qū)間;第三步:登記頻數,計算頻率,列出頻率分布表.5.條形圖、折線圖及扇形圖(1)條形圖:建立直角坐標系,用橫軸(橫軸上的數字)表示樣本數據類型,用縱軸上的單位長度表示一定的數量,根據每個樣本(或某個范圍內的樣本)的數量多少畫出長短不同的等寬矩形,然后把這些矩形按照一定的順序排列起來,這樣一種表達和分析數據的統(tǒng)計圖稱為條形圖.(2)折線圖:建立直角坐標系,用橫軸上的數字表示樣本值,用縱軸上的單位長度表示一定的數量,根據樣本值和數量的多少描出相應各點,然后把各點用線段順次連接,得到一條折線,用這種折線表示出樣本數據的情況,這樣的一種表示和分析數據的統(tǒng)計圖稱為折線圖.(3)扇形圖:用一個圓表示總體,圓中各扇形分別代表總體中的不同部分,每個扇形的大小反映所表示的那部分占總體的百分比的大小,這樣的一種表示和分析數據的統(tǒng)計圖稱為扇形圖.6.百分位數、眾數、平均數的定義(1)如果將一組數據從小到大排序,并計算相應的累計百分位,則某一百分位所對應數據的值就稱為這一百分位的百分位數.一般地,一組數據的第p百分位數是這樣一個值,它使得這組數據中至少有p%的數據小于或等于這個值,且至少有(100-p)%的數據大于或等于這個值.(2)第25百分位數又稱第一四分位數或下四分位數;第75百分位數又稱第三四分位數或上四分位數.(3)眾數一組數據中出現次數最多的數據叫做這組數據的眾數.(4)平均數一組數據的算術平均數即為這組數據的平均數,n個數據x1,x2,…,xn的平均數eq\x\to(x)=eq\f(1,n)(x1+x2+…+xn).7.樣本的數字特征之方差如果有n個數據x1,x2,…,xn,那么這n個數的(1)標準差s=eq\r(\f(1,n)[x1-\x\to(x)2+x2-\x\to(x)2+…+xn-\x\to(x)2]).(2)方差s2=eq\f(1,n)[(x1-eq\x\to(x))2+(x2-eq\x\to(x))2+…+(xn-eq\x\to(x))2].8.平均數、方差的公式推廣(1)若數據x1,x2,…,xn的平均數為eq\x\to(x),則mx1+a,mx2+a,mx3+a,…,mxn+a的平均數是meq\x\to(x)+a.(2)若數據x1,x2,…,xn的方差為s2,則數據ax1+b,ax2+b,…,axn+b的方差為a2s2.兩個變量的線性相關(1)正相關在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩個變量的這種相關關系,我們將它稱為正相關.(2)負相關在散點圖中,點散布在從左上角到右下角的區(qū)域,兩個變量的這種相關關系稱為負相關.(3)線性相關關系、回歸直線如果散點圖中點的分布從整體上看大致在一條直線附近,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線.回歸方程(1)最小二乘法求回歸直線,使得樣本數據的點到它的距離的平方和最小的方法叫做最小二乘法.(2)回歸方程方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))是兩個具有線性相關關系的變量的一組數據(x1,y1),(x2,y2),…,(xn,yn)的回歸方程,其中eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^))是待定參數.eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)yi-\x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)2)=\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\x\to(x)\x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2),,\o(a,\s\up6(^))=\x\to(y)-\o(b,\s\up6(^))\x\to(x).))回歸分析(1)定義:對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法.(2)樣本點的中心對于一組具有線性相關關系的數據(x1,y1),(x2,y2),…,(xn,yn),其中(eq\x\to(x),eq\x\to(y))稱為樣本點的中心.(3)相關系數當r>0時,表明兩個變量正相關;當r<0時,表明兩個變量負相關.r的絕對值越接近于1,表明兩個變量的線性相關性越強.r的絕對值越接近于0,表明兩個變量之間幾乎不存在線性相關關系.通常|r|大于0.75時,認為兩個變量有很強的線性相關性.獨立性檢驗(1)分類變量:變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.(2)列聯表:列出的兩個分類變量的頻數表,稱為列聯表.假設有兩個分類變量X和Y,它們的可能取值分別為{x1,x2}和{y1,y2},其樣本頻數列聯表(稱為2×2列聯表)為2×2列聯表y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d構造一個隨機變量K2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d為樣本容量.(3)獨立性檢驗利用隨機變量K2來判斷“兩個分類變量有關系”的方法稱為獨立性檢驗.當χ2≤2.706時,沒有充分的證據判定變量A,B有關聯;當χ2>2.706時,有90%的把握判定變量A,B有關聯;當χ>3.841時,有95%的把握判定變量A,B有關聯;當χ>6.635時,有99%的把握判定變量A,B有關聯.考點一、簡單隨機抽樣1.(2024·福建泉州·模擬預測)從一個含有個個體的總體中抽取一容量為的樣本,當選取抽簽法、隨機數法和分層隨機抽樣三種不同方法時,總體中每個個體被抽中的概率分別為,三者關系可能是(

)A. B. C. D.2.(2024高一下·全國·專題練習)某中學高一年級有400人,高二年級有320人,高三年級有280人,若用隨機數法在該中學抽取容量為n的樣本,每人被抽到的可能性都為0.2,則n等于()A.80 B.160 C.200 D.2803.(2024·陜西西安·一模)某高校對中文系新生進行體測,利用隨機數表對650名學生進行抽樣,先將650名學生進行編號,001,002,…,649,650.從中抽取50個樣本,下圖提供隨機數表的第4行到第6行,若從表中第5行第6列開始向右讀取數據,則得到的第6個樣本編號是(

)3221183429

7864540732

5242064438

1223435677

35789056428442125331

3457860736

2530073286

2345788907

23689608043256780843

6789535577

3489948375

2253557832

4577892345A.623 B.328 C.072 D.4571.(2024·四川成都·模擬預測)用簡單隨機抽樣的方法從含有10個個體的總體中抽取一個容量為3的樣本,其中某一個體a“第一次被抽到”的可能性與“第二次被抽到”的可能性分別是(

)A., B.,C., D.,2.(2024·云南貴州·二模)本次月考分答題卡的任務由高三16班完成,現從全班55位學生中利用下面的隨機數表抽取10位同學參加,將這55位學生按01、02、、55進行編號,假設從隨機數表第1行第2個數字開始由左向右依次選取兩個數字,重復的跳過,讀到行末則從下一行行首繼續(xù),則選出來的第6個號碼所對應的學生編號為(

)062743132432532709412512631763232616804560111410957774246762428114572042533237322707360701400523261737263890512451793014231021182191A.51 B.25 C.32 D.12考點二、分層隨機抽樣1.(2024·江西南昌·模擬預測)已知三種不同型號的產品數量之比依次為,現用分層抽樣的方法抽取容量為的樣本,若樣本中型號產品有件,則為(

)A.60 B.70 C.80 D.902.(2023·全國·高考真題)某學校為了解學生參加體育運動的情況,用比例分配的分層隨機抽樣方法作抽樣調查,擬從初中部和高中部兩層共抽取60名學生,已知該校初中部和高中部分別有400名和200名學生,則不同的抽樣結果共有(

).A.種 B.種C.種 D.種3.(2024·上海·高考真題)水果分為一級果和二級果,共136箱,其中一級果102箱,二級果34箱.(1)隨機挑選兩箱水果,求恰好一級果和二級果各一箱的概率;(2)進行分層抽樣,共抽8箱水果,求一級果和二級果各幾箱;(3)抽取若干箱水果,其中一級果共120個,單果質量平均數為303.45克,方差為603.46;二級果48個,單果質量平均數為240.41克,方差為648.21;求168個水果的方差和平均數,并預估果園中單果的質量.1.(2024·河南·三模)國內某優(yōu)秀新能源電池制造企業(yè)在鋰電池單位能量密度技術上取得了重大突破,該制造企業(yè)內的某車間有兩條生產線,分別生產高能量密度鋰電池和低能量密度鋰電池,總產量為400個鋰電池.質檢人員采用分層隨機抽樣的方法隨機抽取了一個容量為80的樣本進行質量檢測,已知樣本中高能量密度鋰電池有35個,則估計低能量密度鋰電池的總產量為(

).A.325個 B.300個 C.225個 D.175個2.(2024·黑龍江雙鴨山·模擬預測)為了解某校初中學生的近視情況,按年級用分層抽樣的方法隨機抽取100名學生進行視力檢測,已知初一、初二、初三年級分別有800名,600名,600名學生,則不同的抽樣結果共有(

)A. B. C. D.考點三、條形統(tǒng)計圖1.(2024·江西·二模)下圖是我國年純電動汽車銷量統(tǒng)計情況,則下列說法錯誤的是(

A.我國純電動汽車銷量呈現逐年增長趨勢B.這六年銷量的第60百分位數為536.5萬輛C.2020年銷量高于這六年銷量的平均值D.這六年增長率最大的為2019年至2020年2.(2024·全國·模擬預測)如圖為某中型綜合超市年的年總營業(yè)額(單位:萬元)的統(tǒng)計圖,則下列說法錯誤的是(

A.年的年總營業(yè)額的極差為2200萬元B.年的年總營業(yè)額波動性比年的年總營業(yè)額波動性小C.年的年總營業(yè)額逐年上升,2021年跌落低谷,之后每年又呈上升趨勢D.年的年總營業(yè)額的中位數是2019年和2020年的年總營業(yè)額的平均數1.(2024·四川達州·二模)下圖是某地區(qū)2016-2023年旅游收入(單位:億元)的條形圖,則下列說法錯誤的是(

A.該地區(qū)2016-2019年旅游收入逐年遞增B.該地區(qū)2016-2023年旅游收入的中位數是4.30C.經歷了疫情之后,該地區(qū)2023年旅游收入恢復到接近2018年水平D.該地區(qū)2016-2023年旅游收入的極差是3.692.(2024·陜西西安·模擬預測)國家統(tǒng)計局發(fā)布的2018年至2022年我國居民消費水平情況如圖所示,則下列說法正確的是(居民消費水平)(

A.2018年至2022年我國居民消費水平逐年提高B.2018年至2022年我國城鎮(zhèn)居民消費水平逐年提高C.2018年至2022年我國居民消費水平數據的極差為6463元D.2022年我國城鎮(zhèn)人口數比農村人口數的1.5倍還要多考點四、折線統(tǒng)計圖1.(2024·遼寧撫順·三模)(多選)年月日國家統(tǒng)計局發(fā)布了制造業(yè)采購經理指數(),如下圖所示:下列說法正確的是(

)A.從年月到年月,這個月的制造業(yè)采購經理指數()的第百分位數為B.從年月到年月,這個月的制造業(yè)采購經理指數()的極差為C.從年月到年月制造業(yè)采購經理指數()呈下降趨勢D.大于表示經濟處于擴張活躍的狀態(tài);小于表示經濟處于低迷萎縮的狀態(tài),則年月到年月,經濟處于擴張活躍的狀態(tài)2.(2024·全國·二模)(多選)人均可支配收入和人均消費支出是兩個非常重要的經濟和民生指標,常被用于衡量一個地區(qū)經濟發(fā)展水平和群眾生活水平.下圖為2018~2023年前三季度全國城鎮(zhèn)居民人均可支配收入及人均消費支出統(tǒng)計圖,據此進行分析,則(

)A.2018~2023年前三季度全國城鎮(zhèn)居民人均消費支出逐年遞增B.2018~2023年前三季度全國城鎮(zhèn)居民人均可支配收入逐年遞增C.2018~2023年前三季度全國城鎮(zhèn)居民人均可支配收入的極差比人均消費支出的極差小D.2018~2023年前三季度全國城鎮(zhèn)居民人均消費支出的中位數為21180元1.(2024·黑龍江·三模)(多選)在某市初三年級舉行的一次體育考試中(滿分100分),所有考生成績均在[50,100]內,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五組,甲、乙兩班考生的成績占比如圖所示,則下列說法錯誤的是(

A.成績在[70,80)的考生中,甲班人數多于乙班人數B.甲班成績在[80,90)內人數最多C.乙班成績在[70,80)內人數最多D.甲班成績的極差比乙班成績的極差小2.(23-24高三下·山東·開學考試)(多選)進入冬季哈爾濱旅游火爆全網,下圖是2024年1月1.日到1月7日哈爾濱冰雪大世界和中央大街日旅游人數的折線圖,則(

)A.中央大街日旅游人數的極差是1.2 B.冰雪大世界日旅游人數的中位數是2.3C.冰雪大世界日旅游人數的平均數比中央大街大 D.冰雪大世界日旅游人數的方差比中央大街大考點五、扇形統(tǒng)計圖1.(2024·山東菏澤·模擬預測)南丁格爾玫瑰圖是由近代護理學和護士教育創(chuàng)始人南丁格爾設計的,圖中每個扇形圓心角都是相等的,半徑長短表示數量大?。硻C構統(tǒng)計了近幾年某國知識付費用戶數量(單位:億人次),并繪制成南丁格爾玫瑰圖(如圖所示),根據此圖,以下說法錯誤的是(

)A.2016年至2023年,知識付費用戶數量逐年增加B.2016年至2023年,知識付費用戶數量逐年增加量2019年最多C.2016年至2023年,知識付費用戶數量的逐年增加量逐年遞增D.2023年知識付費用戶數量超過2016年知識付費用戶數量的10倍2.(2024·湖南邵陽·模擬預測)(多選)有關數據顯示,年輕一代的父母更加重視親子陪伴,以往“以孩子為中心”的觀念正逐步向與孩子玩在一起、學在一起的方向轉變.如圖為2023年中國父母參與過的各類親子活動人數在參與調查總人數中的占比,根據該圖,下列說法正確的是(

)A.在參與調查的總人數中父母參與過的親子活動最多的是親子閱讀B.在參與調查的總人數中同時參與過親子閱讀與親子運動會的父母不少于C.圖中各類親子活動占比的中位數為D.圖中10類親子活動占比的極差為1.(2024·遼寧·模擬預測)某高中2023年的高考考生人數是2022年高考考生人數的1.5倍.為了更好地對比該??忌纳龑W情況,統(tǒng)計了該校2022年和2023年高考分數達線情況,得到如圖所示扇形統(tǒng)計圖:

下列結論正確的是(

)A.該校2023年與2022年的本科達線人數比為6:5B.該校2023年與2022年的??七_線人數比為6:7C.2023年該校本科達線人數比2022年該校本科達線人數增加了80%D.2023年該校不上線的人數有所減少2.(2024·遼寧·二模)(多選)下圖為某市2023年第一季度全市居民人均消費支出構成圖.已知城鎮(zhèn)居民人均消費支出7924元,與上一年同比增長4.4%;農村居民人均消費支出4388元,與上一年同比增長7.8%,則關于2023年第一季度該市居民人均消費支出,下列說法正確的是(

)A.2023年第一季度該市居民人均消費支出6393元B.居住及食品煙酒兩項的人均消費支出總和超過了總人均消費支出的50%C.城鄉(xiāng)居民人均消費支出的差額與上一年同比在縮小D.醫(yī)療保健與教育文化娛樂兩項人均消費支出總和約占總人均消費支出的20.6%考點六、頻率分布表1.現有一個容量為50的樣本,其數據的頻數分布表如下表所示:組號12345頻數811109則第4組的頻數和頻率分別是(

)A.12,0.06 B.12,0.24 C.18,0.09 D.18,0.361.某單位招聘員工,有名應聘者參加筆試,隨機抽查了其中名應聘者筆試試卷,統(tǒng)計他們的成績如下表:分數段人數1366211若按筆試成績擇優(yōu)錄取名參加面試,由此可預測參加面試的分數線為A.分 B.分 C.分 D.分考點七、頻率分布直方圖1.(2022·天津·高考真題)將1916到2015年的全球年平均氣溫(單位:),共100個數據,分成6組:,并整理得到如下的頻率分布直方圖,則全球年平均氣溫在區(qū)間內的有(

)A.22年 B.23年 C.25年 D.35年2.(2021·天津·高考真題)從某網絡平臺推薦的影視作品中抽取部,統(tǒng)計其評分數據,將所得個評分數據分為組:、、、,并整理得到如下的頻率分布直方圖,則評分在區(qū)間內的影視作品數量是(

)A. B. C. D.3.(2021·全國·高考真題)為了解某地農村經濟情況,對該地農戶家庭年收入進行抽樣調查,將農戶家庭年收入的調查數據整理得到如下頻率分布直方圖:根據此頻率分布直方圖,下面結論中不正確的是(

)A.該地農戶家庭年收入低于4.5萬元的農戶比率估計為6%B.該地農戶家庭年收入不低于10.5萬元的農戶比率估計為10%C.估計該地農戶家庭年收入的平均值不超過6.5萬元D.估計該地有一半以上的農戶,其家庭年收入介于4.5萬元至8.5萬元之間4.(2022·全國·高考真題)在某地區(qū)進行流行病學調查,隨機調查了100位某種疾病患者的年齡,得到如下的樣本數據的頻率分布直方圖:

(1)估計該地區(qū)這種疾病患者的平均年齡(同一組中的數據用該組區(qū)間的中點值為代表);(2)估計該地區(qū)一位這種疾病患者的年齡位于區(qū)間的概率;(3)已知該地區(qū)這種疾病的患病率為,該地區(qū)年齡位于區(qū)間的人口占該地區(qū)總人口的.從該地區(qū)中任選一人,若此人的年齡位于區(qū)間,求此人患這種疾病的概率.(以樣本數據中患者的年齡位于各區(qū)間的頻率作為患者的年齡位于該區(qū)間的概率,精確到0.0001).1.(2024·湖北黃岡·模擬預測)為了解高中學生每天的體育活動時間,某市教育部門隨機抽取高中學生進行調查,把每天進行體育活動的時間按照時長(單位:分鐘)分成組:,40,50,50,60,60,70,,.然后對統(tǒng)計數據整理得到如圖所示的頻率分布直方圖,則可估計這名學生每天體育活動時間的第百分位數為(

)A. B. C. D.2.(2024·廣西桂林·模擬預測)(多選)某次數學考試后,為分析學生的學習情況,某校從某年級中隨機抽取了100名學生的成績,整理得到如圖所示的頻率分布直方圖.為進一步分析高分學生的成績分布情況,計算得到這100名學生中,成績位于80,90內的學生成績方差為12,成績位于內的同學成績方差為10.則(

)A.B.估計該年級學生成績的中位數約為77.14C.估計該年級成績在80分及以上的學生成績的平均數為87.50D.估計該年級成績在80分及以上的學生成績的方差為323.(2024·福建泉州·模擬預測)(多選)某校在開展“弘揚中華傳統(tǒng)文化,深植文化自信之根”主題教育的系列活動中,舉辦了“誦讀國學經典,傳承中華文明”知識競賽.賽前為了解學生的備賽情況,組織對高一年和高二年學生的抽樣測試,測試成績數據處理后,得到如下頻率分布直方圖,則下面說法正確的是(

)A.高一年抽測成績的眾數為75B.高二年抽測成績低于60分的比率為C.估計高一年學生成績的平均分低于高二年學生成績的平均分D.估計高一年學生成績的中位數低于高二年學生成績的中位數4.(2024·江蘇南京·二模)(多選)2023年10月31日,神舟十六號載人飛船返回艙在東風著陸場成功著陸,激發(fā)了學生對航天的熱愛.某校組織高中學生參加航天知識競賽,現從中隨機抽取100名學生成績分為四組,分別為,得到頻率分布直方圖如圖所示,則(

A.B.這組樣本數據的分位數為88C.若從這100名學生成績不低于80分的學生中,隨機抽取3人,則此3人的分數都不低于90分的概率為D.若用樣本的頻率估計總體,從該校高中學生中隨機抽199人,記“抽取199人中成績不低于90的人數為”的事件為,則最大時,.考點八、總體百分位數的估計1.(2024·江西·一模)從1984年第23屆洛杉磯夏季奧運會到2024年第33屆巴黎夏季奧運會,我國獲得的夏季奧運會金牌數依次為15、5、16、16、28、32、51、38、26、38、40,這11個數據的分位數是(

)A.16 B.30 C.32 D.512.(2024·安徽·模擬預測)一組數據按從小到大的順序排列為2,4,m,12,16,17,若該組數據的中位數是極差的,則該組數據的第40百分位數是.3.(2024·廣東廣州·模擬預測)(多選)已知,,,,,為依次增大的一組數據,則去掉和后,這組數據的(

)一定減小.A.極差 B.下四分位數 C.上四分位數 D.中位數1.(2024·安徽六安·模擬預測)樣本數據16,20,24,21,22,18,14,28的分位數為(

)A.16 B.17 C.23 D.242.(2024·河南周口·模擬預測)已知一組從小到大排列的數據:a,2,2,4,4,5,6,b,8,8,若其第70百分位數等于其極差,則.考點九、總體集中趨勢的估計1.(2023·全國·高考真題)(多選)有一組樣本數據,其中是最小值,是最大值,則(

)A.的平均數等于的平均數B.的中位數等于的中位數C.的標準差不小于的標準差D.的極差不大于的極差2.(2024·黑龍江哈爾濱·三模)如圖所示,下列頻率分布直方圖顯示了三種不同的形態(tài).圖(1)形成對稱形態(tài),圖(2)形成“右拖尾”形態(tài),圖(3)形成“左拖尾”形態(tài),根據所給圖作出以下判斷,正確的是(

)A.圖(1)的平均數=中位數>眾數 B.圖(2)的眾數<中位數<平均數C.圖(2)的平均數<眾數<中位數 D.圖(3)的中位數<平均數<眾數3.(2024·重慶九龍坡·三模)(多選)已知樣本數據的平均數為2,方差為1,則下列說法正確的是(

)A.數據,的平均數為6B.數據,的方差為9C.數據的方差為1D.數據的平均數為51.(23-24高三下·北京·開學考試)設一組數據,則數據的平均值為,30%分位數為.2.(2024·廣東廣州·模擬預測)已知數據,且滿足,若去掉,后組成一組新數據,則新數據與原數據相比,有可能變大的是(

)A.平均數 B.中位數 C.極差 D.方差3.(2024·浙江·三模)(多選)已知a,,有一組樣本數據為,3,,,8,10,,12,13,若在這組數據中再插入一個數8,則(

)A.平均數不變 B.中位數不變 C.方差不變 D.極差不變考點十、總體離散程度的估計1.(2024·陜西商洛·模擬預測)設一組樣本數據的平均值是1,且的平均值是3,則數據的方差是(

)A.1 B.2 C.3 D.42.(2024·黑龍江哈爾濱·模擬預測)已知有4個數據的平均值為5,方差為4,現加入數據6和10,則這6個數據的新方差為(

)A. B. C.6 D.103.(2021·全國·高考真題)(多選)下列統(tǒng)計量中,能度量樣本的離散程度的是(

)A.樣本的標準差 B.樣本的中位數C.樣本的極差 D.樣本的平均數4.(2021·全國·高考真題)(多選)有一組樣本數據,,…,,由這組數據得到新樣本數據,,…,,其中(為非零常數,則(

)A.兩組樣本數據的樣本平均數相同B.兩組樣本數據的樣本中位數相同C.兩組樣本數據的樣本標準差相同D.兩組樣本數據的樣本極差相同5.(2023·全國·高考真題)某廠為比較甲乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為,.試驗結果如下:試驗序號12345678910伸縮率545533551522575544541568596548伸縮率536527543530560533522550576536記,記的樣本平均數為,樣本方差為.(1)求,;(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高(如果,則認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高,否則不認為有顯著提高)6.(2021·全國·高考真題)某廠研制了一種生產高精產品的設備,為檢驗新設備生產產品的某項指標有無提高,用一臺舊設備和一臺新設備各生產了10件產品,得到各件產品該項指標數據如下:舊設備9.810.310.010.29.99.810.010.110.29.7新設備10.110.410.110.010.110.310.610.510.410.5舊設備和新設備生產產品的該項指標的樣本平均數分別記為和,樣本方差分別記為和.(1)求,,,;(2)判斷新設備生產產品的該項指標的均值較舊設備是否有顯著提高(如果,則認為新設備生產產品的該項指標的均值較舊設備有顯著提高,否則不認為有顯著提高).1.(2024·新疆·二模)若數據的平均數為,方差為,則數據的方差為(

)A. B. C. D.2.(2024·江蘇泰州·模擬預測)(多選)已知,有一組數據為,3,,,8,10,,12,13,若在這組數據中去除第5個數8,則(

)A.平均數不變 B.中位數不變 C.方差不變 D.極差不變3.(2024·云南·模擬預測)某學校高三年級男生共有個,女生共有個,為調查該年級學生的年齡情況,通過分層抽樣,得到男生和女生樣本數據的平均數和方差分別為和,已知,則該校高三年級全體學生年齡的方差為(

)A. B.C. D.14.(2024·遼寧·模擬預測)某工廠為了提高精度,采購了一批新型機器,現對這批機器的生產效能進行測試,對其生產的第一批零件的內徑進行測量,統(tǒng)計繪制了如下圖所示的頻率分布直方圖.

(1)求a的值以及這批零件內徑的平均值和方差(同一組中的數據用該組區(qū)間的中點值作代表);(2)以頻率估計概率,若在這批零件中隨機抽取4個,記內徑在區(qū)間內的零件個數為,求的分布列以及數學期望;(3)已知這批零件的內徑(單位:mm)服從正態(tài)分布,現以頻率分布直方圖中的平均數作為的估計值,頻率分布直方圖中的標準差作為的估計值,則在這批零件中隨機抽取200個,記內徑在區(qū)間上的零件個數為,求的方差.參考數據:,若,則,,.5.(2024·湖北武漢·模擬預測)四月的武漢被百萬株薔薇花覆蓋,形成了全城的花海景觀。薔薇花一般扦插繁殖,園林局為了更好的了解扦插枝條的長度對繁殖狀況的影響,選擇甲乙兩區(qū)按比例分層抽樣來抽取樣本.已知甲區(qū)的樣本容量,樣本平均數,樣本方差;乙區(qū)的樣本容量,樣本平均數,樣本方差.(1)求由兩區(qū)樣本組成的總樣本的平均數及其方差;(結果保留一位小數)(2)為了營造“花在風中笑,人在畫中游”的美景,甲乙兩區(qū)決定在各自最大的薔薇花海公園進行一次書畫比賽,兩區(qū)各派一支代表隊參加,經抽簽確定第一場在甲區(qū)舉行.比賽規(guī)則如下:每場比賽分出勝負,沒有平局,勝方得1分,負方得0分,下一場在負方舉行,先得2分的代表隊獲勝,比賽結束.當比賽在甲區(qū)舉行時,甲區(qū)代表隊獲勝的概率為,當比賽在乙區(qū)舉行時,甲區(qū)代表隊獲勝的概率為.假設每場比賽結果相互獨立.甲區(qū)代表隊的最終得分記為X,求X的分布列及的值.參考數據:.考點十一、成對數據的統(tǒng)計相關性1.(2024·上?!じ呖颊骖})已知氣候溫度和海水表層溫度相關,且相關系數為正數,對此描述正確的是(

)A.氣候溫度高,海水表層溫度就高B.氣候溫度高,海水表層溫度就低C.隨著氣候溫度由低到高,海水表層溫度呈上升趨勢D.隨著氣候溫度由低到高,海水表層溫度呈下降趨勢2.(2023·天津·高考真題)鳶是鷹科的一種鳥,《詩經·大雅·旱麓》曰:“鳶飛戾天,魚躍余淵”.鳶尾花因花瓣形如鳶尾而得名,寓意鵬程萬里、前途無量.通過隨機抽樣,收集了若干朵某品種鳶尾花的花萼長度和花瓣長度(單位:cm),繪制散點圖如圖所示,計算得樣本相關系數為,利用最小二乘法求得相應的經驗回歸方程為,根據以上信息,如下判斷正確的為(

)A.花瓣長度和花萼長度不存在相關關系B.花瓣長度和花萼長度負相關C.花萼長度為7cm的該品種鳶尾花的花瓣長度的平均值為D.若從樣本中抽取一部分,則這部分的相關系數一定是3.(2022·全國·高考真題)某地經過多年的環(huán)境治理,已將荒山改造成了綠水青山.為估計一林區(qū)某種樹木的總材積量,隨機選取了10棵這種樹木,測量每棵樹的根部橫截面積(單位:)和材積量(單位:),得到如下數據:樣本號i12345678910總和根部橫截面積0.040.060.040.080.080.050.050.070.070.060.6材積量0.250.400.220.540.510.340.360.460.420.403.9并計算得.(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關系數(精確到0.01);(3)現測量了該林區(qū)所有這種樹木的根部橫截面積,并得到所有這種樹木的根部橫截面積總和為.已知樹木的材積量與其根部橫截面積近似成正比.利用以上數據給出該林區(qū)這種樹木的總材積量的估計值.附:相關系數.4.(2020·全國·高考真題)某沙漠地區(qū)經過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數量有所增加.為調查該地區(qū)某種野生動物的數量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽樣的方法抽取20個作為樣區(qū),調查得到樣本數據(xi,yi)(i=1,2,…,20),其中xi和yi分別表示第i個樣區(qū)的植物覆蓋面積(單位:公頃)和這種野生動物的數量,并計算得,,,,.(1)求該地區(qū)這種野生動物數量的估計值(這種野生動物數量的估計值等于樣區(qū)這種野生動物數量的平均數乘以地塊數);(2)求樣本(xi,yi)(i=1,2,…,20)的相關系數(精確到0.01);(3)根據現有統(tǒng)計資料,各地塊間植物覆蓋面積差異很大.為提高樣本的代表性以獲得該地區(qū)這種野生動物數量更準確的估計,請給出一種你認為更合理的抽樣方法,并說明理由.附:相關系數r=,≈1.414.1.(23-24高三下·云南昆明·階段練習)兩個變量y與x的回歸模型中,分別選擇了4個不同模型,它們的決定系數如下,其中擬合效果最好的模型是(

)A.模型1(決定系數為0.97) B.模型2(決定系數為0.85)C.模型3(決定系數為0.40) D.模型4(決定系數為0.25)2.(2024·貴州貴陽·模擬預測)(多選)某廠近幾年陸續(xù)購買了幾臺A型機床,該型機床已投入生產的時間x(單位:年)與當年所需要支出的維修費用y(單位:萬元)有如下統(tǒng)計資料:x23456y2.23.85.56.57根據表中的數據可得到經驗回歸方程為.,則(

)A.y與x的樣本相關系數B.C.表中維修費用的第60百分位數為6D.該型機床已投入生產的時間為10年時,當年所需要支出的維修費用一定是12.38萬元3.(2024·江蘇宿遷·三模)(多選)為了研究y關于x的線性相關關系,收集了5對樣本數據(見表格),若已求得一元線性回歸方程為,則下列選項中正確的是(

)123451A.B.當時的殘差為C.樣本數據y的40百分位數為1D.去掉樣本點后,y與x的相關系數不會改變4.(2024·河南新鄉(xiāng)·模擬預測)氮氧化物是一種常見的大氣污染物,下圖為我國2015年至2023年氮氧化物排放量(單位:萬噸)的折線圖,其中年份代碼1~9分別對應年份2015~2023.已知,,,.(1)可否用線性回歸模型擬合與的關系?請分別根據折線圖和相關系數加以說明.(2)若根據所給數據建立回歸模型,可否用此模型來預測2024年和2034年我國的氮氧化物排放量?請說明理由.附:相關系數.考點十二、一元線性回歸模型及其應用1.(2024·上?!と#┰O一組成對數據的相關系數為r,線性回歸方程為,則下列說法正確的為(

).A.越大,則r越大 B.越大,則r越小C.若r大于零,則一定大于零 D.若r大于零,則一定小于零2.(2024·天津·二模)有人通過調查統(tǒng)計發(fā)現,兒子成年時的身高與父親的身高呈線性相關,且兒子成年時的身高(單位:)與父親的身高(單位:)的經驗回歸方程為,根據以上信息,下列判斷正確的為(

).A.兒子成年時的身高與父親的身高的樣本相關系數B.父親的身高為,兒子成年時的身高一定在到之間C.父親的身高每增加,兒子成年時的身高平均增加D.兒子在成年時的身高一般會比父親高3.(2024·山東棗莊·模擬預測)(多選)已知兩個變量y與x對應關系如下表:x12345y5m8910.5若y與x滿足一元線性回歸模型,且經驗回歸方程為,則(

)A.y與x正相關 B.C.樣本數據y的第60百分位數為8 D.各組數據的殘差和為04.(2024·陜西西安·二模)近年來我國新能源汽車行業(yè)蓬勃發(fā)展,新能源汽車不僅對環(huán)境保護具有重大的意義,而且還能夠減少對不可再生資源的開發(fā),是全球汽車發(fā)展的重要方向.“保護環(huán)境,人人有責”,在政府和有關企業(yè)的努力下,某地區(qū)近幾年新能源汽車的購買情況如下表所示:年份x20192020202120222023新能源汽車購買數量>(萬輛)0.400.701.101.501.80(1)計算與的相關系數(保留三位小數);(2)求關于的線性回歸方程,并預測該地區(qū)2025年新能源汽車購買數量.參考公式,,.參考數值:,.5.(2024·河北滄州·模擬預測)“南澳牡蠣”是我國地理標志產品,產量高、肉質肥、營養(yǎng)好,素有“海洋牛奶精品”的美譽.2024年該基地考慮增加人工投入,現有以往的人工投入增量x(人)與年收益增量y(萬元)的數據如下:人工投入增量x(人)234681013年收益增量y(萬元)13223142505658該基地為了預測人工投入增量為16人時的年收益增量,建立了y與x的兩個回歸模型:模型①:由最小二乘公式可求得y與x的線性回歸方程:;模型②:由散點圖的樣本點分布,可以認為樣本點集中在曲線:的附近,對人工投入增量x做變換,令,則,且有,,,.(1)(i)根據所給的統(tǒng)計量,求模型②中y關于x的回歸方程(精確到0.1);(ii)根據下列表格中的數據,比較兩種模型的決定系數,并選擇擬合精度更高、更可靠的模型,預測人工投入增量為16人時的年收益增量.回歸模型模型①模型②回歸方程182.479.2(2)根據養(yǎng)殖規(guī)模與以往的養(yǎng)殖經驗,產自某南澳牡蠣養(yǎng)殖基地的單個“南澳牡蠣”質量(克)在正常環(huán)境下服從正態(tài)分布.購買10只該基地的“南澳牡蠣”,會買到質量小于20g的牡蠣的可能性有多大?附:若隨機變量,則,;樣本的最小二乘估計公式為:,,.1.(2024·上海徐匯·二模)為了研究y關于x的線性相關關系,收集了5組樣本數據(見下表):x12345y0.50.911.11.5若已求得一元線性回歸方程為,則下列選項中正確的是(

)A.B.當時,y的預測值為2.2C.樣本數據y的第40百分位數為1D.去掉樣本點后,x與y的樣本相關系數r不會改變2.(2024·河北·一模)某校為了解本校高一男生身高和體重的相關關系,在該校高一年級隨機抽取了7名男生,測量了他們的身高和體重得下表:身高(單位:167173175177178180181體重(單位:90545964677276由表格制作成如圖所示的散點圖:

由最小二乘法計算得到經驗回歸直線的方程為,其相關系數為;經過殘差分析,點對應殘差過大,把它去掉后,再用剩下的6組數據計算得到經驗回歸直線的方程為,相關系數為.則下列選項正確的是(

)A.B.C.D.3.(2024·甘肅隴南·一模)(多選)某廠近幾年陸續(xù)購買了幾臺A型機床,該型機床已投入生產的時間x(單位:年)與當年所需要支出的維修費用y(單位:萬元)有如下統(tǒng)計資料:x23456y2.23.85.56.57根據表中的數據可得到經驗回歸方程為.則(

)A.B.y與x的樣本相關系數C.表中維修費用的第60百分位數為6D.該型機床已投入生產的時間為10年時,當年所需要支出的維修費用一定是12.38萬元4.(2024·全國·模擬預測)腦機接口,即指在人或動物大腦與外部設備之間創(chuàng)建的直接連接,實現腦與設備的信息交換.近日埃隆.馬斯克宣布,腦機接口公司Neuralink正在接收第二位植入者申請,該試驗可以實現意念控制手機和電腦.未來10到20年,我國腦機接口產業(yè)將產生數百億元的經濟價值.為了適應市場需求,同時兼顧企業(yè)盈利的預期,某科技公司決定增加一定數量的研發(fā)人員,經過調研,得到年收益增量(單位:億元)與研發(fā)人員增量(人)的10組數據.現用模型①,②分別進行擬合,由此得到相應的經驗回歸方程,并進行殘差分析,得到如圖所示的殘差圖.根據收集到的數據,計算得到下表數據,其中.7.52.2582.504.5012.142.88(1)根據殘差圖,判斷應選擇哪個模型;(無需說明理由)(2)根據(1)中所選模型,求出關于的經驗回歸方程;并用該模型預測,要使年收益增量超過8億元,研發(fā)人員增量至少多少人?(精確到1)附:對于一組具有線性相關關系的數據,其經驗回歸直線的斜率和截距的最小二乘估計分別為5.(2024·江西九江·三模)車胎凹槽深度是影響汽車剎車的因素,汽車行駛會導致輪胎胎面磨損.某實驗室通過實驗測得轎車行駛里程與某品牌輪胎凹槽深度的數據,如下表所示:行駛里程萬0.00.41.01.62.42.83.44.4輪胎凹槽深度8.07.87.26.25.64.84.44.0(1)求該品牌輪胎凹槽深度與行駛里程的相關系數,并判斷二者之間是否具有很強的線性相關性;(結果保留兩位有效數字)(2)根據我國國家標準規(guī)定:轎車輪胎凹槽安全深度為(當凹槽深度低于時剎車距離增大,駕駛風險增加,必須更換新輪胎).某人在保養(yǎng)汽車時將小轎車的輪胎全部更換成了該品牌的新輪胎,請問在正常行駛情況下,更換新輪胎后繼續(xù)行駛約多少公里需對輪胎再次更換?附:變量與的樣本相關系數;對于一組數據,,其線性回歸方程的斜率和截距的最小二乘估計分別為:.考點十三、列聯表與獨立性檢驗1.(2024·江蘇鹽城·模擬預測)根據分類變量Ⅰ與Ⅱ的統(tǒng)計數據,計算得到,則(

)0.10.050.010.0050.0012.7063.8416.6357.87910.828A.變量Ⅰ與Ⅱ相關B.變量Ⅰ與Ⅱ相關,這個結論犯錯誤的概率不超過0.1C.變量Ⅰ與Ⅱ不相關D.變量Ⅰ與Ⅱ不相關,這個結論犯錯誤的概率不超過0.12.(2024·廣東江門·模擬預測)(多選)某中學為更好的開展素質教育,現對外出研學課程是否和性別有關做了一項調查,其中被調查的男生和女生人數相同,且男生中選修外出研學課程的人數占男生總人數的,女生中選修外出研學課程的人數占女生總人數的.若依據的獨立性檢驗,可以認為“選修外出研學課程與性別有關”.則調查人數中男生可能有(

)男生女生合計選修外出研學課程未選修外出研學課程合計附:,其中A.150人 B.225人 C.300人 D.375人3.(2024·湖南益陽·一模)某公園為了提升公園形象,提高游客旅游的體驗感,他們更新了部分設施,調整了部分旅游線路.為了解游客對新措施是否滿意,隨機抽取了100名游客進行調查,男游客與女游客的人數之比為2:3,其中男游客有35名滿意,女游客有15名不滿意.滿意不滿意總計男游客35女游客15合計100(1)完成列聯表,依據表中數據,以及小概率值的獨立性檢驗,能否認為游客對公園新措施滿意與否與性別有關?(2)從被調查的游客中按男、女分層抽樣抽取5名游客.再隨機從這5名游客中抽取3名游客征求他們對公園進一步提高服務質量的建議,其中抽取男游客的人數為.求出的分布列及數學期望.參考公式:,其中.參考數據:0.100.050.0100.0052.7063.8416.6357.8791.(2024·四川成都·三模)有甲、乙兩個班級進行數學考試,按照大于等于85分為優(yōu)秀,85分以下為非優(yōu)秀統(tǒng)計成績,得到如下所示的列聯表:優(yōu)秀非優(yōu)秀甲班10乙班30附:(),0.050.0250.0100.0053.8415.0246.6357.879已知在全部105人中隨機抽取1人,成績優(yōu)秀的概率為,則下列說法正確的是(

)A.甲班人數少于乙班人數B.甲班的優(yōu)秀率高于乙班的優(yōu)秀率C.表中的值為15,的值為50D.根據表中的數據,若按的可靠性要求,能認為“成績與班級有關系”2.(2024·福建南平·模擬預測)(多選)2023年10月全國多地醫(yī)院出現較多的支原體肺炎感染患者,患者多以兒童為主.某研究所在某小學隨機抽取了46名兒童,得到他們是否接種流感疫苗和是否感染支原體肺炎的情況的相關數據,如下表所示,則(

)感染情況接種情況感染支原體肺炎未感染支原體肺炎合計接種流感疫苗未接種流感疫苗合計46附:.0.10.050.010.0050.0012.7063.8416.6357.87910.828A.B.C.認為是否接種流感疫苗與是否感染支原體肺炎有關聯,此推斷犯錯的概率不大于0.1D.沒有充分的證據推斷是否接種流感疫苗與是否感染支原體肺炎有關聯3.(2024·廣東佛山·模擬預測)某區(qū)中考體育科目有必選項目和選考項目,其中籃球為一個選考項目.該區(qū)體育老師為了了解初中學生的性別和喜歡籃球是否有關,隨機調查了該區(qū)1000名初中學生,得到成對樣本數據的分類統(tǒng)計結果,如下表所示:性別是否喜歡籃球合計喜歡不喜歡男生450150600女生150250400合計6004001000(1)依據的獨立性檢驗,能否認為該區(qū)初中學生的性別與喜歡籃球有關聯;(2)用按性別比例分配的分層隨機抽樣的方法從參與調查的喜歡籃球的600名初中學生中抽取8名學生做進一步調查,將這8名學生作為一個樣本,從中隨機抽取3人,用X表示隨機抽取的3人中女生的人數,求X的分布列和數學期望.附:參考數據,其中.0.10.050.010.0050.0012.7063.8416.6357.87910.828一、單選題1.(2024·四川南充·一模)甲同學近10次數學考試成績情況如下:103,106,113,119,123,118,134,118,125,121,則甲同學數學考試成績的第75百分位數是(

)A.118 B.121 C.122 D.1232.(2024·廣東珠?!つM預測)下列說法正確的是(

)A.一組數據的標準差為0,則這組數據中的數均相等B.兩組數據的標準差相等,則這兩組數據的平均數相等C.若兩個變量的相關系數越接近于0,則這兩個變量的相關性越強D.已知變量,由它們的樣本數據計算得到的觀測值的部分臨界值如下表:0.10.050.0250.012.7063.8415.0246.635則在犯錯誤的概率不超過0.025的前提下認為變量沒有關系3.(2024·江蘇蘇州·模擬預測)設研究某兩個屬性變量時,作出零假設并得到2×2列聯表,計算得,則下列說法正確的是(

)A.有99.5%的把握認為不成立 B.有5%的把握認為的反面正確C.有95%的把握判斷正確 D.有95%的把握能反駁4.(2024·安徽蕪湖·模擬預測)下列說法正確的是(

)A.若隨機變量,則當較小時,對應的正態(tài)曲線“矮胖”,隨機變量X的分布比較分散B.在做回歸分析時,可以用決定系數刻畫模型回歸效果,越小,說明模型擬合的效果越好C.一元線性回歸模型中,如果相關系數,表明兩個變量的相關程度很強D.在列聯表中,若所有數據均變成原來的2倍,則不變(,其中)二、多選題5.(2024·海南??凇つM預測)某校為了解學生的身體狀況,隨機抽取了50名學生測量體重,經統(tǒng)計,這些學生的體重數據(單位:千克)全部介于45至70之間,將數據整理得到如圖所示的頻率分布直方圖,則(

)A.頻率分布直方圖中的值為0.04B.這50名學生體重的眾數約為52.5C.該校學生體重的上四分位數約為61.25D.這50名學生中體重不低于65千克的人數約為106.(2024·湖北武漢·模擬預測)某科技公司統(tǒng)計了一款App最近5個月的下載量如表所示,若與線性相關,且線性回歸方程為,則(

)月份編號12345下載量(萬次)54.543.52.5A.與負相關 B.C.預測第6個月的下載量是2.1萬次 D.殘差絕對值的最大值為0.27.(2024·江西新余·模擬預測)已知對個數據做如下變換:當為奇數時,對應的變?yōu)?;當為偶數時,對應的變?yōu)?,則對于該組數據的變化,下列情況中可能發(fā)生的是:(

).A.平均數增大 B.方差不變C.分位數減小 D.眾數減小三、填空題8.(2024·四川成都·模擬預測)已知關于x的一組數據:x1m345y0.50.6n1.31.4根據表中數據得到的線性回歸直線方程為,則的值.四、解答題9.(2024·浙江嘉興·二模)為了有效預防流感,很多民眾注射了流感疫苗.市防疫部門隨機抽取了1000人進行調查,發(fā)現其中注射疫苗的800人中有220人感染流感,另外沒注射疫苗的200人中有80人感染流感.醫(yī)學研究表明,流感的檢測結果有檢錯的可能,已知患流感的人其檢測結果有呈陽性(流感),而沒有患流感的人其檢測結果有呈陰性(未感染)(1)估計該市流感感染率是多少?(2)根據所給的數據,判斷是否有99%的把握認為注射流感疫苗與預防流感有關;(3)已知某人的流感檢查結果呈陽性,求此人真的患有流感的概率.(精確到0.001)附:.0.0500.0100.001k3.8416.63510.82810.(2024·陜西安康·模擬預測)某乒乓球訓練機構以訓練青少年為主,其中有一項打定點訓練,就是把乒乓球打到對方球臺的指定位置(稱為“準點球”),在每周末,記錄每個接受訓練的學員在訓練時打的所有球中“準點球”的百分比(),A學員已經訓練了1年,下表記錄了學員最近七周“準點球”的百分比:周次(x)12345675252.853.55454.554.955.3若.(1)根據上表數據,計算與的相關系數,并說明與的線性相關性的強弱;(若,則認為與線性相關性很強;若,則認為與線性相關性一般;若,則認為與線性相關性較弱)(精確到)(2)求關于的回歸方程,并預測第周“準點球”的百分比.(精確到)參考公式和數據:,,.一、單選題1.(2024·江蘇鎮(zhèn)江·三模)命題P:的平均數與中位數相等;命題Q:是等差數列,則P是Q的(

)A.充分不必要條件 B.必要不充分條件C.充要條件 D.既不充分也不必要條件2.(2024·江西新余·模擬預測)已知一組數據大致呈線性分布,其回歸直線方程為,則的最小值為(

).A. B. C. D.無法確定3.(2024·吉林·模擬預測)設樣本數據,,…,的平均數為,標準差為,若樣本數據,,…,的平均數比標準差少3,則的最大值為(

)A.1 B. C.4 D.二、多選題4.(2024·湖南邵陽·三模)為了解一片經濟林的生長情況,隨機抽取了其中60株樹木,測量底部周長(單位:cm),所得數據均在區(qū)間內,其頻率分布直方圖如圖所示,則(

)A.圖中的值為0.025B.樣本中底部周長不小于110cm的樹木有12株C.估計該片經濟林中樹木的底部周長的分位數為115D.估計該片經濟林中樹木的底部周長的平均數為104(每組數據用該組所在區(qū)間的中點值作代表)5.(2024·遼寧·模擬預測)已知由樣本數據組成的一個樣本,得到回歸直線方程為,且,去除兩個歧義點和后,得到新的回歸直線的回歸系數為2.5,則下列說法正確的是(

)A.相關變量具有正相關關系B.去除兩個歧義點后,隨值增加相關變量值增加速度變小C.去除兩個歧義點后,重新求得回歸方程對應的直線一定過點D.去除兩個歧義點后,重新求得的回歸直線方程為6.(2024·吉林長春·模擬預測)已知變量x和變量y的一組成對樣本數據()的散點落在一條直線附近,,,相關系數為,線性回歸方程為,則(

)A.當越大時,成對樣本數據的線性相關程度越強B.當時,C.,時,成對樣本數據()的相關系數滿足D.時,成對樣本數據()的線性回歸方程滿足參考公式:7.(2024·福建·模擬預測)已知一組數據的平均數、中位數、眾數依次成等差數列,現在丟失了其中一個數據,另外六個數據分別是7,9,10,7,15,7.將丟失數據的所有可能值從小到大排列成數列an,記,則(

)A. B.C.an是等差數列 D.a8.(2024·湖北·模擬預測)已知互不相同的20個樣本數據,若去掉其中最大和最小的數據,設剩下的18個樣本數據的方差為,平均數;去掉的兩個數據的方差為,平均數;原樣本數據的方差為,平均數,若,則(

)A.B.C.剩下18個數據的中位數大于原樣本數據的中位數D.剩下18個數據的分位數不等于原樣本數據的分位數三、解答題9.(2024·海南??凇つM預測)制定適合自己的學習計劃并在學習過程中根據自己的實際情況有效地安排和調整學習方法是一種有效的學習策略.某教師為研究學生制定學習計劃并堅持實施和數學成績之間的關系,得到如下數據:成績分成績分合計制定學習計劃并堅持實施沒有制定學習計劃合計50(1)依據小概率值的獨立性檢驗,能否認為“制定學習計劃并堅持實施”和“數學成績高于分”有關聯?(2)若該校高三年級每月進行一次月考,該校學生小明在高三開學初認真制定了學習計劃,其中一項要求自己每天要把錯題至少重做一遍,做對為止.以下為小明堅持實施計劃的月份和他在學校數學月考成績的校內名次數據:月考時間月初月初次年月初次年月初次年月初時間代碼月考校內名次參考數據:,.(?。┣笤驴夹让闻c時間代碼的線性回歸方程;(ⅱ)該校老師給出了上一年該校學生高考(月初考試)數學成績在校內的名次和在全省名次的部分數據:校內名次全省名次利用數據分析軟件,根據以上數據得出了兩個回歸模型和決定系數:模型①模型②在以上兩個模型中選擇“較好”模型(說明理由),并結合問題(?。┑幕貧w方程,依據“較好”模型預測小明如果能堅持實施學習計劃,他在次年高考中數學成績的全省名次(名次均保留整數).(參考數據:,,)附:(ii),其中.(i)對于一組數據,其回歸直線的斜率和截距的最小二乘估計分別為:,.10.(2024·江蘇無錫·模擬預測)由于人們對工業(yè)高度發(fā)達的負面影響預料不夠,預防不利,導致了全球性的三大危機:資源短缺、環(huán)境污染、生態(tài)破壞環(huán)境污染指自然的或人為的破壞,向環(huán)境中添加某種物質而超過環(huán)境的自凈能力而產生危害的行為或由于人為的因素,環(huán)境受到有害物質的污染,使生物的生長繁殖和人類的正常生活受到有害影響由于人為因素使環(huán)境的構成或狀態(tài)發(fā)生變化,環(huán)境質量下降,從而擾亂和破壞了生態(tài)系統(tǒng)和人類的正常生產和生活條件的現象據研究,某種污染物具有極強的污染力,現在對這種污染物的污染力進行調查研究,通過實驗調查,可以得到某地區(qū)該污染物到來后的污染時間小時與該污染物的污染面積平方米的一些數據如下:通過分析可知,數據與之間存在很強的線性回歸關系.(1)求出與之間的關系式;(2)根據中的關系式,該污染物到來后的污染時間是多少時,該污染物的污染面積的平均增長最慢?參考公式:對于一組數據,其回歸直線的斜率和截距的最小二乘估計分別,..1.(2024·天津·高考真題)下列圖中,線性相關性系數最大的是(

)A. B.C. D.2.(2024·全國·高考真題)某工廠進行生產線智能化升級改造,升級改造后,從該工廠甲、乙兩個車間的產品中隨機抽取150件進行檢驗,數據如下:優(yōu)級品合格品不合格品總計甲車間2624050乙車間70282100總計96522150(1)填寫如下列聯表:優(yōu)級品非優(yōu)級品甲車間乙車間能否有的把握認為甲、乙兩車間產品的優(yōu)級品率存在差異?能否有的把握認為甲,乙兩車間產品的優(yōu)級品率存在差異?(2)已知升級改造前該工廠產品的優(yōu)級品率,設為升級改造后抽取的n件產品的優(yōu)級品率.如果,則認為該工廠產品的優(yōu)級品率提高了,根據抽取的150件產品的數據,能否認為生產線智能化升級改造后,該工廠產品的優(yōu)級品率提高了?()附:0.0500.0100.001k3.8416.63510.8283.(2024·上?!じ呖颊骖})為了解某地初中學生體育鍛煉時長與學業(yè)成績的關系,從該地區(qū)29000名學生中抽取580人,得到日均體育鍛煉時長與學業(yè)成績的數據如下表所示:時間范圍學業(yè)成績優(yōu)秀5444231不優(yōu)秀1341471374027(1)該地區(qū)29000名學生中體育鍛煉時長不少于1小時人數約為多少?(2)估計該地區(qū)初中學生日均體育鍛煉的時長(精確到0.1)(3)是否有的把握認為學業(yè)成績優(yōu)秀與日均體育鍛煉時長不小于1小時且小于2小時有關?(附:其中,.)4.(2023·全國·高考真題)一項試驗旨在研究臭氧效應,試驗方案如下:選40只小白鼠,隨機地將其中20只分配到試驗組,另外20只分配到對照組,試驗組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:g).試驗結果如下:對照組的小白鼠體重的增加量從小到大排序為15.2

18.8

20.2

21.3

22.5

23.2

25.8

26.5

27.5

30.132.6

34.3

34.8

35.6

35.6

35.8

36.2

37.3

40.5

43.2試驗組的小白鼠體重的增加量從小到大排序為7.8

9.2

11.4

12.4

13.2

15.5

16.5

18.0

18.8

19.219.8

20.2

21.6

22.8

23.6

23.9

25.1

28.2

32.3

36.5(1)計算試驗組的樣本平均數;(2)(?。┣?0只小白鼠體重的增加量的中位數m,再分別統(tǒng)計兩樣本中小于m與不小于m的數據的個數,完成如下列聯表對照組試驗組(ⅱ)根據(i)中的列聯表,能否有95%的把握認為小白鼠在高濃度臭氧環(huán)境中與在正常環(huán)境中體重的增加量有差異?附:,0.1000.0500.0102.7063.8416.6355.(2023·全國·高考真題)一項試驗旨在研究臭氧效應.實驗方案如下:選40只小白鼠,隨機地將其中20只分配到實驗組,另外20只分配到對照組,實驗組的小白鼠飼養(yǎng)在高濃度臭氧環(huán)境,對照組的小白鼠飼養(yǎng)在正常環(huán)境,一段時間后統(tǒng)計每只小白鼠體重的增加量(單位:g).(1)設表示指定的兩只小白鼠中分配到對照組的只數,求的分布列和數學期望;(2)實驗結果如下:對照組的小白鼠體重的增加量從小到大排序為:15.2

18.8

20.2

21.3

22.5

23.2

25.8

26.5

27.5

30.132.6

34.3

34.8

35.6

35.6

35.8

36.2

37.3

40.5

43.2實驗組的小白鼠體重的增加量從小到大排序為:7.8

9.2

11.4

12.4

13.2

15.5

16.5

18.0

18.8

19.219.8

20.2

21.6

22.8

23.6

23.9

25.1

28.2

32.3

36.5(i)求40只小鼠體重的增加量的中位數m,再分別統(tǒng)計兩樣本中小于m與不小于的數據的個數,完成如下列聯表:對照組實驗組(ii)根據(i)中的列聯表,能否有95%的把握認為小白鼠在高濃度臭氧環(huán)境中與正常環(huán)境中體重的增加量有差異.附:0.1000.0500.0102.7063.8416.6356.(2023·全國·高考真題)某廠為比較甲乙兩種工藝對橡膠產品伸縮率的處理效應,進行10次配對試驗,每次配對試驗選用材質相同的兩個橡膠產品,隨機地選其中一個用甲工藝處理,另一個用乙工藝處理,測量處理后的橡膠產品的伸縮率.甲、乙兩種工藝處理后的橡膠產品的伸縮率分別記為,.試驗結果如下:試驗序號12345678910伸縮率545533551522575544541568596548伸縮率536527543530560533522550576536記,記的樣本平均數為,樣本方差為.(1)求,;(2)判斷甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率是否有顯著提高(如果,則認為甲工藝處理后的橡膠產品的伸縮率較乙工藝處理后的橡膠產品的伸縮率有顯著提高,否則不認為有顯著提高)7.(2022·北京·高考真題)在北京冬奧會上,國家速滑館“冰絲帶”使用高效環(huán)保的二氧化碳跨臨界直冷制冰技術,為實現綠色冬奧作出了貢獻.如圖描述了一定條件下二氧化碳所處的狀態(tài)與T和的關系,其中T表示溫度,單位是K;P表示壓強,單位是.下列結論中正確的是(

)A.當,時,二氧化碳處于液態(tài)B.當,時,二氧化碳處于氣態(tài)C.當,時,二氧化碳處于超臨界狀態(tài)D.當,時,二氧化碳處于超臨界狀態(tài)8.(2022·全國·高考真題)某社區(qū)通過公益講座以普及社區(qū)居民的垃圾分類知識.為了解講座效果,隨機抽取10位社區(qū)居民,讓他們在講座前和講座后各回答一份垃圾分類知識問卷,這10位社區(qū)居民在講座前和講座后問卷答題的正確率如下圖:則(

)A.講座前問卷答題的正確率的中位數小于B.講座后問卷答題的正確率的平均數大于C.講座前問卷答題的正確率的標準差小于講座后正確率的標準差D.講座后問卷答題的正確率的極差大于講座前正確率的極差9.(2022·全國·高考真題)甲、乙兩城之間的長途客車均由A和B兩家公司運營,為了解這兩家公司長途客車的運行情況,隨機調查了甲、乙兩城之間的500個班次,得到下面列聯表:準點班次數未準點班次數A24020B21030(1)根據上表,分別估計這兩家公司甲、乙兩城之間的長途客車準點的概率;(2)能否有90%的把握認為甲、乙兩城之間的長途客車是否準點與客車所屬公司有關?附:,0.1000.0500.0102.7063.8416.63510.(2022·全國·高考真題)一醫(yī)療團隊為研究某地的一種地方性疾病與當地居民的衛(wèi)生習慣(衛(wèi)生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查了100例(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照組),得到如下數據:不夠良好良好病例組4060對照組1090(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛(wèi)生習慣有差異?(2)從該地的人群中任選一人,A表示事件“選到的人衛(wèi)生習慣不夠良好”,B表示事件“選到的人患有該疾病”.與的比值是衛(wèi)生習慣不夠良好對患該疾病風險程度的一項度量指標,記該指標為R.(?。┳C明:;(ⅱ)利用該調查數據,給出的估計值,并利用(?。┑慕Y果給出R的估計值.附,0.0500.0100.001k3.8416.63510.82811.(2021·全國·高考真題)甲、乙兩臺機床生產同種產品,產品按質量分為一級品和二級品,為了比較兩臺機床產品的質量,分別用兩臺機床各生產了200件產品,產品的質量情況統(tǒng)計如下表:一級品二級品合計甲機床15050200乙機床12080200合計270130400(1)甲機床、乙機床生產的產品中一級品的頻率分別是多少?(2)能否有99%的把握認為甲機床的產品質量與乙機床的產品質量有差異?附:0.0500.0100.001k3.8416.63510.82812.(2020·江蘇·高考真題)已知一組數據的平均數為4,則的值是.13.(2020·全國·高考真題)在一組樣本數據中,1,2,3,4出現的頻率分別為,且,則下面四種情形中,對應樣本的標準差最大的一組是(

)A. B.C. D.14.(2020·全國·高考真題)設一組樣本數據x1,x2,…,xn的方差為0.01,則數據10x1,10x2,…,10xn的方差為(

)A.0.01 B.0.1 C.1 D.1015.(2020·全國·高考真題)某校一個課外學習小組為研究某作物種子的發(fā)芽率y和溫度x(單位:°C)的關系,在20個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數據得到下面的散點圖:由此散點圖,在10°C至40°C之間,下面四個回歸方程類型中最適宜作為發(fā)芽率y和溫度x的回歸方程類型的是(

)A. B.C. D.16.(2020·海南·高考真題)我國新冠肺炎疫情進入常態(tài)化,各地有序推進復工復產,下面是某地連續(xù)11天復工復產指數折線圖,下列說法正確的是A.這11天復工指數和復產指數均逐日增加;B.這11天期間,復產指數增量大于復工指數

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論