




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
2025年統(tǒng)計(jì)學(xué)專業(yè)期末考試:數(shù)據(jù)分析計(jì)算題庫與數(shù)據(jù)清洗技術(shù)試題考試時(shí)間:______分鐘總分:______分姓名:______一、數(shù)據(jù)描述性統(tǒng)計(jì)要求:運(yùn)用描述性統(tǒng)計(jì)方法,對(duì)給定數(shù)據(jù)集進(jìn)行描述性統(tǒng)計(jì),包括計(jì)算均值、中位數(shù)、眾數(shù)、標(biāo)準(zhǔn)差、方差、極差、四分位數(shù)等。1.某班級(jí)學(xué)生身高數(shù)據(jù)(單位:cm)如下:162,168,166,165,167,169,171,168,167,170,169,168,166,167,169,170,168,168,167,167,168。請(qǐng)計(jì)算以下指標(biāo):(1)均值(2)中位數(shù)(3)眾數(shù)(4)標(biāo)準(zhǔn)差(5)方差(6)極差(7)第一四分位數(shù)(8)第三四分位數(shù)2.某城市某月每日最高氣溫?cái)?shù)據(jù)(單位:℃)如下:27,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47。請(qǐng)計(jì)算以下指標(biāo):(1)均值(2)中位數(shù)(3)眾數(shù)(4)標(biāo)準(zhǔn)差(5)方差(6)極差(7)第一四分位數(shù)(8)第三四分位數(shù)3.某城市某月每日降雨量數(shù)據(jù)(單位:mm)如下:0,5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95。請(qǐng)計(jì)算以下指標(biāo):(1)均值(2)中位數(shù)(3)眾數(shù)(4)標(biāo)準(zhǔn)差(5)方差(6)極差(7)第一四分位數(shù)(8)第三四分位數(shù)二、數(shù)據(jù)可視化要求:運(yùn)用數(shù)據(jù)可視化方法,對(duì)給定數(shù)據(jù)集進(jìn)行可視化展示,包括繪制直方圖、散點(diǎn)圖、折線圖、餅圖等。4.某班級(jí)學(xué)生成績(jī)數(shù)據(jù)(單位:分)如下:90,92,85,88,95,90,87,93,89,86,91,94,88,90,92,89,87,91,93,89。請(qǐng)繪制以下圖形:(1)直方圖,展示成績(jī)分布情況(2)散點(diǎn)圖,展示成績(jī)與班級(jí)平均成績(jī)的關(guān)系(3)折線圖,展示成績(jī)隨時(shí)間的變化趨勢(shì)5.某公司某季度銷售額數(shù)據(jù)如下:100萬,120萬,150萬,180萬,200萬,220萬,250萬,280萬,300萬,320萬。請(qǐng)繪制以下圖形:(1)餅圖,展示各季度銷售額占比(2)折線圖,展示銷售額隨時(shí)間的變化趨勢(shì)6.某城市某月每日空氣質(zhì)量指數(shù)數(shù)據(jù)如下:100,80,90,60,70,80,50,60,70,80,90,100,110,120,130,140,150,160,170。請(qǐng)繪制以下圖形:(1)直方圖,展示空氣質(zhì)量指數(shù)分布情況(2)散點(diǎn)圖,展示空氣質(zhì)量指數(shù)與天氣情況的關(guān)系(3)折線圖,展示空氣質(zhì)量指數(shù)隨時(shí)間的變化趨勢(shì)四、假設(shè)檢驗(yàn)要求:運(yùn)用假設(shè)檢驗(yàn)方法,對(duì)給定數(shù)據(jù)集進(jìn)行假設(shè)檢驗(yàn),包括單樣本t檢驗(yàn)、雙樣本t檢驗(yàn)、卡方檢驗(yàn)等。7.某公司聲稱其產(chǎn)品的平均使用壽命為500小時(shí),現(xiàn)隨機(jī)抽取10個(gè)產(chǎn)品進(jìn)行測(cè)試,得到使用壽命分別為:495,505,502,498,507,503,501,506,504,502。假設(shè)使用壽命服從正態(tài)分布,顯著性水平為0.05,請(qǐng)進(jìn)行單樣本t檢驗(yàn),判斷該產(chǎn)品的平均使用壽命是否顯著低于500小時(shí)。8.某兩種品牌的手機(jī)電池續(xù)航能力進(jìn)行比較,隨機(jī)抽取兩種品牌各10部手機(jī)進(jìn)行測(cè)試,得到續(xù)航能力數(shù)據(jù)如下(單位:小時(shí)):品牌A:4.5,4.7,4.6,4.8,4.9,4.7,4.5,4.6,4.7,4.8品牌B:4.3,4.4,4.5,4.6,4.7,4.8,4.9,5.0,4.6,4.7假設(shè)兩種品牌手機(jī)電池續(xù)航能力服從正態(tài)分布,且方差相等,顯著性水平為0.05,請(qǐng)進(jìn)行雙樣本t檢驗(yàn),判斷兩種品牌手機(jī)電池續(xù)航能力是否存在顯著差異。9.某班級(jí)學(xué)生的數(shù)學(xué)成績(jī)和英語成績(jī)?nèi)缦拢簲?shù)學(xué)成績(jī):70,80,90,60,70,80,90,60,70,80英語成績(jī):60,70,80,70,60,80,90,60,70,80假設(shè)數(shù)學(xué)成績(jī)和英語成績(jī)均服從正態(tài)分布,且方差相等,顯著性水平為0.05,請(qǐng)進(jìn)行卡方檢驗(yàn),判斷數(shù)學(xué)成績(jī)和英語成績(jī)是否獨(dú)立。五、回歸分析要求:運(yùn)用回歸分析方法,對(duì)給定數(shù)據(jù)集進(jìn)行回歸分析,包括線性回歸、多項(xiàng)式回歸等。10.某地區(qū)房?jī)r(jià)與面積的關(guān)系如下:面積(平方米):50,60,70,80,90,100,110,120,130,140房?jī)r(jià)(萬元):80,85,90,95,100,105,110,115,120,125請(qǐng)進(jìn)行線性回歸分析,建立房?jī)r(jià)與面積之間的關(guān)系模型。11.某地區(qū)居民收入與消費(fèi)水平的關(guān)系如下:收入(萬元):10,15,20,25,30,35,40,45,50,55消費(fèi)水平(萬元):8,12,18,22,28,33,38,43,48,53請(qǐng)進(jìn)行多項(xiàng)式回歸分析,建立收入與消費(fèi)水平之間的關(guān)系模型。12.某地區(qū)降水量與農(nóng)作物產(chǎn)量關(guān)系如下:降水量(毫米):100,150,200,250,300,350,400,450,500,550農(nóng)作物產(chǎn)量(噸):150,200,250,300,350,400,450,500,550,600請(qǐng)進(jìn)行線性回歸分析,建立降水量與農(nóng)作物產(chǎn)量的關(guān)系模型。六、時(shí)間序列分析要求:運(yùn)用時(shí)間序列分析方法,對(duì)給定數(shù)據(jù)集進(jìn)行時(shí)間序列分析,包括自回歸模型、移動(dòng)平均模型等。13.某地區(qū)某月平均氣溫?cái)?shù)據(jù)如下:1月:-5,2,5,8,10,12,15,18,20,232月:3,6,9,12,15,18,21,24,27,303月:6,9,12,15,18,21,24,27,30,33請(qǐng)建立自回歸模型,分析氣溫變化趨勢(shì)。14.某公司某月銷售額數(shù)據(jù)如下:1月:100,120,130,140,150,160,170,180,190,2002月:150,160,170,180,190,200,210,220,230,2403月:200,210,220,230,240,250,260,270,280,290請(qǐng)建立移動(dòng)平均模型,分析銷售額變化趨勢(shì)。15.某地區(qū)某月失業(yè)率數(shù)據(jù)如下:1月:5,6,7,8,9,10,11,12,13,142月:14,15,16,17,18,19,20,21,22,233月:23,24,25,26,27,28,29,30,31,32請(qǐng)建立自回歸模型,分析失業(yè)率變化趨勢(shì)。本次試卷答案如下:一、數(shù)據(jù)描述性統(tǒng)計(jì)1.(1)均值=(162+168+166+165+167+169+171+168+167+170+169+168+166+167+169+170+168+168+167+167+168)/20=168.1(2)中位數(shù)=168(3)眾數(shù)=168(4)標(biāo)準(zhǔn)差=√[Σ(x-μ)2/n]=√[Σ(x-168.1)2/20]≈2.9(5)方差=[Σ(x-μ)2/n]=[Σ(x-168.1)2/20]≈8.41(6)極差=最大值-最小值=171-162=9(7)第一四分位數(shù)=(162+166)/2=164(8)第三四分位數(shù)=(168+170)/2=1692.(1)均值=(27+29+30+31+32+33+34+35+36+37+38+39+40+41+42+43+44+45+46+47)/21=36.43(2)中位數(shù)=37(3)眾數(shù)=36(4)標(biāo)準(zhǔn)差=√[Σ(x-μ)2/n]=√[Σ(x-36.43)2/21]≈3.96(5)方差=[Σ(x-μ)2/n]=[Σ(x-36.43)2/21]≈15.87(6)極差=最大值-最小值=47-27=20(7)第一四分位數(shù)=(27+29)/2=28(8)第三四分位數(shù)=(36+37)/2=36.53.(1)均值=(0+5+10+15+20+25+30+35+40+45+50+55+60+65+70+75+80+85+90+95)/19=35.05(2)中位數(shù)=35(3)眾數(shù)=35(4)標(biāo)準(zhǔn)差=√[Σ(x-μ)2/n]=√[Σ(x-35.05)2/19]≈10.27(5)方差=[Σ(x-μ)2/n]=[Σ(x-35.05)2/19]≈106.28(6)極差=最大值-最小值=95-0=95(7)第一四分位數(shù)=(0+5)/2=2.5(8)第三四分位數(shù)=(35+40)/2=37.5二、數(shù)據(jù)可視化4.(1)直方圖:繪制直方圖可以直觀地展示成績(jī)的分布情況,橫軸為成績(jī)區(qū)間,縱軸為頻數(shù)。(2)散點(diǎn)圖:通過散點(diǎn)圖可以觀察成績(jī)與班級(jí)平均成績(jī)的關(guān)系,橫軸為班級(jí)平均成績(jī),縱軸為個(gè)人成績(jī)。(3)折線圖:折線圖可以展示成績(jī)隨時(shí)間的變化趨勢(shì),橫軸為時(shí)間,縱軸為成績(jī)。5.(1)餅圖:餅圖可以展示各季度銷售額占比,每個(gè)扇形區(qū)域代表一個(gè)季度的銷售額占比。(2)折線圖:折線圖可以展示銷售額隨時(shí)間的變化趨勢(shì),橫軸為時(shí)間,縱軸為銷售額。6.(1)直方圖:繪制直方圖可以展示空氣質(zhì)量指數(shù)的分布情況,橫軸為空氣質(zhì)量指數(shù)區(qū)間,縱軸為頻數(shù)。(2)散點(diǎn)圖:散點(diǎn)圖可以展示空氣質(zhì)量指數(shù)與天氣情況的關(guān)系,橫軸為天氣情況,縱軸為空氣質(zhì)量指數(shù)。(3)折線圖:折線圖可以展示空氣質(zhì)量指數(shù)隨時(shí)間的變化趨勢(shì),橫軸為時(shí)間,縱軸為空氣質(zhì)量指數(shù)。三、假設(shè)檢驗(yàn)7.(1)計(jì)算樣本均值=502.5,樣本標(biāo)準(zhǔn)差=3.5,樣本容量=10。(2)計(jì)算t值=(樣本均值-總體均值)/(樣本標(biāo)準(zhǔn)差/√樣本容量)=(502.5-500)/(3.5/√10)≈3.54。(3)查t分布表,自由度為9,顯著性水平為0.05,臨界值為1.833。(4)由于計(jì)算得到的t值大于臨界值,拒絕原假設(shè),認(rèn)為產(chǎn)品的平均使用壽命顯著低于500小時(shí)。8.(1)計(jì)算樣本均值A(chǔ)=4.7,樣本標(biāo)準(zhǔn)差A(yù)=0.3,樣本均值B=4.6,樣本標(biāo)準(zhǔn)差B=0.3。(2)計(jì)算t值=|(樣本均值A(chǔ)-樣本均值B)/√[(樣本標(biāo)準(zhǔn)差A(yù)2/樣本容量A)+(樣本標(biāo)準(zhǔn)差B2/樣本容量B)]|=|(4.7-4.6)/√[(0.32/10)+(0.32/10)]|≈1.47。(3)查t分布表,自由度為18,顯著性水平為0.05,臨界值為1.734。(4)由于計(jì)算得到的t值小于臨界值,不能拒絕原假設(shè),認(rèn)為兩種品牌手機(jī)電池續(xù)航能力不存在顯著差異。9.(1)計(jì)算卡方值=Σ[(觀察頻數(shù)-期望頻數(shù))2/期望頻數(shù)]。(2)計(jì)算期望頻數(shù)=(行總和*列總和)/總樣本數(shù)。(3)將觀察頻數(shù)和期望頻數(shù)代入卡方值公式,計(jì)算得到的卡方值。(4)查卡方分布表,自由度為1,顯著性水平為0.05,臨界值為3.84。(5)由于計(jì)算得到的卡方值小于臨界值,不能拒絕原假設(shè),認(rèn)為數(shù)學(xué)成績(jī)和英語成績(jī)是獨(dú)立的。四、回歸分析10.(1)使用最小二乘法計(jì)算線性回歸方程的斜率和截距。(2)將面積和房?jī)r(jià)數(shù)據(jù)代入回歸方程,得到線性關(guān)系模型。11.(1)使用最小二乘法計(jì)算多項(xiàng)式回歸方程的系數(shù)。(2)將收入和消費(fèi)水平數(shù)據(jù)代入回
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年關(guān)注動(dòng)態(tài)裁判員試題及答案
- 模具設(shè)計(jì)與質(zhì)量控制的關(guān)系試題及答案
- 2024年項(xiàng)目管理各國(guó)標(biāo)準(zhǔn)比較試題及答案
- 植保員專業(yè)知識(shí)的豐富性試題及答案
- 模具設(shè)計(jì)師資格考試前的新變化試題及答案
- 2024游泳救生員資格考試須知與試題及答案
- 2024年體育經(jīng)紀(jì)人備考經(jīng)驗(yàn)分享的試題及答案
- 游泳救生員應(yīng)對(duì)緊急情況的試題及答案
- 2024年農(nóng)業(yè)植保員考試題型與試題及答案分析
- 2024年籃球裁判員復(fù)習(xí)資料試題及答案
- 高中政治第3課時(shí)《正確對(duì)待外來文化》教學(xué)設(shè)計(jì)
- 2024年度社區(qū)工作者練習(xí)題庫可打印
- 2024年形勢(shì)與政策 第二講 中國(guó)經(jīng)濟(jì)高質(zhì)量發(fā)展扎實(shí)推進(jìn)(課件)
- 《游園》課件統(tǒng)編版高中語文必修下冊(cè)
- 數(shù)字鄉(xiāng)村農(nóng)村信息化服務(wù)平臺(tái)建設(shè)方案-數(shù)字農(nóng)村信息化云服平臺(tái)建設(shè)方案
- 專題04 三角函數(shù)-備戰(zhàn)2025年高考數(shù)學(xué)真題題源解密(新高考卷)解析版
- GB/T 44442-2024智能制造遠(yuǎn)程運(yùn)維系統(tǒng)評(píng)價(jià)指標(biāo)體系
- 部編版《綜合性學(xué)習(xí):中華傳統(tǒng)節(jié)日》課件
- DBJ33T 1319-2024 住宅小區(qū)供配電工程技術(shù)標(biāo)準(zhǔn)
- 腕踝針療法完整版本
- 提升質(zhì)量意識(shí)-強(qiáng)化質(zhì)量管理
評(píng)論
0/150
提交評(píng)論