




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一章統(tǒng)計(jì)數(shù)據(jù)的收集與整理1.1 算術(shù)平均數(shù)是怎樣計(jì)算的?為什么要計(jì)算平均數(shù)?答:算數(shù)平均數(shù)由下式計(jì)算:,含義為將全部觀測(cè)值相加再被觀測(cè)值的個(gè)數(shù)除,所得之商稱(chēng)為算術(shù)平均數(shù)。計(jì)算算數(shù)平均數(shù)的目的,是用平均數(shù)表示樣本數(shù)據(jù)的集中點(diǎn),或是說(shuō)是樣本數(shù)據(jù)的代表。1.2 既然方差和標(biāo)準(zhǔn)差都是衡量數(shù)據(jù)變異程度的,有了方差為什么還要計(jì)算標(biāo)準(zhǔn)差?答:標(biāo)準(zhǔn)差的單位與數(shù)據(jù)的原始單位一致,能更直觀地反映數(shù)據(jù)地離散程度。1.3 標(biāo)準(zhǔn)差是描述數(shù)據(jù)變異程度的量,變異系數(shù)也是描述數(shù)據(jù)變異程度的量,兩者之間有什么不同?答:變異系數(shù)可以說(shuō)是用平均數(shù)標(biāo)準(zhǔn)化了的標(biāo)準(zhǔn)差。在比較兩個(gè)平均數(shù)不同的樣本時(shí)所得結(jié)果更可靠。1.4 完整地描述一組
2、數(shù)據(jù)需要哪幾個(gè)特征數(shù)?答:平均數(shù)、標(biāo)準(zhǔn)差、偏斜度和峭度。1.5 下表是我國(guó)青年男子體重(kg)。由于測(cè)量精度的要求,從表面上看像是離散型數(shù)據(jù),不要忘記,體重是通過(guò)度量得到的,屬于連續(xù)型數(shù)據(jù)。根據(jù)表中所給出的數(shù)據(jù)編制頻數(shù)分布表。6669646564666865626469616168665766696665706458676666676666626666646262656465667260666561616667626565616462646562656868656768626370656465626662636865685767666863646668646360646965666767676
3、567676668646759666563566663636667637067706264726967676668646571616361646467697066646564637064626970686563656664686965636763706568676966656766746469656465656867656566677265676267716965657562696868656366666562616865646766646061686763596560646369627169606359676168696664696568676464666973686060633862676
4、56569656765726667646164666363666666636563676866626361666163686566696466706970636465646767656662616565606365626664答:首先建立一個(gè)外部數(shù)據(jù)文件,名稱(chēng)和路徑為:E:dataexer1-5e.dat。所用的SAS程序和計(jì)算結(jié)果如下:proc format;value hfmt56-57='56-57' 58-59='58-59' 60-61='60-61'62-63='62-63' 64-65='64-65'
5、 66-67='66-67'68-69='68-69' 70-71='70-71' 72-73='72-73'74-75='74-75'run;data weight;infile 'E:dataexer1-5e.dat'input bw ;run;proc freq;table bw;format bw hfmt.;run;The SAS SystemCumulative CumulativeBW Frequency Percent Frequency Percent-56-57 3 1.0 3
6、1.058-59 4 1.3 7 2.360-61 22 7.3 29 9.762-63 46 15.3 75 25.064-65 83 27.7 158 52.766-67 77 25.7 235 78.368-69 45 15.0 280 93.370-71 13 4.3 293 97.772-73 5 1.7 298 99.374-75 2 0.7 300 100.01.6 將上述我國(guó)男青年體重看作一個(gè)有限總體,用隨機(jī)數(shù)字表從該總體中隨機(jī)抽出含量為10的兩個(gè)樣本,分別計(jì)算它們的平均數(shù)和標(biāo)準(zhǔn)差并進(jìn)行比較。它們的平均數(shù)相等嗎?標(biāo)準(zhǔn)差相等嗎?能夠解釋為什么嗎?答:用means過(guò)程計(jì)算,兩個(gè)樣本
7、分別稱(chēng)為和,結(jié)果見(jiàn)下表:The SAS SystemVariable N Mean Std Dev-Y1 10 64.5000000 3.5039660Y2 10 63.9000000 3.1780497-隨機(jī)抽出的兩個(gè)樣本,它們的平均數(shù)和標(biāo)準(zhǔn)差都不相等。因?yàn)闃颖酒骄鶖?shù)和標(biāo)準(zhǔn)差都是統(tǒng)計(jì)量,統(tǒng)計(jì)量有自己的分布,很難得到平均數(shù)和標(biāo)準(zhǔn)差都相等的兩個(gè)樣本。1.7 從一個(gè)有限總體中采用非放回式抽樣,所得到的樣本是簡(jiǎn)單的隨機(jī)樣本嗎?為什么?本課程要求的樣本都是隨機(jī)樣本,應(yīng)當(dāng)采用哪種抽樣方法,才能獲得一隨機(jī)樣本?答:不是簡(jiǎn)單的隨機(jī)樣本。從一個(gè)有限總體中以非放回式抽樣方法抽樣,在前后兩次抽樣之間不是相互獨(dú)立的
8、,后一次的抽樣結(jié)果與前一次抽樣的結(jié)果有關(guān)聯(lián),因此不是隨機(jī)樣本。應(yīng)采用隨機(jī)抽樣的方法抽取樣本,具體說(shuō)應(yīng)當(dāng)采用放回式抽樣。1.8 證明若用或編碼時(shí),前式是否仍然相等?答:(1)令則平均數(shù)特性之。(2)令則平均數(shù)特性之。用第二種編碼方式編碼結(jié)果,兩式不再相等。1.9 有一個(gè)樣本:,設(shè)B為其中任意一個(gè)數(shù)值。證明只有當(dāng)最小。這是平均數(shù)的一個(gè)重要特性,在后面講到一元線型回歸時(shí)還會(huì)用到該特性。答:令,為求使p達(dá)最小之B,令則。1.10 檢測(cè)菌肥的功效,在施有菌肥的土壤中種植小麥,成苗后測(cè)量苗高,共100株,數(shù)據(jù)如下1:10.09.37.29.18.58.010.510.69.610.17.06.79.57.
9、810.57.98.19.67.69.410.07.57.25.07.38.77.16.15.26.810.09.97.54.57.67.09.76.28.06.98.38.610.04.84.97.08.38.47.87.56.610.06.59.58.511.09.76.610.05.06.58.08.48.37.47.48.17.77.57.17.87.68.66.07.06.46.76.36.411.010.57.85.08.07.07.45.26.79.08.64.66.93.56.29.76.45.86.49.36.4編制苗高的頻數(shù)分布表,繪制頻數(shù)分布圖,并計(jì)算出該樣本的四個(gè)特征數(shù)
10、。答:首先建立一個(gè)外部數(shù)據(jù)文件,名稱(chēng)和路徑為:E:dataexr1-10e.dat。SAS程序及結(jié)果如下:options nodate;procformat; value hfmt 3.5-4.4='3.5-4.4' 4.5-5.4='4.5-5.4' 5.5-6.4='5.5-6.4' 6.5-7.4='6.5-7.4' 7.5-8.4='7.5-8.4' 8.5-9.4='8.5-9.4' 9.5-10.4='9.5-10.4' 10.5-11.4='10.5-11.4&
11、#39; run; data wheat; infile 'E:dataexr1-10e.dat' input height ; run; procfreq; table height; format height hfmt.; run;proccapability graphics noprint;var height;histogram/vscale=count;inset mean var skewness kurtosis;run;The SAS SystemThe FREQ ProcedureCumulative Cumulativeheight Frequency
12、Percent Frequency Percent- 3.5-4.4 1 1.00 1 1.004.5-5.4 9 9.00 10 10.005.5-6.4 11 11.00 21 21.006.5-7.4 23 23.00 44 44.007.5-8.4 24 24.00 68 68.008.5-9.4 11 11.00 79 79.009.5-10.4 15 15.00 94 94.0010.5-11.4 6 6.00 100 100.001.11 北太平洋寬吻海豚羥丁酸脫氫酶(HDBH)數(shù)據(jù)的接收范圍頻數(shù)表2如下:(略作調(diào)整)HDBH數(shù)據(jù)的接收范圍/(U·L-1)頻數(shù)<2
13、141<245.909 13<277.818 211<309.727 319<341.636 426<373.545 522<405.454 511<437.363 613<469.272 76<501.181 83<533.090 92根據(jù)上表中的數(shù)據(jù)作出直方圖。答:以表中第一列所給出的數(shù)值為組界,直方圖如下:1.12 靈長(zhǎng)類(lèi)手掌和腳掌可以握物一側(cè)的皮膚表面都有突起的皮膚紋嵴。紋嵴有許多特征,這些特征在胚胎形成之后是終生不變的。人類(lèi)手指尖的紋型,大致可以分為弓、箕和斗三種類(lèi)型。在手指第一節(jié)的基部可以找到一個(gè)點(diǎn),從該點(diǎn)紋嵴向三個(gè)方向輻
14、射,這個(gè)點(diǎn)稱(chēng)為三叉點(diǎn)。弓形紋沒(méi)有三叉點(diǎn),箕形紋有一個(gè)三叉點(diǎn),斗形紋有兩個(gè)三叉點(diǎn),記錄從三叉點(diǎn)到箕或斗中心的紋嵴數(shù)目稱(chēng)為紋嵴數(shù)(finger ridge count, FRC)。將雙手十個(gè)指尖的全部箕形紋的紋嵴數(shù)和/或斗形紋兩個(gè)紋嵴數(shù)中較大者相加,稱(chēng)為總紋嵴數(shù)(total finger ridge count, TFRC)。下表給出了大理白族人群總紋嵴數(shù)的頻數(shù)分布3:TFRC分組中值頻數(shù)113020231504015170608719080299111010054111130120631311501406815117016051171190180181912102006首先判斷數(shù)據(jù)的類(lèi)型,然后繪
15、出樣本頻數(shù)分布圖,計(jì)算樣本的四個(gè)特征數(shù)并描述樣本分布形態(tài)。答:總紋脊數(shù)屬計(jì)數(shù)數(shù)據(jù)。計(jì)數(shù)數(shù)據(jù)的頻數(shù)分布圖為柱狀圖,頻數(shù)分布圖如下:樣本特征數(shù)(以TFRC的中值計(jì)算)SAS程序:options nodate;data tfrc;do i=1 to 10; input y ;input n ;do j=1 to n;output;end;end;cards;20 240 160 880 29100 54120 63140 68160 51180 18200 6;run;proc means mean std skewness kurtosis;var y;run;結(jié)果見(jiàn)下表:The SAS Syst
16、emAnalysis Variable : YMean Std Dev Skewness Kurtosis-126.5333333 32.8366112 -0.2056527 -0.0325058-從頻數(shù)分布圖可以看出,該分布的眾數(shù)在第七組,即總紋脊數(shù)的中值為140的那一組。分布不對(duì)稱(chēng),平均數(shù)略小于眾數(shù),有些負(fù)偏。偏斜度為-0.2056527,偏斜的程度不是很明顯,基本上還可以認(rèn)為是對(duì)稱(chēng)的,峭度幾乎為零。1.13 海南粗榧葉長(zhǎng)度的頻數(shù)分布4:葉長(zhǎng)度/mm中值頻數(shù)2.02.22.13902.22.42.31 4342.42.62.52 6432.62.82.73 5462.83.02.95 69
17、23.03.23.15 1873.23.43.34 3333.43.63.52 7673.63.83.71 6773.84.03.91 137nag4.04.24.16674.24.44.33464.44.64.5181繪出頻數(shù)分布圖,并計(jì)算偏斜度和峭度。答:表中第一列所給出的數(shù)值為組限,下圖為海南粗榧葉長(zhǎng)度的頻數(shù)分布圖。計(jì)算偏斜度和峭度的SAS程序和計(jì)算結(jié)果如下:options nodate;data length;do i=1 to 13; input y ;input n ;do j=1 to n;output;end;end;cards;2.1 3902.3 14342.5 26432
18、.7 35462.9 56923.1 51873.3 43333.5 27673.7 16773.9 11374.1 6674.3 3464.5 181;run;proc means n skewness kurtosis;var y;run;The SAS SystemAnalysis Variable : Yn Skewness Kurtosis-30000 0.4106458 0.0587006-樣本含量n30000,是一個(gè)很大的樣本,樣本的偏斜度和峭度都已經(jīng)很可靠了。偏斜度為0.41,有一個(gè)明顯的正偏。1.14 馬邊河貝氏高原鰍繁殖群體體重分布如下5:體質(zhì)量/g中值雌魚(yú)雄魚(yú)2.003.
19、002.50143.004.003.50674.005.004.5013115.006.005.5030256.007.006.5025257.008.007.5016238.009.008.5021179.0010.009.50181610.0011.0010.5012411.0012.0011.50312.0013.0012.502首先判斷數(shù)據(jù)的類(lèi)型,然后分別繪制雌魚(yú)和雄魚(yú)的頻數(shù)分布圖,計(jì)算樣本平均數(shù)、標(biāo)準(zhǔn)差、偏斜度和峭度并比較兩者的變異程度。答:魚(yú)的體重為度量數(shù)據(jù),表中第一列所給出的數(shù)值為組限。在下面的分布圖中雌魚(yú)和雄魚(yú)的分布繪在了同一張圖上,以不同的顏色表示。計(jì)算統(tǒng)計(jì)量的SAS程序與前
20、面的例題類(lèi)似,這里不再給出,只給出結(jié)果。雌魚(yú):The SAS SystemAnalysis Variable : YN Mean Std Dev Skewness Kurtosis-147 7.2414966 2.1456820 0.2318337 -0.6758677-雄魚(yú):The SAS SystemAnalysis Variable : YN Mean Std Dev Skewness Kurtosis-132 6.7803030 1.9233971 -0.1322816 -0.5510332-直觀地看,雄魚(yú)的平均體重低于雌魚(yú)。雌魚(yú)有一正偏,雄魚(yú)有一負(fù)偏。因此,相對(duì)來(lái)說(shuō)雌魚(yú)低體重者較多,
21、雄魚(yú)高體重者較多。但兩者都有很明顯的負(fù)峭度,說(shuō)明“曲線”較平坦,兩尾翹得較高。1.15 黃胸鼠體重的頻數(shù)分布6:組界/g頻數(shù)0<151015<302630<453045<602260<752275<901790<10516105<12014120<1356135<1504150<1652總數(shù)169繪制頻數(shù)分布圖,從圖形上看分布是對(duì)稱(chēng)的嗎,說(shuō)明什么問(wèn)題?答:下面是頻數(shù)分布圖:從上圖可見(jiàn),圖形不是對(duì)稱(chēng)的,有一些正偏。說(shuō)明在該黃雄鼠群體中,低體重者分布數(shù)量,高于高體重者的數(shù)量。另外,似乎峭度也有些低。1.16 25名患者入院后最初的白細(xì)胞數(shù)量(×103)7如下表:851241168771273111411966561014455計(jì)算白細(xì)胞數(shù)量的平均數(shù)、方差和標(biāo)準(zhǔn)差。答:用means過(guò)程計(jì)算,程序不再給出,只
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程項(xiàng)目管理做好溝通的必要性試題及答案
- 打造農(nóng)產(chǎn)品碳標(biāo)簽體系的路徑與策略解析
- 公關(guān)活動(dòng)的效果評(píng)估指標(biāo)試題及答案
- 農(nóng)村電商直播基地與農(nóng)村電商產(chǎn)業(yè)帶建設(shè)研究報(bào)告
- 市政學(xué)未來(lái)展望試題及答案
- 基于TEE的工業(yè)互聯(lián)網(wǎng)平臺(tái)工業(yè)設(shè)備安全認(rèn)證與安全防護(hù)策略研究與實(shí)踐報(bào)告
- 行政管理中的社會(huì)責(zé)任與組織聲譽(yù)管理試題及答案
- 2025年自考行政管理全局觀試題及答案
- 工程經(jīng)濟(jì)項(xiàng)目管理工具試題及答案
- 施工資源配置試題及答案
- 星際穿越PPT課件(PPT 13頁(yè))
- CNAS-CL01:2018(ISO17025:2017)改版后實(shí)驗(yàn)室首次內(nèi)審及管理評(píng)審資料匯總
- 凱悅酒店 財(cái)務(wù)操作手冊(cè)(英)P531
- 天津農(nóng)學(xué)院畢業(yè)論文答辯ppt模板_1975553754.ppt
- 涵洞工程勞務(wù)分包合同
- 投標(biāo)書(shū)(--總醫(yī)院護(hù)理保障服務(wù))
- 燃?xì)夤究?jī)效考核表格大全(共61頁(yè))
- 低壓配電室巡檢表
- 05G515輕型屋面梯形鋼屋架
- 【培訓(xùn)】房地產(chǎn)開(kāi)發(fā)經(jīng)營(yíng)業(yè)務(wù)企業(yè)所得稅政策解讀
- 壓力鋼管鎮(zhèn)墩抗滑穩(wěn)定及地基應(yīng)力計(jì)算
評(píng)論
0/150
提交評(píng)論