數(shù)值變量資料的統(tǒng)計(jì)描述ppt課件_第1頁(yè)
數(shù)值變量資料的統(tǒng)計(jì)描述ppt課件_第2頁(yè)
數(shù)值變量資料的統(tǒng)計(jì)描述ppt課件_第3頁(yè)
數(shù)值變量資料的統(tǒng)計(jì)描述ppt課件_第4頁(yè)
數(shù)值變量資料的統(tǒng)計(jì)描述ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩67頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)值變量資料的統(tǒng)計(jì)分析數(shù)值變量資料的統(tǒng)計(jì)分析 竇東梅 河南大學(xué)護(hù)理學(xué)院公共衛(wèi)生教研室統(tǒng)計(jì)分析統(tǒng)計(jì)分析統(tǒng)計(jì)描述統(tǒng)計(jì)描述統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷數(shù)值變量資料的統(tǒng)計(jì)描述數(shù)值變量資料的統(tǒng)計(jì)描述 統(tǒng)計(jì)描述:利用統(tǒng)計(jì)統(tǒng)計(jì)描述:利用統(tǒng)計(jì)圖、統(tǒng)計(jì)表、統(tǒng)計(jì)指標(biāo)圖、統(tǒng)計(jì)表、統(tǒng)計(jì)指標(biāo)等來(lái)描述樣本資料的特等來(lái)描述樣本資料的特征。征。 數(shù)值變量資料的統(tǒng)計(jì)描述數(shù)值變量資料的統(tǒng)計(jì)描述一一 頻數(shù)分布頻數(shù)分布二二 集中趨勢(shì)的描述集中趨勢(shì)的描述三三 離散趨勢(shì)的描述離散趨勢(shì)的描述四四 正態(tài)分布正態(tài)分布 一一 頻數(shù)分布表及其用途頻數(shù)分布表及其用途 數(shù)值變量資料進(jìn)行描述時(shí),如果樣本量數(shù)值變量資料進(jìn)行描述時(shí),如果樣本量較大,需要對(duì)原始資料進(jìn)行整

2、理,列出較大,需要對(duì)原始資料進(jìn)行整理,列出頻數(shù)分布表,通過(guò)頻數(shù)表以顯示資料的頻數(shù)分布表,通過(guò)頻數(shù)表以顯示資料的分布類型。分布類型。例例2-1 2-1 某醫(yī)院用隨機(jī)抽樣方法檢查了某醫(yī)院用隨機(jī)抽樣方法檢查了138138名成年女子名成年女子的紅細(xì)胞數(shù),其測(cè)量結(jié)果如下,試編制頻數(shù)分布表。的紅細(xì)胞數(shù),其測(cè)量結(jié)果如下,試編制頻數(shù)分布表。 3.96 4.23 4.42 3.59 5.12 4.02 4.32 3.72 4.76 4.16 4.61 4.26 3.77 4.20 4.36 3.07 4.89 3.97 4.28 3.64 4.66 4.04 4.55 4.25 4.63 3.91 4.41 3

3、.52 5.03 4.01 4.30 4.19 4.75 4.14 4.57 4.26 4.56 3.79 3.89 4.21 4.95 3.98 4.29 3.67 4.69 4.12 4.56 4.26 4.66 4.28 3.83 4.20 5.24 4.02 4.33 3.76 4.81 4.17 3.96 3.27 4.61 4.26 3.96 4.23 3.76 4.01 4.29 3.67 3.39 4.12 4.27 3.61 4.98 4.24 3.83 4.20 3.71 4.03 4.34 4.69 3.62 4.18 4.26 4.36 5.28 4.21 4.42 4

4、.36 3.66 4.02 4.31 4.83 3.59 3.97 3.96 4.49 5.11 4.20 4.36 4.54 3.72 3.97 4.28 4.76 3.21 4.04 4.56 4.25 4.92 4.23 4.47 3.60 5.23 4.02 4.32 4.68 4.76 3.69 4.61 4.26 3.89 4.21 4.36 3.42 5.01 4.01 4.29 3.68 4.71 4.13 4.57 4.26 4.03 5.46 4.16 3.64 4.16 3.76 n(1求極差求極差range):即最大值與最小值之差,又稱為全距。):即最大值與最小值之差,

5、又稱為全距。n R5.46 3.07 =2.39(1012/L)n(2) 決定分組組數(shù)、組距:根據(jù)研究目的和樣本含量決定分組組數(shù)、組距:根據(jù)研究目的和樣本含量n確定分組組數(shù),通常分為確定分組組數(shù),通常分為1015個(gè)組。組距個(gè)組。組距=極差極差/組數(shù),為方便計(jì),組距為極差的十分之一組數(shù),為方便計(jì),組距為極差的十分之一, 再略加調(diào)整。再略加調(diào)整。n 2.39/12=0.1990.20(1012/L)n(3) 列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大列出組段:第一組段的下限略小于最小值,最后一個(gè)組段上限必須包含最大值。值。n(4) 劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,

6、得到各組段的頻數(shù)。劃記計(jì)數(shù):用劃記法將所有數(shù)據(jù)歸納到各組段,得到各組段的頻數(shù)。 頻數(shù)表的編制步驟頻數(shù)表的編制步驟Nf138138名成年女子的紅細(xì)胞數(shù)名成年女子的紅細(xì)胞數(shù)( (1012/L)1012/L)頻數(shù)分布頻數(shù)分布紅細(xì)胞數(shù)5.505.385.255.135.004.884.754.634.504.384.254.134.003.883.753.633.503.383.253.13紅細(xì)胞數(shù)Frequency403020100Std. Dev = .45 Mean = 4.23N = 138.00 二、頻數(shù)分布表的用途二、頻數(shù)分布表的用途 1、揭示資料的頻數(shù)分布類型、揭示資料的頻數(shù)分布類型 2

7、描述頻數(shù)分布的特征描述頻數(shù)分布的特征 3便于發(fā)現(xiàn)一些特大或特小便于發(fā)現(xiàn)一些特大或特小的可疑值的可疑值 4便于進(jìn)一步統(tǒng)計(jì)分析與處便于進(jìn)一步統(tǒng)計(jì)分析與處理理 1 1、揭示資料的頻數(shù)分布類型、揭示資料的頻數(shù)分布類型 頻數(shù)分布可分為對(duì)稱分布和偏態(tài)分布兩種類型。頻數(shù)分布可分為對(duì)稱分布和偏態(tài)分布兩種類型。 對(duì)稱分布:是指各組段的頻數(shù)以頻數(shù)最多組段對(duì)稱分布:是指各組段的頻數(shù)以頻數(shù)最多組段集中位置為中心,左右兩側(cè)大體對(duì)稱。集中位置為中心,左右兩側(cè)大體對(duì)稱。 偏態(tài)分布:是指頻數(shù)最多的組段集中位置偏偏態(tài)分布:是指頻數(shù)最多的組段集中位置偏向一側(cè),頻數(shù)分布不對(duì)稱。向一側(cè),頻數(shù)分布不對(duì)稱。 正偏態(tài):集中位置偏向數(shù)值小的

8、一側(cè)左側(cè))。正偏態(tài):集中位置偏向數(shù)值小的一側(cè)左側(cè))。 負(fù)偏態(tài):集中位置偏向數(shù)值大的一側(cè)右側(cè))。負(fù)偏態(tài):集中位置偏向數(shù)值大的一側(cè)右側(cè))。(1 1對(duì)稱分布對(duì)稱分布 若各組段的頻數(shù)以中心位置左右兩側(cè)大體對(duì)稱,就認(rèn)為若各組段的頻數(shù)以中心位置左右兩側(cè)大體對(duì)稱,就認(rèn)為該資料是對(duì)稱分布該資料是對(duì)稱分布 轉(zhuǎn)氨酶含量 人 數(shù) 12 2 15 9 18 14 21 23 24 19 27 14 30 11 33 9 36 7 39 4 4245 3 115115名正常成年女子血清轉(zhuǎn)氨酶名正常成年女子血清轉(zhuǎn)氨酶mmol/Lmmol/L含量分布含量分布 (2偏態(tài)分布偏態(tài)分布 1右偏態(tài)分布正偏態(tài)分布):右側(cè)的組段右偏態(tài)

9、分布正偏態(tài)分布):右側(cè)的組段數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾。數(shù)多于左側(cè)的組段數(shù),頻數(shù)向右側(cè)拖尾。 血清轉(zhuǎn)氨酶(mmol/L)051015202513.519.525.531.537.543.5.圖2-2 115名正常成年女子血清轉(zhuǎn)氨酶的頻數(shù)分布人 數(shù)肌 紅 蛋 白 含 量 人 數(shù) 0 2 5 3 10 7 15 9 20 10 25 22 30 23 35 14 40 9 45 50 2 表表 101 101名正常人的血清肌紅蛋白含量分布名正常人的血清肌紅蛋白含量分布g/mL 2左偏態(tài)分布負(fù)偏態(tài)分布)左偏態(tài)分布負(fù)偏態(tài)分布) 左側(cè)的組段數(shù)多于右側(cè)的組段數(shù),頻數(shù)向左側(cè)拖尾。 血 清 肌 紅 蛋

10、 白(g / m L)05101520252.512.522.532.542.552.5圖 2-3 101 名 正 常 人 血 清 肌 紅 蛋 白 的 頻 數(shù) 分 布人 數(shù)2 2描述頻數(shù)分布的特征描述頻數(shù)分布的特征 根據(jù)上表數(shù)據(jù)的頻數(shù)分布特征:根據(jù)上表數(shù)據(jù)的頻數(shù)分布特征:數(shù)據(jù)變異離散的范圍在數(shù)據(jù)變異離散的范圍在5784 (次(次/分分 )數(shù)據(jù)集中平均的組段在數(shù)據(jù)集中平均的組段在6873 (次(次/分分之間,尤以組段的人數(shù)之間,尤以組段的人數(shù)71(次(次/分最多。分最多。且上下組段的頻數(shù)分布基本對(duì)稱。且上下組段的頻數(shù)分布基本對(duì)稱。3 3便于發(fā)現(xiàn)一些特大或特小的可疑值便于發(fā)現(xiàn)一些特大或特小的可疑值

11、n 二二 集中趨勢(shì)的描述集中趨勢(shì)的描述 統(tǒng)計(jì)上使用平均數(shù)average這一指標(biāo)體系來(lái)描述一組變量值的集中位置或平均水平。 常用的平均數(shù)有: 算術(shù)均數(shù)均數(shù))(mean) 幾何均數(shù)geometric mean) 中位數(shù) (median與百分位數(shù) (percentile) 算術(shù)均數(shù)算術(shù)均數(shù)算術(shù)均數(shù):簡(jiǎn)稱均數(shù)算術(shù)均數(shù):簡(jiǎn)稱均數(shù)meanmean) 可用于反映一組呈對(duì)稱分布的可用于反映一組呈對(duì)稱分布的變量值在數(shù)量上的平均水平或者說(shuō)是變量值在數(shù)量上的平均水平或者說(shuō)是集中位置的特征值。集中位置的特征值。 1 1、計(jì)算方法、計(jì)算方法(1 1直接計(jì)算法直接計(jì)算法 公式公式 :12nXXXXXnn舉例:試計(jì)算舉例:

12、試計(jì)算4 4,4 4,4 4,6 6,6 6,8 8,8 8,8 8,1010的均數(shù)?的均數(shù)?1323101836243X例例2-1 2-1 某醫(yī)院用隨機(jī)抽樣方法檢查了某醫(yī)院用隨機(jī)抽樣方法檢查了138138名成年女子名成年女子的紅細(xì)胞數(shù),其測(cè)量結(jié)果如下,試編制頻數(shù)分布表。的紅細(xì)胞數(shù),其測(cè)量結(jié)果如下,試編制頻數(shù)分布表。 3.96 4.23 4.42 3.59 5.12 4.02 4.32 3.72 4.76 4.16 4.61 4.26 3.77 4.20 4.36 3.07 4.89 3.97 4.28 3.64 4.66 4.04 4.55 4.25 4.63 3.91 4.41 3.52

13、5.03 4.01 4.30 4.19 4.75 4.14 4.57 4.26 4.56 3.79 3.89 4.21 4.95 3.98 4.29 3.67 4.69 4.12 4.56 4.26 4.66 4.28 3.83 4.20 5.24 4.02 4.33 3.76 4.81 4.17 3.96 3.27 4.61 4.26 3.96 4.23 3.76 4.01 4.29 3.67 3.39 4.12 4.27 3.61 4.98 4.24 3.83 4.20 3.71 4.03 4.34 4.69 3.62 4.18 4.26 4.36 5.28 4.21 4.42 4.36

14、3.66 4.02 4.31 4.83 3.59 3.97 3.96 4.49 5.11 4.20 4.36 4.54 3.72 3.97 4.28 4.76 3.21 4.04 4.56 4.25 4.92 4.23 4.47 3.60 5.23 4.02 4.32 4.68 4.76 3.69 4.61 4.26 3.89 4.21 4.36 3.42 5.01 4.01 4.29 3.68 4.71 4.13 4.57 4.26 4.03 5.46 4.16 3.64 4.16 3.76 (2 2加權(quán)法加權(quán)法( (利用頻數(shù)表)利用頻數(shù)表) 公式 :112233123kkkfXf Xf X

15、f Xf XXfffffX 本組段下限值+下組段下限值其中2k k:頻數(shù)表的組段數(shù),:頻數(shù)表的組段數(shù), f f :頻數(shù),:頻數(shù), X X:組中值。:組中值。138138名成年女子的紅細(xì)胞數(shù)名成年女子的紅細(xì)胞數(shù)( (1012/L)1012/L)頻數(shù)分布頻數(shù)分布 2 2、運(yùn)用、運(yùn)用 均數(shù)適用于對(duì)稱分均數(shù)適用于對(duì)稱分布,特別是正態(tài)分布,特別是正態(tài)分布資料。布資料。 幾何均數(shù)幾何均數(shù)geometric meangeometric mean) 可用于反映一組經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布或正態(tài)分布的變量值在數(shù)量上的平均水平。幾何均數(shù)幾何均數(shù)geometric meangeometric mean)12121lg

16、1lg(lglglg)lglgnnnGX XXXGXXXnnXGn為正值,為底的反對(duì)數(shù)表示以為底的對(duì)數(shù);表示以010lg10lg1X幾何均數(shù):變量對(duì)幾何均數(shù):變量對(duì)數(shù)值的算術(shù)均數(shù)的數(shù)值的算術(shù)均數(shù)的反對(duì)數(shù)。反對(duì)數(shù)。 其他對(duì)數(shù)如自然對(duì)數(shù)變換獲得相同的幾何均數(shù)例例 有有8 8份血清的抗體效價(jià)分別為份血清的抗體效價(jià)分別為1:5, 1:10, 1:5, 1:10, 1:20, 1:40, 1:80, 1:160,1:320,1:640,1:20, 1:40, 1:80, 1:160,1:320,1:640,求平均抗求平均抗體效價(jià)。體效價(jià)。57.566403201608040201058G1lg (lg5

17、lg10lg20lg640)/856.57G平均抗體效價(jià)為:平均抗體效價(jià)為: 1:57(2加權(quán)法加權(quán)法公式:公式:1lglg ()fXGf 例 69例類風(fēng)濕關(guān)節(jié)炎R(shí)A患者血清EBV-VCA-lgG抗體滴度的分布見(jiàn)表2-4第(1)、(2)欄,求其平均抗體滴度。111lg150.2778lg ()lg ()lg (2.1779)150.669fXGf 2、運(yùn)用:、運(yùn)用: 適用于成等比數(shù)列的資料,特別是服從對(duì)數(shù)正態(tài)分布資料。 中位數(shù)中位數(shù)median,M) 是指一組觀察值從小到大順序是指一組觀察值從小到大順序排列后居于中間位置的數(shù)。排列后居于中間位置的數(shù)。 即總數(shù)中有一半的數(shù)低于它,一半即總數(shù)中有一

18、半的數(shù)低于它,一半的數(shù)高于它。的數(shù)高于它。 M的適用范圍的適用范圍 : 理論上用于各種分布的定量資料。理論上用于各種分布的定量資料。 實(shí)際用于:實(shí)際用于: 偏態(tài)分布資料;布類型不清的資偏態(tài)分布資料;布類型不清的資料。料。 1111個(gè)大鼠存活天數(shù):個(gè)大鼠存活天數(shù):4 4,1010,7 7,5050,3 3,1515,2 2,9 9,1313,6060,6060 平均存活天數(shù)平均存活天數(shù)? ? 1 1、M M的計(jì)算方法:的計(jì)算方法:小樣本小樣本: : n n為奇數(shù)時(shí)為奇數(shù)時(shí) n n為偶數(shù)時(shí)為偶數(shù)時(shí) 1()2nMX()(1)2212nnMXX例例 9 9名中學(xué)生甲型肝炎的潛伏期分別為名中學(xué)生甲型肝炎

19、的潛伏期分別為1212,1313,1414, 1414, 15 15, 15 15, 15 15, 17, 19 17, 19天,求其中位數(shù)。天,求其中位數(shù)。88451222214 15 214.5()MXXXX如果只調(diào)查了前八位中學(xué)生,則:()( )天)(155219天XXM 大樣本頻數(shù)表資料,可用百分位數(shù)大樣本頻數(shù)表資料,可用百分位數(shù)法計(jì)算:法計(jì)算:百分位數(shù)百分位數(shù)percentile,Px): 它表示一組觀察值按升序排列,并它表示一組觀察值按升序排列,并等分為等分為100等份,位居第等份,位居第x%位置位置的數(shù)。的數(shù)。其中,中位數(shù)其中,中位數(shù)M=P50定量%X(100)%XXP 百分位數(shù)

20、示意圖百分位數(shù)百分位數(shù)percentilepercentile) 頻數(shù)表資料的中位數(shù)頻數(shù)表資料的中位數(shù)(50%)(50%)LmMnnfMLif 所在組段下限值至該下限值的累計(jì)頻數(shù)組距所在組段下限值至上限值間的頻數(shù)下限值下限值L上限值上限值Ui; fm中位數(shù)中位數(shù)M)%50(Lfn 例21頻數(shù)表中位數(shù)的計(jì)算Nf中位數(shù)71+3x(130 x50%59)/2671.69 表表2-2 2-2 某地某地630630名正常女性血清甘油三脂含量名正常女性血清甘油三脂含量(mg/dl)(mg/dl)甘油三脂甘油三脂頻數(shù)頻數(shù) 累積頻數(shù)累積頻數(shù)累積頻率累積頻率(%) 0.10 27 27 4.30.4016919

21、6 31.10.70167363 57.6 M1.00 94457 72.51.30 81538 85.41.60 42580 92.11.90 28608 96.52.20 14622 98.72.50 4626 99.42.80 3629 99.83.10 1630100.0 合計(jì)合計(jì)630 - -03060901201501801頻頻數(shù)數(shù)甘油三脂甘油三脂(mg/dL)0.10.4 0.7 1.01.31.6 1.92.2 2.5 2.83.16300.5196ML L、iMiM、fMfM分別為分別為M M所在組段的下限、組距和頻數(shù),所在組段的下限、組距和頻數(shù), fL fL為為M M所所在

22、組段之前各組段的累積頻數(shù)。在組段之前各組段的累積頻數(shù)。914. 030. 01671965 . 063070. 0MMMLiffnLM5.0 2 運(yùn)用運(yùn)用1 1、各種分布類型的資料、各種分布類型的資料2 2、特別適合大樣本偏態(tài)分布資料或者、特別適合大樣本偏態(tài)分布資料或者一端或兩端無(wú)確切數(shù)值的資料。一端或兩端無(wú)確切數(shù)值的資料。 小 結(jié) 1. 運(yùn)用頻數(shù)表、直方圖和統(tǒng)計(jì)指標(biāo)這些技巧能夠有效地組織、整理和表達(dá)計(jì)量資料的信息。 2.平均數(shù)是描述一組觀察值集中位置或平均水平的統(tǒng)計(jì)指標(biāo),常用的有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。其中均數(shù)的應(yīng)用最為廣泛,幾何均數(shù)則多用于血清學(xué)和微生物學(xué)中,中位數(shù)主要用于偏度較大的數(shù)

23、據(jù)分布資料。 3.百分位數(shù)可用來(lái)描述資料的觀察值序列在某百分位置的水平,中位數(shù)是其中的一個(gè)特例。 設(shè)有甲、乙、丙三名醫(yī)生,分別對(duì)相同的設(shè)有甲、乙、丙三名醫(yī)生,分別對(duì)相同的5份血樣進(jìn)行份血樣進(jìn)行紅細(xì)胞計(jì)數(shù)萬(wàn)紅細(xì)胞計(jì)數(shù)萬(wàn)/mm3),甲得出了),甲得出了560、540、500、460、440,乙得出了,乙得出了520、510、500、490、480,丙得出了,丙得出了510、505、500、495、490,見(jiàn)下圖,見(jiàn)下圖2,三名醫(yī)生的計(jì)數(shù)結(jié)果得,三名醫(yī)生的計(jì)數(shù)結(jié)果得到的均數(shù)均為到的均數(shù)均為500,5個(gè)數(shù)值之和均為個(gè)數(shù)值之和均為2500。三三 離散趨勢(shì)的描述離散趨勢(shì)的描述甲醫(yī)生得出的甲醫(yī)生得出的5 5

24、個(gè)觀察值間的差個(gè)觀察值間的差異離散程度異離散程度較大,而丙醫(yī)生較大,而丙醫(yī)生得出的得出的5 5個(gè)觀察個(gè)觀察值間的差異離值間的差異離散程度較小。散程度較小。 描述離散趨勢(shì)的特征數(shù)描述離散趨勢(shì)的特征數(shù) 常用的描述定量資料離散常用的描述定量資料離散趨勢(shì)的指標(biāo)有極差、四分位數(shù)間趨勢(shì)的指標(biāo)有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。距、方差、標(biāo)準(zhǔn)差、變異系數(shù)。 1 1、極差、極差RangeRange) 極差,用極差,用R R表示:即一組變量值表示:即一組變量值最大值與最小值之差。最大值與最小值之差。 例例2-12-1數(shù)據(jù)數(shù)據(jù),有,有845727(/)R 次 分簡(jiǎn)單,但僅利用了兩端點(diǎn)值,簡(jiǎn)單,但僅利用了

25、兩端點(diǎn)值,穩(wěn)定性差。穩(wěn)定性差。 2 2、四分位數(shù)間距、四分位數(shù)間距 (quartile rangequartile range) 四分位數(shù)間距,用四分位數(shù)間距,用Q Q表示表示:Q=Q=下四分位數(shù):下四分位數(shù): 上四分位數(shù):上四分位數(shù):50P2575PP 25LQP75UQP25P100P0P75P 3 3、方差、方差variancevariance)離均差離均差每一個(gè)觀察值與均數(shù)之差,即每一個(gè)觀察值與均數(shù)之差,即X-X-,可以反映所有觀察值的變異程度??梢苑从乘杏^察值的變異程度。 離均差平方和離均差平方和方差方差離均差平方的平均值離均差平方的平均值觀察值離均數(shù)近,方差就小,表示觀察值離觀察

26、值離均數(shù)近,方差就小,表示觀察值離散小,數(shù)據(jù)較集中。若各觀察值離均數(shù)遠(yuǎn),散小,數(shù)據(jù)較集中。若各觀察值離均數(shù)遠(yuǎn),方差就大,表示各觀察值離散度大,數(shù)據(jù)方差就大,表示各觀察值離散度大,數(shù)據(jù)分布分散。分布分散。 2)( X NX 22 方差方差variance也稱均方差也稱均方差mean square deviation),反映一組數(shù)據(jù)的平均),反映一組數(shù)據(jù)的平均離散水平。離散水平。 總體方差總體方差 樣本方差樣本方差 22()XN離均差平方和SS22()1XXSnn自由度: 表示隨機(jī)變量能“自在取值的個(gè)數(shù),例如有一四個(gè)數(shù)據(jù)的樣本,受到均數(shù)為5的條件的限制,在自由確定4、2、5三個(gè)數(shù)據(jù)后,第四個(gè)數(shù)據(jù)只

27、能是9,=3,=n-限制條件的個(gè)數(shù)。n方差的自由度為n-1。它描述了當(dāng)均數(shù)選定時(shí)n個(gè)觀察值能自由取值個(gè)數(shù)。 由于方差的度量單位是原度量單位的平方,為由于方差的度量單位是原度量單位的平方,為了方便實(shí)際使用,將方差公式開(kāi)方,即得到標(biāo)準(zhǔn)差了方便實(shí)際使用,將方差公式開(kāi)方,即得到標(biāo)準(zhǔn)差 112222 nnXXSnXXSNX 標(biāo)準(zhǔn)差的用途標(biāo)準(zhǔn)差的用途 1、反映個(gè)體觀察值的離散程度大小、反映個(gè)體觀察值的離散程度大小 2、結(jié)合均數(shù)描述正態(tài)分布特征、結(jié)合均數(shù)描述正態(tài)分布特征 3、計(jì)算其他指標(biāo),如標(biāo)準(zhǔn)誤等、計(jì)算其他指標(biāo),如標(biāo)準(zhǔn)誤等 5、變異系數(shù)、變異系數(shù)coefficient of variation) CV 1

28、、意義、意義 標(biāo)準(zhǔn)差與均數(shù)之比用百分?jǐn)?shù)標(biāo)準(zhǔn)差與均數(shù)之比用百分?jǐn)?shù)表示表示 2、計(jì)算、計(jì)算 3、用途、用途 比較度量衡單位不同資料的比較度量衡單位不同資料的變異度變異度 比較均數(shù)相差懸殊資料的變異度比較均數(shù)相差懸殊資料的變異度 %100 xsCV變異系數(shù)的應(yīng)用變異系數(shù)的應(yīng)用(1比較度量衡單位不同的多組資料的變異度。比較度量衡單位不同的多組資料的變異度。 例如例如 某地某地20歲男子歲男子100人,其身高均數(shù)為人,其身高均數(shù)為166.06cm,標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為4.95 cm;其體重均數(shù)為;其體重均數(shù)為53.72 kg,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為2.96 kg。欲比較身高與體重的變異度何者為大,由于。欲比較身

29、高與體重的變異度何者為大,由于度量單位不同,不能直接比較標(biāo)準(zhǔn)差,而應(yīng)比較其變度量單位不同,不能直接比較標(biāo)準(zhǔn)差,而應(yīng)比較其變異系數(shù)。現(xiàn)異系數(shù)。現(xiàn)%98. 2%10006.16695. 4CV身高的變異系數(shù):%51.5%10072.5396.2CV體重的變異系數(shù):由此可見(jiàn),該地20歲男子體重的變異度大于身高的變異度。(2 2比較均數(shù)相差懸殊的多組資料的變異度比較均數(shù)相差懸殊的多組資料的變異度如下表資料可見(jiàn),雖然兒童身高的標(biāo)準(zhǔn)差隨著年齡的如下表資料可見(jiàn),雖然兒童身高的標(biāo)準(zhǔn)差隨著年齡的增大而增大。但不同年齡兒童身高的均數(shù)相差較大,增大而增大。但不同年齡兒童身高的均數(shù)相差較大,在比較身高的變異度時(shí),不能

30、只看標(biāo)準(zhǔn)差的大小。若在比較身高的變異度時(shí),不能只看標(biāo)準(zhǔn)差的大小。若從變異系數(shù)分析,就可看出從變異系數(shù)分析,就可看出6 6歲以下兒童隨年齡增加歲以下兒童隨年齡增加其身高的變異程度逐漸減少。其身高的變異程度逐漸減少。 某地不同年齡兒童身高(cm)的變異程度 年齡組 人數(shù) 均數(shù) 標(biāo)準(zhǔn)差 變異系數(shù) (%) 12月 100 56.3 2.1 3.7 56月 120 66.5 2.2 3.3 33.5歲 300 96.1 3.1 3.2 55.5歲 400 107.8 3.3 3.1 正態(tài)分布及其應(yīng)用 觀察前述資料繪成的直方圖一、正態(tài)分布的概念一、正態(tài)分布的概念正態(tài)曲線:高峰位于中央,兩側(cè)逐漸下降并完正態(tài)

31、曲線:高峰位于中央,兩側(cè)逐漸下降并完全對(duì)稱,曲線兩端永遠(yuǎn)不與橫軸相交的鐘型曲線。全對(duì)稱,曲線兩端永遠(yuǎn)不與橫軸相交的鐘型曲線。該曲線的函數(shù)表達(dá)式該曲線的函數(shù)表達(dá)式f(x)f(x)稱為正態(tài)分布稱為正態(tài)分布 密度函數(shù)密度函數(shù) 22221xexf標(biāo)準(zhǔn)差相同、均數(shù)不同的四條正態(tài)曲線標(biāo)準(zhǔn)差相同、均數(shù)不同的四條正態(tài)曲線-4-3-2-1012345F00.00.10.20.30.40.50.60.70.8U-3-2-10123均數(shù)相同、標(biāo)準(zhǔn)差不同的四條正態(tài)曲線二、正態(tài)概率密度曲線的特點(diǎn)二、正態(tài)概率密度曲線的特點(diǎn) (1集中性:正態(tài)曲線在橫軸上方均數(shù)處最高集中性:正態(tài)曲線在橫軸上方均數(shù)處最高 (2曲線下面積為曲線

32、下面積為1。 (3決定曲線在橫軸上的位置,決定曲線在橫軸上的位置, 增大,曲增大,曲線沿橫軸向右移;反之,線沿橫軸向右移;反之, 減小,曲線沿橫軸向減小,曲線沿橫軸向左移。左移。 決定曲線的形狀,當(dāng)決定曲線的形狀,當(dāng)恒定時(shí),恒定時(shí), 越大,數(shù)越大,數(shù)據(jù)越分散,曲線越據(jù)越分散,曲線越“矮胖矮胖”; 越小,數(shù)據(jù)越集越小,數(shù)據(jù)越集中,曲線越中,曲線越“瘦高瘦高”。習(xí)慣上用。習(xí)慣上用N( , 2表表示均數(shù)為示均數(shù)為、標(biāo)準(zhǔn)差為、標(biāo)準(zhǔn)差為的正態(tài)分布。的正態(tài)分布。 (4正態(tài)曲線下的面積分布有一定規(guī)律。正態(tài)曲線下的面積分布有一定規(guī)律。對(duì)稱。x曲線。處有拐點(diǎn),表現(xiàn)為鐘型在的最大值,處取得該概率密度函數(shù)在xx 正態(tài)曲線下橫軸上一定區(qū)間的面積占總面積的百分正態(tài)曲線下橫軸上一定區(qū)間的面積占總面積的百分?jǐn)?shù),用以反映該區(qū)間的例數(shù)占總例數(shù)的百分?jǐn)?shù)頻率分?jǐn)?shù),用以反映該區(qū)間的例數(shù)占總例數(shù)的百分?jǐn)?shù)頻率分布)。布)。 或變量值落在該區(qū)間的概率概率分布)。一定區(qū)或變量值落在該區(qū)間的概率概率分布)。一定區(qū)間的面積可以通過(guò)對(duì)密度曲線函數(shù)積分求得間的面積可以通過(guò)對(duì)密度曲線函數(shù)積分求得 XXdxeXF22221)(F(X)F(X)稱為正態(tài)分布曲線的分布函數(shù)。它稱為正態(tài)分布曲線的分布函數(shù)。它表示表示 正態(tài)分布曲線下自正態(tài)分布曲線下自到某定值

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論