第二章 統(tǒng)計(jì)描述課件_第1頁(yè)
第二章 統(tǒng)計(jì)描述課件_第2頁(yè)
第二章 統(tǒng)計(jì)描述課件_第3頁(yè)
第二章 統(tǒng)計(jì)描述課件_第4頁(yè)
第二章 統(tǒng)計(jì)描述課件_第5頁(yè)
已閱讀5頁(yè),還剩45頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章數(shù)值變量資料的統(tǒng)計(jì)描述第一節(jié)頻數(shù)表第二章統(tǒng)計(jì)描述頻數(shù)分布表用于反映各變量(觀察單位的某種特征)值及其相應(yīng)頻數(shù)之間關(guān)系的一類表格,我們稱之為頻數(shù)表.這里頻數(shù)指對(duì)一種變量在多個(gè)觀察單位中進(jìn)行多次觀察,其中某一變量值重復(fù)出現(xiàn)的次數(shù).不同的資料類型編制頻數(shù)表難易程度不同,其中計(jì)數(shù)資料和等級(jí)資料比較簡(jiǎn)單,而計(jì)量資料相對(duì)較繁雜些.第二章統(tǒng)計(jì)描述計(jì)量資料頻數(shù)表的編制

一般情況下,樣本含量小于30的統(tǒng)計(jì)資料無(wú)須編制頻數(shù)表,但對(duì)于大樣本含量的資料,編制頻數(shù)表有利于進(jìn)一步的統(tǒng)計(jì)分析、且頻數(shù)表本身也具有統(tǒng)計(jì)描述的作用.

第二章統(tǒng)計(jì)描述編制頻數(shù)表的步驟編制頻數(shù)表步驟流程圖第二章統(tǒng)計(jì)描述舉例說(shuō)明計(jì)量資料頻數(shù)表的編制過(guò)程

第二章統(tǒng)計(jì)描述步驟如下:R=160.8-129.4=31.4。組段數(shù)=10;組距=R/10=3.14≈30(cm);按要求確定每一組段上下限。分組統(tǒng)計(jì)每一組段的頻數(shù),編制頻數(shù)表。第二章統(tǒng)計(jì)描述計(jì)量資料頻數(shù)分布表第二章統(tǒng)計(jì)描述計(jì)量資料頻數(shù)分布圖

第二章統(tǒng)計(jì)描述頻數(shù)分布表的用途揭示數(shù)值變量頻數(shù)分布的類型和特征作為陳述資料的形式便于發(fā)現(xiàn)一些特大或特小的可疑值便于進(jìn)一步的統(tǒng)計(jì)分析第二章統(tǒng)計(jì)描述計(jì)量資料頻數(shù)分布的類型和特征第二章統(tǒng)計(jì)描述第二節(jié)集中趨勢(shì)指標(biāo)第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述3.中位數(shù)(median)

中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,符號(hào)為Md,反映一批觀察值在位次上的平均水平。適用條件:適合各種類型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。

第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md第二章統(tǒng)計(jì)描述

組段(1)

劃記(2)

頻數(shù),f(3)

累計(jì)頻數(shù)Sf(4)累計(jì)百分率0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8

合計(jì)

3160100.0(98.1~100)160中位數(shù)=1.1+0.1x[(160x50%-72)/20]=1.14第二章統(tǒng)計(jì)描述均數(shù)、中位數(shù)、眾數(shù)三者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)=眾數(shù)正偏態(tài)分布時(shí):均數(shù)>中位數(shù)>眾數(shù)負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)<眾數(shù)第二章統(tǒng)計(jì)描述第三節(jié)變異(variation)指標(biāo)第二章統(tǒng)計(jì)描述

反映數(shù)據(jù)的離散度(Dispersion)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:

1.極差(Range)(全距)

2.百分位數(shù)與四分位數(shù)間距

PercentileandQuartilerange

3.方差Variance

4.標(biāo)準(zhǔn)差StandardDeviation

5.變異系數(shù)CoefficientofVariation

第二章統(tǒng)計(jì)描述盤(pán)編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500

例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤(pán),得結(jié)果如下(萬(wàn)/mm3)甲乙丙第二章統(tǒng)計(jì)描述1.極差(Range)(全距)優(yōu)點(diǎn):簡(jiǎn)便缺點(diǎn):1.只利用了兩個(gè)極端值

2.n大,R也會(huì)大

3.不穩(wěn)定1204020第二章統(tǒng)計(jì)描述2.百分位數(shù)與四分位數(shù)間距

Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:QR=P75-P25四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px第二章統(tǒng)計(jì)描述頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)Px第二章統(tǒng)計(jì)描述

組段(1)

劃記(2)

頻數(shù),f(3)

累計(jì)頻數(shù)Sf(4)累計(jì)百分率0.5~

331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8

合計(jì)

3160100.0(98.1~100)160P25=0.9+0.1x[(160x25%-37)/17]=0.92P75=1.3+0.1x[(160x75%-110)/17]=1.36QR=1.36-0.92=0.44;QD=0.22第二章統(tǒng)計(jì)描述3.方差

方差(variance)也稱均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。第二章統(tǒng)計(jì)描述樣本方差為什么要除以(n-1)

與自由度(degreesoffreedom)有關(guān)。自由度是數(shù)學(xué)名詞,在統(tǒng)計(jì)學(xué)中,n個(gè)數(shù)據(jù)如不受任何條件的限制,則n個(gè)數(shù)據(jù)可取任意值,稱為有n個(gè)自由度。若受到k個(gè)條件的限制,就只有(n-k)個(gè)自由度了。計(jì)算標(biāo)準(zhǔn)差時(shí),n個(gè)變量值本身有n個(gè)自由度。但受到樣本均數(shù)的限制,任何一個(gè)“離均差”均可以用另外的(n-1)個(gè)“離均差”表示,所以只有(n-1)個(gè)獨(dú)立的“離均差”。因此只有(n-1)個(gè)自由度。

第二章統(tǒng)計(jì)描述4.標(biāo)準(zhǔn)差

標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。第二章統(tǒng)計(jì)描述標(biāo)準(zhǔn)差的計(jì)算盤(pán)編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500標(biāo)準(zhǔn)差50.9915.817.91第二章統(tǒng)計(jì)描述5.變異系數(shù)變異系數(shù)(coefficientofvariation,CV)適用條件:①觀察指標(biāo)單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)

標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%第二章統(tǒng)計(jì)描述變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;

偏態(tài)分布:中位數(shù)、四分位半間距第二章統(tǒng)計(jì)描述第四節(jié)正態(tài)分布第二章統(tǒng)計(jì)描述正態(tài)分布的通俗概念:如果把數(shù)值變量資料編制頻數(shù)表后繪制頻數(shù)分布圖(又稱直方圖,它用矩形面積表示數(shù)值變量資料的頻數(shù)分布,每條直條的寬表示組距,直條的面積表示頻數(shù)(或頻率)大小,直條與直條之間不留空隙。),若頻數(shù)分布呈現(xiàn)中間為最多,左右兩側(cè)基本對(duì)稱,越靠近中間頻數(shù)越多,離中間越遠(yuǎn),頻數(shù)越少,形成一個(gè)中間頻數(shù)多,兩側(cè)頻數(shù)逐漸減少且基本對(duì)稱的分布,那我們一般認(rèn)為該數(shù)值變量服從或近似服從數(shù)學(xué)上的正態(tài)分布。正態(tài)分布的概念第二章統(tǒng)計(jì)描述

下面我們以第一節(jié)某地13歲女孩118人的身高(cm)資料,來(lái)說(shuō)明身高變量服從正態(tài)分布。頻數(shù)分布表:第二章統(tǒng)計(jì)描述頻數(shù)分布圖一(又稱直方圖)

第二章統(tǒng)計(jì)描述正態(tài)分布的數(shù)理統(tǒng)計(jì)學(xué)概念:如果隨機(jī)變量(X)的概率密度函數(shù)為:

-∞<x<+∞

則該隨機(jī)變量服從正態(tài)分布。式中σ為總體標(biāo)準(zhǔn)差;μ為總體均數(shù);π為圓周率,即3.14159···;e為自然對(duì)數(shù)的底,即2.71828···。第二章統(tǒng)計(jì)描述若某一隨機(jī)變量的概率密度函數(shù)(頻率曲線方程)為上式,則稱該變量X服從參數(shù)為μ和σ的正態(tài)分布,記為:X~N(μ,σ2)。函數(shù)方程中μ為位置參數(shù),σ為形狀參數(shù)。在σ不變的情況下,函數(shù)曲線形狀不變,若μ變大時(shí),曲線位置向右移;若μ變小時(shí),曲線位置向左移。在μ不變的情況下,函數(shù)曲線位置不變,若σ變大時(shí),曲線形狀變的越來(lái)越“胖”和“矮”;若σ變小時(shí),曲線形狀變的越來(lái)越“瘦”和“高”。第二章統(tǒng)計(jì)描述正態(tài)分布曲線由兩個(gè)參數(shù)決定,即總體均數(shù)μ和總體標(biāo)準(zhǔn)差σ。在σ不變的情況下,函數(shù)曲線形狀不變,若μ變大時(shí),曲線位置向右移;若變小時(shí),曲線位置向左移,故稱μ為位置參數(shù)。在μ不變的情況下,函數(shù)曲線位置不變,若σ變大時(shí),曲線形狀變的越來(lái)越“胖”和“矮”;若σ變小時(shí),曲線形狀變的越來(lái)越“瘦”和“高”,故稱σ為形態(tài)參數(shù)或變異度參數(shù)。N(μ,12)、N(μ,22)、N(μ,32)N(μ1

,σ2)、N(μ2

,σ2)

第二章統(tǒng)計(jì)描述正態(tài)分布的特征及其面積規(guī)律正態(tài)分布曲線位于橫軸上方,呈鐘形。正態(tài)分布曲線以均數(shù)所在處最高,且以均數(shù)為中心左右對(duì)稱。第二章統(tǒng)計(jì)描述正態(tài)曲線下面積分布有一定的規(guī)律性。對(duì)于服從正態(tài)分布的隨機(jī)變量(X),隨機(jī)變量值出現(xiàn)在某一區(qū)間(x1,x2)的概率與正態(tài)分布概率密度曲線與橫軸在該區(qū)間所圍成的區(qū)域的面積大小相對(duì)應(yīng)(相等)。正態(tài)分布概率密度曲線與橫軸圍成的區(qū)域的總面積恒等于1。正態(tài)分布概率密度曲線下橫軸上一定區(qū)間的面積可應(yīng)用數(shù)學(xué)知識(shí)求出。在實(shí)際應(yīng)用中,由于所有正態(tài)分布都可以通過(guò)變量變換轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)正態(tài)分。第二章統(tǒng)計(jì)描述若某一隨機(jī)變量X,其總體均數(shù)μ=0,總體標(biāo)準(zhǔn)差σ=1,即X~N(0,1),則稱變量X服從標(biāo)準(zhǔn)正態(tài)分布。習(xí)慣把服從標(biāo)準(zhǔn)正態(tài)分布的變量用字母U或Z表示,此時(shí),我們把U或Z稱為標(biāo)準(zhǔn)正態(tài)變量。標(biāo)準(zhǔn)正態(tài)分布是正態(tài)分布中的一個(gè)典型分布,數(shù)理統(tǒng)計(jì)上證明:對(duì)一服從正態(tài)分布的隨機(jī)變量(X),若進(jìn)行特定的變量變

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論