版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章數(shù)值變量資料的統(tǒng)計(jì)描述第一節(jié)頻數(shù)表第二章統(tǒng)計(jì)描述頻數(shù)分布表用于反映各變量(觀察單位的某種特征)值及其相應(yīng)頻數(shù)之間關(guān)系的一類表格,我們稱之為頻數(shù)表.這里頻數(shù)指對(duì)一種變量在多個(gè)觀察單位中進(jìn)行多次觀察,其中某一變量值重復(fù)出現(xiàn)的次數(shù).不同的資料類型編制頻數(shù)表難易程度不同,其中計(jì)數(shù)資料和等級(jí)資料比較簡(jiǎn)單,而計(jì)量資料相對(duì)較繁雜些.第二章統(tǒng)計(jì)描述計(jì)量資料頻數(shù)表的編制
一般情況下,樣本含量小于30的統(tǒng)計(jì)資料無(wú)須編制頻數(shù)表,但對(duì)于大樣本含量的資料,編制頻數(shù)表有利于進(jìn)一步的統(tǒng)計(jì)分析、且頻數(shù)表本身也具有統(tǒng)計(jì)描述的作用.
第二章統(tǒng)計(jì)描述編制頻數(shù)表的步驟編制頻數(shù)表步驟流程圖第二章統(tǒng)計(jì)描述舉例說(shuō)明計(jì)量資料頻數(shù)表的編制過(guò)程
第二章統(tǒng)計(jì)描述步驟如下:R=160.8-129.4=31.4。組段數(shù)=10;組距=R/10=3.14≈30(cm);按要求確定每一組段上下限。分組統(tǒng)計(jì)每一組段的頻數(shù),編制頻數(shù)表。第二章統(tǒng)計(jì)描述計(jì)量資料頻數(shù)分布表第二章統(tǒng)計(jì)描述計(jì)量資料頻數(shù)分布圖
第二章統(tǒng)計(jì)描述頻數(shù)分布表的用途揭示數(shù)值變量頻數(shù)分布的類型和特征作為陳述資料的形式便于發(fā)現(xiàn)一些特大或特小的可疑值便于進(jìn)一步的統(tǒng)計(jì)分析第二章統(tǒng)計(jì)描述計(jì)量資料頻數(shù)分布的類型和特征第二章統(tǒng)計(jì)描述第二節(jié)集中趨勢(shì)指標(biāo)第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述3.中位數(shù)(median)
中位數(shù)是將一批數(shù)據(jù)從小至大排列后位次居中的數(shù)據(jù)值,符號(hào)為Md,反映一批觀察值在位次上的平均水平。適用條件:適合各種類型的資料。尤其適合于①大樣本偏態(tài)分布的資料;②資料有不確定數(shù)值;③資料分布不明等。
第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述第二章統(tǒng)計(jì)描述頻數(shù)表資料的中位數(shù)下限值L上限值Ui;fm中位數(shù)Md第二章統(tǒng)計(jì)描述
組段(1)
劃記(2)
頻數(shù),f(3)
累計(jì)頻數(shù)Sf(4)累計(jì)百分率0.5~
331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8
合計(jì)
3160100.0(98.1~100)160中位數(shù)=1.1+0.1x[(160x50%-72)/20]=1.14第二章統(tǒng)計(jì)描述均數(shù)、中位數(shù)、眾數(shù)三者關(guān)系正態(tài)分布時(shí):均數(shù)=中位數(shù)=眾數(shù)正偏態(tài)分布時(shí):均數(shù)>中位數(shù)>眾數(shù)負(fù)偏態(tài)分布時(shí):均數(shù)<中位數(shù)<眾數(shù)第二章統(tǒng)計(jì)描述第三節(jié)變異(variation)指標(biāo)第二章統(tǒng)計(jì)描述
反映數(shù)據(jù)的離散度(Dispersion)。即個(gè)體觀察值的變異程度。常用的指標(biāo)有:
1.極差(Range)(全距)
2.百分位數(shù)與四分位數(shù)間距
PercentileandQuartilerange
3.方差Variance
4.標(biāo)準(zhǔn)差StandardDeviation
5.變異系數(shù)CoefficientofVariation
第二章統(tǒng)計(jì)描述盤(pán)編號(hào)甲乙丙14404804902460490495350050050045405105055560520510合計(jì)250025002500均數(shù)500500500
例:設(shè)甲、乙、丙三人,采每人的耳垂血,然后紅細(xì)胞計(jì)數(shù),每人數(shù)5個(gè)計(jì)數(shù)盤(pán),得結(jié)果如下(萬(wàn)/mm3)甲乙丙第二章統(tǒng)計(jì)描述1.極差(Range)(全距)優(yōu)點(diǎn):簡(jiǎn)便缺點(diǎn):1.只利用了兩個(gè)極端值
2.n大,R也會(huì)大
3.不穩(wěn)定1204020第二章統(tǒng)計(jì)描述2.百分位數(shù)與四分位數(shù)間距
Percentileandquartilerange百分位數(shù):數(shù)據(jù)從小到大排列;在百分尺度下,所占百分比對(duì)應(yīng)的值。記為Px。四分位間距:QR=P75-P25四分位半間距quartiledeviation:QD=QR/2P100(max)P75P50(中位數(shù))P25P0(min)Px第二章統(tǒng)計(jì)描述頻數(shù)表資料的百分位數(shù)下限值L上限值Ui;fm百分位數(shù)Px第二章統(tǒng)計(jì)描述
組段(1)
劃記(2)
頻數(shù),f(3)
累計(jì)頻數(shù)Sf(4)累計(jì)百分率0.5~
331.9(0~1.9)0.6~正9127.5(1.9~7.5)0.7~正正122415.0(7.5~15.0)0.8~正正133723.1(15.2~23.1)0.9~正正正175433.8(23.1~33.8)1.0~正正正187245.0(33.8~45.0)1.1~正正正正209257.5(45.0~57.5)1.2~正正正1811068.8(57.5~68.8)1.3~正正正1712779.4(68.8~79.4)1.4~正正1314087.5(79.4~87.5)1.5~正914993.1(87.5~93.1)1.6~正815798.1(93.1~98.1)1.7~1.8
合計(jì)
3160100.0(98.1~100)160P25=0.9+0.1x[(160x25%-37)/17]=0.92P75=1.3+0.1x[(160x75%-110)/17]=1.36QR=1.36-0.92=0.44;QD=0.22第二章統(tǒng)計(jì)描述3.方差
方差(variance)也稱均方差(meansquaredeviation),樣本觀察值的離均差平方和的均值。表示一組數(shù)據(jù)的平均離散情況。第二章統(tǒng)計(jì)描述樣本方差為什么要除以(n-1)
與自由度(degreesoffreedom)有關(guān)。自由度是數(shù)學(xué)名詞,在統(tǒng)計(jì)學(xué)中,n個(gè)數(shù)據(jù)如不受任何條件的限制,則n個(gè)數(shù)據(jù)可取任意值,稱為有n個(gè)自由度。若受到k個(gè)條件的限制,就只有(n-k)個(gè)自由度了。計(jì)算標(biāo)準(zhǔn)差時(shí),n個(gè)變量值本身有n個(gè)自由度。但受到樣本均數(shù)的限制,任何一個(gè)“離均差”均可以用另外的(n-1)個(gè)“離均差”表示,所以只有(n-1)個(gè)獨(dú)立的“離均差”。因此只有(n-1)個(gè)自由度。
第二章統(tǒng)計(jì)描述4.標(biāo)準(zhǔn)差
標(biāo)準(zhǔn)差(standarddeviation)即方差的正平方根;其單位與原變量X的單位相同。第二章統(tǒng)計(jì)描述標(biāo)準(zhǔn)差的計(jì)算盤(pán)編號(hào)甲乙丙甲2乙2丙214404804901936002304002401002460490495211600240100245025350050050025000025000025000045405105052916002601002550255560520510313600270400260100合計(jì)250025002500標(biāo)準(zhǔn)差50.9915.817.91第二章統(tǒng)計(jì)描述5.變異系數(shù)變異系數(shù)(coefficientofvariation,CV)適用條件:①觀察指標(biāo)單位不同,如身高、體重②同單位資料,但均數(shù)相差懸殊均數(shù)
標(biāo)準(zhǔn)差變異系數(shù)青年男子身高170cm6cm3.5%體重60kg7kg11.7%第二章統(tǒng)計(jì)描述變異指標(biāo)小結(jié)1.極差較粗,適合于任何分布2.標(biāo)準(zhǔn)差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標(biāo)和變異指標(biāo)分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標(biāo)準(zhǔn)差;
偏態(tài)分布:中位數(shù)、四分位半間距第二章統(tǒng)計(jì)描述第四節(jié)正態(tài)分布第二章統(tǒng)計(jì)描述正態(tài)分布的通俗概念:如果把數(shù)值變量資料編制頻數(shù)表后繪制頻數(shù)分布圖(又稱直方圖,它用矩形面積表示數(shù)值變量資料的頻數(shù)分布,每條直條的寬表示組距,直條的面積表示頻數(shù)(或頻率)大小,直條與直條之間不留空隙。),若頻數(shù)分布呈現(xiàn)中間為最多,左右兩側(cè)基本對(duì)稱,越靠近中間頻數(shù)越多,離中間越遠(yuǎn),頻數(shù)越少,形成一個(gè)中間頻數(shù)多,兩側(cè)頻數(shù)逐漸減少且基本對(duì)稱的分布,那我們一般認(rèn)為該數(shù)值變量服從或近似服從數(shù)學(xué)上的正態(tài)分布。正態(tài)分布的概念第二章統(tǒng)計(jì)描述
下面我們以第一節(jié)某地13歲女孩118人的身高(cm)資料,來(lái)說(shuō)明身高變量服從正態(tài)分布。頻數(shù)分布表:第二章統(tǒng)計(jì)描述頻數(shù)分布圖一(又稱直方圖)
第二章統(tǒng)計(jì)描述正態(tài)分布的數(shù)理統(tǒng)計(jì)學(xué)概念:如果隨機(jī)變量(X)的概率密度函數(shù)為:
-∞<x<+∞
則該隨機(jī)變量服從正態(tài)分布。式中σ為總體標(biāo)準(zhǔn)差;μ為總體均數(shù);π為圓周率,即3.14159···;e為自然對(duì)數(shù)的底,即2.71828···。第二章統(tǒng)計(jì)描述若某一隨機(jī)變量的概率密度函數(shù)(頻率曲線方程)為上式,則稱該變量X服從參數(shù)為μ和σ的正態(tài)分布,記為:X~N(μ,σ2)。函數(shù)方程中μ為位置參數(shù),σ為形狀參數(shù)。在σ不變的情況下,函數(shù)曲線形狀不變,若μ變大時(shí),曲線位置向右移;若μ變小時(shí),曲線位置向左移。在μ不變的情況下,函數(shù)曲線位置不變,若σ變大時(shí),曲線形狀變的越來(lái)越“胖”和“矮”;若σ變小時(shí),曲線形狀變的越來(lái)越“瘦”和“高”。第二章統(tǒng)計(jì)描述正態(tài)分布曲線由兩個(gè)參數(shù)決定,即總體均數(shù)μ和總體標(biāo)準(zhǔn)差σ。在σ不變的情況下,函數(shù)曲線形狀不變,若μ變大時(shí),曲線位置向右移;若變小時(shí),曲線位置向左移,故稱μ為位置參數(shù)。在μ不變的情況下,函數(shù)曲線位置不變,若σ變大時(shí),曲線形狀變的越來(lái)越“胖”和“矮”;若σ變小時(shí),曲線形狀變的越來(lái)越“瘦”和“高”,故稱σ為形態(tài)參數(shù)或變異度參數(shù)。N(μ,12)、N(μ,22)、N(μ,32)N(μ1
,σ2)、N(μ2
,σ2)
第二章統(tǒng)計(jì)描述正態(tài)分布的特征及其面積規(guī)律正態(tài)分布曲線位于橫軸上方,呈鐘形。正態(tài)分布曲線以均數(shù)所在處最高,且以均數(shù)為中心左右對(duì)稱。第二章統(tǒng)計(jì)描述正態(tài)曲線下面積分布有一定的規(guī)律性。對(duì)于服從正態(tài)分布的隨機(jī)變量(X),隨機(jī)變量值出現(xiàn)在某一區(qū)間(x1,x2)的概率與正態(tài)分布概率密度曲線與橫軸在該區(qū)間所圍成的區(qū)域的面積大小相對(duì)應(yīng)(相等)。正態(tài)分布概率密度曲線與橫軸圍成的區(qū)域的總面積恒等于1。正態(tài)分布概率密度曲線下橫軸上一定區(qū)間的面積可應(yīng)用數(shù)學(xué)知識(shí)求出。在實(shí)際應(yīng)用中,由于所有正態(tài)分布都可以通過(guò)變量變換轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)正態(tài)分。第二章統(tǒng)計(jì)描述若某一隨機(jī)變量X,其總體均數(shù)μ=0,總體標(biāo)準(zhǔn)差σ=1,即X~N(0,1),則稱變量X服從標(biāo)準(zhǔn)正態(tài)分布。習(xí)慣把服從標(biāo)準(zhǔn)正態(tài)分布的變量用字母U或Z表示,此時(shí),我們把U或Z稱為標(biāo)準(zhǔn)正態(tài)變量。標(biāo)準(zhǔn)正態(tài)分布是正態(tài)分布中的一個(gè)典型分布,數(shù)理統(tǒng)計(jì)上證明:對(duì)一服從正態(tài)分布的隨機(jī)變量(X),若進(jìn)行特定的變量變
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 陜西省渭南市合陽(yáng)縣2025屆高考考前模擬數(shù)學(xué)試題含解析
- 2025屆河南省漯河市第五高級(jí)中學(xué)高三第一次調(diào)研測(cè)試數(shù)學(xué)試卷含解析
- 山東省莒縣第一中學(xué)2025屆高考語(yǔ)文必刷試卷含解析
- 江蘇省無(wú)錫市重點(diǎn)中學(xué)2025屆高三最后一模英語(yǔ)試題含解析
- 黑龍江省牡丹江市三中2025屆高考語(yǔ)文三模試卷含解析
- 湖南省天壹名校2025屆高三3月份第一次模擬考試英語(yǔ)試卷含解析
- 分?jǐn)?shù)基本性質(zhì)課件
- 安徽省肥東市高級(jí)中學(xué)2025屆高三下學(xué)期聯(lián)合考試英語(yǔ)試題含解析2
- 湖南省岳陽(yáng)市岳陽(yáng)一中2025屆高考語(yǔ)文五模試卷含解析
- 2025屆湖北省鄂東南五校一體聯(lián)盟聯(lián)考高考英語(yǔ)二模試卷含解析
- 國(guó)開(kāi)期末考試《公共政策概論》機(jī)考試題及答案(第九套)
- 2023學(xué)年廣州市白云區(qū)物理九上期末檢測(cè)試題含解析
- 超聲波焊接機(jī)日常保養(yǎng)點(diǎn)檢記錄表
- 發(fā)電機(jī)房巡檢記錄表
- SPC培訓(xùn)資料課件
- 個(gè)人違法建房出售行為如何適用法律問(wèn)題
- 二年級(jí)上冊(cè)數(shù)學(xué)試題 長(zhǎng)沙市雨花區(qū) 上學(xué)期二年級(jí)期末考試數(shù)學(xué)試題(人教版 無(wú)答案)
- 液氧、液氮、液氬充裝安全管理手冊(cè)
- 保衛(wèi)科安全安全巡查記錄表
- 污水處理操作工考試題庫(kù)與答案(最新版)
- DB65∕T 2794-2007 新疆驢飼養(yǎng)管理規(guī)程
評(píng)論
0/150
提交評(píng)論