




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第四章數(shù)據(jù)的描述性分析本章內(nèi)容一、 集中趨勢的描述二、 離散程度的描述三、 分布的偏態(tài)與峰度集中趨勢的描述數(shù)值平均數(shù)1. 算術(shù)平均數(shù)2. 調(diào)和平均數(shù)3. 幾何平均數(shù)集中趨勢的描述位置平均數(shù)1. 中位數(shù)2. 眾數(shù)對比離散程度的描述絕對指標(biāo)1. 極差與四分位差2. 平均差3. 標(biāo)準(zhǔn)差與方差相對指標(biāo)離散系數(shù)離散程度的描述數(shù)據(jù)標(biāo)準(zhǔn)化分布的偏態(tài)與峰度原點距中心距分布的偏態(tài)與峰度分布的偏態(tài)分布的峰度集中趨勢 集中趨勢(central tendency)是一組數(shù)據(jù)向其中心靠攏的傾向。測定集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值。集中趨勢往往使用平均指標(biāo)來測度 算術(shù)平均數(shù) 算術(shù)平均數(shù)(arithmetic
2、 mean)是總體中各個體的某個數(shù)量標(biāo)志的總和與個體總數(shù)的比值,一般用符號 表示。 x對應(yīng)的個體總數(shù)某數(shù)量標(biāo)志的總和算術(shù)平均數(shù) 簡單算術(shù)平均數(shù)簡單算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)分組數(shù)據(jù)分組數(shù)據(jù)算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì) 簡單算術(shù)平均數(shù)簡單算術(shù)平均數(shù)nxnxxxxniin121.加權(quán)算術(shù)平均數(shù)加權(quán)算術(shù)平均數(shù)分組niiniiinnnffxffffxfxfxx11212211. 某廠某車間某廠某車間2020名工人加工某種零件的產(chǎn)量資料如下:名工人加工某種零件的產(chǎn)量資料如下:- -單項式變量分布數(shù)列單項式變量分布數(shù)列 2020名工人零件生產(chǎn)數(shù)量分組資料名工人零件生產(chǎn)數(shù)量分組資料按
3、日產(chǎn)量分組(件)x工人人數(shù)(人)f總產(chǎn)量(件)xf14151617182485128601288518合計20319加權(quán)算術(shù)平均數(shù)權(quán)數(shù)組距式組距式加權(quán)均值(權(quán)數(shù)對均值的影響) 甲乙兩組各有10名學(xué)生,他們的考試成績及其分布數(shù)據(jù)如下 甲組:甲組: 考試成績(考試成績(x ): 0 20 100 人數(shù)分布(人數(shù)分布(f ):):1 1 8 乙組:乙組: 考試成績(考試成績(x ): 0 20 100 人數(shù)分布(人數(shù)分布(f ):):8 1 1選擇-4權(quán)數(shù) 次數(shù)次數(shù)f f的作用:當(dāng)變量值比較大的次數(shù)多時,平均數(shù)就接近于變量的作用:當(dāng)變量值比較大的次數(shù)多時,平均數(shù)就接近于變量值大的一方;當(dāng)變量值比較小
4、的次數(shù)多時,平均數(shù)就接近于變量值小的一值大的一方;當(dāng)變量值比較小的次數(shù)多時,平均數(shù)就接近于變量值小的一方??梢?,次數(shù)對變量值在平均數(shù)中的影響起著某種權(quán)衡輕重的作用,因方??梢姡螖?shù)對變量值在平均數(shù)中的影響起著某種權(quán)衡輕重的作用,因此被稱為權(quán)數(shù)。此被稱為權(quán)數(shù)。有時權(quán)數(shù)也用比重(頻率)來表示有時權(quán)數(shù)也用比重(頻率)來表示11niiniiifxxf算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)各變量值關(guān)于算術(shù)平均各變量值關(guān)于算術(shù)平均數(shù)的偏離,在平方的意數(shù)的偏離,在平方的意義下達到最小義下達到最小1()0niiixxf21()minniiixxf調(diào)和平均數(shù) 調(diào)和平均數(shù)(harmonic mean)是各變量值
5、倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。由于它是根據(jù)變量值倒數(shù)計算的,所以又稱作倒數(shù)平均數(shù),通常用 表示。簡單調(diào)和平均數(shù)簡單調(diào)和平均數(shù)加權(quán)調(diào)和平均數(shù)加權(quán)調(diào)和平均數(shù)調(diào)和平均數(shù)是算術(shù)平均數(shù)的變形調(diào)和平均數(shù)是算術(shù)平均數(shù)的變形 hx調(diào)和平均數(shù) 某蔬菜批發(fā)市場三種蔬菜的日成交量數(shù)據(jù)如下,計算三種蔬菜該日的平均批發(fā)價格。蔬菜名稱批發(fā)價格(元)x成交量(公斤)f甲乙丙1.200.500.8015000250008000合計-48000369000.76948000iiix fxf(元)算術(shù)平均數(shù)算術(shù)平均數(shù)調(diào)和平均數(shù) 若已知成交額,未知成交量,資料如下:若已知成交額,未知成交量,資料如下:蔬菜名稱蔬菜名稱批發(fā)價格批發(fā)價格(元
6、元)x成交額成交額(元元)m甲甲乙乙丙丙1.200.500.8018000125006400合計合計-36900369000.76948000ihiimxmx(元)加權(quán)調(diào)和平均數(shù)加權(quán)調(diào)和平均數(shù)1211121112.1.hnniiniinnniiiiniimmmmmxmmmmmxxxxx變量值倒數(shù)變量值倒數(shù)簡單調(diào)和平均數(shù)簡單調(diào)和平均數(shù)niinxnxxxnxh12111.11調(diào)和平均數(shù)是算術(shù)平均數(shù)的變形調(diào)和平均數(shù)是算術(shù)平均數(shù)的變形1111iiihnnmletfiiixiinniiiiimx fxxmfx調(diào)和平均數(shù)是標(biāo)志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù),它和算術(shù)平均數(shù)的實際意義是相同的,計算公式也可以互推幾
7、何平均數(shù) 幾何平均數(shù)(geometric mean)是n個變量值連乘積的n次方根。它主要用于計算比率或速度的平均,當(dāng)所掌握的變量值本身是比率的形式,而且各比率的乘積等于總的比率時,就應(yīng)采用幾何平均法計算平均比率。 簡單幾何平均數(shù)簡單幾何平均數(shù)加權(quán)幾何平均數(shù)加權(quán)幾何平均數(shù)gx簡單幾何平均數(shù)簡單幾何平均數(shù)nniinnxxxxxg121.案例:案例:某水泥廠某水泥廠19951995年的水泥產(chǎn)量為年的水泥產(chǎn)量為100100萬噸,萬噸,19961996年與年與19951995年年相比增長率為相比增長率為9 9,19971997年比年比19961996相比增長率為相比增長率為6 6,19981998年比年
8、比19971997年相比增長率為年相比增長率為2020,求這三年的年平均增長率,求這三年的年平均增長率319951995(19%)(16%)(120%)(1)yyr簡單幾何平均數(shù)簡單幾何平均數(shù)案例2:一位投資者在1996年初買進一種股票,1996,1997,1998,1999這四年的收益率分別為4.5,2,3.5,5.4,計算該投資者在這四年內(nèi)的平均收益率r419961241996(1)(1).(1)(1)yrrryr41241(1)(1).(1)rrrr4124(1)(1).(1)1rrrr簡單幾何平均數(shù)簡單幾何平均數(shù)nniinnxxxxxg121.6126ap ppap加權(quán)幾何平均數(shù)加權(quán)幾
9、何平均數(shù)ffniiffffnffginnxxxxx1.212121.4551419901990(110.2% ) (18.7% ) (19.6% )(1)yyr初初位置平均數(shù)1. 中位數(shù)2. 眾數(shù)中位數(shù) 中位數(shù)(median)是一組數(shù)據(jù)按大小順序排列后,處于中間位置的那個變量值,通常用 表示。由未分組數(shù)據(jù)確定中位數(shù)由未分組數(shù)據(jù)確定中位數(shù)由單項數(shù)列確定中位數(shù)由單項數(shù)列確定中位數(shù)em分位數(shù)數(shù)值型未分組數(shù)據(jù)的中位數(shù) (5個數(shù)據(jù)的算例)原始數(shù)據(jù)原始數(shù)據(jù): 24 22 21 26 20排排 序序: 20 21 22 24 26位位 置置: 1 2 3 4 5321521n位置數(shù)值型未分組數(shù)據(jù)的中位數(shù) (
10、6個數(shù)據(jù)的算例)原始數(shù)據(jù)原始數(shù)據(jù): 10 5 9 12 6 8排排 序序: 5 6 8 9 10 12位位 置置: 1 2 3 4 5 6由未分組數(shù)據(jù)確定中位數(shù)由未分組數(shù)據(jù)確定中位數(shù) 對未分組數(shù)據(jù)資料,需先將各變量值按大小順序排列,并按公式 確定中位數(shù)的位置。21n當(dāng)一個序列中的項數(shù)為奇數(shù)時,則處于序列中間位置的變量值就是中位數(shù)。 例: 7、6、8、2、3 當(dāng)一個序列的項數(shù)是偶數(shù)時,則應(yīng)取中間兩個數(shù)的中點值作為中位數(shù),即取中間兩個變量值的平均數(shù)為中位數(shù)。 例: 2、5、7、8、11、12 未分組數(shù)據(jù)的中位數(shù)(計算公式)為偶數(shù)時當(dāng)為奇數(shù)時當(dāng)nxxnxmnnne1222121分組數(shù)據(jù)確定中位數(shù)分組
11、數(shù)據(jù)確定中位數(shù)-單項式,組距式單項式,組距式( (見分位數(shù))見分位數(shù))由單項數(shù)列確定中位數(shù)由單項數(shù)列確定中位數(shù)l按公式 確定中位數(shù)的位置l并對照累計次數(shù)確定中位數(shù)。211niif由單項數(shù)列確定中位數(shù)由單項數(shù)列確定中位數(shù) 先計算各組的累計次數(shù),再按公式 確定中位數(shù)的位置,并對照累計次數(shù)確定中位數(shù)。211niif分位數(shù) 三個數(shù)值可以將變量數(shù)列劃分為項數(shù)相三個數(shù)值可以將變量數(shù)列劃分為項數(shù)相等的四部分,這三個數(shù)值就定義為四分位數(shù)等的四部分,這三個數(shù)值就定義為四分位數(shù)(quartiles)(quartiles)。九個數(shù)值可以將變量數(shù)列劃分為項數(shù)相等的十部九個數(shù)值可以將變量數(shù)列劃分為項數(shù)相等的十部分,這九
12、個數(shù)值就定義為十分位數(shù)分,這九個數(shù)值就定義為十分位數(shù) (dectile)(dectile)9999個數(shù)值可以將變量數(shù)列劃分為項數(shù)相等的個數(shù)值可以將變量數(shù)列劃分為項數(shù)相等的100100部分,這部分,這9999個數(shù)值就定義為百分位數(shù)個數(shù)值就定義為百分位數(shù) (percentile)(percentile)四分位數(shù) 第一個四分位數(shù)稱為下四分位數(shù) 第三個四分位數(shù)稱為上四分位數(shù)1.1.集中趨勢的測度值之一集中趨勢的測度值之一2.2.排序后處于排序后處于25%25%和和75%75%位置上的值位置上的值未分組資料和單項資料的四分位數(shù) 先排序,若為單項分組資料,需計算累計頻數(shù) 再通過公式確定位置: 如果四分位數(shù)
13、的位置不在某變量值上,必須按比例分?jǐn)傋兞恐?,以確定四分位數(shù)。4) 1(34) 1(241fqfqfquml數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (7個數(shù)據(jù)的算例)原始數(shù)據(jù)原始數(shù)據(jù): 23 21 30 32 28 25 26排排 序序: 21 23 25 26 28 30 32位位 置置: 1 2 3 4 5 6 7 數(shù)值型未分組數(shù)據(jù)的四分位數(shù) (6個數(shù)據(jù)的算例)原始數(shù)據(jù)原始數(shù)據(jù): 23 21 30 28 25 26排排 序序: 21 23 25 26 28 30位位 置置: 1 2 3 4 5 62、分組資料 先求累積頻數(shù) 再確定位置 最后依公式求四分位數(shù)(也是按比例分?jǐn)偅﹗uufuummmfmmlll
14、fllifslqifslqifslqfqul的位置的位置其中其中為該分位數(shù)組的下限;為該分位數(shù)組的下限;為總次數(shù);為總次數(shù);為較小累計該分位數(shù)所在組前一組的累計次數(shù)為較小累計該分位數(shù)所在組前一組的累計次數(shù)為分位數(shù)組的次數(shù);為分位數(shù)組的次數(shù);為分位數(shù)組的組距。為分位數(shù)組的組距。lf 1lslfli以第一四分位數(shù)公式說明參數(shù)眾數(shù) 眾數(shù)(mode)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個變量值,通常用 表示。om由未分組數(shù)據(jù)確定眾數(shù)由未分組數(shù)據(jù)確定眾數(shù)由單項數(shù)列確定眾數(shù)由單項數(shù)列確定眾數(shù)由組距數(shù)列確定眾數(shù)由組距數(shù)列確定眾數(shù)由未分組數(shù)據(jù)確定眾數(shù)由未分組數(shù)據(jù)確定眾數(shù)例1: 7、6、8、2
15、、3例2: 7、6、8、2、3 、4、3、2、3例3: 7、6、8、2、3 、4、3、2、3、2由單項數(shù)列確定眾數(shù)由單項數(shù)列確定眾數(shù)由由組距式數(shù)列確定眾數(shù)確定眾數(shù)先確定眾數(shù)組;再用下述公式計算:上限公式下限公式iumilmoo212211按成績分組按成績分組人數(shù)人數(shù)5050 以下以下5050606060607070(l)(l)70708080(u)(u)808090909090 以上以上101020203030(f(fm-1m-1) )5050(f(fm m) )4040(f(fm+1m+1) )3030合計合計180180符號含義:(a)l為眾數(shù)組的下限,u為上限;(b)i為眾數(shù)組的組距;(
16、c)1=fmfm-1,即眾數(shù)組的次數(shù)與前一組次數(shù)之差; 2=fm fm+1,即眾數(shù)組的次數(shù)與后一組次數(shù)之差。stat40 50 60 70 80 90 10050 40 30 20 10bcedx y(l) (u)mo=l+x=u-yo121211121212oa cf db exyib oa ca c oo d fo ef dxximliix 相似于af重點考察眾數(shù)位置和相鄰兩組次數(shù)的關(guān)系重點考察眾數(shù)位置和相鄰兩組次數(shù)的關(guān)系眾數(shù)取值的特點:眾數(shù)取值的特點: 眾數(shù)的數(shù)值始終偏向相鄰組中次數(shù)較大的組,當(dāng)相鄰兩組眾數(shù)的數(shù)值始終偏向相鄰組中次數(shù)較大的組,當(dāng)相鄰兩組的次數(shù)相等時,眾數(shù)則是眾數(shù)組的組中值
17、。的次數(shù)相等時,眾數(shù)則是眾數(shù)組的組中值。注意問題注意問題(1 1)優(yōu)點:不易受極端值的影響。)優(yōu)點:不易受極端值的影響。(2 2)缺點:未利用所有信息,)缺點:未利用所有信息,缺乏敏感性和不適合代數(shù)運算缺乏敏感性和不適合代數(shù)運算對比1. 眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的關(guān)系確定分布是否確定分布是否有偏,偏斜情況如何有偏,偏斜情況如何已知某班學(xué)生的平均年齡為17.8歲,18歲的人數(shù)最多,則該分布屬于( )。a正態(tài) b左偏c右偏 d無法判斷對比2. 眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的特點與應(yīng)用場合眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的特點與應(yīng)用場合l位置平均數(shù)不易受極端值的影響,比較穩(wěn)健。位置
18、平均數(shù)不易受極端值的影響,比較穩(wěn)健。l位置平均數(shù)的取值只與中間位置的一或兩個數(shù)值有關(guān),利用信位置平均數(shù)的取值只與中間位置的一或兩個數(shù)值有關(guān),利用信 息不充分,忽略了其它數(shù)據(jù)的大小,并且不適合于代數(shù)運算息不充分,忽略了其它數(shù)據(jù)的大小,并且不適合于代數(shù)運算。l平均數(shù)所用的的數(shù)據(jù)信息比較完整,但易受極端值影響平均數(shù)所用的的數(shù)據(jù)信息比較完整,但易受極端值影響 1.計算平均指標(biāo)最常用的方法和最基本的形式是()。a.中位數(shù) b.眾數(shù) c.算術(shù)平均數(shù) d.調(diào)和平數(shù) 2受極端數(shù)值影響最小的集中趨勢值是( )。a算術(shù)平均數(shù) b調(diào)和平均數(shù)c幾何平均數(shù) d眾數(shù)4位置平均數(shù)是指()a算術(shù)均值b調(diào)和均值c幾何均值d眾數(shù)
19、e中位數(shù)極差與四分位差極差與四分位差 極差(極差(rangerange)也叫全距,是一組數(shù)據(jù)的最大值)也叫全距,是一組數(shù)據(jù)的最大值與最小值之離差,即與最小值之離差,即:)min()max(iixxr 四分位差(四分位差(interquartile rangeinterquartile range)是指第三四分位)是指第三四分位數(shù)與第一四分位數(shù)之差,也稱為內(nèi)距或四分間距,用表數(shù)與第一四分位數(shù)之差,也稱為內(nèi)距或四分間距,用表示。四分位差的計算公式為:示。四分位差的計算公式為: 13qqqr離散程度刻畫指標(biāo)極差:極差: 是數(shù)據(jù)離散程度的一種簡單刻畫,其中只考慮是數(shù)據(jù)離散程度的一種簡單刻畫,其中只考慮
20、了兩端數(shù)值,沒有體現(xiàn)各單位變量值的變異程度,且易了兩端數(shù)值,沒有體現(xiàn)各單位變量值的變異程度,且易受極端值影響受極端值影響 四分位差:反映了數(shù)據(jù)排序后中間四分位差:反映了數(shù)據(jù)排序后中間50%50%數(shù)據(jù)的離散程數(shù)據(jù)的離散程度,其值越小,說明中間度,其值越小,說明中間50%50%數(shù)據(jù)越集中;四分位差是數(shù)據(jù)越集中;四分位差是由位置平均數(shù)定義,不易受極端值影響,在某種程度上由位置平均數(shù)定義,不易受極端值影響,在某種程度上彌補了極差的不足,但同樣沒有考慮所有數(shù)據(jù)彌補了極差的不足,但同樣沒有考慮所有數(shù)據(jù) 特點平均差 平均差(mean deviation)也稱平均離差,是各變量值與其平均數(shù)離差絕對值的平均數(shù),
21、通常用 md表示。簡單式平均差簡單式平均差加權(quán)式平均差加權(quán)式平均差簡單式平均差簡單式平均差nxxmnid1平均差:avedev( )甲組乙組日產(chǎn)量離差離差絕對值日產(chǎn)量離差離差絕對值xx8090100110120-20-10010202010010209095100105110-10-505101050510合計60合計30 xxxx xxxx加權(quán)式平均差加權(quán)式平均差iiiinidffxxm11標(biāo)準(zhǔn)差與方差 標(biāo)準(zhǔn)差(standard deviation)又稱均方差,它是各單位變量值與其平均數(shù)離差平方的平均數(shù)的方根,通常用 表示。它是測度數(shù)據(jù)離散程度的最主要方法。方差(variance)是各變量值
22、與其算術(shù)平均數(shù)離差平方和的平均數(shù),即是標(biāo)準(zhǔn)差的平方;用 表示總體的方差;用 表示樣本的方差標(biāo)準(zhǔn)差。,而樣本標(biāo)準(zhǔn)差記為s 22s標(biāo)準(zhǔn)差的表達式總體與樣本標(biāo)準(zhǔn)差總體與樣本標(biāo)準(zhǔn)差簡單式標(biāo)準(zhǔn)差簡單式標(biāo)準(zhǔn)差 加權(quán)式標(biāo)準(zhǔn)差加權(quán)式標(biāo)準(zhǔn)差簡單式標(biāo)準(zhǔn)差簡單式標(biāo)準(zhǔn)差nxxnii12)(總體標(biāo)準(zhǔn)差stdevp( )結(jié)論:平均差和標(biāo)準(zhǔn)差的大小,dm甲組乙組日產(chǎn)量離差離差平方日產(chǎn)量 離差離差平方xx8090100110120-20-100102040010001004009095100105110-10-5051010025025100合計1000合計25007. 752501 .145100022nxxnxx乙甲xx
23、xx2xx 2xx加權(quán)式標(biāo)準(zhǔn)差加權(quán)式標(biāo)準(zhǔn)差niiiniiffxx121)(總體與樣本標(biāo)準(zhǔn)差總體與樣本標(biāo)準(zhǔn)差nxxnii12)(niiiniiffxxs1121)(1)(12nxxsniiniiiniiffxx121)(簡單式加權(quán)式總體樣本標(biāo)準(zhǔn)差:樣本標(biāo)準(zhǔn)差stdev( ) 總體標(biāo)準(zhǔn)差stdevp( )方差:樣本方差var( ) 總體方差varp( )離散系數(shù) 對于平均數(shù)不等或計量單位不同的不同組別的變量值,是不能對于平均數(shù)不等或計量單位不同的不同組別的變量值,是不能直接用離散程度的絕對指標(biāo)比較其離散程度的。為了消除變量平均數(shù)直接用離散程度的絕對指標(biāo)比較其離散程度的。為了消除變量平均數(shù)不等和計量
24、單位不同對離散程度測度值的影響,需要計算離散程度的不等和計量單位不同對離散程度測度值的影響,需要計算離散程度的相對指標(biāo),即離散系數(shù),又稱標(biāo)準(zhǔn)差系數(shù)相對指標(biāo),即離散系數(shù),又稱標(biāo)準(zhǔn)差系數(shù)( (無名數(shù)無名數(shù))。其一般公式是:)。其一般公式是:對應(yīng)的平均指標(biāo)離散程度的絕對指標(biāo)離散系數(shù) ( )100%svx離散系數(shù)例:某地隨機抽取一組男青年和女青年,測量他們的平均體重和標(biāo)準(zhǔn)差如下55.59,4.26548.52,3.985xkg skgxkg skg男女離散系數(shù)為( )100%7.67%( )100%8.21%svxsvx男女說明女青年間體重的差異比男青年要大一些數(shù)據(jù)標(biāo)準(zhǔn)化判斷是否有離群點判斷是否有離群
25、點 標(biāo)準(zhǔn)化數(shù)值是變量值與其平均數(shù)的離差除以標(biāo)準(zhǔn)差后的值,也稱為z分?jǐn)?shù)或標(biāo)準(zhǔn)分?jǐn)?shù)。設(shè)標(biāo)準(zhǔn)化數(shù)值為z,則有:xxzi 度量的是數(shù)據(jù)偏離平均值有多少個標(biāo)準(zhǔn)差;度量的是數(shù)據(jù)偏離平均值有多少個標(biāo)準(zhǔn)差;經(jīng)驗表明:當(dāng)數(shù)據(jù)分布對稱時經(jīng)驗表明:當(dāng)數(shù)據(jù)分布對稱時約有約有68.27%68.27%的數(shù)據(jù)與平均值的偏離在的數(shù)據(jù)與平均值的偏離在1 1個標(biāo)準(zhǔn)差的范圍內(nèi),個標(biāo)準(zhǔn)差的范圍內(nèi),約有約有95.45%95.45%的數(shù)據(jù)與平均值的偏離在的數(shù)據(jù)與平均值的偏離在2 2個標(biāo)準(zhǔn)差的范圍內(nèi),個標(biāo)準(zhǔn)差的范圍內(nèi),約有約有99.73%99.73%的數(shù)據(jù)與平均值的偏離在的數(shù)據(jù)與平均值的偏離在3 3個標(biāo)準(zhǔn)差的范圍內(nèi);個標(biāo)準(zhǔn)差的范圍內(nèi);可見
26、,偏離可見,偏離3 3個標(biāo)準(zhǔn)差之外的數(shù)據(jù)時很少的;個標(biāo)準(zhǔn)差之外的數(shù)據(jù)時很少的;一般,偏離一般,偏離3 3個標(biāo)準(zhǔn)差之外的數(shù)據(jù)就稱為是離群點或異常值個標(biāo)準(zhǔn)差之外的數(shù)據(jù)就稱為是離群點或異常值也就是說,標(biāo)準(zhǔn)化之后約有也就是說,標(biāo)準(zhǔn)化之后約有99.73%(95.45%)的結(jié)果是在)的結(jié)果是在+-3(+-2)之間)之間-實際中有此特性的是正態(tài)分布變量實際中有此特性的是正態(tài)分布變量數(shù)據(jù)標(biāo)準(zhǔn)化判斷是否有離群點判斷是否有離群點如果我們認(rèn)為偏離超過3個標(biāo)準(zhǔn)差即為離群點,那么-3.6所對應(yīng)的數(shù)值為離群點數(shù)據(jù)標(biāo)準(zhǔn)化判斷是否有離群點判斷是否有離群點normsdist(z)=p(x1.5)=2(normsdist(-1.
27、5)=0.1336normsinv (probability):返回p(xz)=probability所對應(yīng)的znormsinv (0.975)= 1.96根據(jù)對稱性,有normsinv(0.025)=-1.96標(biāo)準(zhǔn)正態(tài)分布的有關(guān)函數(shù)課后單選12 :-normsinv (0.01)=2.33 -normsinv (0.06)=1.55 數(shù)據(jù)分成k組,每組的次數(shù)ni,i=1.2.k,記 為第i組的第j個數(shù)據(jù), 為第i組的平均數(shù)ijxix2i為第i組的組內(nèi)方差,則212,1,.,inijijiixxikn各組內(nèi)方差的加權(quán)平均數(shù):22112111inkkijiiiijiikkiiiixxnnn 總方
28、差,組間方差,組內(nèi)方差組內(nèi)離差平方和組內(nèi)離差平方和記 為總平均數(shù)x組間方差:11kiiikiixnxn總方差:2211kiiikiixxnn()()ixx組間方差:各組平均數(shù)對總平均數(shù)的方差。222i總方差組間方差平均組內(nèi)方差可證明也被稱為方差加法定理2121inkijijkiixxn 組間離差平方和總離差平方和stat例題:教材數(shù)據(jù)(ch4-方差分解)原點矩原點矩kexk階原點矩一階原點矩ex二階原點矩2exk階樣本原點矩1nkiixn一階樣本原點矩1niixn二階樣本原點矩21niixn中心矩中心矩()ke xuk階原點矩二階原點矩2()e xuk階樣本原點矩1()nkiixxn二階樣本原
29、點矩21()niixxnniinikiikfxfu11一般式-k階原點矩一階原點矩-加權(quán)算術(shù)平均數(shù)niiniiifxfu111對于分組數(shù)據(jù)中心矩niiniikikffxxv11)(一般式-k階中心矩三階中心矩3131()niiiniixxfvf四階中心矩4141()niiiniixxfvf二階中心矩-分組數(shù)據(jù)的方差2121()niiiniixxfvf偏態(tài) 偏態(tài)(偏態(tài)(skewnessskewness)是對分布偏斜方向和程度的測度。)是對分布偏斜方向和程度的測度。變量分組后,總體中各個體在不同的分組變量值下分布變量分組后,總體中各個體在不同的分組變量值下分布并不均勻?qū)ΨQ,而呈現(xiàn)出偏斜的分布狀況,
30、統(tǒng)計上將其并不均勻?qū)ΨQ,而呈現(xiàn)出偏斜的分布狀況,統(tǒng)計上將其稱為偏態(tài)分布。稱為偏態(tài)分布。313133niiiniiffxxv 偏態(tài)系數(shù)偏態(tài)系數(shù) 的數(shù)值一般在的數(shù)值一般在0 0與與3 3之間,越接近之間,越接近0 0,分布的偏斜度越??;越接近分布的偏斜度越?。辉浇咏? 3,分布的偏斜度越大。,分布的偏斜度越大。大于大于0 0稱為是正偏稱為是正偏( (右偏右偏), ),小于小于0 0稱為是負(fù)偏稱為是負(fù)偏( (左偏左偏) )例題偏斜度:skew( )偏態(tài)系數(shù)計算我國1997年農(nóng)村居民家庭按純收入分組的有關(guān)數(shù)據(jù),計算偏態(tài)系數(shù)按純收入分組按純收入分組組中值組中值比重比重5 5以下以下5-105-1010-1510-1515-2015-2020-2520-2525-3025-3030-3530-3535-4035-4040-4540-4545-5045-505050以上以上2.52.57.57.512.512.517.517.522.522.527.52
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 倉儲合同里免責(zé)合同范本
- 產(chǎn)品保本合同范本
- 小學(xué)道法教學(xué)中翻轉(zhuǎn)課堂的應(yīng)用
- 包包寄售合同范本
- 二手車市場發(fā)票合同范本
- 醫(yī)療器械 廣告合同范本
- 《JJG196-2006-常用玻璃量器檢定規(guī)程》
- 加工合同范本包括些費用
- 化糞池清淤合同范本
- 借貸股權(quán)質(zhì)押合同范本
- 【原創(chuàng)】頭腦特工隊開的那些心理學(xué)腦洞
- 美甲藝術(shù)全套教學(xué)課件
- 高等數(shù)學(xué)上冊目錄同濟第七版
- 中國古代餐具
- 電動執(zhí)行機構(gòu)安裝施工工藝標(biāo)準(zhǔn)
- 施工日志模板
- 粗原料氣的凈化-二氧化碳的脫除(合成氨生產(chǎn))
- Agilent7820A氣相色譜儀操作規(guī)程知識講解
- 中醫(yī)適宜技術(shù)模擬試題(附答案)
- 加涅的信息加工理論-課件
- 400字作文稿紙(方格)A4打印模板
評論
0/150
提交評論