04第4章數(shù)據(jù)特征的描述38683-2課件_第1頁
04第4章數(shù)據(jù)特征的描述38683-2課件_第2頁
04第4章數(shù)據(jù)特征的描述38683-2課件_第3頁
04第4章數(shù)據(jù)特征的描述38683-2課件_第4頁
04第4章數(shù)據(jù)特征的描述38683-2課件_第5頁
已閱讀5頁,還剩173頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第4章數(shù)據(jù)分布特征的測度作者:中國人民大學統(tǒng)計學院賈俊平PowerPoint統(tǒng)計學第4章數(shù)據(jù)分布特征的測度作者:中國人民大學統(tǒng)計學院第4章數(shù)據(jù)分布特征的測度§4.1集中趨勢的測度§4.2離散程度的測度§4.3偏態(tài)與峰態(tài)的測度第4章數(shù)據(jù)分布特征的測度§4.1集中趨勢的測學習目標1. 集中趨勢各測度值的計算方法2. 集中趨勢各測度值的特點及應用場合3. 離散程度各測度值的計算方法4. 離散程度各測度值的特點及應用場合偏態(tài)與峰態(tài)的測度方法用Excel計算描述統(tǒng)計量并進行分析學習目標1. 集中趨勢各測度值的計算方法數(shù)據(jù)分布的特征集中趨勢(位置)偏態(tài)和峰態(tài)(形狀)離中趨勢

(分散程度)數(shù)據(jù)分布的特征集中趨勢偏態(tài)和峰態(tài)離中趨勢數(shù)據(jù)分布特征的測度數(shù)據(jù)特征的測度分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標準差峰態(tài)四分位差異眾比率偏態(tài)數(shù)據(jù)分布特征的測度數(shù)據(jù)特征的測度分布的形狀集中趨勢離散程度眾§4.1集中趨勢的測度一.分類數(shù)據(jù):眾數(shù)二.順序數(shù)據(jù):中位數(shù)和分位數(shù)三.數(shù)值型數(shù)據(jù):均值四.眾數(shù)、中位數(shù)和均值的比較§4.1集中趨勢的測度一.分類數(shù)據(jù):眾數(shù)數(shù)據(jù)分布特征的和測度

(本節(jié)位置)數(shù)據(jù)的特征和測度分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標準差峰態(tài)四分位差異眾比率偏態(tài)數(shù)據(jù)分布特征的和測度

(本節(jié)位置)數(shù)據(jù)的特征和測度分布的形狀集中趨勢

(Centraltendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),但高層次數(shù)據(jù)的測度值并不適用于低層次的測量數(shù)據(jù)集中趨勢

(Centraltendency)一組數(shù)據(jù)向其中分類數(shù)據(jù):眾數(shù)分類數(shù)據(jù):眾數(shù)眾數(shù)

(mode)出現(xiàn)次數(shù)最多的變量值不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)眾數(shù)

(mode)出現(xiàn)次數(shù)最多的變量值眾數(shù)

(不唯一性)無眾數(shù)

原始數(shù)據(jù):10591268一個眾數(shù)

原始數(shù)據(jù):65

9855多于一個眾數(shù)

原始數(shù)據(jù):252828

364242眾數(shù)

(不唯一性)無眾數(shù)

原始數(shù)據(jù):10分類數(shù)據(jù)的眾數(shù)

(例題分析)不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計501100解:這里的變量為“飲料品牌”,這是個分類變量,不同類型的飲料就是變量值在所調查的50人中,購買可口可樂的人數(shù)最多,為15人,占總被調查人數(shù)的30%,因此眾數(shù)為“可口可樂”這一品牌,即

Mo=可口可樂分類數(shù)據(jù)的眾數(shù)

(例題分析)不同品牌飲料的頻數(shù)分布飲料品順序數(shù)據(jù)的眾數(shù)

(例題分析)解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量為“回答類別”甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即

Mo=不滿意甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510合計300100.0順序數(shù)據(jù)的眾數(shù)

(例題分析)解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量順序數(shù)據(jù):中位數(shù)和分位數(shù)順序數(shù)據(jù):中位數(shù)和分位數(shù)中位數(shù)

(median)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即中位數(shù)

(median)排序后處于中間位置上的值Me50%5中位數(shù)

(位置的確定)原始數(shù)據(jù):順序數(shù)據(jù):中位數(shù)

(位置的確定)原始數(shù)據(jù):順序數(shù)據(jù):順序數(shù)據(jù)的中位數(shù)

(例題分析)解:中位數(shù)的位置為300/2=150從累計頻數(shù)看,中位數(shù)在“一般”這一組別中。因此

Me=一般甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—順序數(shù)據(jù)的中位數(shù)

(例題分析)解:中位數(shù)的位置為數(shù)值型數(shù)據(jù)的中位數(shù)

(9個數(shù)據(jù)的算例)【例】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:7507808509601080

1250150016302000位置:123456789中位數(shù)1080數(shù)值型數(shù)據(jù)的中位數(shù)

(9個數(shù)據(jù)的算例)【例】:9個家庭的人數(shù)值型數(shù)據(jù)的中位數(shù)

(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排序:

660

75078085096010801250150016302000位置:12345

678910數(shù)值型數(shù)據(jù)的中位數(shù)

(10個數(shù)據(jù)的算例)【例】:10個家庭四分位數(shù)

(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%四分位數(shù)

(quartile)排序后處于25%和75%位置上四分位數(shù)

(位置的確定)原始數(shù)據(jù):順序數(shù)據(jù):四分位數(shù)

(位置的確定)原始數(shù)據(jù):順序數(shù)據(jù):順序數(shù)據(jù)的四分位數(shù)

(例題分析)解:QL位置=(300)/4=75QU位置=(3×300)/4

=225從累計頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中。因此

QL

=不滿意

QU

=一般甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—順序數(shù)據(jù)的四分位數(shù)

(例題分析)解:QL位置=(300)數(shù)值型數(shù)據(jù)的四分位數(shù)

(9個數(shù)據(jù)的算例)【例】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789數(shù)值型數(shù)據(jù)的四分位數(shù)

(9個數(shù)據(jù)的算例)【例】:9個家庭的數(shù)值型數(shù)據(jù)的四分位數(shù)

(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排序:

660

75078085096010801250150016302000位置:1234

5678910數(shù)值型數(shù)據(jù)的四分位數(shù)

(10個數(shù)據(jù)的算例)【例】:10個家數(shù)值型數(shù)據(jù):均值數(shù)值型數(shù)據(jù):均值均值

(mean)集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)均值

(mean)集中趨勢的最常用測度值簡單均值與加權均值

(simplemean/weightedmean)設一組數(shù)據(jù)為:x1,x2,…,xn各組的組中值為:M1,M2,…,Mk

相應的頻數(shù)為:f1,f2,…,fk簡單均值加權均值簡單均值與加權均值

(simplemean/weigh已改至此??!某電腦公司銷售量數(shù)據(jù)分組表按銷售量分組組中值(Mi)頻數(shù)(fi)Mifi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合計—12022200加權均值

(例題分析)已改至此?。∧畴娔X公司銷售量數(shù)據(jù)分組表按銷售量分組組中值(M加權均值

(權數(shù)對均值的影響)

甲乙兩組各有10名學生,他們的考試成績及其分布數(shù)據(jù)如下

甲組:

考試成績(x): 020100

人數(shù)分布(f):118乙組:考試成績(x): 020100

人數(shù)分布(f):811加權均值

(權數(shù)對均值的影響)甲乙兩組各有10名學生,均值

(數(shù)學性質)1. 各變量值與均值的離差之和等于零

2.各變量值與均值的離差平方和最小均值

(數(shù)學性質)1. 各變量值與均值的離差之和等于零2.調和平均數(shù)

(harmonicmean)均值的另一種表現(xiàn)形式易受極端值的影響計算公式為原來只是計算時使用了不同的數(shù)據(jù)!調和平均數(shù)

(harmonicmean)均值的另一種表現(xiàn)形調和平均數(shù)

(例題分析)某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱批發(fā)價格(元)

Mi成交額(元)Mifi成交量(公斤)fi甲乙丙1.200.500.801800012500640015000250008000合計—3690048000【例】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表,計算三種蔬菜該日的平均批發(fā)價格調和平均數(shù)

(例題分析)某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜批發(fā)幾何平均數(shù)

(geometricmean)

n個變量值乘積的n次方根適用于對比率數(shù)據(jù)的平均主要用于計算平均增長率計算公式為5.可看作是均值的一種變形幾何平均數(shù)

(geometricmean)n個變量值乘幾何平均數(shù)

(例題分析)

【例】某水泥生產企業(yè)2019年的水泥產量為100萬噸,2000年與2019年相比增長率為9%,2019年與2000年相比增長率為16%,2019年與2019年相比增長率為20%。求各年的年平均增長率。年平均增長率=114.91%-1=14.91%幾何平均數(shù)

(例題分析)【例】某水泥生產企業(yè)201幾何平均數(shù)

(例題分析)

【例】一位投資者購持有一種股票,在2000、2019、2019和2019年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內的平均收益率算術平均:

幾何平均:幾何平均數(shù)

(例題分析)【例】一位投資者購持有一種眾數(shù)、中位數(shù)和均值的比較眾數(shù)、中位數(shù)和均值的比較眾數(shù)、中位數(shù)和均值的關系左偏分布均值

中位數(shù)

眾數(shù)對稱分布

均值=中位數(shù)=

眾數(shù)右偏分布眾數(shù)

中位數(shù)均值眾數(shù)、中位數(shù)和均值的關系左偏分布均值中位數(shù)眾數(shù)對稱分眾數(shù)、中位數(shù)和均值的特點和應用眾數(shù)不受極端值影響具有不唯一性數(shù)據(jù)分布偏斜程度較大時應用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時應用均值易受極端值影響數(shù)學性質優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應用眾數(shù)、中位數(shù)和均值的特點和應用眾數(shù)數(shù)據(jù)類型與集中趨勢測度值數(shù)據(jù)類型和所適用的集中趨勢測度值數(shù)據(jù)類型分類數(shù)據(jù)順序數(shù)據(jù)間隔數(shù)據(jù)比率數(shù)據(jù)適用的測度值※眾數(shù)※中位數(shù)※均值※均值—四分位數(shù)眾數(shù)調和平均數(shù)—眾數(shù)中位數(shù)幾何平均數(shù)——四分位數(shù)中位數(shù)———四分位數(shù)———眾數(shù)數(shù)據(jù)類型與集中趨勢測度值數(shù)據(jù)類型和所適用的集中趨勢測度值數(shù)據(jù)§4.2離散程度的測度分類數(shù)據(jù):異眾比率順序數(shù)據(jù):四分位差數(shù)值型數(shù)據(jù):方差及標準差相對位置的測量:標準分數(shù)相對離散程度:離散系數(shù)§4.2離散程度的測度分類數(shù)據(jù):異眾比率數(shù)據(jù)的特征和測度

(本節(jié)位置)數(shù)據(jù)的特征和測度分布的形狀離散程度集中趨勢眾數(shù)中位數(shù)均值離散系數(shù)方差和標準差峰度四分位差異眾比率偏態(tài)數(shù)據(jù)的特征和測度

(本節(jié)位置)數(shù)據(jù)的特征和測度分布的形狀離散離中趨勢數(shù)據(jù)分布的另一個重要特征反映各變量值遠離其中心值的程度(離散程度)從另一個側面說明了集中趨勢測度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測度值離中趨勢數(shù)據(jù)分布的另一個重要特征分類數(shù)據(jù):異眾比率分類數(shù)據(jù):異眾比率異眾比率

(variationratio)1. 對分類數(shù)據(jù)離散程度的測度2. 非眾數(shù)組的頻數(shù)占總頻數(shù)的比率3. 計算公式為4.用于衡量眾數(shù)的代表性異眾比率

(variationratio)1. 對分類數(shù)據(jù)異眾比率

(例題分析)解:

在所調查的50人當中,購買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“可口可樂”代表消費者購買飲料品牌的狀況,其代表性不是很好不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)

可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計501100異眾比率

(例題分析)解:不同品牌飲料的頻數(shù)分布飲料品牌順序數(shù)據(jù):四分位差順序數(shù)據(jù):四分位差四分位差

(quartiledeviation)對順序數(shù)據(jù)離散程度的測度也稱為內距或四分間距上四分位數(shù)與下四分位數(shù)之差

QD

=QU–QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性四分位差

(quartiledeviation)對順序數(shù)據(jù)四分位差

(例題分析)解:設非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5已知

QL=不滿意=2

QU=

一般=

3四分位差:

QD

=QU

=

QL

=3–2

=1甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—四分位差

(例題分析)解:設非常不滿意為1,不滿意為2,數(shù)值型數(shù)據(jù):方差和標準差數(shù)值型數(shù)據(jù):方差和標準差極差

(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布7891078910R

=max(xi)-min(xi)計算公式為極差

(range)一組數(shù)據(jù)的最大值與最小值之差789107平均差

(meandeviation)各變量值與其均值離差絕對值的平均數(shù)能全面反映一組數(shù)據(jù)的離散程度數(shù)學性質較差,實際中應用較少計算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差

(meandeviation)各變量值與其均值離差平均差

(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷售量分組組中值(Mi)頻數(shù)(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—2040平均差

(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷平均差

(例題分析)

含義:每一天的銷售量平均數(shù)相比,平均相差17臺平均差

(例題分析)方差和標準差

(varianceandstandarddeviation)數(shù)據(jù)離散程度的最常用測度值反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差4681012x=8.3方差和標準差

(varianceandstandard樣本方差和標準差

(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!樣本方差和標準差

(simplevarianceand樣本方差

自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當樣本數(shù)據(jù)的個數(shù)為

n

時,若樣本均值x

確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則

x

=5。當

x

=5

確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面來解釋,從實際應用角度看,在抽樣估計中,當用樣本方差s2去估計總體方差σ2時,s2是σ2的無偏估計量樣本方差

自由度(degreeoffreedom)一組數(shù)樣本標準差

(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷售量分組組中值(Mi)頻數(shù)(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—55400樣本標準差

(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表樣本標準差

(例題分析)

含義:每一天的銷售量與平均數(shù)相比,平均相差21.58臺樣本標準差

(例題分析)相對位置的測量:標準分數(shù)相對位置的測量:標準分數(shù)標準分數(shù)

(standardscore)1.也稱標準化值2. 對某一個值在一組數(shù)據(jù)中相對位置的度量3. 可用于判斷一組數(shù)據(jù)是否有離群點4. 用于對變量的標準化處理5.計算公式為標準分數(shù)

(standardscore)1.也稱標準化標準分數(shù)

(性質)均值等于02. 方差等于1標準分數(shù)

(性質)均值等于0標準分數(shù)

(性質)z分數(shù)只是將原始數(shù)據(jù)進行了線性變換,它并沒有改變一個數(shù)據(jù)在改組數(shù)據(jù)中的位置,也沒有改變該組數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標準差為1。

標準分數(shù)

(性質)z分數(shù)只是將原始數(shù)據(jù)進行了標準化值

(例題分析)9個家庭人均月收入標準化值計算表家庭編號人均月收入(元)標準化值z

123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996標準化值

(例題分析)9個家庭人均月收入標準化值計算表家經驗法則經驗法則表明:當一組數(shù)據(jù)對稱分布時約有68%的數(shù)據(jù)在平均數(shù)加減1個標準差的范圍之內約有95%的數(shù)據(jù)在平均數(shù)加減2個標準差的范圍之內約有99%的數(shù)據(jù)在平均數(shù)加減3個標準差的范圍之內經驗法則經驗法則表明:當一組數(shù)據(jù)對稱分布時切比雪夫不等式

(Chebyshev’sinequality)如果一組數(shù)據(jù)不是對稱分布,經驗法則就不再使用,這時可使用切比雪夫不等式,它對任何分布形狀的數(shù)據(jù)都適用切比雪夫不等式提供的是“下界”,也就是“所占比例至少和多少”對于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有的數(shù)據(jù)落在k個標準差之內。其中k是大于1的任意值,但不一定是整數(shù)切比雪夫不等式

(Chebyshev’sinequalit切比雪夫不等式

(Chebyshev’sinequality)對于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個標準差的范圍之內至少有89%的數(shù)據(jù)落在平均數(shù)加減3個標準差的范圍之內至少有94%的數(shù)據(jù)落在平均數(shù)加減4個標準差的范圍之內切比雪夫不等式

(Chebyshev’sinequalit相對離散程度:離散系數(shù)相對離散程度:離散系數(shù)離散系數(shù)

(coefficientofvariation)1. 標準差與其相應的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計量單位的影響4. 用于對不同組別數(shù)據(jù)離散程度的比較5.計算公式為離散系數(shù)

(coefficientofvariation離散系數(shù)

(例題分析)某管理局所屬8家企業(yè)的產品銷售數(shù)據(jù)企業(yè)編號產品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產品銷售數(shù)據(jù)如表。試比較產品銷售額與銷售利潤的離散程度離散系數(shù)

(例題分析)某管理局所屬8家企業(yè)的產品銷售數(shù)據(jù)企離散系數(shù)

(例題分析)結論:計算結果表明,v1<v2,說明產品銷售額的離散程度小于銷售利潤的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710離散系數(shù)

(例題分析)結論:計算結果表明,v1<v2,說數(shù)據(jù)類型與離散程度測度值數(shù)據(jù)類型和所適用的離散程度測度值數(shù)據(jù)類型分類數(shù)據(jù)順序數(shù)據(jù)數(shù)值型數(shù)據(jù)適用的測度值※異眾比率※四分位差※方差或標準差—異眾比率※離散系數(shù)(比較時用)——平均差——極差——四分位差——異眾比率數(shù)據(jù)類型與離散程度測度值數(shù)據(jù)類型和所適用的離散程度測度值數(shù)據(jù)§4.3偏態(tài)與峰態(tài)的測度一.偏態(tài)及其測度二.峰態(tài)及其測度§4.3偏態(tài)與峰態(tài)的測度一.偏態(tài)及其測度數(shù)據(jù)的特征和測度

(本節(jié)位置)數(shù)據(jù)的特征和測度分布的形狀離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標準差峰度四分位差異眾比率偏態(tài)集中趨勢數(shù)據(jù)的特征和測度

(本節(jié)位置)數(shù)據(jù)的特征和測度分布的形狀離散偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布與標準正態(tài)分布比較!偏態(tài)與峰態(tài)分布的形狀扁平分布尖峰分布偏態(tài)峰態(tài)左偏分布右偏分布偏態(tài)偏態(tài)偏態(tài)

(skewness)統(tǒng)計學家Pearson于1895年首次提出數(shù)據(jù)分布偏斜程度的測度2. 偏態(tài)系數(shù)=0為對稱分布3. 偏態(tài)系數(shù)>0為右偏分布4. 偏態(tài)系數(shù)<0為左偏分布偏態(tài)

(skewness)統(tǒng)計學家Pearson于1895年偏態(tài)系數(shù)

(skewnesscoefficient)根據(jù)原始數(shù)據(jù)計算根據(jù)分組數(shù)據(jù)計算偏態(tài)系數(shù)

(skewnesscoefficient)根據(jù)偏態(tài)系數(shù)

(例題分析)

某電腦公司銷售量偏態(tài)及峰度計算表按銷售量份組(臺)組中值(Mi)頻數(shù)

fi140—150150—160160—170170—180180—190190—200200—210210—220220—230230—240145155165175185195205215225235491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合計—120540000

70100000

偏態(tài)系數(shù)

(例題分析)某電腦公司銷售量偏態(tài)及峰度計算表偏態(tài)系數(shù)

(例題分析)結論:偏態(tài)系數(shù)為正值,但與0的差異不大,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù)偏態(tài)系數(shù)

(例題分析)結論:偏態(tài)系數(shù)為正值,但與0的差異不偏態(tài)與峰態(tài)

(從直方圖上觀察)按銷售量分組(臺)結論:1.為右偏分布2.峰態(tài)適中140150210某電腦公司銷售量分布的直方圖190200180160170頻數(shù)(天)25201510530220230240偏態(tài)與峰態(tài)

(從直方圖上觀察)按銷售量分組(臺)結論:1.峰態(tài)峰態(tài)峰態(tài)

(kurtosis)統(tǒng)計學家Pearson于1905年首次提出數(shù)據(jù)分布扁平程度的測度峰態(tài)系數(shù)=0扁平峰度適中峰態(tài)系數(shù)<0為扁平分布峰態(tài)系數(shù)>0為尖峰分布峰態(tài)

(kurtosis)統(tǒng)計學家Pearson于1905年峰態(tài)系數(shù)

(kurtosiscoefficient)根據(jù)原始數(shù)據(jù)計算根據(jù)分組數(shù)據(jù)計算峰態(tài)系數(shù)

(kurtosiscoefficient)根據(jù)峰態(tài)系數(shù)

(例題分析)結論:偏態(tài)系數(shù)為負值,但與0的差異不大,說明電腦銷售量為輕微扁平分布峰態(tài)系數(shù)

(例題分析)結論:偏態(tài)系數(shù)為負值,但與0的差異不用Excel計算描述統(tǒng)計量用Excel計算描述統(tǒng)計量用Excel計算描述統(tǒng)計量將120的銷售量的數(shù)據(jù)輸入到Excel工作表中,然后按下列步驟操作:第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析”選項第3步:在分析工具中選擇“描述統(tǒng)計”,然后選擇“確定”第4步:當對話框出現(xiàn)時在“輸入區(qū)域”方框內鍵入數(shù)據(jù)區(qū)域在“輸出選項”中選擇輸出區(qū)域選擇“匯總統(tǒng)計”選擇“確定”實例計算用Excel計算描述統(tǒng)計量將120的銷售量的數(shù)據(jù)輸入到Ex本章小節(jié)1. 數(shù)據(jù)水平的概括性度量2. 數(shù)據(jù)離散程度的概括性度量數(shù)據(jù)分布形狀的測度用Excel計算描述統(tǒng)計量本章小節(jié)1. 數(shù)據(jù)水平的概括性度量結束結束謝謝謝謝89第4章數(shù)據(jù)分布特征的測度作者:中國人民大學統(tǒng)計學院賈俊平PowerPoint統(tǒng)計學第4章數(shù)據(jù)分布特征的測度作者:中國人民大學統(tǒng)計學院第4章數(shù)據(jù)分布特征的測度§4.1集中趨勢的測度§4.2離散程度的測度§4.3偏態(tài)與峰態(tài)的測度第4章數(shù)據(jù)分布特征的測度§4.1集中趨勢的測學習目標1. 集中趨勢各測度值的計算方法2. 集中趨勢各測度值的特點及應用場合3. 離散程度各測度值的計算方法4. 離散程度各測度值的特點及應用場合偏態(tài)與峰態(tài)的測度方法用Excel計算描述統(tǒng)計量并進行分析學習目標1. 集中趨勢各測度值的計算方法數(shù)據(jù)分布的特征集中趨勢(位置)偏態(tài)和峰態(tài)(形狀)離中趨勢

(分散程度)數(shù)據(jù)分布的特征集中趨勢偏態(tài)和峰態(tài)離中趨勢數(shù)據(jù)分布特征的測度數(shù)據(jù)特征的測度分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標準差峰態(tài)四分位差異眾比率偏態(tài)數(shù)據(jù)分布特征的測度數(shù)據(jù)特征的測度分布的形狀集中趨勢離散程度眾§4.1集中趨勢的測度一.分類數(shù)據(jù):眾數(shù)二.順序數(shù)據(jù):中位數(shù)和分位數(shù)三.數(shù)值型數(shù)據(jù):均值四.眾數(shù)、中位數(shù)和均值的比較§4.1集中趨勢的測度一.分類數(shù)據(jù):眾數(shù)數(shù)據(jù)分布特征的和測度

(本節(jié)位置)數(shù)據(jù)的特征和測度分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標準差峰態(tài)四分位差異眾比率偏態(tài)數(shù)據(jù)分布特征的和測度

(本節(jié)位置)數(shù)據(jù)的特征和測度分布的形狀集中趨勢

(Centraltendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),但高層次數(shù)據(jù)的測度值并不適用于低層次的測量數(shù)據(jù)集中趨勢

(Centraltendency)一組數(shù)據(jù)向其中分類數(shù)據(jù):眾數(shù)分類數(shù)據(jù):眾數(shù)眾數(shù)

(mode)出現(xiàn)次數(shù)最多的變量值不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)眾數(shù)

(mode)出現(xiàn)次數(shù)最多的變量值眾數(shù)

(不唯一性)無眾數(shù)

原始數(shù)據(jù):10591268一個眾數(shù)

原始數(shù)據(jù):65

9855多于一個眾數(shù)

原始數(shù)據(jù):252828

364242眾數(shù)

(不唯一性)無眾數(shù)

原始數(shù)據(jù):10分類數(shù)據(jù)的眾數(shù)

(例題分析)不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計501100解:這里的變量為“飲料品牌”,這是個分類變量,不同類型的飲料就是變量值在所調查的50人中,購買可口可樂的人數(shù)最多,為15人,占總被調查人數(shù)的30%,因此眾數(shù)為“可口可樂”這一品牌,即

Mo=可口可樂分類數(shù)據(jù)的眾數(shù)

(例題分析)不同品牌飲料的頻數(shù)分布飲料品順序數(shù)據(jù)的眾數(shù)

(例題分析)解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量為“回答類別”甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即

Mo=不滿意甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510合計300100.0順序數(shù)據(jù)的眾數(shù)

(例題分析)解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量順序數(shù)據(jù):中位數(shù)和分位數(shù)順序數(shù)據(jù):中位數(shù)和分位數(shù)中位數(shù)

(median)排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即中位數(shù)

(median)排序后處于中間位置上的值Me50%5中位數(shù)

(位置的確定)原始數(shù)據(jù):順序數(shù)據(jù):中位數(shù)

(位置的確定)原始數(shù)據(jù):順序數(shù)據(jù):順序數(shù)據(jù)的中位數(shù)

(例題分析)解:中位數(shù)的位置為300/2=150從累計頻數(shù)看,中位數(shù)在“一般”這一組別中。因此

Me=一般甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—順序數(shù)據(jù)的中位數(shù)

(例題分析)解:中位數(shù)的位置為數(shù)值型數(shù)據(jù)的中位數(shù)

(9個數(shù)據(jù)的算例)【例】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:7507808509601080

1250150016302000位置:123456789中位數(shù)1080數(shù)值型數(shù)據(jù)的中位數(shù)

(9個數(shù)據(jù)的算例)【例】:9個家庭的人數(shù)值型數(shù)據(jù)的中位數(shù)

(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排序:

660

75078085096010801250150016302000位置:12345

678910數(shù)值型數(shù)據(jù)的中位數(shù)

(10個數(shù)據(jù)的算例)【例】:10個家庭四分位數(shù)

(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%四分位數(shù)

(quartile)排序后處于25%和75%位置上四分位數(shù)

(位置的確定)原始數(shù)據(jù):順序數(shù)據(jù):四分位數(shù)

(位置的確定)原始數(shù)據(jù):順序數(shù)據(jù):順序數(shù)據(jù)的四分位數(shù)

(例題分析)解:QL位置=(300)/4=75QU位置=(3×300)/4

=225從累計頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中。因此

QL

=不滿意

QU

=一般甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—順序數(shù)據(jù)的四分位數(shù)

(例題分析)解:QL位置=(300)數(shù)值型數(shù)據(jù)的四分位數(shù)

(9個數(shù)據(jù)的算例)【例】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:75078085096010801250150016302000位置:123456789數(shù)值型數(shù)據(jù)的四分位數(shù)

(9個數(shù)據(jù)的算例)【例】:9個家庭的數(shù)值型數(shù)據(jù)的四分位數(shù)

(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排序:

660

75078085096010801250150016302000位置:1234

5678910數(shù)值型數(shù)據(jù)的四分位數(shù)

(10個數(shù)據(jù)的算例)【例】:10個家數(shù)值型數(shù)據(jù):均值數(shù)值型數(shù)據(jù):均值均值

(mean)集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)均值

(mean)集中趨勢的最常用測度值簡單均值與加權均值

(simplemean/weightedmean)設一組數(shù)據(jù)為:x1,x2,…,xn各組的組中值為:M1,M2,…,Mk

相應的頻數(shù)為:f1,f2,…,fk簡單均值加權均值簡單均值與加權均值

(simplemean/weigh已改至此?。∧畴娔X公司銷售量數(shù)據(jù)分組表按銷售量分組組中值(Mi)頻數(shù)(fi)Mifi140~150150~160160~170170~180180~190190~200200~210210~220220~230230~24014515516517518519520521522523549162720171084558013952640472537003315205017209001175合計—12022200加權均值

(例題分析)已改至此?。∧畴娔X公司銷售量數(shù)據(jù)分組表按銷售量分組組中值(M加權均值

(權數(shù)對均值的影響)

甲乙兩組各有10名學生,他們的考試成績及其分布數(shù)據(jù)如下

甲組:

考試成績(x): 020100

人數(shù)分布(f):118乙組:考試成績(x): 020100

人數(shù)分布(f):811加權均值

(權數(shù)對均值的影響)甲乙兩組各有10名學生,均值

(數(shù)學性質)1. 各變量值與均值的離差之和等于零

2.各變量值與均值的離差平方和最小均值

(數(shù)學性質)1. 各變量值與均值的離差之和等于零2.調和平均數(shù)

(harmonicmean)均值的另一種表現(xiàn)形式易受極端值的影響計算公式為原來只是計算時使用了不同的數(shù)據(jù)!調和平均數(shù)

(harmonicmean)均值的另一種表現(xiàn)形調和平均數(shù)

(例題分析)某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱批發(fā)價格(元)

Mi成交額(元)Mifi成交量(公斤)fi甲乙丙1.200.500.801800012500640015000250008000合計—3690048000【例】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表,計算三種蔬菜該日的平均批發(fā)價格調和平均數(shù)

(例題分析)某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜批發(fā)幾何平均數(shù)

(geometricmean)

n個變量值乘積的n次方根適用于對比率數(shù)據(jù)的平均主要用于計算平均增長率計算公式為5.可看作是均值的一種變形幾何平均數(shù)

(geometricmean)n個變量值乘幾何平均數(shù)

(例題分析)

【例】某水泥生產企業(yè)2019年的水泥產量為100萬噸,2000年與2019年相比增長率為9%,2019年與2000年相比增長率為16%,2019年與2019年相比增長率為20%。求各年的年平均增長率。年平均增長率=114.91%-1=14.91%幾何平均數(shù)

(例題分析)【例】某水泥生產企業(yè)201幾何平均數(shù)

(例題分析)

【例】一位投資者購持有一種股票,在2000、2019、2019和2019年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內的平均收益率算術平均:

幾何平均:幾何平均數(shù)

(例題分析)【例】一位投資者購持有一種眾數(shù)、中位數(shù)和均值的比較眾數(shù)、中位數(shù)和均值的比較眾數(shù)、中位數(shù)和均值的關系左偏分布均值

中位數(shù)

眾數(shù)對稱分布

均值=中位數(shù)=

眾數(shù)右偏分布眾數(shù)

中位數(shù)均值眾數(shù)、中位數(shù)和均值的關系左偏分布均值中位數(shù)眾數(shù)對稱分眾數(shù)、中位數(shù)和均值的特點和應用眾數(shù)不受極端值影響具有不唯一性數(shù)據(jù)分布偏斜程度較大時應用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時應用均值易受極端值影響數(shù)學性質優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應用眾數(shù)、中位數(shù)和均值的特點和應用眾數(shù)數(shù)據(jù)類型與集中趨勢測度值數(shù)據(jù)類型和所適用的集中趨勢測度值數(shù)據(jù)類型分類數(shù)據(jù)順序數(shù)據(jù)間隔數(shù)據(jù)比率數(shù)據(jù)適用的測度值※眾數(shù)※中位數(shù)※均值※均值—四分位數(shù)眾數(shù)調和平均數(shù)—眾數(shù)中位數(shù)幾何平均數(shù)——四分位數(shù)中位數(shù)———四分位數(shù)———眾數(shù)數(shù)據(jù)類型與集中趨勢測度值數(shù)據(jù)類型和所適用的集中趨勢測度值數(shù)據(jù)§4.2離散程度的測度分類數(shù)據(jù):異眾比率順序數(shù)據(jù):四分位差數(shù)值型數(shù)據(jù):方差及標準差相對位置的測量:標準分數(shù)相對離散程度:離散系數(shù)§4.2離散程度的測度分類數(shù)據(jù):異眾比率數(shù)據(jù)的特征和測度

(本節(jié)位置)數(shù)據(jù)的特征和測度分布的形狀離散程度集中趨勢眾數(shù)中位數(shù)均值離散系數(shù)方差和標準差峰度四分位差異眾比率偏態(tài)數(shù)據(jù)的特征和測度

(本節(jié)位置)數(shù)據(jù)的特征和測度分布的形狀離散離中趨勢數(shù)據(jù)分布的另一個重要特征反映各變量值遠離其中心值的程度(離散程度)從另一個側面說明了集中趨勢測度值的代表程度不同類型的數(shù)據(jù)有不同的離散程度測度值離中趨勢數(shù)據(jù)分布的另一個重要特征分類數(shù)據(jù):異眾比率分類數(shù)據(jù):異眾比率異眾比率

(variationratio)1. 對分類數(shù)據(jù)離散程度的測度2. 非眾數(shù)組的頻數(shù)占總頻數(shù)的比率3. 計算公式為4.用于衡量眾數(shù)的代表性異眾比率

(variationratio)1. 對分類數(shù)據(jù)異眾比率

(例題分析)解:

在所調查的50人當中,購買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“可口可樂”代表消費者購買飲料品牌的狀況,其代表性不是很好不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)

可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計501100異眾比率

(例題分析)解:不同品牌飲料的頻數(shù)分布飲料品牌順序數(shù)據(jù):四分位差順序數(shù)據(jù):四分位差四分位差

(quartiledeviation)對順序數(shù)據(jù)離散程度的測度也稱為內距或四分間距上四分位數(shù)與下四分位數(shù)之差

QD

=QU–QL反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響用于衡量中位數(shù)的代表性四分位差

(quartiledeviation)對順序數(shù)據(jù)四分位差

(例題分析)解:設非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5已知

QL=不滿意=2

QU=

一般=

3四分位差:

QD

=QU

=

QL

=3–2

=1甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—四分位差

(例題分析)解:設非常不滿意為1,不滿意為2,數(shù)值型數(shù)據(jù):方差和標準差數(shù)值型數(shù)據(jù):方差和標準差極差

(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡單測度值易受極端值影響未考慮數(shù)據(jù)的分布7891078910R

=max(xi)-min(xi)計算公式為極差

(range)一組數(shù)據(jù)的最大值與最小值之差789107平均差

(meandeviation)各變量值與其均值離差絕對值的平均數(shù)能全面反映一組數(shù)據(jù)的離散程度數(shù)學性質較差,實際中應用較少計算公式為未分組數(shù)據(jù)組距分組數(shù)據(jù)平均差

(meandeviation)各變量值與其均值離差平均差

(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷售量分組組中值(Mi)頻數(shù)(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—2040平均差

(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷平均差

(例題分析)

含義:每一天的銷售量平均數(shù)相比,平均相差17臺平均差

(例題分析)方差和標準差

(varianceandstandarddeviation)數(shù)據(jù)離散程度的最常用測度值反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差4681012x=8.3方差和標準差

(varianceandstandard樣本方差和標準差

(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!樣本方差和標準差

(simplevarianceand樣本方差

自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當樣本數(shù)據(jù)的個數(shù)為

n

時,若樣本均值x

確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則

x

=5。當

x

=5

確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面來解釋,從實際應用角度看,在抽樣估計中,當用樣本方差s2去估計總體方差σ2時,s2是σ2的無偏估計量樣本方差

自由度(degreeoffreedom)一組數(shù)樣本標準差

(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表按銷售量分組組中值(Mi)頻數(shù)(fi)140—150150—160160—170170—180180—190190—200200—210210—220220—230230—24014515516517518519520521522523549162720171084540302010010203040501602703202700170200240160250合計—120—55400樣本標準差

(例題分析)某電腦公司銷售量數(shù)據(jù)平均差計算表樣本標準差

(例題分析)

含義:每一天的銷售量與平均數(shù)相比,平均相差21.58臺樣本標準差

(例題分析)相對位置的測量:標準分數(shù)相對位置的測量:標準分數(shù)標準分數(shù)

(standardscore)1.也稱標準化值2. 對某一個值在一組數(shù)據(jù)中相對位置的度量3. 可用于判斷一組數(shù)據(jù)是否有離群點4. 用于對變量的標準化處理5.計算公式為標準分數(shù)

(standardscore)1.也稱標準化標準分數(shù)

(性質)均值等于02. 方差等于1標準分數(shù)

(性質)均值等于0標準分數(shù)

(性質)z分數(shù)只是將原始數(shù)據(jù)進行了線性變換,它并沒有改變一個數(shù)據(jù)在改組數(shù)據(jù)中的位置,也沒有改變該組數(shù)分布的形狀,而只是將該組數(shù)據(jù)變?yōu)榫禐?,標準差為1。

標準分數(shù)

(性質)z分數(shù)只是將原始數(shù)據(jù)進行了標準化值

(例題分析)9個家庭人均月收入標準化值計算表家庭編號人均月收入(元)標準化值z

123456789150075078010808509602000125016300.695-1.042-0.973-0.278-0.811-0.5561.8530.1160.996標準化值

(例題分析)9個家庭人均月收入標準化值計算表家經驗法則經驗法則表明:當一組數(shù)據(jù)對稱分布時約有68%的數(shù)據(jù)在平均數(shù)加減1個標準差的范圍之內約有95%的數(shù)據(jù)在平均數(shù)加減2個標準差的范圍之內約有99%的數(shù)據(jù)在平均數(shù)加減3個標準差的范圍之內經驗法則經驗法則表明:當一組數(shù)據(jù)對稱分布時切比雪夫不等式

(Chebyshev’sinequality)如果一組數(shù)據(jù)不是對稱分布,經驗法則就不再使用,這時可使用切比雪夫不等式,它對任何分布形狀的數(shù)據(jù)都適用切比雪夫不等式提供的是“下界”,也就是“所占比例至少和多少”對于任意分布形態(tài)的數(shù)據(jù),根據(jù)切比雪夫不等式,至少有的數(shù)據(jù)落在k個標準差之內。其中k是大于1的任意值,但不一定是整數(shù)切比雪夫不等式

(Chebyshev’sinequalit切比雪夫不等式

(Chebyshev’sinequality)對于k=2,3,4,該不等式的含義是至少有75%的數(shù)據(jù)落在平均數(shù)加減2個標準差的范圍之內至少有89%的數(shù)據(jù)落在平均數(shù)加減3個標準差的范圍之內至少有94%的數(shù)據(jù)落在平均數(shù)加減4個標準差的范圍之內切比雪夫不等式

(Chebyshev’sinequalit相對離散程度:離散系數(shù)相對離散程度:離散系數(shù)離散系數(shù)

(coefficientofvariation)1. 標準差與其相應的均值之比對數(shù)據(jù)相對離散程度的測度消除了數(shù)據(jù)水平高低和計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論