集中趨勢和離散趨勢(與“數(shù)據(jù)”有關(guān)的文檔共95張)_第1頁
集中趨勢和離散趨勢(與“數(shù)據(jù)”有關(guān)的文檔共95張)_第2頁
集中趨勢和離散趨勢(與“數(shù)據(jù)”有關(guān)的文檔共95張)_第3頁
集中趨勢和離散趨勢(與“數(shù)據(jù)”有關(guān)的文檔共95張)_第4頁
集中趨勢和離散趨勢(與“數(shù)據(jù)”有關(guān)的文檔共95張)_第5頁
已閱讀5頁,還剩90頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

集中趨勢和離散趨勢第一頁,共95頁。觀察:一個平均工資掩蓋了多少差異

3月25日,北京市統(tǒng)計局宣布,年,北京市職工年平均工資為44715元,折合每月3726元,比2007年增長了12%。與往年一樣,這樣的數(shù)據(jù)又是引來一片質(zhì)疑聲。因為它和太多市民對實際收入的感受差距很大,也解釋不了為什么大家的收入逐年增長,而消費(fèi)卻總是無法提振的尷尬。有關(guān)部門對上述職工平均工資的統(tǒng)計給出了一些解釋,使得社會對這一數(shù)據(jù)在統(tǒng)計意義上的正確性沒有多少疑問,卻對它的代表性和實際意義產(chǎn)生了更多的懷疑。按照相關(guān)解釋,目前的職工平均工資統(tǒng)計,所涉及的統(tǒng)計對象還只是企事業(yè)單位、機(jī)關(guān)與社會團(tuán)體,并沒有將社會中小企業(yè)納入。而且職工工資總額計算方法不是按實際發(fā)到職工手里的現(xiàn)金計算,還包括單位代扣代繳的社會、住房公積金等。這樣一解釋,大家有些明白了,原來北京市職工年平均工資統(tǒng)計里的“職工”只是你我中間的一部分人群,這部分人群的收入可能是比較高而且穩(wěn)定的,自然平均工資也相對偏高一些。但這種“有你沒我”的統(tǒng)計,如何能反映整個城市的收入全貌呢?再從收入本身來說,按照《中國報》人士的統(tǒng)計,北京地區(qū)養(yǎng)老單位繳費(fèi)比例20%,個人繳費(fèi)比例8%;醫(yī)療單位繳費(fèi)比例%,個人繳費(fèi)比例2%;生育繳費(fèi)比例為%,單位承擔(dān);失業(yè)單位繳費(fèi)比例2%,個人繳費(fèi)比例1%;工傷按行業(yè)性質(zhì)分為%、%、2%三檔基準(zhǔn)費(fèi)率,只由單位承擔(dān)。以上合計,社??傌?fù)擔(dān)至少已占個人工資總額的42%左右,外加單位和個人各繳(扣)12%以內(nèi)的住房公積金,“職工工資”里面將有可能高達(dá)66%的份額并不在市民的腰包里。而剩下34%的“職工工資”,也還只是稅前收入。難怪與大家的實際感受有如此大的差異。統(tǒng)計的口徑是這樣,再回到平均的概念上來。很多年來,我們的職工平均工資統(tǒng)計數(shù)據(jù)只有平均數(shù),而沒有覆蓋社會不同群體(如國企高管、公務(wù)員、教師、農(nóng)民工)以及不同行業(yè)(如金融、電信、私企、電力、石油)的具體分布數(shù)據(jù)。這樣的統(tǒng)計無法顯示不同行業(yè)以及同一行業(yè)內(nèi)職工與管理人員巨大的收入差異,網(wǎng)民將這樣的統(tǒng)計形象地概括為:“張家有財一千萬,十個鄰居窮光蛋,平均下來算一算,個個都有上百萬”。一個與太多市民收入真實情況不相符的統(tǒng)計層面的工資增長,自然無法得到大家在幸福感上的共鳴。可見,一個“平均”,掩蓋了多少差異;一個“增長”,隱藏了多少問題。當(dāng)然,并不是說平均值的統(tǒng)計方法是不需要的。GDP的人均值在分析一個國家經(jīng)濟(jì)增長階段時有很大的價值,地看,平均值的變化也總是有其時代意義的。但是,平均值的統(tǒng)計方法也是有缺陷的,因為它反映不了貧富分化和財富流向的變動。在統(tǒng)計數(shù)字與社會現(xiàn)實的差異面前,我們是應(yīng)該為了統(tǒng)計數(shù)字的“喜人增長”而無視社會現(xiàn)實,還是應(yīng)該為了真實地反映社會現(xiàn)實,修正統(tǒng)計部門的計算口徑和方法?答案是明擺著的,只有真實的數(shù)據(jù)才能讓大家了解目前社會存在的真正問題,也才能為正確的決策提供有價值的參考。這樣真實的統(tǒng)計也許很難,但在失真和真實之間,統(tǒng)計部門其實沒有選擇?!娟惵?lián)科來源:京華時報】第二頁,共95頁。數(shù)據(jù)分布的特征集中趨勢(位置)離散趨勢

(分散程度)偏態(tài)和峰度(形狀)第三頁,共95頁。數(shù)據(jù)分布的特征和測度數(shù)據(jù)的特征和測度分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標(biāo)準(zhǔn)差峰度Kurtosis四分位差極差偏態(tài)SkewnessModeMedianMeanRangeQuartilesVarianceandStandardDeviation第四頁,共95頁。集中趨勢的測度集中趨勢是對頻數(shù)分布資料的集中狀況和平均水平的綜合測度。而離散趨勢是對頻數(shù)分布資料的差異程度和離散程度的測度,用來衡量集中趨勢所測度的代表性,或者反映變量值的穩(wěn)定性和均勻性。常用來表達(dá)數(shù)列集中趨勢的測度有算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)、中位數(shù)和眾數(shù)。這些測度在統(tǒng)計學(xué)中也稱為平均指標(biāo)或平均數(shù),可以用來反映標(biāo)志值的典型水平和標(biāo)志值分布的中心位置或集中趨勢。返回本章返回總目錄第五頁,共95頁。集中趨勢

(Centraltendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度測度集中趨勢就是尋找數(shù)據(jù)一般水平的代表值或中心值不同類型的數(shù)據(jù)用不同的集中趨勢測度值低層次數(shù)據(jù)的集中趨勢測度值適用于高層次的測量數(shù)據(jù),反過來,高層次數(shù)據(jù)的集中趨勢測度值并不適用于低層次的測量數(shù)據(jù)選用哪一個測度值來反映數(shù)據(jù)的集中趨勢,要根據(jù)所掌握的數(shù)據(jù)的類型來確定第六頁,共95頁。均值

(概念要點(diǎn))1. 集中趨勢的測度值之一2. 最常用的測度值3. 一組數(shù)據(jù)的均衡點(diǎn)所在4. 易受極端值的影響5.用于數(shù)值型數(shù)據(jù),不能用于定類數(shù)據(jù)和定序數(shù)據(jù)第七頁,共95頁。均值

(計算公式)設(shè)一組數(shù)據(jù)為:X1,X2,…,XN

簡單均值的計算公式為設(shè)分組后的數(shù)據(jù)為:X1,X2,…,XK

相應(yīng)的頻數(shù)為:F1,F(xiàn)2,…,F(xiàn)K加權(quán)均值的計算公式為第八頁,共95頁。簡單均值

(算例)原始數(shù)據(jù): 10 5 9 13 6 8第九頁,共95頁。加權(quán)均值

(算例)表4-1某車間50名工人日加工零件均值計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)XiFi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064322.5562.5940.01715.01275.0795.0550.0合計—506160.0計算50名工人日加工零件數(shù)的均值第十頁,共95頁。加權(quán)均值

(權(quán)數(shù)對均值的影響)甲乙兩組各有10名學(xué)生,他們的考試成績及其分布數(shù)據(jù)如下甲組:考試成績(X): 020100

人數(shù)分布(F):118

乙組:考試成績(X): 020100

人數(shù)分布(F):811第十一頁,共95頁。均值

(數(shù)學(xué)性質(zhì))1. 各變量值與均值的離差之和等于零

2.各變量值與均值的離差平方和最小第十二頁,共95頁。2.調(diào)和平均數(shù)調(diào)和平均數(shù)又稱“倒數(shù)平均數(shù)”,它是根據(jù)各標(biāo)志值的倒數(shù)來計算的平均數(shù),即各個標(biāo)志值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。

調(diào)和平均數(shù)也分簡單調(diào)和平均數(shù)和加權(quán)調(diào)和平均數(shù)。簡單調(diào)和平均數(shù)的計算公式為:即設(shè)m為權(quán)數(shù),則加權(quán)調(diào)和平均數(shù)的計算公式為:則第十三頁,共95頁。調(diào)和平均數(shù)

(概念要點(diǎn))1. 集中趨勢的測度值之一2. 均值的另一種表現(xiàn)形式3. 易受極端值的影響4. 用于定比數(shù)據(jù)5.不能用于定類數(shù)據(jù)和定序數(shù)據(jù)6.計算公式為原來只是計算時使用了不同的數(shù)據(jù)!第十四頁,共95頁。調(diào)和平均數(shù)

(算例)表某日三種蔬菜的批發(fā)成交數(shù)據(jù)蔬菜名稱批發(fā)價格(元)

Xi成交額(元)XiFi成交量(公斤)Fi甲乙丙1.200.500.801800012500640015000250008000合計—3690048000【例】某蔬菜批發(fā)市場三種蔬菜的日成交數(shù)據(jù)如表,計算三種蔬菜該日的平均批發(fā)價格第十五頁,共95頁。3.幾何平均數(shù)幾何平均數(shù)是計算平均比率和平均速度最適用的一種方法。幾何平均數(shù)有簡單幾何平均數(shù)和加權(quán)幾何平均數(shù)之分。簡單幾何平均數(shù)是次方根。個標(biāo)志值連乘積的其計算公式為:在用幾何平均數(shù)法計算平均數(shù)時,如果大于2,可采用對數(shù)法計算。計算公式為:第十六頁,共95頁。幾何平均數(shù)

(概念要點(diǎn))1.集中趨勢的測度值之一2.N

個變量值乘積的N

次方根3.適用于特殊的數(shù)據(jù)4.主要用于計算平均發(fā)展速度5.計算公式為6.可看作是均值的一種變形第十七頁,共95頁。幾何平均數(shù)

(算例)一位者持有一種,1996年、1997年、1998年和1999年收益率分別為4.5%、2.0%、3.5%、5.4%。計算該者在這四年內(nèi)的平均收益率。平均收益率=103.84%-1=3.84%第十八頁,共95頁。需要指出的是,當(dāng)把幾何平均數(shù)應(yīng)用于經(jīng)濟(jì)現(xiàn)象時,必須注意經(jīng)濟(jì)現(xiàn)象本身的特點(diǎn)。只有當(dāng)標(biāo)志總量表現(xiàn)為各個標(biāo)志值的連乘積時,才適合采用幾何平均數(shù)方法來計算平均標(biāo)志值。一般來說,計算社會經(jīng)濟(jì)現(xiàn)象在各個時期的平均發(fā)展速度時,要采用幾何平均數(shù)。例如,工農(nóng)業(yè)總產(chǎn)值年平均發(fā)展速度、全國人口年平均發(fā)展速度等。第十九頁,共95頁。4.中位數(shù)中位數(shù)是一種按其在數(shù)列中的特殊位置而決定的平均數(shù)。把總體各單位標(biāo)志值按大小順序排列后,處在中點(diǎn)位次的標(biāo)志值就是中位數(shù),它將全部標(biāo)志值分成兩個部分,一半標(biāo)志值比它大,一半標(biāo)志值比它小,而且比它大的標(biāo)志值個數(shù)和比它小的標(biāo)志值個數(shù)相等。要求得中位數(shù),首先要確定中位數(shù)的位次。未分組資料時,中位數(shù)位次=

當(dāng)總體位數(shù)為奇數(shù)時,中位數(shù)就是中位數(shù)位次上的那個數(shù)據(jù);當(dāng)為偶數(shù)時,中位數(shù)是中位數(shù)位次上2項數(shù)據(jù)的算術(shù)平均數(shù)。第二十頁,共95頁。分組資料時,中位數(shù)位次可以利用中位數(shù)所在組的下限來測算中位數(shù),即中位數(shù)的下限公式為:——中位數(shù)——中位數(shù)所在組的下限——中位數(shù)所在組的次數(shù)——總次數(shù)即各組次數(shù)總和——小于中位數(shù)組的各組次數(shù)之和——中位數(shù)所在組的組距式中:第二十一頁,共95頁。也可以利用中位數(shù)所在組的上限來測算中位數(shù),即中位數(shù)的上限公式為:式中:——中位數(shù)所在組的上限——大于中位數(shù)組的各組次數(shù)之和中位數(shù)最大的特點(diǎn)是:它是序列中間1項或2項的平均數(shù),不受極端值的影響,所以在當(dāng)一個變量數(shù)列中含有特大值與特小值的情況下,采用中位數(shù)較為適宜。正式由于中位數(shù)的這一特點(diǎn),在統(tǒng)計研究中,當(dāng)遇到掌握統(tǒng)計資料不多而且各標(biāo)志值之間差異程度較大或頻數(shù)分布有偏態(tài)時,為避免計算標(biāo)志值所得的算術(shù)平均數(shù)偏大或偏小,就可利用中位數(shù)來表示現(xiàn)象的一般水平。第二十二頁,共95頁。中位數(shù)

(概念要點(diǎn))集中趨勢的測度值之一排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于定序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即第二十三頁,共95頁。中位數(shù)

(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):第二十四頁,共95頁。未分組數(shù)據(jù)的中位數(shù)

(計算公式)第二十五頁,共95頁。定序數(shù)據(jù)的中位數(shù)

(算例)【例】計算甲城市家庭對住房滿意狀況評價的中位數(shù)解:中位數(shù)的位置為:

300/2=150從累計頻數(shù)看,中位數(shù)的在“一般”這一組別中。因此

Me=一般表甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—第二十六頁,共95頁。數(shù)值型未分組數(shù)據(jù)的中位數(shù)

(5個數(shù)據(jù)的算例)原始數(shù)據(jù): 2422212620排序: 2021222426位置: 123 45中位數(shù)22第二十七頁,共95頁。數(shù)值型未分組數(shù)據(jù)的中位數(shù)

(6個數(shù)據(jù)的算例)原始數(shù)據(jù):105 91268排序: 56891012位置: 123

4

56位置N+126+123.5中位數(shù)8+928.5第二十八頁,共95頁。根據(jù)位置公式確定中位數(shù)所在的組采用下列近似公式計算:4.

該公式假定中位數(shù)組的頻數(shù)在該組內(nèi)均勻分布數(shù)值型分組數(shù)據(jù)的中位數(shù)

(要點(diǎn)及計算公式)第二十九頁,共95頁。數(shù)值型分組數(shù)據(jù)的中位數(shù)

(算例)表某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例】計算50名工人日加工零件數(shù)的中位數(shù)第三十頁,共95頁。5.眾數(shù)眾數(shù)是一種位置平均數(shù)。眾數(shù)是總體單位中,標(biāo)志值出現(xiàn)次數(shù)最多的那個數(shù)值。為了確定眾數(shù)的具體數(shù)值,可以利用下限公式或上限公式加以計算。計算眾數(shù)的下限公式為:

式中:——眾數(shù)——眾數(shù)組的下限——眾數(shù)組次數(shù)與上一組次數(shù)之差——眾數(shù)組次數(shù)與下一組次數(shù)之差——眾數(shù)組的組距第三十一頁,共95頁。計算眾數(shù)的上限公式為:

式中:——眾數(shù)組的上限眾數(shù)的計算只適用于單位數(shù)較多,且存在明顯的集中趨勢的情況,否則,計算眾數(shù)時沒有意義的。第三十二頁,共95頁。眾數(shù)

(概念要點(diǎn))集中趨勢的測度值之一出現(xiàn)次數(shù)最多的變量值不受極端值的影響可能沒有眾數(shù)或有幾個眾數(shù)主要用于定類數(shù)據(jù),也可用于定序數(shù)據(jù)和數(shù)值型數(shù)據(jù)第三十三頁,共95頁。眾數(shù)

(眾數(shù)的不唯一性)無眾數(shù)

原始數(shù)據(jù):10591268一個眾數(shù)

原始數(shù)據(jù):65

9855多于一個眾數(shù)

原始數(shù)據(jù):252828

364242第三十四頁,共95頁。定類數(shù)據(jù)的眾數(shù)

(算例)表某城市居民關(guān)注廣告類型的頻數(shù)分布

廣告類型人數(shù)(人)比例頻率(%)商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合計2001100【例】根據(jù)第三章表3-1中的數(shù)據(jù),計算眾數(shù)解:這里的變量為“廣告類型”,這是個定類變量,不同類型的廣告就是變量值。我們看到,在所調(diào)查的200人當(dāng)中,關(guān)注商品廣告的人數(shù)最多,為112人,占總被調(diào)查人數(shù)的56%,因此眾數(shù)為“商品廣告”這一類別,即

Mo=商品廣告第三十五頁,共95頁。定序數(shù)據(jù)的眾數(shù)

(算例)【例】根據(jù)第三章表3-2中的數(shù)據(jù),計算眾數(shù)解:這里的數(shù)據(jù)為定序數(shù)據(jù)。變量為“回答類別”。甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即

Mo=不滿意表3-2甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510合計300100.0第三十六頁,共95頁。數(shù)值型分組數(shù)據(jù)的眾數(shù)

(要點(diǎn)及計算公式)1.眾數(shù)的值與相鄰兩組頻數(shù)的分布有關(guān)4.

該公式假定眾數(shù)組的頻數(shù)在眾數(shù)組內(nèi)均勻分布2.相鄰兩組的頻數(shù)相等時,眾數(shù)組的組中值即為眾數(shù)Mo3.相鄰兩組的頻數(shù)不相等時,眾數(shù)采用下列近似公式計算MoMo第三十七頁,共95頁。數(shù)值型分組數(shù)據(jù)的眾數(shù)

(算例)表某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例】計算50名工人日加工零件數(shù)的眾數(shù)第三十八頁,共95頁。四分位數(shù)

(概念要點(diǎn))1. 集中趨勢的測度值之一2. 排序后處于25%和75%位置上的值3.不受極端值的影響4.主要用于定序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于定類數(shù)據(jù)QLQMQU25%25%25%25%第三十九頁,共95頁。四分位數(shù)

(位置的確定)未分組數(shù)據(jù):組距分組數(shù)據(jù):下四分位數(shù)(QL)位置=N+14上四分位數(shù)(QU)位置=3(N+1)4下四分位數(shù)(QL)位置=N4上四分位數(shù)(QL)位置=3N4第四十頁,共95頁。定序數(shù)據(jù)的四分位數(shù)

(算例)【例】計算甲城市家庭對住房滿意狀況評價的四分位數(shù)解:下四分位數(shù)(QL)的位置為:

QL位置=(300)/4=75

上四分位數(shù)(QL)的位置為:

QU位置=(3×300)/4=225從累計頻數(shù)看,QL在“不滿意”這一組別中;QU在“一般”這一組別中。因此

QL

=不滿意

QU

=一般表甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—第四十一頁,共95頁。數(shù)值型未分組數(shù)據(jù)的四分位數(shù)

(7個數(shù)據(jù)的算例)原始數(shù)據(jù):

2321 3032 282526排序:21232526283032位置:1 23 4567N+1QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4

==6QU=30第四十二頁,共95頁。數(shù)值型未分組數(shù)據(jù)的四分位數(shù)

(6個數(shù)據(jù)的算例)原始數(shù)據(jù):

2321 30 282526排序:212325262830位置:1 2 3 4 56QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)

=第四十三頁,共95頁。數(shù)值型分組數(shù)據(jù)的四分位數(shù)

(計算公式)上四分位數(shù):

下四分位數(shù):

第四十四頁,共95頁。數(shù)值型分組數(shù)據(jù)的四分位數(shù)

(計算示例)QL位置=50/4=QU位置=3×50/4=表某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)累積頻數(shù)105~110110~115115~120120~125125~130130~135135~140358141064381630404650合計50—【例】計算50名工人日加工零件數(shù)的四分位數(shù)第四十五頁,共95頁。第四十六頁,共95頁。離散趨勢的測度離散趨勢的測度,在統(tǒng)計學(xué)中也稱為指標(biāo)變異指標(biāo),是用來描述數(shù)列中指標(biāo)值的離散趨勢與離散程度的。常用的標(biāo)志變異指標(biāo)有極差、平均差和標(biāo)準(zhǔn)差等。1.極差極差是指一個數(shù)列中兩個極端值即最大值與最小值之間的差異。根據(jù)極差的大小能說明標(biāo)志值變動范圍的大小。其計算公式為:極差=最大標(biāo)志值-最小標(biāo)志值根據(jù)組距數(shù)列求極差的計算公式為:極差=最高組上限-最低組下限在實際工作中,極差可以用于檢查產(chǎn)品質(zhì)量的穩(wěn)定性和進(jìn)行質(zhì)量控制。在正常生產(chǎn)的條件下,產(chǎn)品質(zhì)量穩(wěn)定,極差在一定范圍內(nèi)波動,若極差超過給定的范圍,就說明有不正常情況產(chǎn)傷。但極差受到極端是的影響,測定結(jié)果往往不能反映數(shù)據(jù)的實際離散程度。第四十七頁,共95頁。甲、乙二人射擊,結(jié)果如下:甲:,,,,,,,乙:,,,,,,,10他們成績的平均數(shù)是:第四十八頁,共95頁。極差

(概念要點(diǎn)及計算公式)1.一組數(shù)據(jù)的最大值與最小值之差2.離散程度的最簡單測度值3.易受極端值影響4.未考慮數(shù)據(jù)的分布7891078910未分組數(shù)據(jù)

R

=max(Xi)-min(Xi).=組距分組數(shù)據(jù)R

最高組上限-最低組下限5.計算公式為第四十九頁,共95頁。例子1,3,4,7,8,9,10求極差R=10-1=9第五十頁,共95頁。極差是離散程度的最簡單測度值,它只利用了一組數(shù)據(jù)的兩個極端值,易受極端值的影響,且不能反映中間數(shù)據(jù)的分散狀況。比如:1,6,6,6,6,6,10這一組數(shù)據(jù),極差是?R=10-1=9和上一組極差值相同,都是9,如果以此斷言兩組數(shù)據(jù)離散程度相同,恐怕很不合適,直覺告訴我們后一組數(shù)據(jù)的差異比前一組數(shù)據(jù)大的多。

返回第五十一頁,共95頁。2.四分位差四分位差是根據(jù)四分位數(shù)計算的。首先把變量各單位標(biāo)志值從小到大排序,再將數(shù)列四等分,處于四分位點(diǎn)位次的標(biāo)志值就是四分位數(shù),記作,為第一四分位數(shù)(也稱為下四分位數(shù)),為第二四分位數(shù),就是中位數(shù),為第三四分位數(shù)。四分位差的計算公式為:四分位差的計算步驟為:先尋找四分位數(shù),然后根據(jù)四分位差的計算公式計算。第五十二頁,共95頁。四分位差

(定序數(shù)據(jù)的算例)【例】計算甲城市家庭對住房滿意狀況評價的四分位差解:設(shè)非常不滿意為1,不滿意為2,一般為3,滿意為4,非常滿意為5已知M1=不滿意=2,

M3=

一般=

3四分位差:=M3

-

M1

=3–2

=1表甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)累計頻數(shù)

非常不滿意

不滿意

一般

滿意

非常滿意2410893453024132225270300合計300—第五十三頁,共95頁。四分位差是對極差的一種改進(jìn)。與極差相比,四分位差因不受極值的影響,在反映數(shù)據(jù)的離散程度方面比極差準(zhǔn)確,具有較高的穩(wěn)定性;同時,對于存在開口的組距數(shù)列,不能計算極差,但可以計算四分位差。四分位差與極差相比較:四分位差和極差一樣,不能充分利用數(shù)據(jù)的全部信息,也無法反映標(biāo)志值的一般變動。第五十四頁,共95頁。3.平均差平均差是各單位標(biāo)志值對平均數(shù)的離差絕對值的平均數(shù)。平均差僅反映總體各單位標(biāo)志值對其平均數(shù)的平均離差量。平均差越大,表明標(biāo)志變異程度越大;反之,則表明標(biāo)志變異程度越小。平均差通常用字母表示。

未分組資料時,其計算公式為:分組資料時,其計算公式為:第五十五頁,共95頁。因為一組數(shù)據(jù)中各變量值與其均值之差有正號也有負(fù)號,正負(fù)加起來抵銷正好等于零。第五十六頁,共95頁。例:1,3,4,7,8,9,10各個離差如果不加絕對值的加起來:(1-6)+(3-6)+(4—6)+(7-6)+(8-6)+(9-6)+(10-6)=-5-3-2+1+2+3+4=-10+10=0第五十七頁,共95頁。求兩組數(shù)據(jù)的平均差:

例一:1,3,4,7,8,9,10

例二:1,6,6,6,6,6,10第五十八頁,共95頁。平均差

(計算過程及結(jié)果)表某車間50名工人日加工零件標(biāo)準(zhǔn)差計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)|Xi-X||Xi-X|Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合計—50—312【例】計算工人日加工零件數(shù)的平均差第五十九頁,共95頁。4.方差和標(biāo)準(zhǔn)差未分組資料時,方差的公式為:

標(biāo)準(zhǔn)差的公式為:分組資料時,方差的公式為:

標(biāo)準(zhǔn)差的公式為:式中:——算術(shù)平均數(shù)——總體單位數(shù)——各組次數(shù)——方差——標(biāo)準(zhǔn)差——變量值第六十頁,共95頁。需要指出的是,是總體標(biāo)準(zhǔn)差,而樣本標(biāo)準(zhǔn)差為。當(dāng)樣本較大時,由于幾乎等于,因此常用公式代替公式來計算樣本標(biāo)準(zhǔn)差S,并用于估計總體標(biāo)準(zhǔn)差。在小樣本的情況下,較為總體標(biāo)準(zhǔn)差的更優(yōu)良的估計量。

返回本章返回總目錄第六十一頁,共95頁。方差和標(biāo)準(zhǔn)差

(概念要點(diǎn))1. 離散程度的測度值之一2. 最常用的測度值3. 反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標(biāo)準(zhǔn)差4681012X=8.3第六十二頁,共95頁??傮w方差和標(biāo)準(zhǔn)差

(計算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標(biāo)準(zhǔn)差的計算公式第六十三頁,共95頁??傮w標(biāo)準(zhǔn)差

(計算過程及結(jié)果)表某車間50名工人日加工零件標(biāo)準(zhǔn)差計算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)(Xi-X)2(Xi-X)2Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合計—50—3100.5【例】計算工人日加工零件數(shù)的標(biāo)準(zhǔn)差第六十四頁,共95頁。樣本方差和標(biāo)準(zhǔn)差

(計算公式)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標(biāo)準(zhǔn)差的計算公式注意:樣本方差用自由度n-1去除!第六十五頁,共95頁。樣本方差

自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當(dāng)樣本數(shù)據(jù)的個數(shù)為n

時,若樣本均值x確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則x=5。當(dāng)x

=5

確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面來解釋,從實際應(yīng)用角度看,在抽樣估計中,當(dāng)用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量第六十六頁,共95頁。樣本方差

(算例)原始數(shù)據(jù):10 591368第六十七頁,共95頁。樣本標(biāo)準(zhǔn)差

(算例)樣本標(biāo)準(zhǔn)差原始數(shù)據(jù):

10591368第六十八頁,共95頁。方差

(簡化計算公式)樣本方差總體方差第六十九頁,共95頁。方差

(數(shù)學(xué)性質(zhì))各變量值對均值的方差小于對任意值的方差設(shè)X0為不等于X的任意數(shù),D2為對X0的方差,則第七十頁,共95頁。5.離散系數(shù)上述的各種標(biāo)志變異度指標(biāo),都是對總體中各單位指標(biāo)值變異測定的絕對量指標(biāo)。而離散系數(shù)是測定總體中各單位標(biāo)志值變異的相對量指標(biāo),以消除不同總體之間在計量單位、平均水平方面的不可比因素。常用的離散系數(shù)主要有平均差離散系數(shù)和標(biāo)準(zhǔn)差離散系數(shù)其公式分別為:

第七十一頁,共95頁。離散系數(shù)上面介紹的各離散程度的測度值,反映的是數(shù)據(jù)分散程度的絕對值,其數(shù)值的大小取決于原變量值絕對水平的高低。舉個例子:兩組數(shù)據(jù):第一組:5,10,20,25,30第二組:100000,100005,99995,100020,100040第七十二頁,共95頁。第一組數(shù)據(jù)極差=25第二組數(shù)據(jù)極差=45第一組數(shù)據(jù)平均差=第二組數(shù)據(jù)平均差=第一組數(shù)據(jù)方差=標(biāo)準(zhǔn)差=第二組數(shù)據(jù)方差=標(biāo)準(zhǔn)差=第七十三頁,共95頁。還比如如果一組測量人的重量的數(shù)據(jù):65(公斤),75,60,62,58極差=17平均差=4.8方差=44.5標(biāo)準(zhǔn)差=而如果將這些人的體重改成用噸計算,則數(shù)據(jù)變成:(噸),,,,極差=0.017平均差=0.0048方差=0.000045標(biāo)準(zhǔn)差=第七十四頁,共95頁。因此,對平均水平不同或計量單位不同的不同組別的變量值,不能直接的用上述離散程度的測度值進(jìn)行直接的比較各組的離散程度。為了消除變量值水平的高低和計量單位不同對離散測度值的影響,我們計算離散系數(shù)值。離散系數(shù)一般是用標(biāo)準(zhǔn)差計算的,也稱為標(biāo)準(zhǔn)差系數(shù),它是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的均值之比,是測度數(shù)據(jù)離散程度的相對指標(biāo),其計算公式為:第七十五頁,共95頁。剛剛講的一個例子:第一組:5,10,20,25,30離散系數(shù)=第二組:100000,100005,99995,100020,100040離散系數(shù)=第七十六頁,共95頁。體重的那個例子:65(公斤),75,60,62,58離散系數(shù)=(噸),,,,離散系數(shù)=第七十七頁,共95頁。離散系數(shù)

(概念要點(diǎn)和計算公式)1. 標(biāo)準(zhǔn)差與其相應(yīng)的均值之比2. 消除了數(shù)據(jù)水平高低和計量單位的影響3. 測度了數(shù)據(jù)的相對離散程度4. 用于對不同組別數(shù)據(jù)離散程度的比較5.計算公式為第七十八頁,共95頁。離散系數(shù)

(實例和計算過程)表某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號產(chǎn)品銷售額(萬元)X1銷售利潤(萬元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤的離散程度第七十九頁,共95頁。離散系數(shù)

(計算結(jié)果)X1=536.25(萬元)S1=309.19(萬元)V1=536.25309.19=0.577S2=23.09(萬元)V2=32.521523.09=0.710X2=32.5215(萬元)結(jié)論:計算結(jié)果表明,V1<V2,說明產(chǎn)品銷售額的離散程度小于銷售利潤的離散程度第八十頁,共95頁。偏態(tài)第八十一頁,共95頁。偏態(tài)與峰度分布的形狀扁平分布尖峰分布偏態(tài)峰度左偏分布右偏分布與標(biāo)準(zhǔn)正態(tài)分布比較!第八十二頁,共95頁。頻數(shù)(人)1512963105110115120125130135140日加工零件數(shù)(個)直方圖下的面積之和等于1圖3-5某車間工人日加工零件數(shù)的直方圖對稱分布第八十三頁,共95頁。戶數(shù)比重(%)252015105農(nóng)村居民家庭村收入數(shù)據(jù)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論