




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三章集中趨勢(shì)和離中趨勢(shì)3·1集中趨勢(shì)的測(cè)度3·2離中趨勢(shì)的測(cè)度3·3偏態(tài)與峰度的測(cè)定1
3·1集中趨勢(shì)的測(cè)度集中趨勢(shì)是指一組數(shù)據(jù)(或總體各單位標(biāo)志值)向某一中心值靠攏的傾向,測(cè)度集中趨勢(shì)也就是尋找資料一般水平代表值或中心值,即平均指標(biāo)。所謂平均指標(biāo),是說明同質(zhì)總體內(nèi)各單位某一數(shù)量標(biāo)志在一定時(shí)間、地點(diǎn)條件下所達(dá)到的一般水平。趨勢(shì)的測(cè)度值(平均指標(biāo))主要有算術(shù)平均數(shù)、調(diào)和平均數(shù)、幾何平均數(shù)、眾數(shù)和中位數(shù)等。本節(jié)將分別介紹它們的計(jì)算方法、特點(diǎn)及應(yīng)用場(chǎng)合。
22集中趨勢(shì)測(cè)度方法:
平均指標(biāo)
算術(shù)平均數(shù)調(diào)和平均數(shù)幾何平均數(shù)位置平均數(shù)眾數(shù)中位數(shù)分位數(shù)3北京46507天津34938內(nèi)蒙古21884山西21525河北19911
遼寧23202吉林20513黑龍江19386
上海49310江蘇27374浙江31086安徽22180福建22283江西18400山東22844河南20935湖北19818湖南21534廣東29443廣西21898海南19357
重慶23098四川21312貴州20668云南20481西藏46098
陜西21296甘肅20987青海26166寧夏26210新疆2143407年各地職工平均工資12345678912314
北
京
(2)56328
天
津
(4)41748
河
北
24756
山
西
(16)25828
內(nèi)蒙古
(14)26114
遼
寧
(10)27729
吉
林
23486
黑龍江
23046
上
海
(1)56565
江
蘇
(7)31667
浙
江
(5)34146
安
徽
(13)26363
福
建
(17)25702
江
西
21000
山
東
(12)26404
河
南
24816
湖
北
22739
湖
南
24870
廣
東
(6)33110
廣
西
(18)25660
海
南
21864
重
慶
(11)26985
四
川
25038
貴
州
24602
云
南
24030
西
藏
(3)47280
陜
西
(15)25942
甘
肅
24017
青
海
(8)30983
寧
夏
(9)30719
新
疆
2468708年各地職工平均工資5全國(guó)平均數(shù)據(jù)
2007年全國(guó)城鎮(zhèn)單位在崗職工年平均工資為24932元,日平均工資為99.31元
2008年全國(guó)城鎮(zhèn)單位在崗職工平均工資為29229元,日平均工資為111.99元。
2009年,全國(guó)城鎮(zhèn)單位就業(yè)人員平均工資為32244元。2010年,全國(guó)城鎮(zhèn)單位就業(yè)人員平均工資為36539元。
年份19902000200920102011城鎮(zhèn)居民人均可支配收入(元)1510
6280
17175
1910921810農(nóng)村居民人均純收入(元)
686
2253
5153
59196977
2011年城鎮(zhèn)居民收入中位數(shù)19118元,農(nóng)村居民收入中位數(shù)6194元。608年中國(guó)城鎮(zhèn)職工平均工資為2.9萬元,同比增17.2%平均數(shù)背后存在三大差異:平均工資存在地區(qū)差異。2008年城鎮(zhèn)單位在崗職工平均工資高于全國(guó)平均水平的有9個(gè)省區(qū)市,低于全國(guó)平均水平的有22個(gè)省區(qū)市。分四大區(qū)域看,平均工資由高到低排列依次是東部、西部、東北和中部,分別為34316元、25602元、25101元和24390元。平均工資存在行業(yè)差異。2008年平均工資最高的行業(yè)是證券業(yè)172123元,最低的行業(yè)是木材加工及木竹滕棕草制品業(yè)15663元。受國(guó)際金融危機(jī)影響較大的紡織業(yè)和紡織服裝鞋帽制造業(yè)在崗職工平均工資分別為16222元和18572元。
不同類型單位平均工資存在差異。2008年機(jī)關(guān)在崗職工平均工資為33869元,事業(yè)單位平均工資為29758元,企業(yè)平均工資為28359元。機(jī)關(guān)、事業(yè)單位平均工資略高于全國(guó)平均水平,企業(yè)平均工資略低于全國(guó)平均水平的格局多年來一直沒有改變。7女性為購(gòu)物一年走247公里
不少女性是商場(chǎng)的忠實(shí)擁躉:新貨上市時(shí)要去嘗鮮,商品打折時(shí)要去“掃貨”,有時(shí)為找到自己喜歡的東西,更是不惜“長(zhǎng)途跋涉”。那么,這樣下來,愛逛街的女性一年會(huì)走多遠(yuǎn)的路?
女性年均逛街160小時(shí)
英國(guó)德貝納姆百貨公司調(diào)查2000名顧客后發(fā)現(xiàn),女性平均每周花費(fèi)2.5小時(shí)逛商場(chǎng),行走大約4.7公里。男性每周逛商場(chǎng)的平均時(shí)間約為50分鐘,行走大約2.4公里。
分解來看,女性平均每次逛街買衣服需要1小時(shí)59分,買食品需要1小時(shí)22分,到住所附近買其他雜物需要38分鐘。
按每年買24次服裝、60次食品和48次雜物來算,女性每年花在買衣服上的時(shí)間為47小時(shí)36分,花在買食品上的時(shí)間為82小時(shí),花在買雜物上的時(shí)間為30小時(shí)24分。
8女性為購(gòu)物一年走247公里
也就是說,女性平均每年有160小時(shí)的時(shí)間在逛街,相當(dāng)于約20個(gè)8小時(shí)工作日。行走長(zhǎng)度達(dá)到約247公里。
購(gòu)物3小時(shí)熱量消耗相當(dāng)一個(gè)漢堡
逛街除了可以滿足女性的消費(fèi)欲望外,還可以“順便”鍛煉身體。
統(tǒng)計(jì)數(shù)字顯示,女性每次出去逛街時(shí)大約要走7305步,相當(dāng)于國(guó)家醫(yī)療服務(wù)系統(tǒng)推薦的“日行萬步”的四分之三。如果再算上她們手提肩背的“戰(zhàn)利品”,那么效果不亞于去健身房鍛煉。
怪不得有超過半數(shù)的受調(diào)查者說,逛街一天比去健身房累得多。
研究人員進(jìn)一步推算得出:購(gòu)物3小時(shí)能幫助女性消耗495卡路里,相當(dāng)于一個(gè)麥當(dāng)勞巨無霸漢堡;逛街2小時(shí)也能用掉約283卡路里,等于一杯中號(hào)拿鐵咖啡。
從平均值來看,女性每周逛街可以消耗385卡路里,相當(dāng)于一塊胡蘿卜蛋糕或兩大杯紅酒。
(新華社供本報(bào)特稿)9一、算術(shù)平均數(shù)
算術(shù)平均數(shù)是集中趨勢(shì)中最常用、最重要的測(cè)度值。它是將總體標(biāo)志總量除以總體單位總量而得到的均值。(一)算術(shù)平均數(shù)的基本公式算術(shù)平均數(shù)=總體標(biāo)志總量/總體單位總量注意:式中分子、分母指標(biāo)必須屬于同一總體,即各標(biāo)志值與各單位之間是一一對(duì)應(yīng)的。這也是算術(shù)平均數(shù)與強(qiáng)度相對(duì)指標(biāo)的區(qū)別。(二)兩種計(jì)算形式:首先看兩個(gè)資料。10例一:設(shè)有一組大學(xué)生的月生活費(fèi)支出為:150,200,240,300,350,500(單位:元)。(x=290)例二:有一班級(jí)的大學(xué)生月生活費(fèi)支出如下表:
月生活費(fèi)(元)x人數(shù)(人)f頻率(%)15035.3620058.93240712.503002442.853501628.5750011.79合計(jì)56100.00
1111
加權(quán)算術(shù)平均數(shù)計(jì)算表
月生活費(fèi)(元)x人數(shù)(人)f頻率(%)xfx*頻率15035.364508.0420058.93100017.86240712.50168030.003002442.857200128.553501628.575600100.0050011.795008.95合計(jì)56100.0016430293.40資料欄計(jì)算欄解:該班級(jí)學(xué)生平均月生活費(fèi)=(公式)=16430/56=293.39(元)
121、簡(jiǎn)單算術(shù)平均數(shù)(適用于未分組資料)計(jì)算公式為:
如果所給的數(shù)據(jù)是已經(jīng)分組的次數(shù)分布數(shù)列,則算術(shù)平均數(shù)的計(jì)算應(yīng)采用加權(quán)算術(shù)平均數(shù)的形式。
132、加權(quán)算術(shù)平均數(shù)(適用于分組資料)(為什么由分組資料計(jì)算平均指標(biāo)不能將各組的標(biāo)志值簡(jiǎn)單平均?)。
計(jì)算公式為:
式中:f——代表各組的次數(shù)或頻數(shù)(即各組的單位數(shù))。
比較兩個(gè)公式,并解釋為什么次數(shù)f又稱之為權(quán)數(shù)?1415
平均數(shù)的大小不僅取決于各組標(biāo)志值x的大小,同時(shí)還受各組次數(shù)f多少的影響。各組標(biāo)志值次數(shù)的多少在平均數(shù)的計(jì)算中具有權(quán)衡輕重的作用,因而把各組的次數(shù)又稱為權(quán)數(shù),用各組的次數(shù)去乘以各組的標(biāo)志值,就是對(duì)各組的標(biāo)志值進(jìn)行加權(quán)。所以,用這種方法計(jì)算的算術(shù)平均數(shù),稱為加權(quán)算術(shù)平均數(shù)。試想,如果各組次數(shù)完全相同,結(jié)果會(huì)怎樣?16實(shí)務(wù)中給定的權(quán)數(shù)資料,既可以是絕對(duì)數(shù),也可以是相對(duì)數(shù),即頻率或稱權(quán)數(shù)系數(shù)。當(dāng)權(quán)數(shù)為相對(duì)數(shù)時(shí),加權(quán)算術(shù)平均數(shù)的表達(dá)公式如何呢?
算術(shù)平均數(shù)既可依據(jù)單項(xiàng)變量數(shù)列計(jì)算也可依據(jù)組距數(shù)列計(jì)算;既可根據(jù)絕對(duì)數(shù)計(jì)算,也可根據(jù)相對(duì)數(shù)或平均數(shù)進(jìn)行計(jì)算。17如果根據(jù)相對(duì)數(shù)或平均數(shù)進(jìn)行計(jì)算,則應(yīng)注意的問題是:(1)
只能用加權(quán)形式計(jì)算;(2)
權(quán)數(shù)的選擇問題。18
【例三】見下表所給資料。某市某局18個(gè)企業(yè)稅收計(jì)劃完成情況計(jì)劃完成(%)企業(yè)數(shù)(個(gè))計(jì)劃任務(wù)數(shù)(萬元)95——1005100100——10581200105——1103100110以上260合計(jì)181460要求:計(jì)算18個(gè)企業(yè)稅收收入平均計(jì)劃完成程度。
19
計(jì)算表計(jì)劃完成(%)組中值x(%)計(jì)劃任務(wù)數(shù)f(萬元)實(shí)際完成數(shù)xf(萬元)95——10097.510097.5100——105102.512001230.0105——110107.5100107.5110以上112.56067.5
合計(jì)—14601502.5計(jì)算欄
解:平均計(jì)劃完成程度x=∑xf/∑f
=1502.5/1460=102.91%
20【例四】(用于計(jì)算調(diào)和平均數(shù))
計(jì)劃完成(%)企業(yè)數(shù)(個(gè))實(shí)際完成數(shù)(萬元)
95——100597.5100——10581230.0105——1103107.5110以上267.5合計(jì)181502.5要求同上:計(jì)算18個(gè)企業(yè)稅收收入平均計(jì)劃完成程度。
21計(jì)算表計(jì)劃完成(%)組中值x(%)實(shí)際完成數(shù)m
計(jì)劃任務(wù)數(shù)m/x(萬元)(萬元)95—10097.597.5100100—105102.51230.01200
105—110107.5107.5100110以上112.567.560合計(jì)—1502.51460
計(jì)算欄解:=1502.5/1460=102.91%
22(三)算術(shù)平均數(shù)的數(shù)學(xué)性質(zhì)1、各個(gè)變量值與算術(shù)平均數(shù)的離差總和等于零。表達(dá)式:∑(x-x)=0或∑(x-x)f=02、各個(gè)變量值與算術(shù)平均數(shù)的離差平方總和為最小值。表達(dá)式:
∑(x-x)2=最小
或
最小
23二、調(diào)和平均數(shù)——又稱“倒數(shù)平均數(shù)”,它是根據(jù)各變量值的倒數(shù)來計(jì)算的平均數(shù)。具體地講,調(diào)和平均數(shù)是各變量值倒數(shù)的算術(shù)平均數(shù)的倒數(shù)。(一)調(diào)和平均數(shù)的計(jì)算方法1、
簡(jiǎn)單調(diào)和平均數(shù)(適用于未分組資料)計(jì)算公式為:
xH==(1/x1+1/x2+……+1/xn)/n∑(1/x)
1n24二、調(diào)和平均數(shù)(一)調(diào)和平均數(shù)的計(jì)算方法2、加權(quán)調(diào)和平均數(shù)(適用于分組資料)計(jì)算公式:
25二、調(diào)和平均數(shù)以m加權(quán)的調(diào)和平均數(shù)與以f加權(quán)的算術(shù)平均數(shù)的關(guān)系.因?yàn)椋鹘M標(biāo)志總量m=所以,各組的單位數(shù)(次數(shù))f=則:
26(二)加權(quán)算術(shù)平均數(shù)和加權(quán)調(diào)和平均數(shù)的采用
1、由平均數(shù)計(jì)算[例五]以某種蔬菜為例,資料見表。
某種蔬菜的有關(guān)資料
價(jià)格x(元/公斤)采購(gòu)金額m(元)早市0.5010.00中市0.4513.50晚市0.408.00合計(jì)—31.50
27
【例六】?jī)r(jià)格x(元/公斤)采購(gòu)量f(公斤)早市0.5020中市0.4530晚市0.4020合計(jì)——70分別依據(jù)表一和表二的資料,計(jì)算該種蔬菜的平均價(jià)格。
思路:平均每公斤價(jià)格=購(gòu)買金額/采購(gòu)量=0.45(元/公斤)
282、由相對(duì)數(shù)計(jì)算
例題見前述計(jì)劃完成程度的計(jì)算。結(jié)論:在由相對(duì)數(shù)或平均數(shù)計(jì)算平均數(shù)時(shí),在什么情況下采用加權(quán)算術(shù)平均數(shù)或加權(quán)調(diào)和平均數(shù),首先要明確所求平均指標(biāo)的分子、分母是什么,而后再根據(jù)所掌握的資料條件來選擇。如果所掌握的權(quán)數(shù)資料是計(jì)算公式的分母數(shù)值時(shí),則直接采用加權(quán)算術(shù)平均數(shù)的形式;如果所掌握的權(quán)數(shù)資料是計(jì)算公式的分子數(shù)值時(shí),則需采用加權(quán)調(diào)和平均數(shù)的形式。
29三、幾何平均數(shù)幾何平均數(shù)是計(jì)算平均比率或平均發(fā)展速度的最適用的一種方法。凡是變量值的連乘積等于總比率或總速度的現(xiàn)象,都采用幾何平均數(shù)反映現(xiàn)象總體的一般水平。根據(jù)所掌握資料的不同,也有簡(jiǎn)單和加權(quán)兩種形式:(一)簡(jiǎn)單幾何平均數(shù)是n個(gè)變量值連乘開n次方根的結(jié)果。
30三、幾何平均數(shù)(二)加權(quán)幾何平均數(shù)
31幾何平均數(shù)應(yīng)用案例:【例七】某機(jī)械廠有四個(gè)連續(xù)作業(yè)的車間:毛坯車間、粗加工車間、精加工車間和裝配車間,某月份各車間的產(chǎn)品合格率依次為:95%,90%,92%,85%。要求計(jì)算四個(gè)車間的平均產(chǎn)品合格率。(90.43%)【例八】投資銀行某項(xiàng)投資是按復(fù)利計(jì)算,18年間年利率的分配情況是:利率(%)3581015期限(年)14562要求:計(jì)算18年間的平均年利率。(8.45%)32四、切尾均值切尾均值是一種新的集中趨勢(shì)測(cè)度方法,在大賽中得到廣發(fā)應(yīng)用。切尾均值是去掉大小兩端的若干數(shù)值后計(jì)算中間數(shù)據(jù)的均值。
33四、切尾均值式中:n表示觀察值的個(gè)數(shù);表示切尾系數(shù),各觀察值是經(jīng)排隊(duì)后由小到大形成的順序統(tǒng)計(jì)量值。2834五、位置平均數(shù)(一)眾數(shù)(二)中位數(shù)(三)分位數(shù)四分位數(shù)十分位數(shù)百分位數(shù)35
(一)眾數(shù)1、眾數(shù)的概念眾數(shù)是總體中出現(xiàn)次數(shù)最多的標(biāo)志值,即最普遍、最常見的標(biāo)志值。眾數(shù)只有在總體單位較多而又有明確的集中趨勢(shì)的資料中才有意義。2、眾數(shù)的確定
單項(xiàng)數(shù)列中,出現(xiàn)次數(shù)最多的那個(gè)組的標(biāo)志值就是眾數(shù)。若在數(shù)列中有兩組的次數(shù)是相同的,且次數(shù)最多,則就是雙眾數(shù)或復(fù)眾數(shù)。
組距數(shù)列中,眾數(shù)的確定要分兩步:第一步,用直接觀察法確定眾數(shù)組即次數(shù)最多的那一組;第二步,計(jì)算眾數(shù)的近似值。比較精確的方法是用眾數(shù)組次數(shù)與相鄰兩組次數(shù)之差來推算眾數(shù)的近似值。
五、位置平均數(shù)36眾數(shù)一般有兩種計(jì)算公式:
Δ1
下限公式:M0=L+d
Δ1+Δ2上限公式:M0=U-Δ2/(Δ1+Δ2)d
組距數(shù)列眾數(shù)的確定一般與其相鄰兩組的頻數(shù)分布有關(guān)。若眾數(shù)組前一組的頻數(shù)比眾數(shù)組后一組的頻數(shù)多,則眾數(shù)小于眾數(shù)組的組中值;反之,眾數(shù)大于其組中值。若眾數(shù)組前一組的頻數(shù)等于其后一組的頻數(shù),則眾數(shù)就是眾數(shù)組的組中值。
37五、位置平均數(shù)(二)中位數(shù)1、中位數(shù)的概念中位數(shù)是將總體單位某一變量的各個(gè)變量值按大小順序排列,處在數(shù)列中間位置的那個(gè)變量值就是中位數(shù)。
2、中位數(shù)的確定(1)未分組資料確定中位數(shù)在資料未分組的情況下,將各變量值按大小順序排列后,
首先,確定中位數(shù)的位置,即(n+1)/2;
然后,根據(jù)中點(diǎn)位置確定中位數(shù)。
38(二)中位數(shù)2、中位數(shù)的確定
單項(xiàng)數(shù)列
(2)分組資料確定中位數(shù)組距數(shù)列
由單項(xiàng)數(shù)列計(jì)算中位數(shù):
首先,計(jì)算各組的累積次數(shù);
然后,根據(jù)中點(diǎn)位置(總次數(shù)/2)在累積次數(shù)中確定中位數(shù)所在組,以確定中位數(shù)。
39(二)中位數(shù)2、中位數(shù)的確定(2)分組資料確定中位數(shù)由組距數(shù)列計(jì)算中位數(shù)(情況要復(fù)雜一些):分三步驟:第一步,計(jì)算累積次數(shù);第二步,計(jì)算中位數(shù)位置(總次數(shù)/2),以確定中位數(shù)組;
第三步,用比例推算法估計(jì)中位數(shù)的近似值。40組距數(shù)列中位數(shù)的計(jì)算公式下限公式:上限公式:41下限公式的比例推算法:累積次數(shù)Sm-1=180中點(diǎn)位置f/2=215
中位數(shù)所在組次數(shù)fm=180215-180=35中位數(shù)在該組分?jǐn)偨M距的比例為:35/18042五、位置平均數(shù)(三)分位數(shù)中位數(shù)是將統(tǒng)計(jì)分布從中間分成面積相等的兩部分(即兩邊數(shù)據(jù)個(gè)數(shù)相等)。與中位數(shù)性質(zhì)相似的還有四分位數(shù)十分位數(shù)百分位數(shù)43(三)分位數(shù)1、四分位數(shù)(Qi)
又稱四分位點(diǎn),它是通過3個(gè)點(diǎn)將排好序的全部數(shù)據(jù)等分為4部分,其中每部分包含25%的數(shù)據(jù),處在分割點(diǎn)上的數(shù)值就是四分位數(shù)。很顯然,其中中間的四分位數(shù)就是中位數(shù)。所以,通常所說的的四分位數(shù)是指第一個(gè)和第三個(gè)四分位數(shù),分別又稱作下四分位數(shù)和上四分位數(shù)。44(三)分位數(shù)四分位數(shù)的計(jì)算方法:與中位數(shù)計(jì)算相類似(1)未分組資料計(jì)算首先對(duì)數(shù)據(jù)進(jìn)行排序,然后確定四分位數(shù)所在位置。設(shè):下四分位數(shù)為上四分位數(shù)為中間四分位數(shù)為45(三)分位數(shù)四分位數(shù)的計(jì)算方法:(1)未分組資料計(jì)算
的位置=的位置=46(三)分位數(shù)四分位數(shù)的計(jì)算方法:(1)未分組資料計(jì)算
的位置=47(三)分位數(shù)四分位數(shù)的計(jì)算方法:(1)未分組資料計(jì)算當(dāng)四分位數(shù)的位置不在某個(gè)數(shù)值上時(shí),可根據(jù)四分位數(shù)的位置,按比例分?jǐn)偹姆治粩?shù)位置兩側(cè)數(shù)值的差值。48(三)分位數(shù)四分位數(shù)的計(jì)算方法:(2)分組資料計(jì)算首先,確定和的位置,并確定和所在的組。
的位置=N/4的位置=3N/449(三)分位數(shù)四分位數(shù)的計(jì)算方法:(2)分組資料計(jì)算
然后,仿照中位數(shù)的計(jì)算公式確定和的具體數(shù)值。
50(三)分位數(shù)四分位數(shù)的計(jì)算方法:(2)分組資料計(jì)算51四分位數(shù)的計(jì)算方法:(2)分組資料計(jì)算式中:和分別為和所在組的下限值;
和分別為和所在組的次數(shù);
52(三)分位數(shù)四分位數(shù)的計(jì)算方法:(2)分組資料計(jì)算案例p2753(三)分位數(shù)2、十分位數(shù)(Di)3、百分位數(shù)(Pi)十分位數(shù)和百分位數(shù)是分別將排好序的數(shù)據(jù)分布10等分和100等分的分割點(diǎn)上數(shù)值。計(jì)算公式仿照四分位數(shù)計(jì)算即可。54六、平均指標(biāo)之間的相互關(guān)系
(一)算術(shù)平均數(shù)、幾何平均數(shù)和調(diào)和平均數(shù)的關(guān)系三者存在的數(shù)量關(guān)系表現(xiàn)在:根據(jù)同一資料所計(jì)算的三種平均數(shù),幾何平均數(shù)大于調(diào)和平均數(shù)而小于算術(shù)平均數(shù),即X≥XG≥XH
;當(dāng)變量數(shù)列中所有的標(biāo)志值都相等時(shí),三種平均數(shù)相同,即X=XG=XH。(二)中位數(shù)、眾數(shù)與算術(shù)平均數(shù)的關(guān)系這三者之間的關(guān)系,決定于總體內(nèi)部的次數(shù)分布狀況。
55(二)中位數(shù)、眾數(shù)與算術(shù)平均數(shù)的關(guān)系
在對(duì)稱分布的情況下,中位數(shù),眾數(shù)和算術(shù)平均數(shù)合而為一,即:Me=M0=在非對(duì)稱分布的情況下,中位數(shù),眾數(shù)和算術(shù)平均數(shù)之間存在一定的差別。如果分布右偏,則三者之間的關(guān)系是:M0<Me<;如果分布左偏,則三者之間的關(guān)系是:M0>Me>。可見,無論是右偏還是左偏,中位數(shù)總是介于算術(shù)平均數(shù)和眾數(shù)之間。適度偏態(tài)時(shí),-Me的距離是-M0的1/3。
56對(duì)稱分布M0=Me
=
X;57MeM0X右偏分布58左偏分布XMeM059(三)眾數(shù)、中位數(shù)和算術(shù)平均數(shù)的特點(diǎn)和應(yīng)用
場(chǎng)合眾數(shù)是一組數(shù)據(jù)分布的峰值,是一種位置代表值。其優(yōu)點(diǎn)是易于理解,不受極端值的影響。當(dāng)數(shù)據(jù)的分布具有明顯的集中趨勢(shì)時(shí),尤其是對(duì)于偏態(tài)分布,眾數(shù)的代表性比均值要好。其缺點(diǎn)是具有不唯一性。中位數(shù)是一組數(shù)據(jù)中間數(shù)據(jù)的代表值,其特點(diǎn)是不受數(shù)據(jù)極端值的影響,因此,對(duì)于具有偏態(tài)分布的數(shù)據(jù),中位數(shù)的代表性要比均值好。算術(shù)平均數(shù)是就全部數(shù)據(jù)計(jì)算的,它具有優(yōu)良的數(shù)學(xué)性質(zhì),是實(shí)際應(yīng)用最廣泛的集中趨勢(shì)測(cè)度值。其主要缺點(diǎn)是易受極端值的影響,對(duì)于偏態(tài)分布的數(shù)據(jù),均值的代表性較差。
60
結(jié)論:從各種代表值之間的關(guān)系及其特點(diǎn)可看出:當(dāng)數(shù)據(jù)呈對(duì)稱分布或接近對(duì)稱分布時(shí),三個(gè)代表值相等或接近相等,這時(shí),應(yīng)選擇均值作為集中趨勢(shì)的代表值(為什么?);當(dāng)數(shù)據(jù)為偏態(tài)分布,特別當(dāng)偏斜的程度較大時(shí),則應(yīng)選擇眾數(shù)或中為數(shù)等位置平均數(shù),這時(shí)它們的代表性要比均值好。此外,均值只適用于定距或定比尺度的數(shù)據(jù),而對(duì)于定類或定序尺度的數(shù)據(jù)無法計(jì)算均值,但卻可以計(jì)算眾數(shù)和中位數(shù)。
61補(bǔ)充介紹:箱線圖箱線圖是由一組數(shù)據(jù)的最大值、最小值、中位數(shù)和兩個(gè)四分位數(shù)5個(gè)特征值繪制而成的。對(duì)于單組數(shù)據(jù),可繪制簡(jiǎn)單箱線圖;對(duì)于多組數(shù)據(jù),可繪制多批比較箱線圖。箱線圖可反映出一組數(shù)據(jù)分布特征,還可進(jìn)行多組數(shù)據(jù)分布特征的比較。62箱線圖的繪制方法箱線圖是由一個(gè)箱子和兩條線段組成。(1)找出一組數(shù)據(jù)的5個(gè)特征值;(2)連接兩個(gè)四分位數(shù)畫出箱子;(3)將兩個(gè)極值點(diǎn)與箱子相連接。63第二節(jié)頻數(shù)分布離中程度的測(cè)度[案例1]有兩組男生身高分別為:甲組(cm):168,172,172,173,175,190乙組(cm):168,172,175,175,178,182兩組平均身高均為175cm,它們的代表性一樣嗎?64
[案例2]有男、女兩組身高:男組(cm):168,172,172,173,175,190女組(cm):163,164,165,165,167,171男組平均身高175cm;(7.02cm,4.01%)女組平均身高165.83cm。(2.61cm,1.57%)思考:兩組平均身高的代表性如何評(píng)價(jià)?第二節(jié)頻數(shù)分布離中程度的測(cè)度65
[案例3]從某校一年級(jí)大學(xué)生中隨機(jī)抽取100人,測(cè)得他們的身高和體重平均值分別是168厘米和52千克,相應(yīng)的標(biāo)準(zhǔn)差為9厘米和5千克,問身高和體重哪一個(gè)差異大?(5.36%,9.62%)第二節(jié)頻數(shù)分布離中程度的測(cè)度66案例1計(jì)算表:
甲組乙組
身高xx-x(x-x)2身高xx-x(x-x)2168-749168-749172-39172-39172-3917500173-2417500175001783919015225182749合計(jì)296合計(jì)116
甲組:σ=[∑(x-x)2/n]1/2=7.02(厘米)乙組:σ=[116/6]1/2=4.4(厘米)67第二節(jié)頻數(shù)分布離中程度的測(cè)度
離中程度,是各個(gè)變量值遠(yuǎn)離其中心值的程度,又稱離散程度,或變異指標(biāo)。
為什么要測(cè)度離中程度?集中趨勢(shì)只是數(shù)據(jù)分布的一個(gè)特征,它所反映的是總體各單位變量值向其中心值聚集的程度。而各變量值之間的差異狀況如何,均值的代表性有多大,這就需要用離中程度對(duì)其進(jìn)行考察。數(shù)據(jù)的離中程度是數(shù)據(jù)分布的另一個(gè)重要特征,它與均值的關(guān)系是:
變量值的差異大,離散程度就大,均值的代表性就??;變量值差異小,離散程度就小,均值的代表性也就大。
68
描述數(shù)據(jù)離散程度的測(cè)度值主要有極差、平均差、方差和標(biāo)準(zhǔn)差、離散系數(shù)等。
一、極差
極差亦稱全距,即兩極之差。根據(jù)全距的大小來說明變量值變動(dòng)范圍的大小。極差R=最大值-最小值對(duì)于組距分組數(shù)據(jù),極差也可以近似表示為:R=最高組的上限值-最低組的下限值優(yōu)缺點(diǎn):極差是描述數(shù)據(jù)離散程度的最簡(jiǎn)便測(cè)度值,其計(jì)算簡(jiǎn)單,易于理解,但它容易受極端值的影響。第二節(jié)頻數(shù)分布離中程度的測(cè)度69補(bǔ)充:內(nèi)距內(nèi)距,是兩個(gè)四分位數(shù)之差,即:
內(nèi)距=上四分位數(shù)-下四分位數(shù)與極差比較,內(nèi)距基本不受極端值的影響,且內(nèi)距反映的是中間50%數(shù)值大小的差異,故能給出比極差更多的數(shù)據(jù)差異信息。70二、平均差
平均差是表明總體各單位變量值與其均值之間絕對(duì)離差的算術(shù)平均數(shù),又稱平均離差,一般用A·D表示。
為什么采取離差的絕對(duì)值,即
71平均差兩種計(jì)算形式(1)簡(jiǎn)單平均差(適用于未分組資料)其公式為:
(2)加權(quán)平均差(分組資料)其公式為:
72二、平均差優(yōu)缺點(diǎn):平均差是根據(jù)全部變量值計(jì)算的,受極端值的影響比較小,所以,它能夠綜合反映總體中各單位變量值的離散程度。但由于它采用絕對(duì)值計(jì)算不符合代數(shù)方法的演算,所以在統(tǒng)計(jì)研究中應(yīng)用較少。
73
三、方差和標(biāo)準(zhǔn)差(一)
方差和標(biāo)準(zhǔn)差的含義方差,是總體各單位變量值與其算術(shù)平均數(shù)的離差平方的算術(shù)平均數(shù),用σ2表示,方差的平方根就是標(biāo)準(zhǔn)差σ。與方差不同的是,標(biāo)準(zhǔn)差是具有量綱的,它與變量值的計(jì)量單位相同,其實(shí)際意義要比方差清楚。因此,在對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行分析時(shí),更多使用標(biāo)準(zhǔn)差。
思考:與平均差比較,標(biāo)準(zhǔn)差的優(yōu)點(diǎn)是什么?74
平均差與標(biāo)準(zhǔn)差的比較:標(biāo)準(zhǔn)差與平均差雖都是變量值與均值的平均離差,但不同的是平均差所平均的是離差絕對(duì)值,而標(biāo)準(zhǔn)差平均的是離差平方。標(biāo)準(zhǔn)差徹底解決了正負(fù)離差不能相加的問題。它在抽樣調(diào)查、相關(guān)分析中應(yīng)用較多,所以標(biāo)準(zhǔn)差是應(yīng)用較為廣泛的一種離中趨勢(shì)的測(cè)度值。
75標(biāo)準(zhǔn)差的計(jì)算有兩種形式——
簡(jiǎn)單平均式和加權(quán)平均式(1)在未分組資料情況下,采用簡(jiǎn)單平均式。公式為:
(2)在分組資料情況下,采用加權(quán)平均式。公式為:
76(二)方差的數(shù)學(xué)性質(zhì):
1、變量的方差等于變量平方的平均數(shù)減去變量平均數(shù)的平方。即:2、變量對(duì)算術(shù)平均數(shù)的方差,小于對(duì)任意常數(shù)的方差。(三)標(biāo)準(zhǔn)差的應(yīng)用
標(biāo)準(zhǔn)差可用于計(jì)算標(biāo)準(zhǔn)化值。
標(biāo)準(zhǔn)化值是某一數(shù)據(jù)與平均數(shù)的距離以標(biāo)準(zhǔn)差為單位的測(cè)量值。其計(jì)算公式為:
77一組數(shù)據(jù)中的每一個(gè)原始數(shù)據(jù)都可以計(jì)算出對(duì)應(yīng)的標(biāo)準(zhǔn)化值,這一組標(biāo)準(zhǔn)化值組成一個(gè)標(biāo)準(zhǔn)化值的平均數(shù)為零,標(biāo)準(zhǔn)差為1。
當(dāng)Zi=0時(shí),即xi=x,這時(shí)原始數(shù)據(jù)正好等于這一組數(shù)據(jù)的平均數(shù);
當(dāng)Zi>0時(shí),原始數(shù)據(jù)高于其平均數(shù);當(dāng)Zi<0時(shí),原始數(shù)據(jù)低于其平均數(shù)。標(biāo)準(zhǔn)化數(shù)據(jù)越大,說明它距離平均數(shù)越遠(yuǎn)。標(biāo)準(zhǔn)化值的作用:標(biāo)準(zhǔn)化值不僅能表明各原始數(shù)據(jù)在一組數(shù)據(jù)分布中的相對(duì)位置,而且還能在不同分布的各原始數(shù)據(jù)間進(jìn)行比較,同時(shí)還能接受代數(shù)方法的處理。因此,標(biāo)準(zhǔn)化值在統(tǒng)計(jì)分析中起這十分重要的作用。
78標(biāo)準(zhǔn)化值的應(yīng)用:比如,已知某班統(tǒng)計(jì)學(xué)平均成績(jī)?yōu)?0分,標(biāo)準(zhǔn)差為10分;會(huì)計(jì)學(xué)平均成績(jī)?yōu)?0分,標(biāo)準(zhǔn)差為8分。甲學(xué)生統(tǒng)計(jì)學(xué)成績(jī)?yōu)?2分,會(huì)計(jì)學(xué)成績(jī)?yōu)?8分。試比較甲學(xué)生兩門課程考試成績(jī)的優(yōu)劣。若僅從原始分?jǐn)?shù)看,甲學(xué)生統(tǒng)計(jì)學(xué)的成績(jī)高于會(huì)計(jì)學(xué)成績(jī)。但由于甲學(xué)生這兩門課的成績(jī)分屬于不同的分布,所以無法直接比較。要正確比較,首先要把原始數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)分?jǐn)?shù),使這兩個(gè)分?jǐn)?shù)放在標(biāo)準(zhǔn)差為1、平均數(shù)為0的統(tǒng)一尺度下進(jìn)行比較。統(tǒng)計(jì)學(xué)的標(biāo)準(zhǔn)分?jǐn)?shù)為:Z=(82-80)/10=0.2會(huì)計(jì)學(xué)的標(biāo)準(zhǔn)分?jǐn)?shù)為:Z=(78-70)/8=1從標(biāo)準(zhǔn)分?jǐn)?shù)可看出,甲學(xué)生統(tǒng)計(jì)學(xué)成績(jī)超過全班平均成績(jī)0.2個(gè)標(biāo)準(zhǔn)差,即接近于平均成績(jī);會(huì)計(jì)學(xué)成績(jī)超過平均成績(jī)1個(gè)標(biāo)準(zhǔn)差。顯然,甲學(xué)生的會(huì)計(jì)學(xué)成績(jī)相對(duì)地更優(yōu)些。79四、變異系數(shù)平均差和標(biāo)準(zhǔn)差其數(shù)值大小,不僅決定于各標(biāo)志值的差異程度,還決定于數(shù)列平均水平的高低,同時(shí)它們具有與標(biāo)志值相同的名數(shù)。因而,對(duì)于具有不同平均水平和不同計(jì)量單位的數(shù)列,就不能直接利用標(biāo)準(zhǔn)差等來比較其標(biāo)志變動(dòng)程度的大小,而需要用變異系數(shù),以消除不同數(shù)列水平的影響。80四、變異系數(shù)變異系數(shù)是將標(biāo)準(zhǔn)差或平均差與其平均數(shù)對(duì)比所得的比值,又稱離散系數(shù)。公式為:
或(被常用)
變異系數(shù)是一個(gè)無名數(shù)的數(shù)值,可用于比較不同數(shù)列的變異程度。
81五、成數(shù)(一)成數(shù)的概念
所謂成數(shù)是總體中具有某種屬性或特征的單位數(shù)占全部單位數(shù)的比重,它反映了總體中“是”或“非”屬性的構(gòu)成,并且代表著該種屬性或特征反復(fù)出現(xiàn)的程度,即頻率。
成數(shù)的計(jì)算。在一個(gè)是非標(biāo)志總體中,如果全部總體單位數(shù)用N來表示,具有某種屬性或特征的單位數(shù)用N1表示,它在全部總體單位數(shù)中所占的比重(即成數(shù))用P表示。則:P=N1/N
82
將不具有某種屬性或特征的單位數(shù)用N0表示,它在全部總體單位數(shù)中所占的比重(成數(shù))用Q表示,則:Q=N0/N
兩個(gè)成數(shù)之和等于1,即:N1/N+N0/N=1亦即,P+Q=1因而,Q=1-P83(二)是非標(biāo)志的平均數(shù)和標(biāo)準(zhǔn)差
是非標(biāo)志是品質(zhì)標(biāo)志,因而無法直接計(jì)算其平均質(zhì)量。要計(jì)算是非標(biāo)志的平均數(shù),就必須將是非標(biāo)志在性質(zhì)上的差別過渡到數(shù)量上的變異,即將是非標(biāo)志數(shù)量化。如果以“1”表示具有某種屬性或特征的單位的標(biāo)志值,以“0”表示不具有某種屬性或特征的單位的標(biāo)志值,則是非標(biāo)志就轉(zhuǎn)化為(0,1)的數(shù)量標(biāo)志值。
列成統(tǒng)計(jì)表,則有:
是非標(biāo)志值(變量值)x比重(成數(shù))f1
P0
Q合計(jì)
184
是非標(biāo)志平均數(shù)和標(biāo)準(zhǔn)差的計(jì)算表
是非標(biāo)志值比重變量值×離差離差離差平方(變量值)(成數(shù))比重平方×權(quán)數(shù)xfxfx-x(x-x)2(x-x)2f
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 水泥路面施工承包合同
- 辦公樓裝修合同合同
- 委托招聘合同協(xié)議
- 招標(biāo)信息合作協(xié)議書
- 出版業(yè)數(shù)字化出版與版權(quán)保護(hù)管理方案
- 建筑原材料采購(gòu)合同
- 樓房租賃合同
- 傳統(tǒng)行業(yè)數(shù)字化轉(zhuǎn)型路徑選擇及實(shí)施方案研究項(xiàng)目
- 電子行業(yè)電子設(shè)備保修協(xié)議
- 項(xiàng)目進(jìn)展困難原因分析與解決方案說明報(bào)告
- 雨水管道中粗砂回填
- 團(tuán)意操作流程詳解課件
- SH/T 0356-1996燃料油
- 第1課中華優(yōu)秀傳統(tǒng)文化的內(nèi)涵與特點(diǎn)課件(共28張PPT)
- 耳鼻咽喉頭頸外科學(xué)-鼻科癥狀學(xué)課件
- 輪胎使用日常說明
- 第8章 動(dòng)車組空調(diào)裝置檢修動(dòng)車組維護(hù)與檢修
- 《幼小銜接存在的問題及對(duì)策研究(論文)6400字》
- 英語(yǔ)詞匯量測(cè)試附答案
- 七年級(jí)上冊(cè)整式的化簡(jiǎn)求值專題訓(xùn)練26914
- 通信工程監(jiān)理方案
評(píng)論
0/150
提交評(píng)論