統(tǒng)計(jì)學(xué) 第2章 統(tǒng)計(jì)數(shù)據(jù)的描述_第1頁(yè)
統(tǒng)計(jì)學(xué) 第2章 統(tǒng)計(jì)數(shù)據(jù)的描述_第2頁(yè)
統(tǒng)計(jì)學(xué) 第2章 統(tǒng)計(jì)數(shù)據(jù)的描述_第3頁(yè)
統(tǒng)計(jì)學(xué) 第2章 統(tǒng)計(jì)數(shù)據(jù)的描述_第4頁(yè)
統(tǒng)計(jì)學(xué) 第2章 統(tǒng)計(jì)數(shù)據(jù)的描述_第5頁(yè)
已閱讀5頁(yè),還剩137頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第2章

統(tǒng)計(jì)數(shù)據(jù)的描述第2章統(tǒng)計(jì)數(shù)據(jù)的描述2.1統(tǒng)計(jì)數(shù)據(jù)的整理2.2分布集中趨勢(shì)的測(cè)度2.3分布離散程度的測(cè)度2.4分布偏態(tài)與峰度的測(cè)度2.5統(tǒng)計(jì)表與統(tǒng)計(jì)圖本章小結(jié)一、統(tǒng)計(jì)數(shù)據(jù)的預(yù)處理(補(bǔ)充)二、統(tǒng)計(jì)數(shù)據(jù)的分組

三、次數(shù)分配四、次數(shù)分配直方圖五、洛倫茨曲線與基尼系數(shù)2.1統(tǒng)計(jì)數(shù)據(jù)的整理一、數(shù)據(jù)的預(yù)處理數(shù)據(jù)的審核:從數(shù)據(jù)的完整性、準(zhǔn)確性、適用性、時(shí)效性幾個(gè)方面發(fā)現(xiàn)數(shù)據(jù)的錯(cuò)誤數(shù)據(jù)的篩選:找出符合條件的數(shù)據(jù),對(duì)于錯(cuò)誤的或不符合條件的數(shù)據(jù)予以剔除1、數(shù)據(jù)的審核與篩選2、數(shù)據(jù)的排序補(bǔ)充數(shù)據(jù)的審核(原始數(shù)據(jù))完整性審核檢查應(yīng)調(diào)查的單位或個(gè)體是否有遺漏所有的調(diào)查項(xiàng)目或指標(biāo)是否填寫齊全準(zhǔn)確性審核檢查數(shù)據(jù)是否真實(shí)反映客觀實(shí)際情況,內(nèi)容是否符合實(shí)際檢查數(shù)據(jù)是否有錯(cuò)誤,計(jì)算是否正確等數(shù)據(jù)的審核(第二手?jǐn)?shù)據(jù))適用性審核弄清楚數(shù)據(jù)的來(lái)源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定這些數(shù)據(jù)是否符合自己分析研究的需要時(shí)效性審核應(yīng)盡可能使用最新的統(tǒng)計(jì)數(shù)據(jù)數(shù)據(jù)的篩選數(shù)據(jù)篩選的內(nèi)容包括:將某些不符合要求的數(shù)據(jù)或有明顯錯(cuò)誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來(lái),而不符合特定條件的數(shù)據(jù)予以剔出數(shù)據(jù)的排序

按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢(shì),找到解決問(wèn)題的線索,排序還有助于對(duì)數(shù)據(jù)檢查糾錯(cuò),以及為重新歸類或分組等提供依據(jù)

在Excel中,利用升序或降序圖表就可以簡(jiǎn)單對(duì)列數(shù)據(jù)進(jìn)行排序二、統(tǒng)計(jì)數(shù)據(jù)的分組品質(zhì)標(biāo)志和數(shù)量標(biāo)志

標(biāo)志按其性質(zhì)可以分為品質(zhì)標(biāo)志和數(shù)量標(biāo)志品質(zhì)標(biāo)志是表明總體單位的質(zhì)的特征的名稱。例如,工人的性別、民族、文化程度、工種等這一類標(biāo)志,不能用數(shù)量而只能以性質(zhì)屬性上的差別即文字來(lái)表示,稱為品質(zhì)標(biāo)志。數(shù)量標(biāo)志是表明總體單位的量的特征的名稱。例如,工人的年齡、工齡、工資,工業(yè)企業(yè)的工人數(shù)、產(chǎn)量、產(chǎn)值、固定資產(chǎn)等等,只能以數(shù)量的多少來(lái)表示,稱為數(shù)量標(biāo)志。

在數(shù)據(jù)整理中,主要方法是對(duì)品質(zhì)數(shù)據(jù)(定類數(shù)據(jù)、定序數(shù)據(jù))做分類整理;定類數(shù)據(jù)表現(xiàn)為類別,分類的標(biāo)準(zhǔn)稱為定類尺度,定類數(shù)據(jù)不區(qū)分順序。如金融、紡織等行業(yè)分類。定序數(shù)據(jù)表現(xiàn)為類別,分類的標(biāo)準(zhǔn)稱為定序尺度,定序數(shù)據(jù)有等級(jí)差異或順序差異。如優(yōu)秀、良好、中等、及格、不及格。對(duì)數(shù)量數(shù)據(jù)則做分組整理定距尺度:是對(duì)現(xiàn)象類別或現(xiàn)象之間的間距進(jìn)行測(cè)度,也稱間隔數(shù)據(jù)。無(wú)零點(diǎn),如溫度,衣服尺寸。定比尺度:對(duì)現(xiàn)象進(jìn)行觀測(cè)計(jì)數(shù)或計(jì)算。具有加減乘除功能。(一)定類數(shù)據(jù)的整理定類數(shù)據(jù)整理方法1)列出各類別2)計(jì)算各類別的頻數(shù)(頻率)3)制作頻數(shù)(頻率)分布表4)用圖形顯示數(shù)據(jù)定類數(shù)據(jù)整理中一般采用的可計(jì)算的指標(biāo):頻數(shù):落在各類別中的數(shù)據(jù)個(gè)數(shù)百分比(頻率):某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值比率:不同類別數(shù)值的比值定類數(shù)據(jù)整理—頻數(shù)分布表(實(shí)例)【例】為研究廣告市場(chǎng)的狀況,一家廣告公司在某城市隨機(jī)抽取200人就廣告問(wèn)題做了郵寄問(wèn)卷調(diào)查,其中的一個(gè)問(wèn)題是“您比較關(guān)心下列哪一類廣告?”

1.商品廣告;2.服務(wù)廣告;3.金融廣告;4.房地產(chǎn)廣告;5.招生招聘廣告;6.其他廣告。表某城市居民關(guān)注廣告類型的頻數(shù)分布

廣告類型人數(shù)(人)頻率(%)

商品廣告服務(wù)廣告金融廣告房地產(chǎn)廣告招生招聘廣告其他廣告1125191610256.025.54.58.05.01.0合計(jì)200100整理后得的定類數(shù)據(jù)的顯示常見方法柱形圖(條形圖)是用矩形的高度來(lái)表示各類別數(shù)據(jù)的頻數(shù)或頻率。繪制時(shí),各類別放在橫軸,稱為柱形圖,也可以放在縱軸,稱為條形圖人數(shù)(人)5191610211204080120

商品廣告

服務(wù)廣告

金融廣告

房地產(chǎn)廣告

招生招聘廣告

其他廣告廣告類型

圓形圖主要用于表示總體中各組成部分所占的比例,對(duì)于研究結(jié)構(gòu)性問(wèn)題十分有用。在繪制圓形圖時(shí),總體中各部分所占的百分比用園內(nèi)的各個(gè)扇形面積表示。

其他廣告1.0%

房地產(chǎn)廣告8.0%

商品廣告56.0%

金融廣告4.5%

服務(wù)廣告25.5%

招生招聘廣告5.8%圖某城市居民關(guān)注不同類型廣告的人數(shù)構(gòu)成(二)定序數(shù)據(jù)的整理定序數(shù)據(jù)中可計(jì)算的指標(biāo):累計(jì)頻數(shù):將各類別的頻數(shù)逐級(jí)累加(由小到大向上累加和由大到小向下累加)累計(jì)頻率:將各類別的頻率(百分比)逐級(jí)累加定序數(shù)據(jù)整理方法1)列出各類別2)計(jì)算各類別的頻數(shù)(頻率、累計(jì)頻數(shù)、累計(jì)頻率)3)制作頻數(shù)(頻率、累計(jì)頻率、累計(jì)頻數(shù))分布表4)用圖形顯示數(shù)據(jù)定序數(shù)據(jù)頻數(shù)分布表(實(shí)例)【例】在一項(xiàng)城市住房問(wèn)題的研究中,研究人員在甲乙兩個(gè)城市各抽樣調(diào)查300戶,其中的一個(gè)問(wèn)題是:“您對(duì)您家庭目前的住房狀況是否滿意?

1.非常不滿意;2.不滿意;3.一般;4.滿意;5.非常滿意。

表甲城市家庭對(duì)住房狀況評(píng)價(jià)的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)向下累積

向上累積

戶數(shù)(戶)百分比(%)戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510241322252703008.044.075.090.0100.03002761687530100.092562510合計(jì)300100.0————定序數(shù)據(jù)的顯示—累計(jì)頻數(shù)分布圖

(由Excel繪制的累計(jì)頻數(shù)分布圖)243001322252700100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(a)向下累積27616830300750100200300400

非常不滿意

不滿意

一般

滿意

非常滿意累積戶數(shù)(戶)(b)向上累積圖甲城市家庭對(duì)住房狀況評(píng)價(jià)的累積頻數(shù)分布定類、定序數(shù)據(jù)的圖示—環(huán)形圖環(huán)形圖可以同時(shí)繪制多個(gè)總體的數(shù)據(jù)系列,從而可用于進(jìn)行比較研究

8%36%31%15%7%33%26%21%13%10%

非常不滿意

不滿意

一般

滿意

非常滿意

圖3-4甲乙兩城市家庭對(duì)住房狀況的評(píng)價(jià)

為評(píng)價(jià)家電行業(yè)售后服務(wù)的質(zhì)量,隨機(jī)抽取了由100家庭構(gòu)成的一個(gè)樣本。服務(wù)質(zhì)量的等級(jí)分別表示為:A.好;B.較好;C.一般;D.差;E.較差。調(diào)查結(jié)果如下表:(1)指出下面的數(shù)據(jù)屬于什么類型;(2)制作一張頻數(shù)分布表;(3)

繪制一張條形圖,反映評(píng)價(jià)等級(jí)的分布。BECCADCBAEDACBCDECEEADBCCAEDCBBACDEABDDCCBCEDBCCBCDACBCDECEBBECCADCBAEBACDEABDDCADBCCAEDCBCBCEDBCCBC練習(xí)(1)屬于定序數(shù)據(jù)。(2)頻數(shù)分布表如下:服務(wù)質(zhì)量等級(jí)評(píng)價(jià)的頻數(shù)分布(3)條形圖(略)服務(wù)質(zhì)量等級(jí)家庭數(shù)(頻數(shù))頻率%A1414B2121C3232D1818E1515合計(jì)100100(三)組距分組

組距分組是指根據(jù)研究的任務(wù)和對(duì)象的特點(diǎn),按照一定的分組標(biāo)志將總體分為若干組成部分的工作。

具體含義:1、對(duì)總體而言是“分”即將總體分為性質(zhì)相異的若干部分2、對(duì)個(gè)體而言是“合”,將在某些方面性質(zhì)相同的個(gè)體組合起來(lái)組距分組要點(diǎn)將變量值的一個(gè)區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組~~~~~幻燈片11組距分組中基本概念1.下限(lowlimit)

:一個(gè)組的最小值2.上限(upperlimit)

:一個(gè)組的最大值3.重復(fù)組限、不重復(fù)組限4.開口組、封口組5.組距(classwidth)

:上限與下限之差6.組中值(classmidpoint)

:下限與上限之間的中點(diǎn)值(開口組和封口組分別計(jì)算)下限值+上限值2組中值=組距分組

(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的確定組距:組距(classwidth)是一個(gè)組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來(lái)確定,即

組距=(最大值-最小值)÷組數(shù)統(tǒng)計(jì)出各組的頻數(shù)并整理成頻數(shù)分布表等距分組表(上下組限重疊)表某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合計(jì)50100“上組限不在內(nèi)原則”等距分組表(上下組限間斷)表某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)105~109110~114115~119120~124125~129130~134135~139358141064610162820128合計(jì)50100等距分組表(使用開口組)表某車間50名工人日加工零件數(shù)分組表按零件數(shù)分組頻數(shù)(人)頻率(%)110以下110~114115~119120~124125~129130~134135以上358141064610162820128合計(jì)50100使用了開口組,無(wú)上限情形等距分組與異距分組的比較等距分組:適用于標(biāo)志變異比較均勻的現(xiàn)象;可直接根據(jù)絕對(duì)頻數(shù)來(lái)觀察頻數(shù)分布的特征和規(guī)律異距分組:適用于分布存在著明顯偏斜狀況;各組絕對(duì)頻數(shù)的多少不能反映頻數(shù)分布的實(shí)際狀況,需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實(shí)際狀況

某行業(yè)管理局所屬40個(gè)企業(yè)2002年的產(chǎn)品銷售收入數(shù)據(jù)如下(單位:萬(wàn)元):

1521241291161001039295127104105119114115871031181421351251171081051101071371201361171089788123115119138112146113126(1)根據(jù)上面的數(shù)據(jù)進(jìn)行適當(dāng)?shù)姆纸M,編制頻數(shù)分布表,并計(jì)算出累積頻數(shù)和累積頻率;(2)如果按規(guī)定:銷售收入在125萬(wàn)元以上為先進(jìn)企業(yè),115萬(wàn)~125萬(wàn)元為良好企業(yè),105萬(wàn)~115萬(wàn)元為一般企業(yè),105萬(wàn)元以下為落后企業(yè),按先進(jìn)企業(yè)、良好企業(yè)、一般企業(yè)、落后企業(yè)進(jìn)行分組。練習(xí)(1)頻數(shù)分布表如下:40個(gè)企業(yè)按產(chǎn)品銷售收入分組表按銷售收入分組(萬(wàn)元)企業(yè)數(shù)(個(gè))頻率(%)向上累積向下累積企業(yè)數(shù)頻率企業(yè)數(shù)頻率100以下100~110110~120120~130130~140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合計(jì)40100.0————(2)某管理局下屬40個(gè)企分組表按銷售收入分組(萬(wàn)元)企業(yè)數(shù)(個(gè))頻率(%)先進(jìn)企業(yè)良好企業(yè)一般企業(yè)落后企業(yè)11119927.527.522.522.5合計(jì)40100.0三、次數(shù)分配(頻數(shù)分布)【例】某車間30名工人每周加工某種零件件數(shù)如右表,試對(duì)數(shù)據(jù)進(jìn)行分組。

次數(shù)分配表(頻數(shù)分布表)四、次數(shù)分配直方圖

(histogram)用矩形的寬度和高度來(lái)表示頻數(shù)分布的圖形,實(shí)際上是用矩形的面積來(lái)表示各組的頻數(shù)分布在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個(gè)矩形,即直方圖直方圖下的總面積等于1Excel分組數(shù)據(jù)的圖示

(直方圖的繪制)某車間工人周加工零件直方圖

我一眼就看出來(lái)了,周加工零件在100~110之間的人數(shù)最多!折線圖

(frequencypolygon)折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(diǎn)(組中值)用直線連接起來(lái),再把原來(lái)的直方圖抹掉折線圖的兩個(gè)終點(diǎn)要與橫軸相交,具體的做法是第一個(gè)矩形的頂部中點(diǎn)通過(guò)豎邊中點(diǎn)(即該組頻數(shù)一半的位置)連接到橫軸,最后一個(gè)矩形頂部中點(diǎn)與其豎邊中點(diǎn)連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的分組數(shù)據(jù)的圖示

(折線圖的繪制)某車間工人周加工零件折線圖

折線圖與直方圖下的面積相等!當(dāng)觀察的次數(shù)越多,組距越小,拆線就越光滑,逐漸形成一條光滑的次數(shù)分布曲線次數(shù)(頻數(shù))分配的類型對(duì)稱分布右偏分布左偏分布正J型分布反J型分布U型分布幾種常見的頻數(shù)分布下面是北方某城市1~2月份各天氣溫的記錄數(shù)據(jù):指出下表的數(shù)據(jù)屬于什么類型;對(duì)下表的數(shù)據(jù)進(jìn)行適當(dāng)?shù)姆纸M;繪制直方圖和拆線圖,說(shuō)明該城市氣溫分布的特點(diǎn)。-32-4-7-11-1789-6-7-14-18-15-9-6-105-4-9-3-6-8-12-16-19-15-22-25-24-19-21-8-6-15-11-12-19-25-24-18-17-24-14-22-13-9-60-15-4-9-3-32-4-4-16-175-6-5練習(xí)(1)屬于數(shù)值型數(shù)據(jù)(2)分組結(jié)果如右:(3)直方圖分組天數(shù)(天)-25~-206-20~-158-15~-1010-10~-513-5~0120~545~107合計(jì)60五、洛倫茨曲線與基尼系數(shù)洛倫茨曲線20世紀(jì)初美國(guó)經(jīng)濟(jì)學(xué)家、統(tǒng)計(jì)學(xué)家洛倫茨(M.E.Lorentz)根據(jù)意大利經(jīng)濟(jì)學(xué)家帕累托(V.Pareto)提出的“二八原理”和收入分配公式繪制而成的描述收入和財(cái)富分配性質(zhì)的曲線用以分析一個(gè)國(guó)家或地區(qū)分配的平均程度AB累積的人口百分比累積的收入百分比絕對(duì)公平線基尼系數(shù)20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼(G.Gini)根據(jù)洛倫茨曲線給出了衡量收入分配平均程度的指標(biāo)

A表示實(shí)際收入曲線與絕對(duì)平均線之間的面積B表示實(shí)際收入曲線與絕對(duì)不平均線之間的面積如果A=0,則基尼系數(shù)=0,表示收入絕對(duì)平均如果B=0,則基尼系數(shù)=1,表示收入絕對(duì)不平均基尼系數(shù)在0和1之間取值一般認(rèn)為,基尼系數(shù)若小于0.2,表明分配平均;基尼系數(shù)在0.2至0.4之間是比較適當(dāng)?shù)?,即一個(gè)社會(huì)既有效率又沒(méi)有造成極大的分配不公;基尼系數(shù)在0.4被認(rèn)為是收入分配不公平的警戒線,超過(guò)了0.4應(yīng)該采取措施縮小這一差距。AB累積的人口百分比

累積的收入百分比絕對(duì)平均線一、眾數(shù)二、中位數(shù)三、分位數(shù)四、均值五、幾何平均數(shù)六、切尾均值七、眾數(shù)、中位數(shù)和均值的關(guān)系2.2分布集中趨勢(shì)的測(cè)度一、眾數(shù)

(mode)眾數(shù)是由英國(guó)統(tǒng)計(jì)學(xué)家皮爾遜首先提出來(lái)的。將數(shù)據(jù)按大小順序排隊(duì)形成次數(shù)分配后,在統(tǒng)計(jì)分布中具有明顯集中趨勢(shì)點(diǎn)的數(shù)值。一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時(shí)使用不受極端值的影響一組數(shù)據(jù)可能沒(méi)有眾數(shù)或有幾個(gè)眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)是一種位置代表值,應(yīng)用場(chǎng)合比較有限眾數(shù)

(不惟一性)無(wú)眾數(shù)

原始數(shù)據(jù):10591268一個(gè)眾數(shù)

原始數(shù)據(jù):65

9855多于一個(gè)眾數(shù)

原始數(shù)據(jù):252828

364242例如:某制鞋廠要了解消費(fèi)者最需要哪種型號(hào)的男皮鞋,調(diào)查了某百貨商場(chǎng)某季度男皮鞋的銷售情況,得到資料如下表(某商場(chǎng)某季度男皮鞋銷售情況):請(qǐng)問(wèn)眾數(shù)是多少?男皮鞋號(hào)碼/厘米銷售量/雙24.01224.58425.011825.554126.032026.510427.052合計(jì)1200眾數(shù)是一種位置平均數(shù),是總體中出現(xiàn)次數(shù)最多的變量值,因而在實(shí)際工作中有時(shí)有它特殊的用途。如:要說(shuō)明一個(gè)企業(yè)中工人最普遍的技術(shù)等級(jí),說(shuō)明消費(fèi)者需要的內(nèi)衣、鞋襪、帽子等最普遍的號(hào)碼,說(shuō)明農(nóng)貿(mào)市場(chǎng)上某種農(nóng)副產(chǎn)品最普遍的成交價(jià)格等,都需要利用眾數(shù)。但是必須注意,從分布的角度看,眾數(shù)是具有明顯集中趨勢(shì)點(diǎn)的數(shù)值,只有在總體單位比較多,而且又明顯地集中于某個(gè)變量值時(shí),計(jì)算眾數(shù)才有意義。分組數(shù)據(jù)眾數(shù)計(jì)算首先確定眾數(shù)所在組,即出現(xiàn)頻數(shù)最高的組眾數(shù)通常用下面的近似公式:例:依據(jù)課本第18頁(yè)表2.7按公式計(jì)算得5-50眾數(shù)練習(xí):公司職工按月工資分組月工資職工人數(shù)(人)500以下208500-600314600-700382700-800456800-900305900-10002371000-1100781100以上20合計(jì)2000

眾數(shù)最不受極端變量值的影響。

二、中位數(shù)(median)

排序后處于中間位置上的值Me50%50%不受極端值的影響,稱中位數(shù)具有穩(wěn)健性主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)如果數(shù)據(jù)中某一數(shù)值大量重復(fù)時(shí),中位數(shù)不一定準(zhǔn)確各變量值與中位數(shù)的離差絕對(duì)值之和最小,即

數(shù)值型數(shù)據(jù)的中位數(shù)

(9個(gè)數(shù)據(jù)的算例)【例】

9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:7507808509601080

1250150016302000位置:1234

56789中位數(shù)1080數(shù)值型數(shù)據(jù)的中位數(shù)

(10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排序:

660

75078085096010801250150016302000位置:1234

5678910分組數(shù)據(jù)中位數(shù)計(jì)算首先確定中位數(shù)所在組:看第N/2個(gè)數(shù)所在組即為中位數(shù)所在組(需要計(jì)算累積頻數(shù))對(duì)已分組的數(shù)據(jù)中位數(shù)計(jì)算公式(前提條件是假設(shè)各組數(shù)據(jù)在組中均勻分布)其中:N/2為中位數(shù)所在位置;L表示中位數(shù)所在組的下組限;分別表示中位數(shù)所在組以前(后)各組的累計(jì)次數(shù);表示中位數(shù)所在組的次數(shù);i表示中位數(shù)所在組的組距。中位數(shù)的性質(zhì)中位數(shù)具有穩(wěn)健性,個(gè)別極端大或極端小的值的變化不影響中位數(shù)數(shù)值。數(shù)據(jù)值與中位數(shù)之差的絕對(duì)值之和最小。即中位數(shù)和數(shù)據(jù)值的距離最短。即:5-56中位數(shù)練習(xí):某公司職工按月工資分組月工資職工人數(shù)(人)向上累計(jì)次數(shù)(人)500以下208208500-600314522600-700382904

700-8004561360800-9003051665900-100023719021000-11007819801100以上202000合計(jì)2000—三、分位數(shù)分位數(shù)根據(jù)其將數(shù)列等分的形式不同可以分為中位數(shù),四分位數(shù),十分位數(shù)、百分位數(shù)等等。與中位數(shù)性質(zhì)相似四分位數(shù)將數(shù)據(jù)分布4等分十分位數(shù)將數(shù)據(jù)分布10等分百分位數(shù)將數(shù)據(jù)分布100等分四分位數(shù)作為分位數(shù)的一種形式,在統(tǒng)計(jì)中有著十分重要的意義和作用。

四分位數(shù)

(quartile)排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%Q3Q1Q2人們經(jīng)常會(huì)將數(shù)據(jù)劃分為4個(gè)部分,每一個(gè)部分大約包含有1/4即25%的數(shù)據(jù)項(xiàng)。這種劃分的臨界點(diǎn)即為四分位數(shù)。它們定義如下:Q1=第1四分位數(shù),即第25百分位數(shù);Q2=第2四分位數(shù),即第50百分位數(shù);Q3=第3四分位數(shù),即第75百分位數(shù)四分位數(shù)

(位置的確定)原始數(shù)據(jù):分組數(shù)據(jù):數(shù)值型數(shù)據(jù)的四分位數(shù)(9個(gè)數(shù)據(jù)的算例)【例】:9個(gè)家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):

15007507801080850960200012501630排序:

75078085096010801250150016302000位置:123456789數(shù)值型數(shù)據(jù)的四分位數(shù)

(10個(gè)數(shù)據(jù)的算例)【例】:10個(gè)家庭的人均月收入數(shù)據(jù)排序:

660

75078085096010801250150016302000位置:1234

5678910練習(xí):某車間某月份的工人生產(chǎn)某產(chǎn)品的數(shù)量分別為13、13.5、13.8、13.9、14、14.6、14.8、15、15.2、15.4公斤,則三個(gè)四分位數(shù)的位置分別為多少?Q1的位置Q2的位置Q3的位置即變量數(shù)列中的第2.75項(xiàng)、第5.5項(xiàng)、第8.25項(xiàng)工人的某種產(chǎn)品產(chǎn)量分別為下四分位數(shù)、中位數(shù)和上四分位數(shù)。Q1=0.25×第二項(xiàng)+0.75×第三項(xiàng)=0.25×13.5+0.75×13.8=13.73(公斤)Q2=0.5×第五項(xiàng)+0.5×第六項(xiàng)=0.5×14+0.5×14.6=14.3(公斤)Q3=0.75×第八項(xiàng)+0.25×第九項(xiàng)=0.75×15+0.25×15.2=15.05(公斤)在實(shí)際資料中,由于標(biāo)志值序列中的相鄰標(biāo)志值往往是相同的,因而不一定要通過(guò)計(jì)算才能得到有關(guān)的四分位數(shù)。對(duì)已分組的組距式數(shù)列四分位數(shù)計(jì)算向上或向下累計(jì)次數(shù);根據(jù)累計(jì)次數(shù)確定四分位數(shù)的位置:Q1的位置=(∑f+1)/4,Q2的位置=2(∑f+1)/4,Q3的位置=3(∑f+1)/4?!苀表示數(shù)據(jù)資料的總次數(shù);根據(jù)四分位數(shù)的位置計(jì)算各四分位數(shù)(向上累計(jì)次數(shù),按照下限公式計(jì)算四分位數(shù)):其中:表示第i個(gè)四分位數(shù),i=1,2,3;N表示總次數(shù),L表示四分位數(shù)所在組的下組限;表示四分位數(shù)所在組以下各組的累計(jì)次數(shù);表示四分位數(shù)所在組的次數(shù);di表示四分位數(shù)所在組的組距。分組數(shù)列分位數(shù)計(jì)算推廣向上或向下累計(jì)次數(shù);根據(jù)累計(jì)次數(shù)確定分位數(shù)的位置:p(∑f+1)/M,∑f表示數(shù)據(jù)資料的總次數(shù);p為第幾個(gè)分位數(shù),M為多少分位數(shù),十分位數(shù)即M=10根據(jù)分位數(shù)的位置計(jì)算各分位數(shù)(向上累計(jì)次數(shù),按照下限公式計(jì)算四分位數(shù)):其中:表示第p個(gè)分位數(shù),p=1,2,3;N表示總次數(shù),同∑f,L表示分位數(shù)所在組的下組限;表示分位數(shù)所在組以下各組的累計(jì)次數(shù);表示分位數(shù)所在組的次數(shù);di表示分位數(shù)所在組的組距。四、均值(算術(shù)平均數(shù))

(mean)集中趨勢(shì)的最常用測(cè)度值一組數(shù)據(jù)的均衡點(diǎn)所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)簡(jiǎn)單算術(shù)均值

(simplemean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn總體均值樣本均值加權(quán)均值

(weightedmean)設(shè)一組數(shù)據(jù)為:x1,x2,…,xn相應(yīng)的頻數(shù)為:

f1,f2,…,fk樣本均值總體均值分組數(shù)據(jù)加權(quán)均值

(例題分析:已分組并形成次數(shù)分配的數(shù)據(jù))

工人日產(chǎn)量(件)工人人數(shù)(人)工人人數(shù)比重(%)1011121314701003801501008.7512.5047.5018.7512.50合計(jì)800100.00分組數(shù)據(jù)加權(quán)均值

(例題分析:已分組并只知道頻率的數(shù)據(jù))加權(quán)均值(權(quán)數(shù)對(duì)均值的影響)X甲0×1+20×1+100×8n10i=1Xi82(分)X乙0×8+20×1+100×1n10i=1Xi

12(分)甲乙兩組各有10名學(xué)生,考試成績(jī)及其分布數(shù)據(jù)如下

甲組:

考試成績(jī)(X): 020100

人數(shù)分布(F):118

乙組:考試成績(jī)(X): 020100

人數(shù)分布(F):811均值

(數(shù)學(xué)性質(zhì))1. 各變量值與均值的離差之和等于零2.各變量值與均值的離差平方和最小

常作為加權(quán)算術(shù)平均數(shù)的變形公式使用。仍是總體的標(biāo)志總量與總體單位總量的對(duì)比,僅僅是因?yàn)橘Y料的不同,需要將算術(shù)平均數(shù)變形。

某供銷社分三批收購(gòu)某種農(nóng)副產(chǎn)品,其收購(gòu)單價(jià)及各批收購(gòu)額如下:批次單價(jià)(元)收購(gòu)額12.40600022.251200032.152150合計(jì)~20150調(diào)和平均數(shù)(倒數(shù)平均數(shù))工人日產(chǎn)量(件)

x工人日總產(chǎn)量(件)

xf10111213147001100456019501400合計(jì)9710調(diào)和平均數(shù)練習(xí)五、幾何平均數(shù)

(geometricmean)

n個(gè)變量值乘積的

n次方根適用于對(duì)比率數(shù)據(jù)的平均主要用于計(jì)算平均增長(zhǎng)率如:平均利率、平均發(fā)展速度、平均合格率等

計(jì)算公式為5.可看作是均值的一種變形例1

某流水生產(chǎn)線有前后銜接的五道工序。某日各工序產(chǎn)品的不合格率分別為5%、8%、10%、15%、20%,整個(gè)流水線產(chǎn)品合格率?例2

某金融機(jī)構(gòu)以復(fù)利方式計(jì)息。近12年來(lái)的年利率有4年為3%、2年為5%,2年為8%、3年為10%、1年為15%。則12年的平均年利率?

平均年利率=106.82%-1=6.82%幾何平均數(shù)的特點(diǎn)幾何平均數(shù)受極端值的影響較算術(shù)平均數(shù)小。如果變量值有負(fù)值,計(jì)算出的幾何平均數(shù)就會(huì)成為負(fù)數(shù)或虛數(shù)。它僅適用于具有等比或近似等比關(guān)系的數(shù)據(jù)。變量數(shù)列中任何一個(gè)變量值不能為0,一個(gè)為0,則幾何平均數(shù)為0。用環(huán)比指數(shù)計(jì)算的幾何平均易受最初水平和最末水平的影響。幾何平均法主要用于動(dòng)態(tài)平均數(shù)的計(jì)算。平均發(fā)展水平又稱“序時(shí)平均數(shù)”、“動(dòng)態(tài)平均數(shù)”,是時(shí)間序列中各項(xiàng)發(fā)展水平的平均數(shù),反映現(xiàn)象在一段時(shí)期中發(fā)展的一般水平。六、切尾均值

(trimmedMean)

去掉大小兩端的若干數(shù)值后計(jì)算中間數(shù)據(jù)的均值,是綜合了均值與中位數(shù)優(yōu)點(diǎn)的一種較理想的統(tǒng)計(jì)量

在電視大獎(jiǎng)賽、體育比賽及需要人們進(jìn)行綜合評(píng)價(jià)的比賽項(xiàng)目中已得到廣泛應(yīng)用計(jì)算公式為n

表示觀察值的個(gè)數(shù);α表示切尾系數(shù),

切尾均值(例題分析)【例】謀次比賽共有11名評(píng)委,對(duì)某位歌手的給分分別是:經(jīng)整理得到順序統(tǒng)計(jì)量值為去掉一個(gè)最高分和一個(gè)最低分,取切尾系數(shù)α=1/11七、眾數(shù)、中位數(shù)和均值的關(guān)系對(duì)稱分布

均值=中位數(shù)=眾數(shù)==右偏分布眾數(shù)

中位數(shù)

均值左偏分布均值

中位數(shù)

眾數(shù)偏態(tài)眾數(shù)、中位數(shù)、均值的特點(diǎn)和應(yīng)用眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時(shí)應(yīng)用均值易受極端值影響數(shù)學(xué)性質(zhì)優(yōu)良數(shù)據(jù)對(duì)稱分布或接近對(duì)稱分布時(shí)應(yīng)用眾數(shù)最易計(jì)算,但可能不存在,應(yīng)用較少中位數(shù)直觀,不受極端值影響,但不能充分利用數(shù)據(jù)信息均值在整個(gè)統(tǒng)計(jì)方法中應(yīng)用最為廣泛某百貨公司6月份各天的銷售額數(shù)據(jù)如下(單位:萬(wàn)元),計(jì)算該百貨公司日銷售額的均值、中位數(shù)和四分位數(shù)。257276297252238310240236265278271292261281301274267280291258272284268303273263322249269295=274.1(萬(wàn)元);Me=272.5;QL=260.25;QU=291.25。綜合練習(xí)2.3分布離散程度的測(cè)度一、極差二、內(nèi)距三、方差和標(biāo)準(zhǔn)差四、離散系數(shù)一、極差

(range)一組數(shù)據(jù)的最大值與最小值之差離散程度的最簡(jiǎn)單測(cè)度值易受極端值影響未考慮數(shù)據(jù)的分布7891078910R

=max(xi)-min(xi)計(jì)算公式為二、內(nèi)距

(Inter-QuartileRange,IQR)

1.也稱四分位差2.上四分位數(shù)與下四分位數(shù)之差

內(nèi)距=Q3

–Q13.反映了中間50%數(shù)據(jù)的離散程度4.不受極端值的影響5.可用于衡量中位數(shù)的代表性Q1Q2Q325%25%25%25%Q4內(nèi)距的優(yōu)缺點(diǎn)其計(jì)算實(shí)質(zhì)是,將總體各單位從小到大排序后,用居于中間50%的數(shù)據(jù)的全距來(lái)反映差異程度優(yōu)點(diǎn):很好地克服了全距易受極端值影響、不能計(jì)算開口組全距這一缺陷;適合衡量中位數(shù)的代表性缺點(diǎn):依然不能反映所有數(shù)據(jù)的變動(dòng)情況數(shù)值型未分組數(shù)據(jù)的四分位差

(算例)Q1=23Q3=30Q.D.=7N+17+1Q1位置=4=4=2Q3位置=3(N+1)43(7+1)4==6原始數(shù)據(jù):

23213032282526排序:2123

2526283032位置:1234567四分位的位置5-91平均差——是各標(biāo)志值對(duì)其算術(shù)平均數(shù)的離差絕對(duì)值的平均數(shù)。三、平均差計(jì)算平均差步驟:第一步,求各標(biāo)志值與算術(shù)平均數(shù)的離差;第二步,求離差的絕對(duì)值;第三步,將離差絕對(duì)值的總和除以項(xiàng)數(shù)(n)或總次數(shù)平均差數(shù)值越小,其平均數(shù)的代表性越大(好)。平均差的計(jì)算舉例表3-3

某車間50名工人日加工零件標(biāo)準(zhǔn)差計(jì)算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)|Xi-X||Xi-X|Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合計(jì)—50—312【例】根據(jù)下表的數(shù)據(jù),計(jì)算工人日加工零件數(shù)的平均差四、方差和標(biāo)準(zhǔn)差

(VarianceandStandarddeviation)1. 方差和標(biāo)準(zhǔn)差是測(cè)度數(shù)據(jù)變異程度的最重要、最常用的指標(biāo)。2. 方差是各個(gè)數(shù)據(jù)與其算術(shù)平均數(shù)的離差平方和的平均數(shù),方差的計(jì)量單位不便于從經(jīng)濟(jì)意義上進(jìn)行解釋,所以實(shí)際統(tǒng)計(jì)工作中多用方差的算術(shù)平方根——標(biāo)準(zhǔn)差來(lái)測(cè)度統(tǒng)計(jì)數(shù)據(jù)的差異程度。標(biāo)準(zhǔn)差又稱均方差。4681012x=8.31.根據(jù)總體數(shù)據(jù)計(jì)算的,稱為總體方差或標(biāo)準(zhǔn)差;根據(jù)樣本數(shù)據(jù)計(jì)算的,稱為樣本方差或標(biāo)準(zhǔn)差

2.方差和標(biāo)準(zhǔn)差的計(jì)算也分為簡(jiǎn)單平均法和加權(quán)平均法,另外,對(duì)于總體數(shù)據(jù)和樣本數(shù)據(jù),公式略有不同。3.優(yōu)點(diǎn)反映了數(shù)據(jù)的分布反映了各變量值與均值的平均差異以均值為中心,提取了全部數(shù)據(jù)中的離差信息,這使得它在反映離散程度方面更為全面; 保證了在說(shuō)明均值代表性方面的良好性質(zhì)。方差的特點(diǎn)總體方差和標(biāo)準(zhǔn)差

(PopulationvarianceandStandarddeviation)組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式未分組數(shù)據(jù):加權(quán)平均數(shù)總體標(biāo)準(zhǔn)差的計(jì)算表某車間50名工人日加工零件標(biāo)準(zhǔn)差計(jì)算表按零件數(shù)分組組中值(Xi)頻數(shù)(Fi)(Xi-X)2(Xi-X)2Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合計(jì)—50—3100.5【例】根據(jù)數(shù)據(jù),計(jì)算工人日加工零件數(shù)的標(biāo)準(zhǔn)差,平均值為123.2。

課堂練習(xí):某廠工人按工資分組的資料,根據(jù)資料計(jì)算該廠工人日工資的標(biāo)準(zhǔn)差。

按日工資額分組各組工人所占比重(%)70元以下1570~80元2580~90元3590~100元15100元以上10

合計(jì)100樣本方差和標(biāo)準(zhǔn)差

(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計(jì)算公式標(biāo)準(zhǔn)差的計(jì)算公式注意:樣本方差用自由度n-1去除!樣本方差、樣本標(biāo)準(zhǔn)差(算例)原始數(shù)據(jù):10 591368樣本方差

自由度(degreeoffreedom)

一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個(gè)數(shù)。當(dāng)樣本數(shù)據(jù)的個(gè)數(shù)為

n

時(shí),若樣本均值x

確定后,只有n-1個(gè)數(shù)據(jù)可以自由取值,其中必有一個(gè)數(shù)據(jù)則不能自由取值。這里,均值就相當(dāng)于一個(gè)限制條件,由于加了這個(gè)限制條件,估計(jì)總體方差的自由度為n-1。例如,樣本有3個(gè)數(shù)值,即x1=2,x2=4,x3=9,則x=5。當(dāng)x

=5確定后,x1,x2和x3有兩個(gè)數(shù)據(jù)可以自由取值,另一個(gè)則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值從實(shí)際應(yīng)用角度看,在抽樣估計(jì)中,用自由度n-1計(jì)算的樣本方差s2去估計(jì)總體方差σ2時(shí),它是σ2的無(wú)偏估計(jì)量五、離散系數(shù)

(coefficientofvariation)

離散系數(shù)又稱“變異系數(shù)”。是用來(lái)說(shuō)明標(biāo)志變異程度的相對(duì)指標(biāo),通常指標(biāo)準(zhǔn)差與平均數(shù)之比,一般以百分?jǐn)?shù)表示。由于全距、平均差、標(biāo)準(zhǔn)差等標(biāo)志變異指標(biāo)都是根據(jù)標(biāo)志值絕對(duì)數(shù)計(jì)算的,其大小不僅取決于標(biāo)志值之間變異的大小,而且與標(biāo)志值平均水平的高低有關(guān)。要比較不同水平的數(shù)列之間的變異程度,就需要計(jì)算反映標(biāo)志變動(dòng)程度的相對(duì)指標(biāo)。離散系數(shù)小,說(shuō)明標(biāo)志變動(dòng)程度小,平均數(shù)代表性好;反之,說(shuō)明標(biāo)志變動(dòng)程度大。離散系數(shù)的公式

(coefficientofvariation)1.標(biāo)準(zhǔn)差與其相應(yīng)的均值之比2.對(duì)數(shù)據(jù)相對(duì)離散程度的測(cè)度3.消除了數(shù)據(jù)水平高低和計(jì)量單位的影響4.用于對(duì)不同組別數(shù)據(jù)離散程度的比較5.計(jì)算公式為總體離散系數(shù)樣本離散系數(shù)離散系數(shù)

(練習(xí))某管理局所屬8家企業(yè)的產(chǎn)品銷售數(shù)據(jù)企業(yè)編號(hào)產(chǎn)品銷售額(萬(wàn)元)x1銷售利潤(rùn)(萬(wàn)元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產(chǎn)品銷售數(shù)據(jù)如表。試比較產(chǎn)品銷售額與銷售利潤(rùn)的離散程度離散系數(shù)

(練習(xí))結(jié)論:計(jì)算結(jié)果表明,v1<v2,說(shuō)明產(chǎn)品銷售額的離散程度小于銷售利潤(rùn)的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.710練習(xí):某班分甲、乙兩個(gè)學(xué)習(xí)小組,在統(tǒng)計(jì)學(xué)考試中,甲小組平均成績(jī)75分,標(biāo)準(zhǔn)差11.5分,乙小組成績(jī)資料如下。

成績(jī)(分)

人數(shù)(人)60分以下260-70570-80880-90690分以上4

合計(jì)25要求(1)計(jì)算乙小組平均成績(jī)。(2)以盡可能精確的方法比較兩小組平均成績(jī)的代表性。(要求:絕對(duì)數(shù)、平均數(shù)和百分?jǐn)?shù)均保留兩位小數(shù))(1)(2)加權(quán)標(biāo)準(zhǔn)差計(jì)算:2.4分布偏態(tài)與峰度的測(cè)度一、偏態(tài)及其測(cè)度二、峰度及其測(cè)度扁平分布尖峰分布偏態(tài)峰度左偏分布右偏分布偏態(tài)與峰度一、偏態(tài)及其測(cè)度偏態(tài)是對(duì)數(shù)據(jù)分布偏斜方向及程度的測(cè)度利用眾數(shù)、中位數(shù)、均值之間的關(guān)系可以判斷偏斜的方向,而偏態(tài)系數(shù)則是測(cè)度分布偏斜程度。常用計(jì)算公式為:偏態(tài)系數(shù)=0為對(duì)稱分布偏態(tài)系數(shù)>0為右(正)偏分布偏態(tài)系數(shù)<0為左(負(fù))偏分布偏態(tài)(實(shí)例)【例】已知1997年我國(guó)農(nóng)村居民家庭按純收入分組的有關(guān)數(shù)據(jù)如表。試計(jì)算偏態(tài)系數(shù)表1997年農(nóng)村居民家庭純收入數(shù)據(jù)按純收入分組(元)戶數(shù)比重(%)500以下500~10001000~15001500~20002000~25002500~30003000~35003500~40004000~45004500~50005000以上2.2812.4520.3519.5214.9310.356.564.132.681.814.94偏態(tài)系數(shù)(計(jì)算過(guò)程)表農(nóng)村居民家庭純收入數(shù)據(jù)偏態(tài)及峰度計(jì)算表純收入分組(百元)組中值Xi戶數(shù)比重(%)Fi(Xi-X)3Fi(Xi-X)4

Fi5以下5—1010—1515—2020—2525—3030—3535—4040—4545—5050以上2.57.512.517.522.527.532.537.542.547.552.52.2812.4520.3519.5214.9310.356.564.132.681.814.94-154.64-336.46-144.87-11.840.1823.1689.02171.43250.72320.741481.812927.154686.511293.5346.520.20140.60985.492755.005282.948361.9846041.33合計(jì)—1001689.2572521.25偏態(tài)系數(shù)(計(jì)算結(jié)果)根據(jù)上表數(shù)據(jù)計(jì)算得將計(jì)算結(jié)果代入公式得結(jié)論:偏態(tài)系數(shù)為正值,而且數(shù)值較大,說(shuō)明農(nóng)村居民家庭純收入的分布為右偏分布,即收入較少的家庭占據(jù)多數(shù),而收入較高的家庭則占少數(shù),而且偏斜的程度較大

二、峰度及其測(cè)度峰度是數(shù)據(jù)分布扁平程度的測(cè)度一般與標(biāo)準(zhǔn)正態(tài)分布比較,若分布的形狀比標(biāo)準(zhǔn)正態(tài)分布更高更瘦,則稱尖峰分布;若更扁平則稱扁平分布。峰度系數(shù)計(jì)算公式:峰度系數(shù)=0扁平程度適中(正態(tài)分布)峰度系數(shù)<0為扁平分布峰度系數(shù)>0為尖峰分布正態(tài)分布是一種概率分布,它的圖像是一條位于x軸上方的鐘形曲線,高峰位于正中央(即均數(shù)所在的位置),分別向左右兩側(cè)逐漸均勻下降,左右對(duì)稱,曲線兩端永遠(yuǎn)不與橫軸相交。正態(tài)分布有兩個(gè)參數(shù),即均數(shù)μ和標(biāo)準(zhǔn)差σ,可記作N(μ,σ2):均數(shù)μ決定正態(tài)曲線的中心位置;標(biāo)準(zhǔn)差σ決定正態(tài)曲線的陡峭或扁平程度。σ越小,曲線越陡峭;σ越大,曲線越扁平。當(dāng)μ=0,σ2

=1時(shí),稱為標(biāo)準(zhǔn)正態(tài)分布,記為N(0,1)。峰度系數(shù)系數(shù)(實(shí)例計(jì)算結(jié)果)代入公式得

【例】根據(jù)表計(jì)算結(jié)果,計(jì)算農(nóng)村居民家庭純收入分布的峰度系數(shù)

結(jié)論:由于0.4>0,說(shuō)明我國(guó)農(nóng)村居民家庭純收入的分布為尖峰分布,右偏,說(shuō)明低收入家庭占有較大的比重

偏態(tài)與峰度(從直方圖上觀察)按純收入分組(元)戶數(shù)比重(%)252015105農(nóng)村居民家庭村收入數(shù)據(jù)的直方圖1000500←15002000250030003500400045005000→結(jié)論:1.為右偏分布

2.峰度適中產(chǎn)品名稱單位成本(元)總成本(元)甲企業(yè)乙企業(yè)ABC152030210030001500325515001500甲企業(yè)平均成本=19.41(元),乙企業(yè)平均成本=18.29(元);原因:盡管兩個(gè)企業(yè)的單位成本相同,但單位成本較低的產(chǎn)品在乙企業(yè)的產(chǎn)量中所占比重較大,因此拉低了總平均成本。練習(xí):甲乙兩個(gè)企業(yè)生產(chǎn)三種產(chǎn)品的單位成本和總成本資料如表:比較哪個(gè)企業(yè)的總平均成本高?并分析其原因。練習(xí)在某地區(qū)抽取的120家企業(yè)按利潤(rùn)額進(jìn)行分組,結(jié)果如表:按利潤(rùn)額分組(萬(wàn)元)企業(yè)數(shù)(個(gè))200~30019300~40030400~50042 500~600 18600以上11合計(jì)120

計(jì)算120家企業(yè)利潤(rùn)額的均值和標(biāo)準(zhǔn)差。(萬(wàn)元)

=426.67(萬(wàn)元);練習(xí)對(duì)10名成年人和10名幼兒的身高(厘米)進(jìn)行抽樣調(diào)查,結(jié)果如表:成年組166169172177180170172174168173幼兒組68696870717372737475(1)要比較成年組和幼兒組的身高差異,你會(huì)采用什么樣的指標(biāo)測(cè)度值?為什么?(2)比較分析哪一組的身高差異大?由于幼兒組身高的離散系數(shù)大于成年組身高的離散系數(shù),說(shuō)明幼兒組身高的離散程度相對(duì)較大。

幼兒組身高的離散系數(shù):(1)離散系數(shù),因?yàn)樗瞬煌M數(shù)據(jù)水平高地的影響。(2)成年組身高的離散系數(shù):一、統(tǒng)計(jì)表二、統(tǒng)計(jì)圖2.5統(tǒng)計(jì)表與統(tǒng)計(jì)圖一、統(tǒng)計(jì)表(統(tǒng)計(jì)表的結(jié)構(gòu))表1997~1998年城鎮(zhèn)居民家庭抽樣調(diào)查資料項(xiàng)目單位1997年1998年

一、調(diào)查戶數(shù)二、平均每戶家庭人口數(shù)三、平均每戶就業(yè)人口數(shù)四、平均每人全部收入五、平均每人實(shí)際支出#消費(fèi)性支出非消費(fèi)性支出六、平均每人居住面積戶人人元元元元平方米378903.191.835188.544945.874185.64755.9411.90390803.161.805458.345322.954331.61987.1712.40資料來(lái)源:《中國(guó)統(tǒng)計(jì)摘要1999》,中國(guó)統(tǒng)計(jì)出版社,1999,第79頁(yè)。注:1.本表為城市和縣城的城鎮(zhèn)居民家庭抽樣調(diào)查材料。

2.消費(fèi)性支出項(xiàng)目包括:食品、衣著、家庭設(shè)備用品及服務(wù)、醫(yī)療保健、交通和通訊、娛樂(lè)教育文化服務(wù)、居住、雜項(xiàng)商品和服務(wù)。行標(biāo)題數(shù)字資料列標(biāo)題附加表頭統(tǒng)計(jì)表的設(shè)計(jì)要合理安排統(tǒng)計(jì)表的結(jié)構(gòu)總標(biāo)題內(nèi)容應(yīng)滿足3W要求數(shù)據(jù)計(jì)量單位相同時(shí),可放在表的右上角標(biāo)明,不同時(shí)應(yīng)放在每個(gè)指標(biāo)后或單列出一列標(biāo)明表中的上下兩條橫線一般用粗線,其他線用細(xì)線通常情況下,統(tǒng)計(jì)表的左右兩邊不封口表中的數(shù)據(jù)一般是右對(duì)齊,有小數(shù)點(diǎn)時(shí)應(yīng)以小數(shù)點(diǎn)對(duì)齊,而且小數(shù)點(diǎn)的位數(shù)應(yīng)統(tǒng)一對(duì)于沒(méi)有數(shù)字的表格單元,一般用“—”表示必要時(shí)可在表的下方加上注釋二、統(tǒng)計(jì)圖數(shù)據(jù)分析中使用最多的統(tǒng)計(jì)圖有:折線圖條形圖圓形圖環(huán)形圖雷達(dá)圖等在Excel的“插入”功能中利用“圖表”功能鍵,可以利用已有數(shù)據(jù)繪出統(tǒng)計(jì)圖形莖葉圖

(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒(méi)有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個(gè)原始數(shù)值,保留了原始數(shù)據(jù)的信息莖葉圖又稱“枝葉圖”,它的思路是將數(shù)組中的數(shù)按位數(shù)進(jìn)行比較,將數(shù)的大小基本不變或變化不大的位作為一個(gè)主干(莖),將變化大的位的數(shù)作為分枝(葉),列在主干的后面,這樣就可以清楚地看到每個(gè)主干后面的幾個(gè)數(shù),每個(gè)數(shù)具體是多少。未分組數(shù)據(jù)—莖葉圖用于顯示未分組的原始數(shù)據(jù)的分布,以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉。樹莖樹葉7880

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論