第2章 統(tǒng)計數(shù)據(jù)的描述_第1頁
第2章 統(tǒng)計數(shù)據(jù)的描述_第2頁
第2章 統(tǒng)計數(shù)據(jù)的描述_第3頁
第2章 統(tǒng)計數(shù)據(jù)的描述_第4頁
第2章 統(tǒng)計數(shù)據(jù)的描述_第5頁
已閱讀5頁,還剩98頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第2章統(tǒng)計數(shù)據(jù)的描述2.1統(tǒng)計數(shù)據(jù)的整理2.2分布集中趨勢的測度2.3分布離散程度的測度2.4分布偏態(tài)與峰度的測度2.5統(tǒng)計表與統(tǒng)計圖學習目標掌握數(shù)值型數(shù)據(jù)的整理與顯示方法掌握分布集中趨勢的測度方法掌握分布離散程度的測度方掌握莖葉圖和箱線圖的制作方法2.1統(tǒng)計數(shù)據(jù)的整理一、統(tǒng)計數(shù)據(jù)的分組

二、次數(shù)分配三、次數(shù)分配直方圖四、洛倫茨曲線(選講)統(tǒng)計數(shù)據(jù)的分組4例如:P16表2.3---2.5統(tǒng)計分組是統(tǒng)計整理的第一步組距分組

(要點)將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組組距分組

(步驟)確定組數(shù):組數(shù)的確定應以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的確定組距:組距(ClassWidth)是一個組的上限與下限之差,可根據(jù)全部數(shù)據(jù)的最大值和最小值及所分的組數(shù)來確定,即

組距=(最大值-最小值)÷組數(shù)統(tǒng)計出各組的頻數(shù)并整理成頻數(shù)分布表組距分組

(幾個概念)1.下限(lowlimit)

:一個組的最小值2.上限(upperlimit)

:一個組的最大值3.組距(classwidth)

:上限與下限之差4.組中值(classmidpoint)

:下限與上限之間的中點值,注意開口組的組中值的計算下限值+上限值2組中值=次數(shù)分配表的編制(例題分析)【例2.1】某車間30名工人每周加工某種零件件數(shù)如下表,試對數(shù)據(jù)進行分組。次數(shù)分配表注:不重不漏、上組限不在內5-10按年齡階段分組

男性

女性嬰兒期0—6歲0—6歲少年兒童7--17歲7--17歲中青年18—59歲18—54歲老年60歲及以上55歲及以上不等組距分組表2.8我國人口年齡階段的分組累積次數(shù)分配表按周加工零件分組人數(shù)向上累積向下累積80--90333090--10071027100--110132320110--1205287120--1302302合計30表2.9累積次數(shù)分配表與課本的區(qū)別次數(shù)分配直方圖用矩形的寬度和高度來表示頻數(shù)分布的圖形。在直角坐標中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應的頻數(shù)就形成了一個矩形,即直方圖分組數(shù)據(jù)的圖示

(直方圖的繪制)某車間工人周加工零件直方圖

5-13折線圖

(frequencypolygon)折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的分組數(shù)據(jù)的圖示

(折線圖的繪制)某車間工人周加工零件折線圖

折線圖與直方圖下方的面積相等詳細分析見P20洛倫茨曲線本世紀初美國經濟學家、統(tǒng)計學家洛倫茨(M.E.Lorentz)根據(jù)意大利經濟學家巴雷特(V.Pareto)提出的收入分配公式繪制成描述收入和財富分配性質的曲線分析該國家或地區(qū)分配的平均程度

AB累積的人口百分比累積的收入百分比絕對公平線基尼系數(shù)20世紀初意大利經濟學家基尼(G.Gini)根據(jù)洛倫茨曲線給出了衡收入分配平均程度的指標

A表示實際收入曲線與絕對平均線之間的面積B表示實際收入曲線與絕對不平均線之間的面積如果A=0,則基尼系數(shù)=0,表示收入絕對平均如果B=0,則基尼系數(shù)=1,表示收入絕對不平均基尼系數(shù)在0和1之間取值一般認為,基尼系數(shù)若小于0.2,表明分配平均;基尼系數(shù)在0.2至0.4之間是比較適當?shù)?,即一個社會既有效率又沒有造成極大的分配不公;基尼系數(shù)在0.4被認為是收入分配不公平的警戒線,超過了0.4應該采取措施縮小這一差距。

AB5-172.2分布集中趨勢的測度一、眾數(shù)二、中位數(shù)三、分位數(shù)四、均值五、幾何平均數(shù)六、切尾均值七、眾數(shù)、中位數(shù)和均值的比較眾數(shù)

(mode)一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值適合于數(shù)據(jù)量較多時使用不受極端值的影響一組數(shù)據(jù)可能沒有眾數(shù)或有幾個眾數(shù)主要用于分類數(shù)據(jù),也可用于順序數(shù)據(jù)和數(shù)值型數(shù)據(jù)(1)分類數(shù)據(jù)的眾數(shù)(例題分析)不同品牌飲料的頻數(shù)分布飲料品牌頻數(shù)比例百分比(%)

可口可樂旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計501100

解:這里的變量為“飲料品牌”,這是個分類變量,不同類型的飲料就是變量值。在所調查的50人中,購買可口可樂的人數(shù)最多,為15人,占總被調查人數(shù)的30%,因此眾數(shù)為“可口可樂”這一品牌,即

Mo=可口可樂解:這里的數(shù)據(jù)為順序數(shù)據(jù)。變量為“回答類別”甲城市中對住房表示不滿意的戶數(shù)最多,為108戶,因此眾數(shù)為“不滿意”這一類別,即

Mo=不滿意甲城市家庭對住房狀況評價的頻數(shù)分布回答類別甲城市戶數(shù)(戶)百分比(%)

非常不滿意

不滿意

一般

滿意

非常滿意24108934530836311510合計300100.0(2)順序數(shù)據(jù)的眾數(shù)(例題分析)(3)數(shù)值型數(shù)據(jù)的眾數(shù)

●無眾數(shù)

原始數(shù)據(jù):10591268

一個眾數(shù)

原始數(shù)據(jù):65

9855

●多于一個眾數(shù)

原始數(shù)據(jù):2528

28

364242ppp分組數(shù)據(jù)的眾數(shù)求解L表示眾數(shù)組下限數(shù)值,U表示示眾數(shù)組上限數(shù)值;?1表示眾數(shù)組次數(shù)與前一組次數(shù)之差;?2表示眾數(shù)組次數(shù)與后一組次數(shù)之差;i表示眾數(shù)組組距。例題,某公司各地區(qū)銷售額如下表所示,試求銷售額數(shù)據(jù)的眾數(shù)銷售額(萬元)地區(qū)個數(shù)500以下143500~10002601000~1500541500~2000132000~250032500~30001合計474第二組出現(xiàn)的次數(shù)最多,所以第二組是眾數(shù)組L=500,U=1000,?1=260-143=117,?2=260-54=206,i=500中位數(shù)

(median)1.排序后處于中間位置上的值Me50%50%不受極端值的影響主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)各變量值與中位數(shù)的離差絕對值之和最小,即數(shù)值型數(shù)據(jù)的中位數(shù)

(9個數(shù)據(jù)的算例)【例】9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:7507808509601080

1250150016302000位置:

1234

56789中位數(shù)

1080

根據(jù)分組數(shù)據(jù)計算中位數(shù)

利用?f/2代替(n+1)/2確定中位數(shù)的位置,再由累積次數(shù)確定中位數(shù)組,然后按比例推算中位數(shù).

me

為中位數(shù);L為中位數(shù)所在數(shù)組下限數(shù)值,U為中位數(shù)所在數(shù)組上限數(shù)值;fm為中位數(shù)所在數(shù)組次數(shù);Sm-1

為中位數(shù)所在數(shù)組以下的向上累積次數(shù);Sm+1

為中位數(shù)所在數(shù)組以上的向下累積次數(shù);?f為次數(shù)的總和

;i表示中位數(shù)所在數(shù)組組距。利用下限公式利用上限公式例題,某公司各地區(qū)銷售額如下表所示,試求銷售額數(shù)據(jù)的中位數(shù)銷售額(萬元)地區(qū)個數(shù)向上累積數(shù)向下累積數(shù)500以下143143474500~10002604033311000~150054457711500~200013470172000~2500347342500~300014741合計474中位數(shù)應當位于?f/2=237的位置,根據(jù)向上累積次數(shù)可知,第237位置居于第二組,其累積次數(shù)為403,包含第237個。L=500,U=1000,fm=260,Sm-1=143,Sm+1=71,?f=474,i=500例題分析:四分位數(shù)

(quartile)1.排序后處于25%和75%位置上的值不受極端值的影響主要用于順序數(shù)據(jù),也可用于數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)QLQMQU25%25%25%25%未分組數(shù)據(jù)計算四分位數(shù)

(位置的確定)原始數(shù)據(jù):注意:當四分位數(shù)的位置不在某一個數(shù)值上時,可根據(jù)四分位數(shù)的位置按比例分攤四分位數(shù)位置兩側數(shù)值的差值數(shù)值型數(shù)據(jù)的四分位數(shù)

(9個數(shù)據(jù)的算例)【例】:9個家庭的人均月收入數(shù)據(jù)原始數(shù)據(jù):15007507801080850960200012501630排序:750780850

9601080125015001630

2000位置:123456789

數(shù)值型數(shù)據(jù)的四分位數(shù)

(10個數(shù)據(jù)的算例)【例】:10個家庭的人均月收入數(shù)據(jù)排序:

660

750780

8509601080125015001630

2000位置:1234

5678910

根據(jù)分組數(shù)據(jù)計算四分位數(shù)

先確定Q1和Q3的位置,并確定Q1和Q3所在數(shù)組,Q1的位置=?f/4,Q3的位置=3?f/4,然后利用下面的公式計算四分位數(shù)的具體數(shù)值.

L1和L3分別為Q1和Q3所在組的下限變量值;fQ1和fQ3分別為Q1和Q3所在組的次數(shù);i1和i3分別為Q1和Q3所在組的組距;Sm1-1和Sm3-1分比為Q1和Q3所在組以前各組的累積次數(shù)例題,某公司各地區(qū)銷售額如下表所示,試求銷售額數(shù)據(jù)的四分位數(shù)銷售額(萬元)地區(qū)個數(shù)向上累積數(shù)向下累積數(shù)0~500143143474500~10002604033311000~150054457711500~200013470172000~2500347342500~300014741合計474解:Q1的位置=?f/4=474/4=118.5,即在0~500這一組,Q3的位置=3?f/4=355.5,即在500~1000這一組;L1=0,L3=500;fQ1=143,fQ3=260;i1=i3=500;Sm1-1=0,Sm3-1=143;均值

(mean)集中趨勢的最常用測度值一組數(shù)據(jù)的均衡點所在體現(xiàn)了數(shù)據(jù)的必然性特征易受極端值的影響用于數(shù)值型數(shù)據(jù),不能用于分類數(shù)據(jù)和順序數(shù)據(jù)5-38簡單平均數(shù)

(simplemean)設一組數(shù)據(jù)為:x1,x2,…,xn總體平均數(shù)樣本平均數(shù)分組數(shù)據(jù)-----加權平均數(shù)

(weightedmean)總體平均數(shù)樣本平均數(shù)k<nXi是次數(shù)分配中變量分組的組中值;fi是各組次數(shù),也稱為權數(shù);加權平均數(shù)

(例題分析)

平均數(shù)

(數(shù)學性質)1. 各變量值與平均數(shù)的離差之和等于零2.各變量值與平均數(shù)的離差平方和最小幾何平均數(shù)

(geometricmean)

n個變量值乘積的

n次方根適用于對比率數(shù)據(jù)的平均主要用于計算平均增長率計算公式為5.可看作是平均數(shù)的一種變形幾何平均數(shù)

(例題分析)【例】一位投資者購持有一種股票,在2000、2001、2002和2003年收益率分別為4.5%、2.1%、25.5%、1.9%。計算該投資者在這四年內的平均收益率算術平均:

幾何平均:注意兩者的區(qū)別切尾均值

(trimmedMean)

去掉大小兩端的若干數(shù)值后計算中間數(shù)據(jù)的均值在電視大獎賽、體育比賽及需要人們進行綜合評價的比賽項目中已得到廣泛應用計算公式為n

表示觀察值的個數(shù);α表示切尾系數(shù),

切尾均值

(例題分析)

【例】謀次比賽共有11名評委,對某位歌手的給分分別是:經整理得到順序統(tǒng)計量值為去掉一個最高分和一個最低分,取1/11

眾數(shù)、中位數(shù)和均值的關系左偏分布均值

中位數(shù)

眾數(shù)對稱分布

均值=中位數(shù)=

眾數(shù)右偏分布眾數(shù)

中位數(shù)均值2、某公司進行的計算機水平測試中,新員工的平均得分是80分,標準差是5分,中位數(shù)是86分,則新員工得分的分布形狀是(

).A、左偏的

B、右偏的C、對稱的

D、無法確定3、眾數(shù)是總體中出現(xiàn)最多的次數(shù).(

)1、有一個學生考試成績?yōu)?0分,這個變量應歸入().A、60—70B、70—80C、60—70或70—80都可以D、60—70和70—80都不可以4、在抽樣推斷中,抽樣誤差是()A、可以避免的

B、可避免且可控制C、不可避免且無法控制

D、不可避免但可控制5、某連續(xù)變量數(shù)列,其末組為500以上,如果又知其鄰近組的組中值為480,則末組的組中值為(

)。A、

530B、

510C、520D、540眾數(shù)、中位數(shù)、平均數(shù)的特點和應用眾數(shù)不受極端值影響具有不惟一性數(shù)據(jù)分布偏斜程度較大時應用中位數(shù)不受極端值影響數(shù)據(jù)分布偏斜程度較大時應用平均數(shù)易受極端值影響數(shù)學性質優(yōu)良數(shù)據(jù)對稱分布或接近對稱分布時應用

數(shù)據(jù)類型與集中趨勢測度值數(shù)據(jù)類型和所適用的集中趨勢測度值數(shù)據(jù)類型分類數(shù)據(jù)順序數(shù)據(jù)間隔數(shù)據(jù)比率數(shù)據(jù)適用的測度值※眾數(shù)※中位數(shù)※均值※均值—四分位數(shù)眾數(shù)調和平均數(shù)—眾數(shù)中位數(shù)幾何平均數(shù)——四分位數(shù)

中位數(shù)———四分位數(shù)———眾數(shù)小結:集中趨勢測度方法的總結

(Centraltendency)一組數(shù)據(jù)向其中心值靠攏的傾向和程度。測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值。不同類型的數(shù)據(jù)用不同的集中趨勢測度值。低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),但高層次數(shù)據(jù)的測度值并不適用于低層次的測量數(shù)據(jù)。一、極差二、內距三、方差和標準差四、離散系數(shù)2.3分布離散程度的測度極差(全距)

(range)1.一組數(shù)據(jù)的最大值與最小值之差2.離散程度的最簡單測度值3.易受極端值影響4.未考慮數(shù)據(jù)的分布R

=max(xi)-min(xi)計算公式為內距(四分位差)

(Inter-QuartileRange,IQR)

也稱四分位差上四分位數(shù)與下四分位數(shù)之差

內距=Q3

–Q1反映了中間50%數(shù)據(jù)的離散程度不受極端值的影響可用于衡量中位數(shù)的代表性方差和標準差

(VarianceandStandarddeviation)1. 離散程度的測度值之一2. 最常用的測度值3. 反映了數(shù)據(jù)的分布4.反映了各變量值與均值的平均差異5.根據(jù)總體數(shù)據(jù)計算的,稱為總體方差或標準差;根據(jù)樣本數(shù)據(jù)計算的,稱為樣本方差或標準差總體方差和標準差

(PopulationvarianceandStandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標準差的計算公式樣本方差和標準差

(simplevarianceandstandarddeviation)未分組數(shù)據(jù):組距分組數(shù)據(jù):未分組數(shù)據(jù):組距分組數(shù)據(jù):方差的計算公式標準差的計算公式注意:樣本方差用自由度n-1去除!樣本方差

自由度(degreeoffreedom)一組數(shù)據(jù)中可以自由取值的數(shù)據(jù)的個數(shù)當樣本數(shù)據(jù)的個數(shù)為n

時,若樣本均值

x確定后,只有n-1個數(shù)據(jù)可以自由取值,其中必有一個數(shù)據(jù)則不能自由取值例如,樣本有3個數(shù)值,即x1=2,x2=4,x3=9,則

x=5。當

x

=5

確定后,x1,x2和x3有兩個數(shù)據(jù)可以自由取值,另一個則不能自由取值,比如x1=6,x2=7,那么x3則必然取2,而不能取其他值樣本方差用自由度去除,其原因可從多方面解釋,從實際應用角度看,在抽樣估計中,當用樣本方差去估計總體方差σ2時,它是σ2的無偏估計量一、方差和標準差的缺陷1、受數(shù)值大小的影響較大。2、受數(shù)值單位的影響較大。3、不同組別的數(shù)據(jù),無法直接比較離散程度。離散系數(shù)

(coefficientofvariation)1.標準差與其相應的均值之比2.對數(shù)據(jù)相對離散程度的測度3.消除了數(shù)據(jù)水平高低和計量單位的影響4.用于對不同組別數(shù)據(jù)離散程度的比較5.計算公式為離散樣本離散系數(shù)總體離散系數(shù)離散系數(shù)

(例題分析)某管理局所屬8家企業(yè)的產品銷售數(shù)據(jù)企業(yè)編號產品銷售額(萬元)x1銷售利潤(萬元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所屬的8家企業(yè),其產品銷售數(shù)據(jù)如表。試比較產品銷售額與銷售利潤的離散程度離散系數(shù)

(例題分析)結論:計算結果表明,v1<v2,說明產品銷售額的離散程度小于銷售利潤的離散程度v1=536.25309.19=0.577v2=32.521523.09=0.7101、對分類數(shù)據(jù)離散程度的測度2、非眾數(shù)組的頻數(shù)占總頻數(shù)的比率

3.用于衡量眾數(shù)的代表性分類數(shù)據(jù):異眾比率(variationratio)例題:異眾比率(例題分析)解在所調查的50人當中,購買其他品牌飲料的人數(shù)占70%,異眾比率比較大。因此,用“可口可樂”代表消費者購買飲料品牌的狀況,其代表性不是很好不同品牌飲料的頻數(shù)分布

飲料品牌頻數(shù)比例百分比(%)

可口可樂

旭日升冰茶百事可樂匯源果汁露露15119690.300.220.180.120.183022181218合計501100一、偏態(tài)的含義

所謂偏態(tài),是指次數(shù)分布的非對稱程度。它和算術平均數(shù)與標準差一樣,也是次數(shù)分布的一個數(shù)量特征。偏態(tài)通常分為兩種,即右偏(或正偏態(tài))與左偏(或負偏態(tài))。它們是與對稱分布相比較而言。右向偏態(tài),算術平均數(shù)的數(shù)值較大,眾數(shù)的數(shù)值較小,算術平均數(shù)與眾數(shù)之差為正值,故右向偏態(tài)又稱為正向偏態(tài)。如果眾數(shù)在右邊,算術平均數(shù)在左邊,即極端數(shù)值在左邊,次數(shù)分布曲線向左延伸,稱為左向偏態(tài)。左向偏態(tài),算術平均數(shù)的數(shù)值較小,眾數(shù)的數(shù)值較大。算術平均數(shù)與眾數(shù)之差為負值,故左向偏態(tài)又稱為負向偏態(tài)。2.4偏態(tài)與峰度偏態(tài)與峰度分布的形狀扁平分布尖峰分布偏態(tài)峰度左偏分布右偏分布與標準正態(tài)分布比較!眾數(shù)、中位數(shù)和均值的關系左偏分布均值

中位數(shù)

眾數(shù)對稱分布

均值=中位數(shù)=

眾數(shù)右偏分布眾數(shù)

中位數(shù)均值偏態(tài)

(skewness)統(tǒng)計學家皮爾遜(Pearson)于1895年首次提出數(shù)據(jù)分布偏斜程度的測度2. 偏態(tài)系數(shù)=0為對稱分布3. 偏態(tài)系數(shù)>0為右偏分布偏態(tài)系數(shù)<0為左偏分布偏態(tài)系數(shù)大于1或小于-1,被稱為高度偏態(tài)分布;偏態(tài)系數(shù)在0.5~1或-0.5~-1之間,被認為是中等偏態(tài)分布;偏態(tài)系數(shù)越接近0,偏斜程度就越低正態(tài)分布為參照物偏態(tài)系數(shù)

(coefficientofskewness)未分組數(shù)據(jù)情況下偏態(tài)系數(shù)

(coefficientofskewness)根據(jù)分組數(shù)據(jù)計算偏態(tài)系數(shù)計算

(例題分析)

某電腦公司銷售量偏態(tài)及峰度計算表按銷售量份組(臺)組中值(Mi)頻數(shù)

fi140—150150—160160—170170—180180—190190—200200—210210—220220—230230—240145155165175185195205215225235491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合計—120540000

70100000

X-bar=185例題分析:偏態(tài)系數(shù)結論:偏態(tài)系數(shù)為正值,但與0的差異不大,說明電腦銷售量為輕微右偏分布,即銷售量較少的天數(shù)占據(jù)多數(shù),而銷售量較多的天數(shù)則占少數(shù)。峰度

(kurtosis)統(tǒng)計學家皮爾遜(Pearson)于1905年首次提出數(shù)據(jù)分布扁平程度的測度峰度系數(shù)=0扁平峰度適中峰度系數(shù)<0為扁平分布峰度系數(shù)

>0為尖峰分布正態(tài)分布為參照物峰度系數(shù)

(coefficientofkurtosis)根據(jù)分組數(shù)據(jù)計算峰度系數(shù)的計算

(分組數(shù)據(jù))

某電腦公司銷售量偏態(tài)及峰度計算表按銷售量份組(臺)組中值(Mi)頻數(shù)

fi140—150150—160160—170170—180180—190190—200200—210210—220220—230230—240145155165175185195205215225235491627201710845-256000-243000-128000-270000170008000021600025600062500010240000729000025600002700000170000160000064800001024000031250000合計—120540000

70100000

峰度系數(shù)計算(例題分析)

結論:峰度系數(shù)為負值,但與0的差異不大,說明電腦銷售量為輕微扁平分布。

小結:數(shù)據(jù)分布特征的測度方法數(shù)據(jù)特征的測度分布的形狀集中趨勢離散程度眾數(shù)中位數(shù)均值離散系數(shù)方差和標準差峰度四分位差極差偏態(tài)異眾比率幾何均值2.5統(tǒng)計表與統(tǒng)計圖一、統(tǒng)計表二、統(tǒng)計圖79統(tǒng)計表一、

統(tǒng)計表的構成統(tǒng)計表是以橫縱交叉的線條所繪制的表格來表現(xiàn)統(tǒng)計資料的一種形式。主要優(yōu)點:第一,能有條理、有系統(tǒng)的排列統(tǒng)計資料,一目了然。第二,能合理地、科學地組織統(tǒng)計資料,便于對照比較。統(tǒng)計表由總標題(表頭)、橫行標題、縱欄標題、指標數(shù)值四部分所構成(如表)。2004年某市各類工業(yè)企業(yè)的總產值

2103128合計

1236185735

(2)(1)(甲)

總產值

(億元)工業(yè)企業(yè)數(shù)(個)按經濟類型分組國有企業(yè)集體企業(yè)中外合資137676縱欄標題指標數(shù)值橫行標題→1.要合理安排統(tǒng)計表的結構2.總標題內容應滿足3W(when、where、what)要求3.數(shù)據(jù)計量單位相同時,可放在表的右上角標明,不同時應放在每個指標后或單列出一列標明4.表中的上下兩條橫線一般用粗線,其他線用細線5.通常情況下,統(tǒng)計表的左右兩邊不封口6.表中的數(shù)據(jù)一般是右對齊,有小數(shù)點時應以小數(shù)點對齊,而且小數(shù)點的位數(shù)應統(tǒng)一7.對于沒有數(shù)字的表格單元,一般用“—”表示8.必要時可在表的下方加上注釋統(tǒng)計表的設計遵循科學、實用、簡練、美觀的原則。統(tǒng)計圖83莖葉圖

(stem-and-leafdisplay)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息(例題分析)【例2.1】某車間30名工人每周加工某種零件件數(shù)如下表,試對數(shù)據(jù)進行分組。次數(shù)分配表注:不重不漏、上組限不在內分組數(shù)據(jù)的圖示

(直方圖的繪制)某車間工人周加工零件直方圖

莖葉圖

(例題分析)5-88莖葉圖

(擴展的莖葉圖)5-89箱線圖

(boxplot)用于顯示未分組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成箱線圖的繪制方法首先找出一組數(shù)據(jù)的5個特征值,即最大值、最小值、中位數(shù)Me和兩個四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接5-90箱線圖

(箱線圖的構成)中位數(shù)4681012QUQLX最大值X最小值簡單箱線圖箱線圖

(例題分析)最小值84最大值128中位數(shù)105下四分位數(shù)96上四分位數(shù)109808590951001

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論