第四章統(tǒng)計(jì)整理(統(tǒng)計(jì)學(xué)原理南開(kāi)大學(xué),陸宇建)_第1頁(yè)
第四章統(tǒng)計(jì)整理(統(tǒng)計(jì)學(xué)原理南開(kāi)大學(xué),陸宇建)_第2頁(yè)
第四章統(tǒng)計(jì)整理(統(tǒng)計(jì)學(xué)原理南開(kāi)大學(xué),陸宇建)_第3頁(yè)
第四章統(tǒng)計(jì)整理(統(tǒng)計(jì)學(xué)原理南開(kāi)大學(xué),陸宇建)_第4頁(yè)
第四章統(tǒng)計(jì)整理(統(tǒng)計(jì)學(xué)原理南開(kāi)大學(xué),陸宇建)_第5頁(yè)
已閱讀5頁(yè),還剩108頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章統(tǒng)計(jì)整理§1統(tǒng)計(jì)整理的一般問(wèn)題§2統(tǒng)計(jì)分組§3次數(shù)分布§4數(shù)據(jù)顯示1

§1統(tǒng)計(jì)整理的一般問(wèn)題

統(tǒng)計(jì)整理的概念統(tǒng)計(jì)整理的內(nèi)容2統(tǒng)計(jì)整理的含義

統(tǒng)計(jì)整理通常是指對(duì)調(diào)查所得到的原始資料進(jìn)行分類(lèi)、匯總,使之系統(tǒng)化、條理化的工作過(guò)程。但廣義的統(tǒng)計(jì)整理也包括對(duì)原來(lái)已經(jīng)加工的綜合資料的再整理。如歷史資料的整理、統(tǒng)計(jì)年鑒的編輯、次級(jí)資料(如各出版物公布的)的加工整理等。統(tǒng)計(jì)整理是統(tǒng)計(jì)工作的第三階段。這個(gè)階段是統(tǒng)計(jì)調(diào)查的繼續(xù),統(tǒng)計(jì)分析的前提。承上啟下的作用3統(tǒng)計(jì)整理的意義統(tǒng)計(jì)調(diào)查所搜集的反映個(gè)體量的原始資料是分散的,不是集中的;是零碎的,不是系統(tǒng)的。根據(jù)這些資料。人們難以從總體上分析和認(rèn)識(shí)社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)量表現(xiàn)。至于某些已經(jīng)加工的綜合資料,則往往由于資料在分組方法、總體范圍或指標(biāo)涵義、口徑、計(jì)算方法等方面不同,而不能滿足統(tǒng)計(jì)分析的要求,也必須先通過(guò)統(tǒng)計(jì)整理,才能據(jù)以從總體上分析社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)量表現(xiàn),4統(tǒng)計(jì)資料整理的內(nèi)容審核統(tǒng)計(jì)資料。包括:完整性、準(zhǔn)確性、及時(shí)性進(jìn)行統(tǒng)計(jì)分組。這是統(tǒng)計(jì)整理的關(guān)鍵問(wèn)題。進(jìn)行資料的匯總。這是統(tǒng)計(jì)整理的中心內(nèi)容。編制統(tǒng)計(jì)表或統(tǒng)計(jì)圖。統(tǒng)計(jì)整理的結(jié)果。匯總技術(shù)手工匯總、電子計(jì)算機(jī)匯總5第三章統(tǒng)計(jì)資料整理§1統(tǒng)計(jì)整理的一般問(wèn)題§2統(tǒng)計(jì)分組§3次數(shù)分布§4數(shù)據(jù)顯示6

§2統(tǒng)計(jì)分組

統(tǒng)計(jì)分組的概念和種類(lèi)

統(tǒng)計(jì)分組的方法1、選擇分組標(biāo)志——統(tǒng)計(jì)分組的核心問(wèn)題2、選擇分組種類(lèi)3、劃分分組界限7統(tǒng)計(jì)分組概念

根據(jù)統(tǒng)計(jì)研究的目的和客觀現(xiàn)象的內(nèi)在特點(diǎn),按某個(gè)標(biāo)志(或幾個(gè)標(biāo)志)把被研究對(duì)象的總體劃分為若干個(gè)不同性質(zhì)的組。原則窮盡原則、互斥原則例1:從業(yè)人員按文化程度分組小學(xué)畢業(yè)中學(xué)畢業(yè)(含中專(zhuān))大學(xué)畢業(yè)文盲或識(shí)字不多小學(xué)畢業(yè)中學(xué)畢業(yè)(含中專(zhuān))大專(zhuān)畢業(yè)大學(xué)及大學(xué)以上

(√)(×)8種類(lèi)例2:某商場(chǎng)把服裝分為①男裝、女裝、童裝。(×)②成年裝(男女裝)兒童裝(男女裝)統(tǒng)計(jì)分組(√)按分組標(biāo)志的多少不同簡(jiǎn)單分組復(fù)合分組按分組標(biāo)志的性質(zhì)不同品質(zhì)標(biāo)志分組數(shù)量標(biāo)志分組9例1為了了解某地區(qū)銀行存款的構(gòu)成,可以選用存款性質(zhì)、期限兩個(gè)標(biāo)志分別進(jìn)行分組:按存款性質(zhì)分組企業(yè)存款儲(chǔ)蓄存款財(cái)政性存款按存款期限分組活期存款定期存款簡(jiǎn)單分組復(fù)合分組存款同時(shí)按其性質(zhì)及期限分組企業(yè)存款活期定期儲(chǔ)蓄存款活期定期財(cái)政性存款活期定期例2企業(yè)職工按工齡分組:5年以下5~10年10~15年15~20年20年以上品質(zhì)標(biāo)志分組數(shù)量標(biāo)志分組10統(tǒng)計(jì)分組作用1、統(tǒng)計(jì)分組的根本作用是將復(fù)雜的社會(huì)經(jīng)濟(jì)現(xiàn)象按照統(tǒng)計(jì)認(rèn)識(shí)的要求區(qū)分為各個(gè)性質(zhì)不同的組成部分。在區(qū)分事物性質(zhì)的分組中,劃分經(jīng)濟(jì)類(lèi)型具有重要意義。經(jīng)濟(jì)類(lèi)型是指直接反映社會(huì)生產(chǎn)關(guān)系的各種類(lèi)型。我國(guó)根據(jù)不同時(shí)期經(jīng)濟(jì)發(fā)展情況來(lái)劃分不同的經(jīng)濟(jì)類(lèi)型。1112統(tǒng)計(jì)分組作用2.研究總體現(xiàn)象的內(nèi)部結(jié)構(gòu)?,F(xiàn)象的內(nèi)部結(jié)構(gòu)是表明現(xiàn)象本質(zhì)特點(diǎn)的一個(gè)重要方面,將同一總體不同時(shí)期的結(jié)構(gòu)聯(lián)系起來(lái),還可以看到現(xiàn)象的發(fā)展趨勢(shì)和規(guī)律。例如,1988年全國(guó)獨(dú)立核算工業(yè)企業(yè)凈產(chǎn)值如下:13統(tǒng)計(jì)分組作用3、將總體的分組資料按時(shí)間的移動(dòng)聯(lián)系起來(lái)進(jìn)行分析,可以反映總體及各組在數(shù)量上的變動(dòng)情況和變動(dòng)規(guī)律,認(rèn)識(shí)由于各組變動(dòng)速度不同,而形成總體中性質(zhì)不同的各組地位改變的狀況,從而獲得對(duì)總體由量變逐漸轉(zhuǎn)化為質(zhì)變的過(guò)程的認(rèn)識(shí)。例如,我國(guó)農(nóng)業(yè)總產(chǎn)值個(gè)農(nóng)林牧副漁各業(yè)所占比重的變化情況如下表:14統(tǒng)計(jì)分組作用4、分析總體現(xiàn)象之間的依存關(guān)系。通過(guò)分組將有相互影響的現(xiàn)象聯(lián)系起來(lái)進(jìn)行研究,反映它們?cè)跀?shù)量上的變動(dòng)規(guī)律。例如:商品銷(xiāo)售額與流通費(fèi)用率的關(guān)系;居民收入與儲(chǔ)蓄額的關(guān)系。15統(tǒng)計(jì)分組的方法

統(tǒng)計(jì)分組的關(guān)鍵在于選擇分組標(biāo)志和劃分各組界限。

1、選擇分組標(biāo)志——統(tǒng)計(jì)分組的核心問(wèn)題分組標(biāo)志是將總體區(qū)分為各個(gè)性質(zhì)不同的組的標(biāo)準(zhǔn)或依據(jù)。選擇分組標(biāo)志的原則是:結(jié)合一定的歷史條件或經(jīng)濟(jì)條件,根據(jù)統(tǒng)計(jì)研究的目的和任務(wù),選用那些最能反映現(xiàn)象本質(zhì)特征的標(biāo)志作為分組標(biāo)志。如:工業(yè)企業(yè)的分類(lèi)——規(guī)模分類(lèi)、部門(mén)分類(lèi)16例:經(jīng)調(diào)查,某地年末貨幣流通量為15.3億元,比上年增加4.5億元。為了宏觀調(diào)控,有必要對(duì)本地區(qū)貨幣流通量分布狀況進(jìn)行調(diào)查。有兩種資料整理結(jié)果:按地區(qū)分組上期本期增減%甲縣乙縣丙縣丁縣360002400028000200005200034000410002600044.441.746.730.0合計(jì)10800015300041.7(1)(2)按行業(yè)結(jié)構(gòu)分組上期本期增減%集團(tuán)單位庫(kù)存現(xiàn)金農(nóng)民手持現(xiàn)金城鎮(zhèn)居民手持現(xiàn)金其他流動(dòng)人口手持現(xiàn)金27000430003100070003500071000370001000029.665.019.042.6合計(jì)10800015300041.717統(tǒng)計(jì)分組的方法2、選擇分組種類(lèi)簡(jiǎn)單分組分組體系主要根據(jù)研究任務(wù)及對(duì)象特點(diǎn)來(lái)選擇,前者簡(jiǎn)單。后者更全面、深入,但復(fù)雜。品質(zhì)標(biāo)志分組數(shù)量標(biāo)志分組單項(xiàng)式分組組距式分組主要根據(jù)研究任務(wù)來(lái)選擇。(根據(jù)數(shù)量變動(dòng)的特征不同來(lái)選擇)18

對(duì)總體只按一個(gè)標(biāo)志進(jìn)行分組,稱(chēng)為簡(jiǎn)單分組。如:以產(chǎn)值作為劃分企業(yè)規(guī)模的標(biāo)志;按文化程度對(duì)人口總體進(jìn)行分組。統(tǒng)計(jì)對(duì)總體往往要從多方面進(jìn)行研究,僅僅依賴(lài)一個(gè)分組標(biāo)志進(jìn)行分組是難以滿足需要的,必須運(yùn)用多個(gè)分組標(biāo)志進(jìn)行多種分組,形成一個(gè)分組體系,才能滿足需要。

統(tǒng)計(jì)分組的方法2、選擇分組種類(lèi)19統(tǒng)計(jì)分組體系就是根據(jù)統(tǒng)計(jì)分析的要求,通過(guò)對(duì)同一總體進(jìn)行多種不同分組而形成的一種相互聯(lián)系、相互補(bǔ)充,能從總體在各種特殊性質(zhì)意義上的量來(lái)加深對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象總體數(shù)量表現(xiàn)的認(rèn)識(shí)的體系。例如,對(duì)于國(guó)民經(jīng)濟(jì)總體進(jìn)行統(tǒng)計(jì)研究,必須通過(guò)按部門(mén)、按所有制、按地區(qū)、按主管系統(tǒng)等多種分組,才能得到比較深刻的認(rèn)識(shí)。這就是國(guó)民經(jīng)分組體系。統(tǒng)計(jì)分組體系可分為平行分組體系與復(fù)合分組體系。統(tǒng)計(jì)分組的方法2、選擇分組種類(lèi)20對(duì)同一總體選擇兩個(gè)或兩個(gè)以上的標(biāo)志分別進(jìn)行簡(jiǎn)單分組然后并列在一起就形成平行分組體系。例如,為了認(rèn)識(shí)人口總體的自然構(gòu)成,可以分別選擇性別、民族、文化程度、年齡等四個(gè)分組標(biāo)志進(jìn)行分組,得到如下分組體系。平行分組體系的特點(diǎn)是,每一分組只能固定一個(gè)因素對(duì)差異的影響,不能固定其他因素對(duì)差異的影響。例如,男子組.女子組中性別的差異已被固定;各民族組中民族的差異已被固定;但這些組中其他因素的差異都依然存在。

統(tǒng)計(jì)分組的方法平行分組體系

21

22對(duì)同一總體選擇兩個(gè)或兩個(gè)以上的標(biāo)志層疊進(jìn)行分組,就形成復(fù)合分組體系。例如,為了認(rèn)識(shí)我國(guó)高等院校在校學(xué)生的基本狀況,可以同時(shí)選擇學(xué)科、學(xué)制、性別等三個(gè)標(biāo)志進(jìn)行復(fù)合分組,得到如下分組體系。統(tǒng)計(jì)分組的方法復(fù)合分組體系

23

24建立復(fù)合分組體系,應(yīng)根據(jù)統(tǒng)計(jì)分析的要求,在選擇分組標(biāo)志的同時(shí),確定它們的主次順序。首先按主要的標(biāo)志對(duì)總體進(jìn)行第一次分組;然后按次要的標(biāo)志對(duì)第一次所分的組再進(jìn)行第二次分組;依次按所有標(biāo)志分至最后一層為止。復(fù)合分組體系的持點(diǎn)是,第一次分組只固定一個(gè)因素對(duì)差異的影響、第二次分組則同時(shí)固定兩個(gè)因素對(duì)差異的影響,當(dāng)最后一次分組時(shí),則所有被選擇標(biāo)志對(duì)差異的影響已全部被固定。例如,理科、文科組中只固定了學(xué)科一個(gè)因素的差異,但仍存在著學(xué)制及性別的差異。在兩組下再分的本科、專(zhuān)科組中,則已固定了學(xué)科、學(xué)制兩個(gè)因素的差異,但仍存在著性別的差別。而最后分的男、女組中,則所有被選擇標(biāo)志各因素的差異部已被固定。即這些組中的學(xué)生,他們的學(xué)科、學(xué)制、性別全部是相同的。統(tǒng)計(jì)分組的方法復(fù)合分組體系

25分組標(biāo)志確定之后,必須解決分組組數(shù)和各組界限的劃分,即分組的具體方法問(wèn)題。根據(jù)分組標(biāo)志的特征不同,統(tǒng)計(jì)總體可以按品質(zhì)標(biāo)志分組,也可以按數(shù)量標(biāo)志分組。

統(tǒng)計(jì)分組的方法2、選擇分組種類(lèi)26按品質(zhì)標(biāo)志分組,就是選擇反映事物屬性差異的品質(zhì)標(biāo)志作為分組標(biāo)志,并在品質(zhì)標(biāo)志的變異范圍內(nèi)劃定各組界限,將總體劃分成為若干個(gè)性質(zhì)不同的組成部分。例如,人口總體按性別,分為男、女兩組;再如,企業(yè)總體按所有制,分為全民、集體、合營(yíng)、個(gè)體等組。

統(tǒng)計(jì)分組的方法按品質(zhì)標(biāo)志分組27按數(shù)量標(biāo)志分組,就是選擇反映事物數(shù)量差異的數(shù)量標(biāo)志為分組標(biāo)志,并在數(shù)量標(biāo)志的變異范圍內(nèi)劃定各組界限,將總體劃分為性質(zhì)不同的若干組成部分。例如,居民家庭按子女?dāng)?shù)分組,可分為0人(無(wú)子女)、1人、2人、3人;等等。

統(tǒng)計(jì)分組的方法按數(shù)量標(biāo)志分組28就具體的分組形式而言,如果變量的變異較小,我們可以將每個(gè)變量值單列一組,這種分組稱(chēng)為單項(xiàng)式分組。如果變量的變異較大,則可以把變量的整個(gè)的取值范圍依次劃分為若干個(gè)區(qū)間,一個(gè)區(qū)間內(nèi)的所有變量值歸為一組。區(qū)間的最大值稱(chēng)為上限,最小值稱(chēng)為下限,上限與下限之差為組距,即組距=區(qū)間的最大值(上限)-區(qū)間的最小值(下限)……(1)這樣的分組稱(chēng)為組距式分組。統(tǒng)計(jì)分組的方法按數(shù)量標(biāo)志分組29按總體內(nèi)各組組距是否完全相等,數(shù)量標(biāo)志分組又可以分為等距式分組與異距式分組。等距式分組適用于總體各單位的變量值由小到大呈現(xiàn)均勻變化的情況。異距式分組則適用于總體各單位的變量值由小到大呈現(xiàn)不均勻變化的情況。各種分組舉例如表4-3。

統(tǒng)計(jì)分組的方法按數(shù)量標(biāo)志分組30

31變量按其變量值能否無(wú)限分割可以分為離散型變量和連續(xù)型變量。例如表4-3中,例1、例2、例4中的變量均為離散型變量,例3和例5中的變量為連續(xù)型變量。一般來(lái)說(shuō),離散型變量既可以來(lái)用單項(xiàng)式分組,也能夠采用組距式分組;而連續(xù)型變量只能采用組距式分組,不能采用單項(xiàng)式分組。因?yàn)檫B續(xù)型變量的取值能夠無(wú)限分割,變量值有無(wú)窮多個(gè)。

統(tǒng)計(jì)分組的方法按數(shù)量標(biāo)志分組32在采用組距式分組中,兩種變量類(lèi)型在組限的表示方法上也有不同。離散型變量下各相鄰組的組限可以間斷,如例2中第一組的上限為999人,第二組的下限為1000人,兩者不相重疊。連續(xù)型變量的各相鄰組的組限必須重疊,如例3中第—組的上限為80元,第二組的下限為80元,兩者重疊。為保證重疊后不致發(fā)生“80元”究竟歸屬第幾組的混亂,習(xí)慣上規(guī)定各組一般均只包括本組下限變量值而不包括本組上限變量值。上例80元應(yīng)歸入第二組。

統(tǒng)計(jì)分組的方法按數(shù)量標(biāo)志分組33單項(xiàng)式分組:一個(gè)變量值列為一組。如:對(duì)居民家庭按家庭人口數(shù)進(jìn)行分組:

1人2人3人4人5人及以上2、選擇分組種類(lèi)組距式分組:若干個(gè)變量值列為一組。如:A、企業(yè)的工人按日B、工人按工資水平分組(連)產(chǎn)零件數(shù)分組(離)50-60300-40060-70400-50070-80500-60080-90600-70090以上700-800適用于離散型變量,且變量值不多時(shí)。適用于連續(xù)型變量,且變量值變化范圍大時(shí)。34①全距與組距②等距與異距③組限與組中值④開(kāi)口組與閉口組⑤連續(xù)組距分組和不連續(xù)組距分組重疊組限“上限不在內(nèi)”原則關(guān)于組距式分組的幾個(gè)問(wèn)題例:學(xué)生按成績(jī)分組(分)

(1)50—6060—70

70—8080—9090—100(2)60以下60—6970—7980—89

90以上組距=80-70=10上限:80下限:70開(kāi)口組閉口組組中值組中值組中值重疊組限值70歸于70—80組不連續(xù)組距式分組連續(xù)組距式分組35統(tǒng)計(jì)分組的方法3、劃分分組界限

按品質(zhì)標(biāo)志分組,只要根據(jù)事物的性質(zhì)劃分界限。目前我國(guó)實(shí)踐中有制定和實(shí)施的幾種最重要的、基礎(chǔ)性國(guó)家分類(lèi)標(biāo)準(zhǔn)。按數(shù)量標(biāo)志分組,要根據(jù)事物的數(shù)量變動(dòng)來(lái)判斷事物性質(zhì)上的差異。注意客觀界限。例:1、人口按年齡分組(歲):0——6嬰幼兒7——17少年兒童18——59中青年60以上老年362、學(xué)生按成績(jī)分組(分):

60以下60——7070——8080——9090以上3、企業(yè)按產(chǎn)值計(jì)劃完成程度分組(%):

100以下100——110110以上例:55-6060-6565-70……95-10055-6565-7575-8585-9595以上(×)(×)95-105105-115115以上(×)37第三章統(tǒng)計(jì)資料整理§1統(tǒng)計(jì)整理的一般問(wèn)題§2統(tǒng)計(jì)分組§3次數(shù)分布§4數(shù)據(jù)顯示38

§3次數(shù)分布

次數(shù)分布的概念和種類(lèi)

變量數(shù)列的編制

次數(shù)分布類(lèi)型39次數(shù)分布概念在統(tǒng)計(jì)分組的基礎(chǔ)上,將總體中的所有單位按組歸類(lèi)整理,形成總體中各個(gè)單位數(shù)在各組間的分布,就叫做次數(shù)分布。分布在各組的個(gè)體單位數(shù)叫次數(shù),又稱(chēng)額數(shù)。各組次數(shù)與總次數(shù)之比稱(chēng)比率,又稱(chēng)頻率。將各組組別與次數(shù)依次編排而成的數(shù)列就叫做次數(shù)分布數(shù)列,簡(jiǎn)稱(chēng)分布數(shù)列。有時(shí)也可把比率列入分布數(shù)列中。分布數(shù)列又稱(chēng)分配數(shù)列或次數(shù)分配,它可以反映總體中所有單位在各組間的分布狀態(tài)和分布特征,研究這種分布特征是統(tǒng)計(jì)分析的—項(xiàng)重要內(nèi)容。40次數(shù)分布概念

各組名稱(chēng)(常用x表示)兩個(gè)構(gòu)成要素

各組次數(shù)(有兩種表現(xiàn)形式:絕對(duì)數(shù)也稱(chēng)頻數(shù),用f表示相對(duì)數(shù)稱(chēng)為頻率,用f/∑f表示。)41次數(shù)分布種類(lèi)由于分組是次數(shù)分布的基礎(chǔ),因此有怎樣的分組就形成怎樣的次數(shù)分布。綜合上述各種的分組,次數(shù)分布的類(lèi)型,可歸納為:次數(shù)分布品質(zhì)數(shù)列變量數(shù)列單項(xiàng)數(shù)列組距數(shù)列等距數(shù)列異距數(shù)列不連續(xù)組距數(shù)列連續(xù)組距數(shù)列42根據(jù)分組標(biāo)志特征的不同.分布數(shù)列可以分為屬性分布數(shù)列與變量分布數(shù)列兩種。按品質(zhì)標(biāo)志分組形成的分布數(shù)列稱(chēng)為屬性分布數(shù)列,簡(jiǎn)稱(chēng)品質(zhì)數(shù)列。按數(shù)量標(biāo)志分組形成的分布數(shù)列稱(chēng)為變量分布數(shù)列,簡(jiǎn)稱(chēng)變量數(shù)列。次數(shù)分布種類(lèi)43種類(lèi)例:1、某地人口的性別分布按性別分組次數(shù)人數(shù)(人)比重(%)男女154349271461329751.3748.63合計(jì)30048224100.002、學(xué)生的成績(jī)分布學(xué)生按成績(jī)分組x次數(shù)學(xué)生數(shù)(人)f比重(%)f/∑f60以下60-7070-8080-9090以上2820155416403010合計(jì)50100變量數(shù)列品質(zhì)數(shù)列44對(duì)于品質(zhì)數(shù)列來(lái)說(shuō),如果分組標(biāo)志選擇得好,分組標(biāo)準(zhǔn)定得恰當(dāng),則事物性質(zhì)的差異表現(xiàn)得比較明確,總體中各組如何劃分較易解決。因而屬性分布數(shù)列一般也較穩(wěn)定,通常均能準(zhǔn)確地反映總體的分布特征。對(duì)于變量數(shù)列來(lái)講,因?yàn)槭挛镄再|(zhì)的差異表現(xiàn)得不甚明確,決定事物性質(zhì)的數(shù)量界限往往因人的主觀認(rèn)識(shí)而異,因此按同一數(shù)量標(biāo)志分組有出現(xiàn)多種分布數(shù)列的可能。為了使變量數(shù)列能比較準(zhǔn)確地反映總體的分布特征.除了按照前面講到的按數(shù)量標(biāo)志分組的原理進(jìn)行分組外,還需要從次數(shù)分布特征的角度,對(duì)變量數(shù)列中幾個(gè)特有的問(wèn)題加以討論。種類(lèi)45變量數(shù)列由各組變量值x和次數(shù)f(f/∑f)構(gòu)成。變量數(shù)列的編制

1、確定變量數(shù)列的形式——根據(jù)變量的性質(zhì)及特點(diǎn)選擇不同的變量數(shù)列。2、確定組距和組數(shù)——組距=全距/組數(shù)。組數(shù)過(guò)多,組距太小,要避免將相同性質(zhì)的單位分到不同組中去;反之,如果組數(shù)過(guò)少,組距太大,要避免將不同性質(zhì)的單位分到同一組中去。3、確定組限——(1)客觀數(shù)量界限。(2)第一組的下限和最后一組的上限。有極端值時(shí),第一組和最后一組可采用開(kāi)口組。(3)盡可能采用5或10的倍數(shù)。4、分配次數(shù)——可利用EXCEL表進(jìn)行匯總。46單項(xiàng)數(shù)列不存在組距的問(wèn)題,如表4-8所示。此時(shí),組數(shù)等于數(shù)量標(biāo)志所包含的變量值的數(shù)目。

確定組距和組數(shù)47然而當(dāng)所包括的變量值較多時(shí),單項(xiàng)數(shù)列顯得十分繁瑣,如表4-9,難以反映總體內(nèi)不同性質(zhì)組成部分的分布特征。這就有必要編制組距數(shù)列。確定組距和組數(shù)48若將上例根據(jù)考試成績(jī)的不同,分為不及格與及格兩組,可編成如下組距數(shù)列(如友4-10):這個(gè)數(shù)列也能說(shuō)明該班統(tǒng)計(jì)學(xué)考試成績(jī)的基本情況。但是,由于組數(shù)過(guò)少組距過(guò)大,第二組學(xué)生成績(jī)相差的幅度太大,看不出學(xué)生成績(jī)的分布特征。為了將考試成績(jī)分布情況說(shuō)明得細(xì)致些,按4分為組距分組,編成如下的組距數(shù)列(如表4-11)確定組距和組數(shù)49確定組距和組數(shù)50表4-11則顯然又由于組距過(guò)小,組數(shù)過(guò)多,也難以看清學(xué)生成績(jī)的分布特征。如果先根據(jù)考試成績(jī)性質(zhì)的不同,在60分的數(shù)量界限的基礎(chǔ)上,再細(xì)致地分為不及格、及格、中等、良好、優(yōu)秀等五個(gè)類(lèi)型。并將每組組距擴(kuò)大為10分,編成如下組距數(shù)列(表4-12),則基本上能準(zhǔn)確地反映學(xué)生成績(jī)的分布特征。確定組距和組數(shù)51由此可見(jiàn),編制組距數(shù)列時(shí),不僅要考慮各組的劃分是否能區(qū)分總體內(nèi)各組成部分的性質(zhì)差別,還需要確定適當(dāng)?shù)慕M距和組數(shù),才能準(zhǔn)確而清晰地反映總體的分布特征。在實(shí)際進(jìn)行分組時(shí),采用等距數(shù)列或異距數(shù)列,應(yīng)決定于現(xiàn)象的性質(zhì)和研究的目的。

等距數(shù)列由于組距相同,各組次數(shù)的分布不受組距大小的影響,它和消除了組距因素影響的次數(shù)密度(即單位組距內(nèi)分布的次數(shù),也稱(chēng)為頻數(shù)密度)的分布相一致。

確定組距和組數(shù)52表4-13中組距都是10分。因此,次數(shù)分布和次數(shù)密度的分布是一樣的。確定組距和組數(shù)53如果畫(huà)成直方圖,圖形是相同的(圖4-1,①②)。確定組距和組數(shù)54

如果是異距數(shù)列,則各組次數(shù)的數(shù)值受組距不同的影響。在研究各組次數(shù)的實(shí)際分布時(shí),要消除組距不同的影響。就是說(shuō),要按次數(shù)密度來(lái)看實(shí)際的次數(shù)分布情況。若上例按異距分組,編制組距數(shù)列如表4-14。

確定組距和組數(shù)55在這種情況下,次數(shù)密度才能準(zhǔn)確地反映實(shí)際的次數(shù)分布情況,如果畫(huà)成直方圖,應(yīng)該按照次數(shù)密度來(lái)畫(huà),如圖4-2。

確定組距和組數(shù)56因此,從明確反映總體的分布特征考慮,編制組距數(shù)列時(shí)應(yīng)盡量采用等距分組的方法。等距數(shù)列一般在社會(huì)經(jīng)濟(jì)現(xiàn)象性質(zhì)差異的變動(dòng)比較均衡的條件下使用。分組時(shí),一般應(yīng)依據(jù)對(duì)總體內(nèi)部情況的定性分析,先確定組數(shù),然后用變量的變動(dòng)范圍(即全距)除以組數(shù),確定組距,并據(jù)以計(jì)分各組界限。設(shè)R為全距,即總體內(nèi)變量最大值與最小值之差。K為組數(shù),i為等組距。則:

(2)確定組距和組數(shù)57如上例,R=99-56=43設(shè)K=5則:i=R/K=43/5=8.6為計(jì)算方便,i宜取5或10的整倍數(shù).故可令:i=10確定組距和組數(shù)58確定組距和組數(shù)當(dāng)偏度系數(shù)不大時(shí),用斯特吉斯(美國(guó)H.A.Sturges)經(jīng)驗(yàn)公式確定組數(shù):n為組數(shù),N為總體單位數(shù),d為組距,R為全距,即最大值(xmax)與最小值(xmin)的差。根據(jù)這個(gè)公式,可得出如下的組數(shù)參考標(biāo)準(zhǔn):N15~2425~4445~8990~179180~359n56789當(dāng)偏度系數(shù)大時(shí),分布明顯偏態(tài)時(shí),以平均數(shù)為中心,以K倍標(biāo)準(zhǔn)差為組距。59異距數(shù)列能比較準(zhǔn)確地反映總體內(nèi)部各組成部分的性質(zhì)差異。在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)總體中,有一部分現(xiàn)象性質(zhì)差異的變動(dòng)并不均衡,很難用等組距的辦法近似地區(qū)分性質(zhì)不同的組。再如,為研究人口總體在人生各發(fā)展階段上的分布,就需要按照人在一生中自然的和社會(huì)的發(fā)展規(guī)律采用異距分組。例如,整理我國(guó)1982年第三次人口普查資料時(shí)采用了如下的異距分組:確定組距和組數(shù)60

確定組距和組數(shù)61異距數(shù)列的組距與組數(shù)應(yīng)根據(jù)對(duì)現(xiàn)象本身質(zhì)量關(guān)系的分析研究來(lái)確定。由于異距數(shù)列的各組往往均表明某一種性質(zhì)的現(xiàn)象,因此可將其分布視同品質(zhì)數(shù)列的分布。除非統(tǒng)計(jì)分析的需要,可不再考慮與次數(shù)密度分布不相一致的問(wèn)題。確定組距和組數(shù)62當(dāng)組距、組數(shù)確定后,只需劃定各組數(shù)量界限便可編制組距數(shù)列。一般講來(lái),按數(shù)量分組標(biāo)志分組的組限應(yīng)是決定事物性質(zhì)的數(shù)量界限。然而在具體劃分時(shí),尚需在遵循這一原則的前提下,從次數(shù)分布特征的角度考慮編成的組距數(shù)列是否真實(shí)地反映了總體內(nèi)各個(gè)單位的實(shí)際分布特征。例如:某小組10名工人的基本工資變量資料如下(單位:元):45495456586062646970組限63設(shè)已確定分為低、中、高三個(gè)工資組,各組組距為10元(已確定組數(shù)和組距)。于是可以有如下兩種劃分組限的方法,形成兩個(gè)分布特征不同的組距數(shù)列(表4-15、表4-16)。表4-15的分布持征反映著高工資的工人占全小組工人數(shù)的一半,中等工資的工人數(shù)持中,低工資的工人數(shù)最少。表4-16的分布特征反映著中等工資的工人占全小組工人數(shù)的一半,低工資的工人數(shù)持中,高工資的工人數(shù)最少。究竟哪一種分布特征準(zhǔn)確?需要依據(jù)該小組工人工資變量的實(shí)際分布來(lái)檢驗(yàn)。組限64

65可以看出,這一數(shù)軸可以分為三個(gè)區(qū)段:其中以55—65元一段變量值分布最為密集;數(shù)軸的首段,則是另外一種形態(tài),變量值分布較為稀疏;而在數(shù)軸末段,直至70元附近才有兩個(gè)變量值出現(xiàn)。因而可以判斷,表4-15的組距數(shù)列正是由于組限劃分不當(dāng)將最密集的55-65段變量值拆散在兩個(gè)組內(nèi),造成了高工資組分布最多的假象。組限66組距數(shù)列掩蓋了分布在組內(nèi)各單位的實(shí)際變量值。為了反映各組中個(gè)體單位變量值的一般水平,統(tǒng)計(jì)工作中往往用組中值來(lái)代表它。組中值是組內(nèi)變量范圍的中間數(shù)值,通??筛鶕?jù)備組的上限、下限進(jìn)行簡(jiǎn)單平均,即:例如:組中值67

組中值68用組中值來(lái)代表組內(nèi)變量值的一般水平有一個(gè)必要的前提:各單位的變量值在本組范圍內(nèi)呈均勻分布或在組中值兩側(cè)呈對(duì)稱(chēng)分布。完全具備這一條件實(shí)際上是不可能的。我們?cè)趧澐指鹘M組限時(shí),必須考慮使各組內(nèi)變量值的分布盡可能滿足這一要求,以減少用組中值代表各組變量值一般水平時(shí)所造成的誤差。此外,為了統(tǒng)計(jì)分析計(jì)算的方便,還應(yīng)力求使組中值能取整齊的數(shù)值。組中值69在編制組距數(shù)列時(shí),為了避免出現(xiàn)空白組,同時(shí)又能使個(gè)別變量離差較大的單位不致于無(wú)組可歸,往往在首末兩組使用“××以下”及“××以上”的不確定組限的形式。這種形式叫做“開(kāi)口組”。為進(jìn)行統(tǒng)計(jì)分橋,有時(shí)也要假定開(kāi)口組的組限,并計(jì)算其組中值。一般可按相鄰組的組距來(lái)計(jì)算“開(kāi)口組”的假定的組限.然后再計(jì)算組中值。計(jì)算式為,首組假定下限=首組上限-鄰組組距………………(4)末組假定上限=末組下限+鄰組組距………………(5)組中值70次數(shù)是分布在各組中的個(gè)體單位數(shù)。如用相對(duì)數(shù)形式表示便是比率。比率是一種結(jié)構(gòu)相對(duì)數(shù),各組比率之和應(yīng)等于1或100%。各組次數(shù)或比率的大小意味著相應(yīng)的變量值在決定總體數(shù)量表現(xiàn)中所起的作用不同。次數(shù)或比率大的組,其變量值在決定總體數(shù)量表現(xiàn)中的作用就大,反之就小。

一、次數(shù)分布的特征71由于社會(huì)經(jīng)濟(jì)現(xiàn)象性質(zhì)的不同,各種統(tǒng)計(jì)總體都有不同的次數(shù)分布,形成各種不同類(lèi)型的分布特征。研究各種類(lèi)型的次數(shù)分布特征對(duì)于準(zhǔn)確認(rèn)識(shí)不同社會(huì)經(jīng)濟(jì)性質(zhì)的變量在形成總體數(shù)量表現(xiàn)中的作用有著重要的意義。

一、次數(shù)分布的概念72表示法——即用統(tǒng)計(jì)表來(lái)表示次數(shù)分布,并可列入累計(jì)次數(shù)。例如,前舉某班學(xué)生統(tǒng)計(jì)學(xué)考分的次數(shù)分布可以列成如下的統(tǒng)計(jì)表4—19:次數(shù)分布的表示法1.表示法73表中:70一80分組的次數(shù)為11人,比率為27.5%,表示考分在70一80分范圍內(nèi)的學(xué)生共11人,占全班學(xué)生的27.5%。向上累計(jì)次數(shù)及比率是將各組次數(shù)和比率由變量值低的組向變量值高的組累計(jì),各累計(jì)數(shù)的意義是備組上限以下的累計(jì)次或累計(jì)比率。向下累計(jì)次數(shù)及比率是將各組次數(shù)和比率由變量值高的組向變量值低的組累計(jì),各累計(jì)數(shù)的意義是各組下限以上的累計(jì)次數(shù)或累計(jì)比率。次數(shù)分布的表示法1.表示法74圖示法:即用統(tǒng)計(jì)圖形來(lái)表示次數(shù)分布的方法。常用的有三種:直方圖折線圖曲線圖次數(shù)分布的表示法2.圖示法75直方圖,即用直方形的寬度和高度來(lái)表示次數(shù)分布的圖形。如鋸表4-19資料可繪制直方圖如圖4-3。次數(shù)分布的表示法(1)直方圖2.圖示法76繪制直方圖時(shí),橫軸表示各組組限,縱軸表示次數(shù)(一般標(biāo)在左方)和比率(一般標(biāo)在右方),沒(méi)有比率的直方圖只保留左側(cè)次數(shù)。然后按分布在各組的次數(shù)及比率確定各組在縱軸上的坐標(biāo),并依據(jù)備組組距的寬度與次數(shù)的高度繪成直方形。次數(shù)分布的表示法2.圖示法(1)直方圖77遇到異距數(shù)列時(shí),則通常按次數(shù)密度繪制直方聞以表示共分布,如圖4-2所示。

直方圖一般不用來(lái)表示累計(jì)次數(shù)的分布。次數(shù)分布的表示法2.圖示法(1)直方圖78折線圖可以在直方圖的基礎(chǔ)上,用組中值與次數(shù)求坐標(biāo)點(diǎn)連接而成,它表示次數(shù)分布的圖形。如據(jù)表4-19資料可繪制折線圖如圖4-4。次數(shù)分布的表示法2.圖示法(2)折線圖79折線圖還可以用來(lái)表示累計(jì)次數(shù)的分布。根據(jù)表4-19的資料可以繪制兩種累計(jì)次數(shù)分布折線圖,如圖4-5。

次數(shù)分布的表示法2.圖示法(2)折線圖80累計(jì)次數(shù)分布折線圖的畫(huà)法和次數(shù)分布折線圖有些不同。畫(huà)遞增累計(jì)分布折線圖時(shí),從首組下限開(kāi)始,將各累計(jì)次數(shù)組的上限的縱坐標(biāo)連接起來(lái)。畫(huà)遞減累計(jì)分布折線圖時(shí),從末組的上限開(kāi)始,將各累計(jì)次數(shù)組的下限的縱坐標(biāo)連接起來(lái)。次數(shù)分布的表示法2.圖示法(2)折線圖81當(dāng)變量值非常多,變量數(shù)列的組數(shù)無(wú)限增多時(shí),折線便近似地表現(xiàn)為一條平滑的曲線。曲線圖是組數(shù)趨向于無(wú)限多時(shí)折線圖的極限描繪,是一種理論曲線。它實(shí)質(zhì)上是對(duì)應(yīng)于連續(xù)變量的次數(shù)或比率分布的函數(shù)關(guān)系圖。曲線圖的繪制方法與折線圖基本相同,只是連接各組次數(shù)坐標(biāo)點(diǎn)的線段應(yīng)當(dāng)用平滑曲線而不用折線。

根據(jù)表4-19的資料,可以近似地畫(huà)成如下的次數(shù)分布曲線圖。如圖4-6。

次數(shù)分布的表示法2.圖示法(3)曲線圖82

次數(shù)分布的表示法2.圖示法(3)曲線圖83根據(jù)表4-19的資料,也可以繪制如下兩種近似的累計(jì)次數(shù)分布曲線圖。如圖4-7。

次數(shù)分布的表示法2.圖示法(3)曲線圖84洛倫茨曲線累計(jì)頻數(shù)(頻率)分布曲線,可用于分析社會(huì)財(cái)富、土地和工資收入等的分配是否公平的問(wèn)題。該曲線圖是由美國(guó)洛倫茨博士提出,故稱(chēng)為洛倫茨曲線。洛倫茨曲線某國(guó)家收入所得的分配情況按收入所得水平分組人口收入累計(jì)收入的(%)人口數(shù)(萬(wàn)人)結(jié)構(gòu)%累計(jì)%月收入額(億美元)結(jié)構(gòu)%實(shí)際累計(jì)%絕對(duì)平等絕對(duì)不平等最低中下等中等較高最高128.5348.0466.945.611.012.8534.8046.694.561.112.8547.6594.3498.91001.574.0816.337.541.8851352246518709410012.8547.6594.3498.91000000100合計(jì)1000.0100.0__31.40100______8520406080100806040200100絕對(duì)平等線實(shí)際收入分配線絕對(duì)不平等線絕對(duì)不平等線人口(%)收入(%)洛倫茨曲線AB86洛倫茨曲線與基尼系數(shù)

20世紀(jì)初意大利經(jīng)濟(jì)學(xué)家基尼,根據(jù)洛倫茨曲線找出了判斷分配平等程度的指標(biāo)。實(shí)際收入分配曲線和收入分配絕對(duì)平等曲線之間的面積為A,實(shí)際收入分配曲線右下方的面積為B。以A除以A+B的商表示不平等程度。這個(gè)數(shù)值被稱(chēng)為基尼系數(shù)或稱(chēng)洛倫茨系數(shù)。87洛倫茨曲線與基尼系數(shù)當(dāng)A=0時(shí),A/(A+B)=0,則基尼系數(shù)為0,收入分配完全平等;當(dāng)B=0時(shí),A/(A+B)=1,則基尼系數(shù)為1,收入分配絕對(duì)不平等;所以,基尼系數(shù)可在0和1之間取任何值。

聯(lián)合國(guó)有關(guān)組織規(guī)定:若低于0.2表示收入絕對(duì)平均;0.2-0.3表示比較平均;0.3-0.4表示相對(duì)合理;0.4-0.5表示收入差距較大;0.6以上表示收入差距懸殊。基尼系數(shù)還可用于財(cái)產(chǎn)、資本、資源、產(chǎn)品、市場(chǎng)等資源分配均衡程度的分析。88各種不同性質(zhì)的社會(huì)經(jīng)濟(jì)現(xiàn)象都有著特殊的次數(shù)分布。概括起來(lái),主要有下列四種類(lèi)型:鐘形分布水平分布U形分布J形分布

次數(shù)分布的主要類(lèi)型891.鐘形分布鐘形分布的符征是“兩頭小、中間大”,即靠近中間的變量值分布的次數(shù)多,靠近兩端的變量值分布的次數(shù)少。繪成曲線圖,宛如一口古鐘。次數(shù)分布的主要類(lèi)型90鐘形分布具體可分為對(duì)稱(chēng)分布和非對(duì)稱(chēng)分布。對(duì)稱(chēng)分布的特征是中間變量值分布的次數(shù)最多,兩側(cè)變量值分布的次數(shù)則隨著與中間變量值距離的增大而漸次減少,并且圍繞中心變量值兩側(cè)呈對(duì)稱(chēng)分布,如圖4—8①。

次數(shù)分布的主要類(lèi)型91對(duì)稱(chēng)分布中的正態(tài)分布最為重要,許多社會(huì)經(jīng)濟(jì)現(xiàn)象統(tǒng)計(jì)總體的分布都趨近于正態(tài)分布。例如,農(nóng)業(yè)平均畝產(chǎn)量的分布、零件公差的分布、商品市場(chǎng)價(jià)格的分布等。正態(tài)分布在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)中具有重要意義。在非對(duì)稱(chēng)的分布中,有不同方向的偏態(tài),如圖4—8②、②所示。關(guān)于偏態(tài)分布及其偏斜度的測(cè)定問(wèn)題,將在本書(shū)第七章中論述。次數(shù)分布的主要類(lèi)型92

次數(shù)分布的主要類(lèi)型932.水平分布水平分布的特征是總體內(nèi)各個(gè)變量值分布的次數(shù)大體相等,繪成圖形,表現(xiàn)為一條平行于橫鈾的水平線,如圖4-9。次數(shù)分布的主要類(lèi)型94例如,某些必需而用途又比較狹窄的商品(如喪葬用品)的價(jià)格,需求彈性小,不論價(jià)格如何變化,而需求量變動(dòng)不大。需求量按價(jià)格水平分組便呈現(xiàn)水平分布?,F(xiàn)實(shí)生活中嚴(yán)格的水平分布是比較少見(jiàn)的,但對(duì)這種分布的研究,在統(tǒng)計(jì)理論上有著特殊的意義。次數(shù)分布的主要類(lèi)型953.U形分布U形分布的待征與鐘形分布恰恰相反,靠近兩端的變量值分布的次數(shù)多,靠近中間的變量值分布的次數(shù)少,形成“兩頭高、中間低”的分布持征。繪成曲線圖,象英文字母“U”字。圖形如圖4—30。次數(shù)分布的主要類(lèi)型96有些社會(huì)經(jīng)濟(jì)現(xiàn)象的分布表現(xiàn)為U形分布,例如人口死亡率分布。由于人口總體中幼兒死亡人數(shù)和老年死亡人數(shù)均較高,而中年死亡人數(shù)最低,因而按年齡分組的人口死亡率便表現(xiàn)為U形分布。次數(shù)分布的主要類(lèi)型974.J形分布J形分布有兩種類(lèi)型。正J形分布是次數(shù)隨著變量值的增大而增多,繪成曲線圖,猶如英文字母“J”字。反J形分布是次數(shù)隨著變量值的增大而減少,繪成曲線圖,猶如反寫(xiě)的英文字母“J”字,圖形如下:次數(shù)分布的主要類(lèi)型98在社會(huì)經(jīng)濟(jì)現(xiàn)象中,有一些統(tǒng)計(jì)總體呈J形分布。例如,資本主義社會(huì)中,投資額按利潤(rùn)率大小分布,一般均呈正J形分布;而人口總體按年齡大小分布,則一般均呈反J分布。次數(shù)分布的主要類(lèi)型99第三章統(tǒng)計(jì)資料整理§1統(tǒng)計(jì)整理的一般問(wèn)題§2統(tǒng)計(jì)分組§3次數(shù)分布§4數(shù)據(jù)顯示100

§4數(shù)據(jù)顯示

統(tǒng)計(jì)表統(tǒng)計(jì)圖101統(tǒng)計(jì)表

將統(tǒng)計(jì)數(shù)據(jù)按一定的順序排列在表格上,就形成了統(tǒng)計(jì)表。從廣義講,統(tǒng)計(jì)表包括統(tǒng)計(jì)工作各階段

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論