統(tǒng)計(jì)整理數(shù)據(jù)分析_第1頁(yè)
統(tǒng)計(jì)整理數(shù)據(jù)分析_第2頁(yè)
統(tǒng)計(jì)整理數(shù)據(jù)分析_第3頁(yè)
統(tǒng)計(jì)整理數(shù)據(jù)分析_第4頁(yè)
統(tǒng)計(jì)整理數(shù)據(jù)分析_第5頁(yè)
已閱讀5頁(yè),還剩61頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章數(shù)據(jù)整理和次數(shù)分布1主要內(nèi)容第一節(jié)統(tǒng)計(jì)數(shù)據(jù)整理的概述第二節(jié)統(tǒng)計(jì)分組第三節(jié)分配數(shù)列第四節(jié)統(tǒng)計(jì)表和統(tǒng)計(jì)圖2一、數(shù)據(jù)審核(DataAuditing)是指在進(jìn)行數(shù)據(jù)整理之前對(duì)原始數(shù)據(jù)的審查與核對(duì)。數(shù)據(jù)整理是按照數(shù)據(jù)分析的要求進(jìn)行的,數(shù)據(jù)分析的思路和目的決定著數(shù)據(jù)整理的分類或分組?;谌祟愓J(rèn)識(shí)活動(dòng)的漸進(jìn)性,往往需要采用不同的分組方式對(duì)原始數(shù)據(jù)進(jìn)行反復(fù)整理,以便得出正確的認(rèn)識(shí)結(jié)論。第一節(jié)統(tǒng)計(jì)數(shù)據(jù)整理的概述3二、數(shù)據(jù)審核的內(nèi)容1、時(shí)效性的審核檢查是否在規(guī)定的調(diào)查時(shí)間內(nèi)完成數(shù)據(jù)的搜集工作,采集的數(shù)據(jù)是否為規(guī)定調(diào)查時(shí)點(diǎn)上或規(guī)定的調(diào)查時(shí)段內(nèi)的數(shù)量特征,以保證統(tǒng)計(jì)數(shù)據(jù)在時(shí)間上的準(zhǔn)確性和可比性。2、準(zhǔn)確性的審核檢查是否每一調(diào)查單位的特征都無(wú)偏差、無(wú)失真、準(zhǔn)確無(wú)誤地記錄在登記資料中,抽樣調(diào)查的誤差是否有效地控制在規(guī)定的范圍內(nèi).

3、一致性的審核檢查統(tǒng)計(jì)數(shù)據(jù)在時(shí)間和空間上的連續(xù)性和可比性。4三、數(shù)據(jù)審核的方式1、邏輯審核檢查原始數(shù)據(jù)中各項(xiàng)數(shù)據(jù)是否合理的數(shù)據(jù)審核方式。要求檢查人員具備較強(qiáng)的邏輯推理能力和豐富的專業(yè)知識(shí)及數(shù)據(jù)審核經(jīng)驗(yàn)。2、技術(shù)審核對(duì)調(diào)查數(shù)據(jù)原始登記表和其他原始材料進(jìn)行機(jī)械性核對(duì)的數(shù)據(jù)審核方式。由于技術(shù)檢查是一種機(jī)械性的核對(duì),一般可采用專門的計(jì)算機(jī)軟件來(lái)實(shí)現(xiàn)。5四、數(shù)據(jù)的排序數(shù)據(jù)排序是指將一組數(shù)據(jù)按照大小、高低、優(yōu)劣等順序進(jìn)行依次排列的過(guò)程。數(shù)據(jù)排序?yàn)橛?jì)算取值范圍、最大值、最小值等總體參數(shù)提供了便利,有助于人們了解數(shù)據(jù)大致的分布狀態(tài)。數(shù)據(jù)排序也是有效地進(jìn)行數(shù)據(jù)分類或分組的前期準(zhǔn)備工作。數(shù)據(jù)排序可以使用計(jì)算機(jī)軟件來(lái)實(shí)現(xiàn),Excel就具有很強(qiáng)的數(shù)據(jù)排序功能。6第二節(jié)統(tǒng)計(jì)分組一、統(tǒng)計(jì)分組的概念統(tǒng)計(jì)分組就是根據(jù)統(tǒng)計(jì)研究的需要,將統(tǒng)計(jì)總體按照一定的標(biāo)志區(qū)分為若干個(gè)不同類型或性質(zhì)的部分的一種統(tǒng)計(jì)方法。統(tǒng)計(jì)分組具有兩方面含義:對(duì)總體而言是“分”,即將總體分為性質(zhì)相異的若干部分。對(duì)總體單位而言則是“合”,即將性質(zhì)相同的總體單位組合起來(lái)。7二、統(tǒng)計(jì)分組的作用與原則1、統(tǒng)計(jì)分組的作用(P40-42)劃分現(xiàn)象的類型;揭示現(xiàn)象的內(nèi)部結(jié)構(gòu);分析現(xiàn)象之間的內(nèi)在關(guān)系:正依存關(guān)系:現(xiàn)象之間成同向變動(dòng)負(fù)依存關(guān)系:現(xiàn)象之間成反向變動(dòng)2、統(tǒng)計(jì)分組的原則窮盡原則:組數(shù)有限且不宜過(guò)多?;コ庠瓌t:組間的差異、界限要分明。8※三、分組標(biāo)志的選擇(一)選擇分組標(biāo)志的原則

P421.目的性原則:根據(jù)研究問(wèn)題的目的選擇分組標(biāo)志。2.本質(zhì)性原則:選擇最能反映現(xiàn)象本質(zhì)特征的標(biāo)志分組。例如反映家庭生活水平的因素:總收入?平均收入?研究學(xué)生的學(xué)習(xí)狀況:成績(jī)?性別?年齡?籍貫?3.具體條件原則:結(jié)合現(xiàn)象所處的具體歷史條件或經(jīng)濟(jì)條件選擇分組標(biāo)志。9(二)統(tǒng)計(jì)分組的種類1.按分組標(biāo)志個(gè)數(shù)不同分為:簡(jiǎn)單分組與復(fù)合分組P44標(biāo)志人數(shù)(人)比重(%)按性別分組男性女性按企業(yè)性質(zhì)分組國(guó)有企業(yè)獨(dú)資企業(yè)其他企業(yè)按規(guī)模分組大型企業(yè)中型企業(yè)小型企業(yè)簡(jiǎn)單分組10工業(yè)企業(yè)按經(jīng)營(yíng)組織形式和規(guī)模大小同時(shí)進(jìn)行分組按經(jīng)營(yíng)組織形式分組:按規(guī)模分組:

大型企業(yè)

內(nèi)資企業(yè)

中型企業(yè)

小型企業(yè)

大型企業(yè)港澳臺(tái)商投資經(jīng)營(yíng)企業(yè)

中型企業(yè)

小型企業(yè)

大型企業(yè)外商投資經(jīng)營(yíng)企業(yè)

中型企業(yè)

小型企業(yè)復(fù)合分組11

2.按分組標(biāo)志性質(zhì)不同可分為:

品質(zhì)標(biāo)志分組和數(shù)量標(biāo)志分組標(biāo)志人數(shù)(人)比重(%)按性別分組男性女性按產(chǎn)值分組大型企業(yè)中型企業(yè)小型企業(yè)品質(zhì)標(biāo)志分組數(shù)量標(biāo)志分組121)品質(zhì)標(biāo)志分組:對(duì)總體按照品質(zhì)標(biāo)志分組,如人口按性別分組;企業(yè)按所有制、行業(yè)分組等屬于簡(jiǎn)單分組;復(fù)雜分組有國(guó)家制定統(tǒng)一的分類目錄。(P44)2)數(shù)量標(biāo)志分組:對(duì)總體按照數(shù)量標(biāo)志分組,具體又分為以下兩種情況:①單項(xiàng)式分組:是以一個(gè)變量值為一組的分組方法,只適用于離散型變量的分組。13②組距式分組:是按變量變動(dòng)的一定區(qū)間來(lái)分組的方法。既適用于連續(xù)型變量,也適用于離散型變量。具體又分為以下兩種情況:

等距分組與異距分組:根據(jù)變量值變動(dòng)的均勻性來(lái)確定。均勻變動(dòng)的變量適合用等距分組,否則應(yīng)選擇異距分組。說(shuō)明:離散型變量采用單項(xiàng)式分組還是組距式分組主要取決于變量值的多少和變量值變動(dòng)范圍的大小,變量值少且變動(dòng)范圍小的用單項(xiàng)式分組,反之用組距式分組。14一、分配數(shù)列的概念和種類(一)分配數(shù)列的概念(P46)在數(shù)據(jù)分組的基礎(chǔ)上,將總體的所有單位按組歸類整理,并按一定的順序排列,形成總體中各個(gè)單位在各組間的分布就稱為分配數(shù)列(次數(shù)分布)。分布在各組的總體單位數(shù)叫次數(shù)或頻數(shù),各組次數(shù)與總次數(shù)之比叫比重或頻率?!?/p>

第三節(jié)分配數(shù)列15(二)分配數(shù)列的種類分配數(shù)列

單項(xiàng)式數(shù)列組距式數(shù)列等距分組異距分組品質(zhì)分配數(shù)列(品質(zhì)數(shù)列)數(shù)量分配數(shù)列(變量數(shù)列)16中國(guó)2005年人口狀況品質(zhì)分配數(shù)列按性別分組絕對(duì)人數(shù)(萬(wàn)人)比重(%)男67375

51.5女63381

48.5合計(jì)130756100.00各組名稱次數(shù)或頻數(shù)比率或頻率(品質(zhì)分組標(biāo)志)(品質(zhì)分組標(biāo)志)17變量數(shù)列——單項(xiàng)式數(shù)列

某企業(yè)工人平均日產(chǎn)量(離散變量)按平均日產(chǎn)量分組(件)(χ)工人數(shù)絕對(duì)數(shù)(f)比重(%)(fi/Σf)1920212223153045352010.3420.6931.0424.1413.79合計(jì)145100.00變量次數(shù)比率或頻率18變量數(shù)列——等距數(shù)列

某廠工人生產(chǎn)定額完成情況表(連續(xù)變量)工人按完成生產(chǎn)定額分組(%)(χ)工人數(shù)絕對(duì)數(shù)(f)比重(%)(fi/Σf)80-9090-100100-110110-120120-130304060302016.722.233.316.711.1合計(jì)180100.0變量次數(shù)比率或頻率19二、單項(xiàng)式數(shù)列的編制1、對(duì)變量值排序通常按照由小到大的順序來(lái)排列。例如,某生產(chǎn)車間21名工人日加工零件數(shù)資料如下:

117108110117110117130114110114128120110120108117124114120117124202、某車間21名工人日加工零件分組表日產(chǎn)生零件數(shù)次數(shù)或頻數(shù)(人)10821104114311751203124212811301合計(jì)2121三、組距數(shù)列的編制(一)組距與組數(shù)首先對(duì)已取得的調(diào)查數(shù)據(jù)進(jìn)行排序(P48)。1、組、組限和組距的概念在組距數(shù)列中用變量變動(dòng)的一定范圍代表一個(gè)組。每個(gè)組的最小值為該組的下限,最大值為該組的上限,下限與上限合稱為組限,每個(gè)組上限和下限之間的距離稱為組距。22

2、組數(shù)和組距的關(guān)系組數(shù):即整個(gè)組距數(shù)列中所包含的組的個(gè)數(shù)組數(shù)的多少和組距的大小成反向變動(dòng)關(guān)系:組距大則組數(shù)少,組距小則組數(shù)多。因此,組距的大小會(huì)直接影響組數(shù)的多少。確定組距的原則:體現(xiàn)組內(nèi)資料的同質(zhì)性和組間資料的差異性。一般取5~~10的倍數(shù)為宜。學(xué)生按考試成績(jī)分組:23某班學(xué)生《統(tǒng)計(jì)學(xué)》考試成績(jī)統(tǒng)計(jì)表考試成績(jī)?nèi)藬?shù)(次數(shù))比重(%)50—6025.060—70717.570—801127.580—901230.090—100820.0合計(jì)40100.0不及格及格中等良好優(yōu)秀體現(xiàn)組內(nèi)資料的同質(zhì)性和組間資料的差異性24(二)等距分組和異距分組按組距是否相等可將組距數(shù)列分為:1、等距數(shù)列:是指各組組距都相等的組距數(shù)列。適用范圍:適用于變量值變動(dòng)比較均勻的現(xiàn)象,即各組間性質(zhì)差異是由變量值均勻增加或減少而引起的。(P50)例如,成績(jī)、身高、體重、計(jì)劃完成程度等。25等距數(shù)列可繪制次數(shù)分布直方圖和次數(shù)分布折線圖,直方圖的面積與折線圖所圍成的面積相等。折線兩端應(yīng)在直方圖的左右兩邊各延伸一個(gè)假想組,并連接至假想組的中點(diǎn)。根據(jù)分組表繪制次數(shù)分布直方圖次數(shù)分布折線圖26某班學(xué)生統(tǒng)計(jì)學(xué)考試成績(jī)表考分人數(shù)(人)比重(%)50—6025.060—70717.570—801127.580—901230.090—100820.0合計(jì)40100.02728292、異距數(shù)列:指各組組距不完全相等的組距數(shù)列。1)適用范圍:當(dāng)總體的分布存在明顯的偏斜狀況時(shí),變量不適合等距分組;總體單位的變量變動(dòng)范圍較大,若變量按一定比例關(guān)系發(fā)展變化的話可按等比間隔分組編制異距數(shù)列(P52)。例如,煉鋼高爐按容積(m3)的異距分組為:

30

鋼爐容積(m3)

組距

100以下—100—200100200—400200400—800400800—16008001600以上—

組距間隔等比為2312)次數(shù)密度與頻率密度在異距數(shù)列中,由于各組組距不完全相同,因此分布在各組中的次數(shù)就不具有可比性。要使各組的次數(shù)可比,必須要消除組距不同的影響將不等組距的次數(shù)換算為標(biāo)準(zhǔn)組距次數(shù)。標(biāo)準(zhǔn)組距的確定:選擇數(shù)列中最小的組距。次數(shù)密度:?jiǎn)挝唤M距內(nèi)分布的次數(shù)。公式:次數(shù)密度=各組次數(shù)÷各組組距頻率密度:?jiǎn)挝唤M距內(nèi)分布的頻率。公式:32頻率密度=各組頻率÷各組組距通過(guò)標(biāo)準(zhǔn)組距次數(shù)或次數(shù)密度將異距數(shù)列中不可比的各組次數(shù)換算成可比的各組次數(shù),并可根據(jù)標(biāo)準(zhǔn)組距次數(shù)或次數(shù)密度來(lái)繪制次數(shù)分布直方圖和次數(shù)分布折線圖,用以反映總體的數(shù)量分布特征?,F(xiàn)以某廠工人年齡分布情況為例,將上述兩種方法的換算結(jié)果列成表格,并繪制次數(shù)分布直方圖和次數(shù)分布折線圖,并與等距數(shù)列進(jìn)行比較。33某廠工人年齡分布情況表工人按年齡分組組距人數(shù)(人)標(biāo)準(zhǔn)組距人數(shù)次數(shù)密度15—20517173.420—25528285.625—3054040830—35570701435—45106532.56.545—50510102合計(jì)—230——標(biāo)準(zhǔn)組距為組距最小值534年齡人數(shù)未經(jīng)處理的異距數(shù)列直方圖35次數(shù)密度某廠工人年齡次數(shù)分布直方圖異距數(shù)列標(biāo)準(zhǔn)組距人數(shù)年齡36標(biāo)準(zhǔn)組距人數(shù)異距數(shù)列ABCD某廠工人年齡次數(shù)分布折線圖次數(shù)密度年齡B+D與A+C哪一個(gè)要大一些?37(三)組限與組中值1、組限:組距兩端的數(shù)值稱為組限。組限的確定也是統(tǒng)計(jì)分組中的重要問(wèn)題。確定組限的原則:

①體現(xiàn)組內(nèi)的同質(zhì)性和組間的差異性

②“上組限不在內(nèi)”原則只要遵循“上組限不在內(nèi)”的原則,無(wú)論是連續(xù)變量還是離散變量均可以采用相鄰兩組的上限和下限共用同一個(gè)數(shù)值做組限的方法。382、組中值:是各組變量范圍的中間數(shù)值,可以根據(jù)各組的上限與下限的簡(jiǎn)單平均數(shù)來(lái)確定。組中值=(上限+下限)÷2為什么要計(jì)算組中值原因:組距數(shù)列是按變量變動(dòng)的一段區(qū)間來(lái)分組的,它掩蓋了分布在各組內(nèi)的各單位的實(shí)際變量值。為了反映每一組變量值的一般水平,統(tǒng)計(jì)上就用組中值來(lái)代表每一組變量值的一般水平。例:39學(xué)生按體重(公斤)進(jìn)行分組:40以下39.9以下39.99以下40—4540—44.940—44.9945—5045—49.945—49.9950—5550—54.950—54.9955—6055—59.955—59.9960—6560—64.960—64.9965以上65以上65以上40某班學(xué)生統(tǒng)計(jì)學(xué)成績(jī)分布情況表考試成績(jī)?nèi)藬?shù)(人)組中值50—6025560—7076570—80117580—90128590—100895合計(jì)40—組中值=(上限+下限)÷2

=

下限+組距/2=上限-組距/2413、開口組組中值的確定:開口組:是組限不齊全的組,可分為有上限缺下限和有下限缺上限兩種。缺上限的開口組組中值=缺下限的開口組組中值=42完成凈產(chǎn)值(億元)企業(yè)數(shù)(個(gè))組中值10以下20510—20701520—30952530—402103540—70605570以上4585合計(jì)500—

5=10-(20-10)÷285=70+(70-40)÷2開口組開口組國(guó)有工業(yè)企業(yè)凈產(chǎn)值完成情況分組表43四、累計(jì)次數(shù)分布(一)次數(shù)分布:是指總體中各單位數(shù)在各組間的分布。次數(shù)分布是統(tǒng)計(jì)研究的一個(gè)基本課題,通過(guò)次數(shù)的分布規(guī)律,可以研究大量現(xiàn)象的統(tǒng)計(jì)規(guī)律性。P54(二)累計(jì)次數(shù)分布:是指將變量數(shù)列各組的次數(shù)和頻率逐組累計(jì)相加而成的。有兩種累計(jì)方法:441.向上累計(jì)(較小制累計(jì),上限以下累計(jì))是將各組次數(shù)或比率,由變量值低的組向變量值高的組逐組累計(jì)的方法。含義:表明各組上限以下總共所包含的總體次數(shù)或比率有多少。45是將各組次數(shù)或比率,由變量值高的組向變量值低的組逐組累計(jì)的方法。含義:表明各組下限以上總共所包含的總體次數(shù)或比率有多少。2.向下累計(jì)(較大制累計(jì),下限以上累計(jì))46某班統(tǒng)計(jì)學(xué)考試成績(jī)次數(shù)分配表次數(shù)向上累計(jì)向下累計(jì)人數(shù)(人)比率(%)人數(shù)(人)比率(%)人數(shù)(人)比率(%)50—6025.025.040100.060—70717.5922.53895.070—801127.52050.03177.580—901230.03280.02050.090—100820.040100.0820.0合計(jì)40100.0————考分47(三)累計(jì)次數(shù)的特點(diǎn):(P55)同一數(shù)值的向上累計(jì)和向下累計(jì)次數(shù)之和等于總體總次數(shù),而累計(jì)比率之和等于1或100%。單項(xiàng)數(shù)列也可以計(jì)算累計(jì)次數(shù)和累計(jì)比率。累計(jì)次數(shù)分布是確定各種位置平均數(shù)的依據(jù);累計(jì)次數(shù)分布圖還可以用于研究社會(huì)財(cái)富分配的公平程度等問(wèn)題。累計(jì)次數(shù)分布折線圖見下表:48考分累計(jì)次數(shù)分布折線圖4038312082920324049

五、次數(shù)分布的類型(一)鐘型分布特點(diǎn):“兩頭小中間大”,即兩頭次數(shù)分布少,中間次數(shù)分布多。變量次數(shù)a.對(duì)稱分布(正態(tài)分布)

中軸線兩邊的圖形完全對(duì)稱。50b.右偏分布:當(dāng)變量值中存在極大值時(shí),次數(shù)分布曲線就會(huì)向右延伸,即右偏。次數(shù)變量051C.左偏分布:當(dāng)變量值中存在極小值時(shí),次數(shù)分布曲線就會(huì)向左延伸,即左偏。許多社會(huì)經(jīng)濟(jì)現(xiàn)象都接近正態(tài)分布,如市場(chǎng)價(jià)格、學(xué)生成績(jī)、職工的工資等。次數(shù)變量52(二)U型分布特征:“兩頭大,中間小”,即中間變量值分布的次數(shù)少,兩端變量值分布的次數(shù)多。其分布圖形像英文字母“U”字。變量次數(shù)(d)U型分布053(三)J型分布特征:“一邊小,一邊大”,即大部分變量值集中在某一端分布,分布曲線圖像英文字母“J”字。具體分布有兩種類型:次數(shù)次數(shù)變量變量(e)正J型分布(f)反J型分布0054第四節(jié)統(tǒng)計(jì)表和統(tǒng)計(jì)圖一、統(tǒng)計(jì)表的定義與作用(一)統(tǒng)計(jì)表的定義:將通過(guò)匯總整理的系統(tǒng)化的統(tǒng)計(jì)資料,按一定順序填列在一定的表格內(nèi),這種表格稱為統(tǒng)計(jì)表。(二)作用:1.使大量統(tǒng)計(jì)資料系統(tǒng)化、條理化;2.便于比較各項(xiàng)目之間的關(guān)系和計(jì)算

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論