第三章、數(shù)據(jù)的整理及展示1_第1頁
第三章、數(shù)據(jù)的整理及展示1_第2頁
第三章、數(shù)據(jù)的整理及展示1_第3頁
第三章、數(shù)據(jù)的整理及展示1_第4頁
第三章、數(shù)據(jù)的整理及展示1_第5頁
已閱讀5頁,還剩66頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章、統(tǒng)計(jì)數(shù)據(jù)的整理和展示【學(xué)習(xí)目標(biāo)】了解統(tǒng)計(jì)數(shù)據(jù)的整理的意義掌握統(tǒng)計(jì)分組的方法掌握分配數(shù)列的編制方法熟悉統(tǒng)計(jì)表的結(jié)構(gòu)和編制方法熟悉統(tǒng)計(jì)圖的特征和繪制方法掌握Excel在統(tǒng)計(jì)數(shù)據(jù)整理的運(yùn)用第三章、統(tǒng)計(jì)數(shù)據(jù)的整理和展示第一節(jié)、統(tǒng)計(jì)數(shù)據(jù)的整理第二節(jié)、統(tǒng)計(jì)數(shù)據(jù)的展示第三節(jié)、統(tǒng)計(jì)數(shù)據(jù)整理中Excel的運(yùn)用第一節(jié)、統(tǒng)計(jì)數(shù)據(jù)的整理統(tǒng)計(jì)調(diào)查所收集到的統(tǒng)計(jì)數(shù)據(jù)是零星的、分散的、不系統(tǒng)的,他只能說明總體單位的情況,而不能反映總體的特征,不能深刻揭示現(xiàn)象的本質(zhì),更不能從量的方面反映現(xiàn)象發(fā)展變化的規(guī)律。根據(jù)統(tǒng)計(jì)研究預(yù)定的目的和任務(wù),運(yùn)用科學(xué)的方法和手段,有計(jì)劃、有組織的收集反映客觀現(xiàn)實(shí)的統(tǒng)計(jì)資料的工作過程。統(tǒng)計(jì)調(diào)查隨機(jī)抽取130位顧客的購物小票如下單位:元小票金額人數(shù)8以下468—162616—241624—321132--40840—48748—56356—64464—72372—80080以上1130位顧客的購物小票統(tǒng)計(jì)表一、統(tǒng)計(jì)數(shù)據(jù)的整理統(tǒng)計(jì)數(shù)據(jù)整理

根據(jù)統(tǒng)計(jì)研究任務(wù)的要求,將統(tǒng)計(jì)調(diào)查得到的原始資料進(jìn)行審核、分組、匯總,使之系統(tǒng)化、條理化,形成能夠反映總體特征的綜合統(tǒng)計(jì)資料的工作過程。統(tǒng)計(jì)整理主要內(nèi)容資料審核、分組、匯總、制表、制圖等。分組分配數(shù)列統(tǒng)計(jì)表統(tǒng)計(jì)圖統(tǒng)計(jì)數(shù)據(jù)整理的意義實(shí)現(xiàn)由反映總體單位特征的標(biāo)志向反映總體綜合特征的的統(tǒng)計(jì)指標(biāo)的轉(zhuǎn)化;是從對個(gè)體量的觀察到對總體量的認(rèn)識的連接點(diǎn);是人們對社會(huì)經(jīng)濟(jì)現(xiàn)象從感性認(rèn)識到理性認(rèn)識的過渡階段;是統(tǒng)計(jì)分析的前提和基礎(chǔ)。意義對原始資料進(jìn)行審核進(jìn)行統(tǒng)計(jì)分組加工匯總、編制分配數(shù)列制作統(tǒng)計(jì)表、繪制統(tǒng)計(jì)圖統(tǒng)計(jì)整理的程序根據(jù)統(tǒng)計(jì)研究的需要,按某種標(biāo)志(能反映現(xiàn)象的本質(zhì)特征)將總體中所有單位分為性質(zhì)不同但又有聯(lián)系的幾個(gè)部分的一種統(tǒng)計(jì)方法。統(tǒng)計(jì)分組(一)統(tǒng)計(jì)分組的意義和種類二、統(tǒng)計(jì)分組分組前分組后25%33%42%1、統(tǒng)計(jì)分組的意義:第一,分組的結(jié)果,對總體而言是“分”,對于個(gè)體而言是“合”。

第二,分組的結(jié)果,在同一組內(nèi)則保持著相同的性質(zhì)、組與組之間保持差異性。

品質(zhì)分組變量分組

2、統(tǒng)計(jì)分組的種類

(1)按照分組標(biāo)志的性質(zhì)

選擇反映事物屬性差異的品質(zhì)標(biāo)志作為分組標(biāo)志,并且在品質(zhì)標(biāo)志的變異范圍內(nèi)劃分各組界限,將總體劃分為若干性質(zhì)不同又有聯(lián)系的幾個(gè)部分。選擇反映事物數(shù)量差異的數(shù)量標(biāo)志作為分組標(biāo)志,并且在數(shù)量標(biāo)志的變動(dòng)范圍內(nèi)劃分各組界限,將總體劃分為若干性質(zhì)不同又有聯(lián)系的幾個(gè)部分。我國三種產(chǎn)業(yè)結(jié)構(gòu)(%)年份1980199020002004200520062007GDP100100100100100100100第一產(chǎn)業(yè)29.926.914.813.112.611.811.7第二產(chǎn)業(yè)48.241.345.946.247.548.749.2第三產(chǎn)業(yè)21.931.839.931.839.939.539.1按照產(chǎn)業(yè)類型(品質(zhì)標(biāo)志)分組統(tǒng)計(jì)學(xué)成績(分)學(xué)生人數(shù)(人)60以下60-7070-8080-9090-100合計(jì)

5

7

8

20

14

54某班同學(xué)《統(tǒng)計(jì)學(xué)》成績按照成績(數(shù)量標(biāo)志)分組某地區(qū)100個(gè)百貨商店月銷售額與流通費(fèi)用情況銷售額(萬元)每百元商品銷售額中支付的流通費(fèi)(元)2135363945454647…32936038718.316.917.215.614.714.213.612.9…8.27.17.6按銷售額分組(萬元)商店數(shù)(個(gè))每百元商品銷售額中支付的流通費(fèi)(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5某地區(qū)100個(gè)百貨商店月銷售額與流通費(fèi)用情況按照銷售額(數(shù)量標(biāo)志)分組簡單分組復(fù)合分組

即總體按一個(gè)標(biāo)志進(jìn)行分組。它只能從某一方面說明總體的分布狀況和內(nèi)部結(jié)構(gòu)。

復(fù)合分組是指對所研究的總體按兩個(gè)或兩個(gè)以上的標(biāo)志進(jìn)行的多層次分組??捎糜趯κ挛锒喾矫?、多層次的分析研究。

(2)按照分組標(biāo)志的多少統(tǒng)計(jì)學(xué)成績(分)學(xué)生人數(shù)(人)60以下60-7070-8080-9090-100合計(jì)

5

7

8

20

14

54某班同學(xué)《統(tǒng)計(jì)學(xué)》成績第一標(biāo)志(職務(wù))第二標(biāo)志(年齡)第三標(biāo)志(性別)高級職稱(教授、副教授)45歲以上男女45歲以下男女非高級職稱(講師、助教)45歲以上男女45歲以下男女某高校教師按照職務(wù)、年齡、性別進(jìn)行分組練習(xí):如何對下列資料進(jìn)行分組?某地200家企業(yè)的有關(guān)資料如下:(1)2000人以下的企業(yè)中全民企業(yè)10家,集體企業(yè)5家,合資企業(yè)3家(2)2000—3000人的企業(yè)中全民企業(yè)20家,集體企業(yè)34家,合資企業(yè)4家(3)3000—4000人的企業(yè)中全民企業(yè)15家,集體企業(yè)15家,合資企業(yè)2家(4)4000人以上的企業(yè)中全民企業(yè)20家,集體企業(yè)15家,合資企業(yè)1家職工人數(shù)經(jīng)濟(jì)類型企業(yè)個(gè)數(shù)2000人以下全民企業(yè)10集體企業(yè)5合資企業(yè)32000--3000全民企業(yè)20集體企業(yè)34合資企業(yè)43000--4000全民企業(yè)15集體企業(yè)15合資企業(yè)24000人以上全民企業(yè)20集體企業(yè)15合資企業(yè)1(二)分組標(biāo)志的選擇統(tǒng)計(jì)分組的關(guān)鍵是分組標(biāo)志的選擇分組標(biāo)志的選擇的正確與否關(guān)系到能否正確的反映總體的性質(zhì)特征,能否實(shí)現(xiàn)統(tǒng)計(jì)調(diào)查任務(wù)和目的。如:考察學(xué)生學(xué)習(xí)《統(tǒng)計(jì)學(xué)》的情況:性別、《統(tǒng)計(jì)學(xué)》成績?統(tǒng)計(jì)學(xué)成績(分)學(xué)生人數(shù)(人)60以下60-7070-8080-9090-100合計(jì)

5

7

8

20

14

54某班同學(xué)《統(tǒng)計(jì)學(xué)》成績分組標(biāo)志的選擇應(yīng)該注意的幾個(gè)問題分組標(biāo)志要根據(jù)統(tǒng)計(jì)調(diào)查目的和任務(wù)選擇。若干標(biāo)志中,要選擇最能反映事物本質(zhì)特征的標(biāo)志作為分組標(biāo)志。如:毛澤東的《對湖南農(nóng)民運(yùn)動(dòng)考察報(bào)告》中,對農(nóng)民進(jìn)行分組,根據(jù)研究目的——看農(nóng)民對中國革命的態(tài)度。于是根據(jù)階級成分劃分:地主、富農(nóng)、中農(nóng)、貧農(nóng)、赤貧。在分組過程中,毛也看到了生活水平的差異?,F(xiàn)在如果研究目的是看農(nóng)民的生活水平,絕對不能在以階級成分劃分,現(xiàn)在的分組標(biāo)志應(yīng)該是農(nóng)民家庭人均收入。(三)統(tǒng)計(jì)分組的方法品質(zhì)分組:選擇反映事物屬性差異的品質(zhì)標(biāo)志作為分組標(biāo)志,并且在品質(zhì)標(biāo)志的變異范圍內(nèi)劃分各組界限,將總體劃分為若干性質(zhì)不同又有聯(lián)系的幾個(gè)部分。變量分組:選擇反映事物數(shù)量差異的數(shù)量標(biāo)志作為分組標(biāo)志,并且在數(shù)量標(biāo)志的變動(dòng)范圍內(nèi)劃分各組界限,將總體劃分為若干性質(zhì)不同又有聯(lián)系的幾個(gè)部分。變量分組分為:單項(xiàng)式分組、組距式分組(等距分組、不等距分組)單項(xiàng)式分組:一個(gè)變量值為一組組距式分組:一個(gè)區(qū)間為一組“窮盡原則”和“互斥原則”?!案F盡原則”是指各分組必須容納所有總體單位,即總體中的每一個(gè)總體單位都必須有組的歸屬。如勞動(dòng)者按文化程度分組,分為小學(xué)、中學(xué)畢業(yè)、和大學(xué)畢業(yè)三組。“互斥原則”是指在特定的分組標(biāo)志下,總體中的任何一個(gè)單位不能同時(shí)歸屬于幾個(gè)組,而只能歸屬于某一組。如把鞋子分為男鞋、女鞋、童鞋三類,就不符合互斥原則。

三、分配數(shù)列分配數(shù)列的概念和分類變量數(shù)列的編制(重點(diǎn))次數(shù)分布的主要類型——統(tǒng)計(jì)分組整理、匯總的基本結(jié)果變量數(shù)列品質(zhì)數(shù)列將統(tǒng)計(jì)資料按某一標(biāo)志分成若干組后按照一定的分組順序,列出各組的總體單位數(shù),形成一個(gè)反應(yīng)總體單位在各組間分配情況的統(tǒng)計(jì)數(shù)列。分配數(shù)列分類不等距數(shù)列等距數(shù)列組距數(shù)列單項(xiàng)數(shù)列(一)分配數(shù)列的概念和分類分組標(biāo)志的具體表現(xiàn)(各組名稱)各組的次數(shù)(頻數(shù))構(gòu)成要素基本形式:分組單位數(shù)頻率(%)合計(jì)………100頻數(shù)分布頻率分布總體單位總量獲金牌項(xiàng)目

金牌數(shù)占總數(shù)比例跳水5枚0.1786舉重5枚0.1786乒乓球4枚0.1429羽毛球4枚0.1429體操3枚0.1071射擊3枚0.1071柔道2枚0.0714田徑1枚0.0357跆拳道1枚0.0357中國體育代表團(tuán)在悉尼奧運(yùn)會(huì)上獲金牌的項(xiàng)目品質(zhì)數(shù)列變量數(shù)列品質(zhì)數(shù)列種類通常我們用X表示變量,變量數(shù)列由兩串?dāng)?shù)字組成,一串?dāng)?shù)字為變量的不同取值,另一串為次數(shù)或頻率。

用表示變量值,表示次數(shù)。

用變量數(shù)列品質(zhì)數(shù)列種類異距數(shù)列等距數(shù)列組距數(shù)列單項(xiàng)數(shù)列變量數(shù)列按每個(gè)組的變量取值形式不同將若干個(gè)相鄰的變量值合并為一組,使每個(gè)組有一個(gè)變量值變動(dòng)范圍,以組距形式表示的變量數(shù)列。組距數(shù)列的每組變量值為一個(gè)區(qū)間。是按數(shù)量標(biāo)志分組后,用一個(gè)變量值代表一個(gè)組形成的數(shù)列。即一個(gè)變量值為一組。某地區(qū)100個(gè)百貨商店月銷售額與流通費(fèi)用情況銷售額(萬元)每百元商品銷售額中支付的流通費(fèi)(元)2135363945454647…32936038718.316.917.215.614.714.213.612.9…8.27.17.6按銷售額分組(萬元)商店數(shù)(個(gè))每百元商品銷售額中支付的流通費(fèi)(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5(1)單項(xiàng)數(shù)列的編制同時(shí)具備變量是離散變量變量值個(gè)數(shù)較少(二)變量數(shù)列的編制單項(xiàng)數(shù)列編制條件:單項(xiàng)數(shù)列一個(gè)變量值為一組的變量數(shù)列編制步驟排序匯總組單位數(shù)(次數(shù))

制作單項(xiàng)數(shù)列統(tǒng)計(jì)表【例】己知某車間有24名工人,他們的日產(chǎn)量(件)分別是:20,23,20,24,23,21,22,25,26,20,21,21,22,22,23,22,22,24,25,21,22,21,24,23.要求根據(jù)以上資料編制變量數(shù)列。日產(chǎn)量(件)X工人數(shù)(人)f202122232425263564321合計(jì)24編制結(jié)果如下:【例】統(tǒng)計(jì)某企業(yè)40名工人在一個(gè)工作日內(nèi)生產(chǎn)的零件數(shù)量。請根據(jù)表中資料編制單項(xiàng)數(shù)列。40名工人一個(gè)班次生產(chǎn)的零件數(shù)量找出最大值和最小值排序匯總組單位數(shù)(次數(shù))

制作單項(xiàng)數(shù)列統(tǒng)計(jì)表【解】作業(yè):思考與練習(xí)5編制單項(xiàng)數(shù)列統(tǒng)計(jì)表組距數(shù)列指每個(gè)組的變量值用一個(gè)區(qū)間來表現(xiàn)的變量數(shù)列(2)組距數(shù)列的編制變量是連續(xù)變量;總體單位數(shù)較多、變量值個(gè)數(shù)也較多的離散變量。

編制條件:變量值變動(dòng)區(qū)間的長度相等變量值變動(dòng)區(qū)間的長度不完全相等等距數(shù)列不等距數(shù)列注意:數(shù)據(jù)分組一般還與數(shù)據(jù)本身的特點(diǎn)及數(shù)據(jù)的多少有關(guān)。分組的目的是觀察數(shù)據(jù)分布的特征。組數(shù)太少則數(shù)據(jù)分布就會(huì)過于集中,組數(shù)太多數(shù)據(jù)分布就會(huì)過于分散,不便于觀察數(shù)據(jù)分布的特征和規(guī)律。一般情況下數(shù)據(jù)組數(shù)不少于5組且不多于15組。實(shí)際應(yīng)用中,可根據(jù)數(shù)據(jù)的多少和特點(diǎn)及分析的要求確定組數(shù)。組距數(shù)列的編制程序編制步驟或內(nèi)容計(jì)算組中值排序確定組限計(jì)算變異全距確定組數(shù)、組距匯總組單位數(shù)制作組距數(shù)列統(tǒng)計(jì)表編制組距數(shù)列將要使用的相關(guān)概念總的變異范圍。簡稱全距,用R來表示。變異全距變異全距的計(jì)算公式:指每組兩端表示各組界限的變量值,各組的最小值為下限L,最大值為上限U。組限當(dāng)首、末組組限采用“××以下”或“××以上”形式時(shí)。開口式組距數(shù)列相關(guān)概念每組變量值變動(dòng)區(qū)間的長度,為上下限之差組距每組變量取值范圍的中點(diǎn)數(shù)值組中值組中值=各組只包括本組下限變量值至本組上限以下變量值的單位。上組限不記入原則“××以上”組距數(shù)列的上限值“××以下”組距數(shù)列的下限值假定上限假定下限開口式組距數(shù)列組中值的計(jì)算:首組假定下限=首組上限-相鄰組組距末組假定上限=末組下限+相鄰組組距先計(jì)算開口組的假定上、下限:

因此有:首組組中值末組組中值某地區(qū)100個(gè)百貨商店月銷售額與流通費(fèi)用情況銷售額(萬元)商店數(shù)(個(gè))每百元商品銷售額中支付的流通費(fèi)(元)50以下50~100100~200200~300300以上102030251514.211.410.19.28.5上組限U下組限L如:組距d=U-L=100-50=50(萬元)如:組中值x=(U+L)/2=(100+200)/2=150(萬元)假定上限400假定下限040名工人一個(gè)班次生產(chǎn)的零件數(shù)量【例】統(tǒng)計(jì)某企業(yè)40名工人在一個(gè)工作日內(nèi)生產(chǎn)的零件數(shù)量。請根據(jù)表中資料編制組距數(shù)列。③確定組數(shù)及組距等距數(shù)列編制步驟:【解】①排序②計(jì)算變異全距計(jì)算組數(shù)(組數(shù)不宜過多,也不宜太少)計(jì)算組數(shù)(我們使用斯特基斯H.A.Sturges公式)其中,N是總體單位總數(shù)。編制等距數(shù)列本例中(當(dāng)?shù)慕Y(jié)果為整數(shù)時(shí))(當(dāng)?shù)慕Y(jié)果為小數(shù)時(shí))因此,取本例中,m=7,則有(當(dāng)?shù)慕Y(jié)果為整數(shù)時(shí))(當(dāng)?shù)慕Y(jié)果為小數(shù)時(shí))由于R≤組距(d)×組數(shù)(m)確定組距的原則:要能區(qū)分各組的性質(zhì)差異要能反映總體資料的分布特征為方便計(jì)算,盡可能為5或10的整數(shù)倍④確定組限對于離散變量,相鄰組組限可以間斷,也可重疊;對于連續(xù)變量,相鄰組組限必須重疊;符合“上組限不計(jì)入”原則;首末兩組可使用“××以下”及“××以上”的開口組。組限的表示方法日產(chǎn)量(件)組中值次數(shù)合計(jì)—試分組?日產(chǎn)量(件)組中值次數(shù)82以下82~8686~9090~9494~9898~102102以上合計(jì)—⑤計(jì)算次數(shù)日產(chǎn)量(件)組中值次數(shù)82以下82~8686~9090~9494~9898~102102以上04918531合計(jì)—40?日產(chǎn)量(件)組中值次數(shù)83以下83~8787~9191~9595~9999~103103以上131710621合計(jì)—40試分組?編制結(jié)果:日產(chǎn)量(件)組中值次數(shù)83以下83~8787~9191~9595~9999~103103以上131710621合計(jì)—40??⑥制作組距數(shù)列編制等距數(shù)列適用于總體單位的標(biāo)志值變動(dòng)比較均勻的情況實(shí)例己知某地區(qū)某年50個(gè)商店商品銷售額的資料如下(單位:百萬元):

7.412.629.02.012.47.014.817.515.018.218.715.512.826.017.38.314.712.03.56.825.019.36.44.011.98.513.214.517.115.613.44.59.520.015.76.011.423.014.216.721.016.013.610.013.95.05.810.516.322.0要求編制組距數(shù)列。③確定組數(shù)及組距等距數(shù)列編制步驟:【解】①排序②計(jì)算變異全距其中,N=50④確定組限銷售額(百萬元)組中值商店數(shù)(次數(shù))2~66~1010~1414~1818~2222~2626~30481216202428681214532合計(jì)—50⑤計(jì)算次數(shù)⑥制作組距數(shù)列P50例題3.1Excel操作時(shí)注意確定分組上限的確定例:某電腦公司2008年前四個(gè)月的銷售量(單位:臺(tái))141159166172177182188196203214143160167173177183189196203215144160168173178184189196205218149161168174178185189196206223150161168174178186190196207225152162170174179186190197208226153163171175179187191197209228153163171175179187192198210233154164172175180187194198210233155165172175180187194200211234156165172176181188195201211234158165172176182188195202213237組數(shù)及組距的確定最小值141最大值237數(shù)據(jù)個(gè)數(shù)120全距96組數(shù)10組距102.確定分組上限、計(jì)算頻數(shù)Excel在計(jì)算頻數(shù)時(shí),每一組的頻數(shù)包括組的上限值,即a<x<=b數(shù)據(jù)分組原則:上組限不計(jì)入,即a<=x<b所以,右面的分組是正確的。但是,分組上限的確定不正確。

按銷售量分組(臺(tái))分組上限頻數(shù)(天)140-1501505150-1601601016018018028180-19019020190-20020016200-21021011210-2202206220-2302304230-24024052.確定分組上限、計(jì)算頻數(shù)(續(xù))

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論