第三章_數(shù)據(jù)的整理與顯示_第1頁
第三章_數(shù)據(jù)的整理與顯示_第2頁
第三章_數(shù)據(jù)的整理與顯示_第3頁
第三章_數(shù)據(jù)的整理與顯示_第4頁
第三章_數(shù)據(jù)的整理與顯示_第5頁
已閱讀5頁,還剩90頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第 3 章 數(shù)據(jù)的整理與顯示3.1 數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理 3.2 分類和順序數(shù)據(jù)的整理與顯示分類和順序數(shù)據(jù)的整理與顯示3.3 數(shù)值型數(shù)據(jù)的整理與顯示數(shù)值型數(shù)據(jù)的整理與顯示3.4 統(tǒng)計表統(tǒng)計表3.1 數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理是數(shù)據(jù)的預(yù)處理是數(shù)據(jù)整理數(shù)據(jù)整理的先前步驟,包括:的先前步驟,包括:1.數(shù)據(jù)的審核數(shù)據(jù)的審核檢查數(shù)據(jù)中的錯誤檢查數(shù)據(jù)中的錯誤2.數(shù)據(jù)的篩選數(shù)據(jù)的篩選找出符合條件的數(shù)據(jù)找出符合條件的數(shù)據(jù)3.數(shù)據(jù)排序數(shù)據(jù)排序升序和降序升序和降序?qū)ふ覕?shù)據(jù)的基本特征尋找數(shù)據(jù)的基本特征數(shù)據(jù)審核原始數(shù)據(jù)n 審核的內(nèi)容審核的內(nèi)容1.1.完整性審核完整性審核n檢查應(yīng)調(diào)查的單位或個體是否有遺漏檢查應(yīng)調(diào)查的

2、單位或個體是否有遺漏n所有的調(diào)查項目或指標(biāo)是否填寫齊全所有的調(diào)查項目或指標(biāo)是否填寫齊全2.2.準(zhǔn)確性審核準(zhǔn)確性審核n檢查數(shù)據(jù)是否真實反映客觀實際情況,內(nèi)容檢查數(shù)據(jù)是否真實反映客觀實際情況,內(nèi)容是否符合實際是否符合實際n檢查數(shù)據(jù)是否有錯誤,計算是否正確等檢查數(shù)據(jù)是否有錯誤,計算是否正確等數(shù)據(jù)的審核原始數(shù)據(jù)n審核數(shù)據(jù)準(zhǔn)確性的方法審核數(shù)據(jù)準(zhǔn)確性的方法1. 1. 邏輯檢查邏輯檢查n從定性角度,審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否合從定性角度,審核數(shù)據(jù)是否符合邏輯,內(nèi)容是否合理,各項目或數(shù)字之間有無相互矛盾的現(xiàn)象理,各項目或數(shù)字之間有無相互矛盾的現(xiàn)象n主要用于對分類和順序據(jù)的審核主要用于對分類和順序據(jù)的審核2

3、. 2. 計算檢查計算檢查n檢查調(diào)查表中的各項數(shù)據(jù)在計算結(jié)果和計算方法上檢查調(diào)查表中的各項數(shù)據(jù)在計算結(jié)果和計算方法上有無錯誤有無錯誤n主要用于對數(shù)值型數(shù)據(jù)的審核主要用于對數(shù)值型數(shù)據(jù)的審核數(shù)據(jù)的審核二手?jǐn)?shù)據(jù)1. 適用性審核適用性審核n弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料的背景材料n確定數(shù)據(jù)是否符合自己分析研究的需要確定數(shù)據(jù)是否符合自己分析研究的需要2. 時效性審核時效性審核n盡可能使用最新的數(shù)據(jù)盡可能使用最新的數(shù)據(jù)3. 確認(rèn)是否必要做進一步的加工整理確認(rèn)是否必要做進一步的加工整理n統(tǒng)計調(diào)查所搜集的可以是原始數(shù)據(jù),也可以是二手?jǐn)?shù)據(jù),原始數(shù)據(jù)與二手?jǐn)?shù)據(jù)的

4、關(guān)系是( ) A 原始數(shù)據(jù)來源于基層單位,二手?jǐn)?shù)據(jù)來源于上級單位 B二手?jǐn)?shù)據(jù)是由原始數(shù)據(jù)加工整理而成的 C原始數(shù)據(jù)與二手?jǐn)?shù)據(jù)之間無必然聯(lián)系 D原始數(shù)據(jù)與二手?jǐn)?shù)據(jù)沒有區(qū)別數(shù)據(jù)篩選1. 當(dāng)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不當(dāng)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補時,符合調(diào)查的要求而又無法彌補時,需要對數(shù)據(jù)需要對數(shù)據(jù)進行篩選進行篩選2. 數(shù)據(jù)篩選的內(nèi)容包括數(shù)據(jù)篩選的內(nèi)容包括:2個個將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的

5、數(shù)據(jù)予以剔除合特定條件的數(shù)據(jù)予以剔除用用EXCEL進行數(shù)據(jù)篩選進行數(shù)據(jù)篩選 數(shù)據(jù)篩選(data filter)數(shù)據(jù)排序1. 按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索特征或趨勢,找到解決問題的線索2. 排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)類或分組等提供依據(jù)3. 在某些場合,排序本身就是分析的目的之一在某些場合,排序本身就是分析的目的之一4. 排序可借助于計算機完成排序可借助于計算機完成數(shù)據(jù)排序(方法) 1.1.分類數(shù)據(jù)的排序分類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)

6、慣上用升序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分筆畫排序,其中也有筆畫多少的升序降序之分2.2.數(shù)值型數(shù)據(jù)的排序數(shù)值型數(shù)據(jù)的排序n遞增排序:設(shè)一組數(shù)據(jù)為遞增排序:設(shè)一組數(shù)據(jù)為x x1 1,x x2 2,x xn n,遞增排序,遞增排序后可表示為:后可表示為:x x(1)(1) x x( (2)2) x x(2)(2) x x(n)(n)3.2 分類和順序數(shù)據(jù)的整理與顯示n一、分類數(shù)據(jù)的整理和顯示一、分類數(shù)據(jù)的整理和顯示n二、順序數(shù)據(jù)的整理和顯示二、順序數(shù)據(jù)

7、的整理和顯示主要任務(wù)主要任務(wù)資料審核、分組、資料審核、分組、匯總、制表、制圖等。匯總、制表、制圖等。分組分組頻數(shù)分布頻數(shù)分布統(tǒng)計表統(tǒng)計表統(tǒng)計圖統(tǒng)計圖 補充補充 統(tǒng)計數(shù)據(jù)整理統(tǒng)計數(shù)據(jù)整理 補充 統(tǒng)計分組n統(tǒng)計分組 統(tǒng)計分組是根據(jù)統(tǒng)計研究目的,將總體按一定標(biāo)志區(qū)分為不同類型或不同性質(zhì)的組,使組與組之間有比較明顯的差別,而在同一組內(nèi)的單位具有相對的同質(zhì)性,即同一組內(nèi)各單位之間具有某些共同的特征。n數(shù)據(jù)分組的結(jié)果?組內(nèi)同質(zhì)性、組外差異性n統(tǒng)計分組的關(guān)鍵: 1)選擇分組標(biāo)志:使組間差異大,組內(nèi)差異小 2)劃分各組界限。一、分類數(shù)據(jù)的整理與顯示n(一)頻數(shù)與頻數(shù)分布 1.頻數(shù):又叫次數(shù),落在各類別中的數(shù)據(jù)

8、(單位)個數(shù),記作 Fi 。 2.頻率:又叫比例,各組次數(shù)(頻數(shù))與總次數(shù)(頻數(shù))之比。特點:特點: 各組的頻率大于; 所有組的頻率總和等于。工資分組工資分組 職工人數(shù)(人)職工人數(shù)(人) 各組人數(shù)所占比重各組人數(shù)所占比重 (元)(元) (次數(shù)或頻數(shù))(次數(shù)或頻數(shù)) (%) (頻率)(頻率)500600 100 25600700 200 50700800 100 25 合合 計計 400 100頻率:各組的頻率大于頻率:各組的頻率大于0 0,各組的頻率總和等于,各組的頻率總和等于1 1或或100%100%。頻率分布的性質(zhì):頻率分布的性質(zhì):= = = = = =110111NiNiiiNiiiF

9、FFF(一)頻數(shù)與頻數(shù)分布3.3.百分比百分比 將比例乘以將比例乘以100100就是百分比或百分?jǐn)?shù),就是百分比或百分?jǐn)?shù),它是將對比的基數(shù)抽象化為它是將對比的基數(shù)抽象化為100100而計算出來而計算出來的,用的,用% %表示,它表示每表示,它表示每100100個墳?zāi)怪袚碛卸鄠€墳?zāi)怪袚碛卸嗌賯€分子。少個分子。 如表如表3-23-2(一)頻數(shù)與頻數(shù)分布4. 4. 比率比率 比率是各不同類別的數(shù)量的比值。比率是各不同類別的數(shù)量的比值。 比率由于不是總體中部分與整體之間的對比比率由于不是總體中部分與整體之間的對比關(guān)系,因而比值可能大于關(guān)系,因而比值可能大于1.1.(二)分類數(shù)據(jù)的圖示(二)分類數(shù)據(jù)的圖示

10、條形圖(條形圖(Bar chart)條形圖常用于描述離散型數(shù)據(jù)的情況,是我們經(jīng)常見到的一種圖形,它條形圖常用于描述離散型數(shù)據(jù)的情況,是我們經(jīng)常見到的一種圖形,它是用寬度相等而高度為頻數(shù)是用寬度相等而高度為頻數(shù)(率率)來表示各類數(shù)據(jù)的大小。來表示各類數(shù)據(jù)的大小。 條形圖(條形圖(Bar chart) 解:由表解:由表2.4.2中的數(shù)據(jù)應(yīng)用中的數(shù)據(jù)應(yīng)用Excel軟件中的軟件中的“插入插入”功能中功能中的的“圖表圖表”功能繪成的條形圖如圖功能繪成的條形圖如圖2.4.2所示。所示。 直方圖(直方圖(Histogram) 直方圖表征數(shù)據(jù)的頻數(shù)分布特征,它與條形圖在形式上有類似之處,直方圖表征數(shù)據(jù)的頻數(shù)分

11、布特征,它與條形圖在形式上有類似之處,都是用條形來表示數(shù)據(jù)特征,但直方圖中的條形之間是沒有間隔的。都是用條形來表示數(shù)據(jù)特征,但直方圖中的條形之間是沒有間隔的。 直方圖(直方圖(Histogram) 解:應(yīng)用解:應(yīng)用Spss軟件中的軟件中的“Gragh”功能繪制的直方圖,功能繪制的直方圖,如圖如圖2.4.3所示。所示。 餅分圖(餅分圖(Pie chart) 餅分圖經(jīng)常用來表示各成分在總體中所占的百分比。餅分圖經(jīng)常用來表示各成分在總體中所占的百分比。例例2.4.3某課題組為了科學(xué)評價某高校學(xué)科建設(shè)項目的績效,某課題組為了科學(xué)評價某高校學(xué)科建設(shè)項目的績效,對構(gòu)建的學(xué)科建設(shè)績效評估指標(biāo)權(quán)重進行了問卷調(diào)

12、查,累計發(fā)放問對構(gòu)建的學(xué)科建設(shè)績效評估指標(biāo)權(quán)重進行了問卷調(diào)查,累計發(fā)放問卷調(diào)查表卷調(diào)查表243份,回收有效問卷份,回收有效問卷223份,其中,教授占份,其中,教授占65%,研究員,研究員占占1%,副教授占,副教授占12%,副研究員占,副研究員占1%,講師占,講師占20%,助教占,助教占1%,則樣本職稱分布如圖則樣本職稱分布如圖2.4.4所示。所示。二、數(shù)據(jù)的整理與顯示n(一)累計頻數(shù)和累積頻率n 在具體的研究中,經(jīng)常會觀察某個數(shù)值以上或以下的分布次數(shù)(頻數(shù))之和,這就需要計算累計次數(shù)(累計頻數(shù)),繼而計算累計頻率。n 在計算時,由變量值小的向變量值大的方向累計稱為向上累計。n 由變量值大的向變

13、量值小的方向累計稱為向下累計。序 計劃完成 工人數(shù) 比重 向上累計 向下累計號 程度(%) (人) (%) 人數(shù) 比重 人數(shù) 比重 1 60 70 2 1.0 2 70 80 5 2.5 3 80 90 14 7.0 4 90 100 31 15.5 5 100110 65 32.5 6 110120 52 26.0 7 120130 23 11.5 8 130140 8 4.0 合 計 200 100 累計頻數(shù)或頻率分配數(shù)列通過累計頻數(shù)分配數(shù)列可以反映累計到某一組出現(xiàn)的總次數(shù)或總頻率。想一想:第四組的累計結(jié)果說明什么問題?2721521171691922001.03.510.526.058.

14、584.596.0100831831481791931982004.015.541.574.089.596.599.0100二、數(shù)據(jù)的整理與顯示(二)順序數(shù)據(jù)的圖示1.累計頻數(shù)分布圖2.環(huán)形圖 第三節(jié) 數(shù)值型數(shù)據(jù)的整理與顯示253342統(tǒng)計分組前后對照圖統(tǒng)計分組前后對照圖 第三節(jié) 數(shù)值型數(shù)據(jù)的整理與顯示一、數(shù)據(jù)的分組分組的方法: 單變量值分組和組距分組n例題:數(shù)據(jù)的分組是( )A 統(tǒng)計調(diào)查階段的基本方法B 統(tǒng)計整理階段的基本方法C 統(tǒng)計分析階段的基本方法D 貫穿于統(tǒng)計工作全過程的基本方法 答案 Bn例題:離散型變量分組的方法( )A 只能是單變量值分組B 既可以是單變量值分組,也可以使組距分組

15、C 只能是組距分組D 不能進行分組 答案:B分組方法n分組方法分組方法等距分組等距分組異距分組異距分組單變量值分組單變量值分組組距分組組距分組單變量值分組(要點)n1. 1. 將一個變量值作為一組將一個變量值作為一組n2. 2. 適合于離散變量適合于離散變量n3. 3. 適合于變量值較少的情況適合于變量值較少的情況組限n1. 1. 組限組限( (class limit)class limit) :各組的上限界限值:各組的上限界限值n2. 2. 組下限組下限(low limit) (low limit) :一個組的最小值:一個組的最小值n3. 3. 組上限組上限(upper limit) (up

16、per limit) :一個組的最大值:一個組的最大值組距分組(要點)1.將變量值的一個區(qū)間作為一組將變量值的一個區(qū)間作為一組2.適合于連續(xù)變量適合于連續(xù)變量3.適合于變量值較多的情況適合于變量值較多的情況4.需要遵循需要遵循“不重不漏不重不漏”的原則(組限的確定)的原則(組限的確定)5.可采用等距分組,也可采用不等距分組可采用等距分組,也可采用不等距分組何為何為“不重不漏不重不漏”n不重:一項數(shù)據(jù)只能分在其中的某一組,不能在其他組中重復(fù)出現(xiàn);n不漏:組別能夠窮盡,即在所分的全部組別中每項數(shù)據(jù)都能分在其中的某一組,不能遺漏。解決不重解決不重 為解決“不重”的問題,統(tǒng)計分組時習(xí)慣上規(guī)定“上組限不

17、在內(nèi)”,即當(dāng)相鄰兩組的上下限重疊時,恰好等于某一組上限的變量值不算在本組內(nèi),而計算在下一組內(nèi)。 如:150,不計算在“140150”這一組內(nèi),而計算在“150160”中。 解決不重解決不重 對于離散變量對于離散變量,可以采用相鄰兩組限間斷間斷的辦法解決“不重”的問題。 如表3-8:140149,150159,160169 對于連續(xù)變量,對于連續(xù)變量,可以采取相鄰兩組限重疊重疊的方法,根據(jù)“上限不在內(nèi)”的規(guī)定解決不重的問題,也可以對一個組的上限采用小數(shù)點的形式(小數(shù)點的位數(shù)根據(jù)所要求的精度具體確定)。 如:1011.99,1213.99,1415.99n例題:劃分連續(xù)型變量的組限時,相鄰組的組限

18、通常( )。A 交叉B 不等C 重疊D 間斷 答案:Cn例題:劃分離散型變量的組限時,相鄰組的組限通常( )。A 交叉B 不等C 重疊D 間斷 答案:D等距分組表(上下組限重疊)等距分組表(上下組限間斷)等距分組等距分組(步驟步驟)2.2.確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目的。在實際分組時,可以按律為目的。在實際分組時,可以按 SturgesSturges 提出的經(jīng)驗提出的經(jīng)驗公式來確定組數(shù)公式來確定組數(shù)K K)lg(322. 31)2lg()lg(1loglog121010nnKn=等距分組等距分組( (步驟步驟) )n

19、例題:在全距一定的情況下,組距的大小與組數(shù)的多少( )。nA 成正比nB 成反比nC 不成比例nD 毫無關(guān)系n n 答案: B頻數(shù)分布表的編制頻數(shù)分布表的編制( (例題分析例題分析) )頻數(shù)分布表的編制(步驟)1.1.確定組數(shù):根據(jù)確定組數(shù):根據(jù) SturgesSturges 提出的經(jīng)驗公式得提出的經(jīng)驗公式得組數(shù)組數(shù)K K為:為:108)2lg()120lg(1loglog121012010=K組限和組中值n1. 1. 組限:各組的上限界限值組限:各組的上限界限值n2. 2. 組下限:一個組的最小值組下限:一個組的最小值n3. 3. 組上限:一個組的最大值組上限:一個組的最大值n4. 4. 閉

20、口組:上限和下限都齊全的組閉口組:上限和下限都齊全的組n5. 5. 開口組:上限或下限有一個沒有的組開口組:上限或下限有一個沒有的組 第一組:第一組:“XXXX以下以下” 最后一組:最后一組:“XXXX以上以上”n例題:組距分組時,當(dāng)資料中存在少數(shù)特大或特小的變量值時,應(yīng)采?。?)形式處理。A 開口組B 等距C 閉口組D 不等距 答案 A等距分組表(上下組限重疊)等距分組表(上下組限間斷)等距分組表(使用開口組)2鄰鄰組組組組距距缺缺上上限限的的開開口口組組組組中中值值下下限限2鄰鄰組組組組距距缺缺下下限限的的開開口口組組組組中中值值上上限限n例題:組距、組限和組中值之間的關(guān)系是( )A 組距

21、=(上限-下限)2B 組中值=(上限+下限)2C 組中值=(上限-下限)2D 組限=組中值2 答案:Bn對于開口組來說,開口組的組中值的計算方法是( )。A 用相鄰組的組中值代替B 用相鄰組的組距代替C 缺少組限,無法計算組中值D 用相鄰組的組距作為開口組的假定組距,然后再計算組中值。2鄰鄰組組組組距距缺缺上上限限的的開開口口組組組組中中值值下下限限2鄰鄰組組組組距距缺缺上上限限的的開開口口組組組組中中值值下下限限2鄰鄰組組組組距距缺缺上上限限的的開開口口組組組組中中值值下下限限n連續(xù)數(shù)列變量中,其末組為開口組,下限是1000,相鄰組的組中值為975,其末組的組中值 ( )n第一步: 組中值=

22、(上限+下限)/2 已知相鄰組組中值為975,相鄰組的上限即為末組的下限1000,即 975=(1000+下限)/2 得下限=950 所以,相鄰組組距=1000-950=50 n第二步: 計算開口組的組中值時,只有下限而無上限,則 組中值=下限+相鄰組組距/2 =1000+50/2=1025 組距分組組距分組n可采用等距分組,也可采用不等距分組。 當(dāng)標(biāo)志值變動比較均勻時,可采用等距分組。 當(dāng)標(biāo)志值變動很不均勻時,宜采用不等距分組。異距分組異距分組(幾個概念)(幾個概念)n各組組距相等稱為等距分組; 各組組距不相等則稱為不等距分組,即異距分組。n頻數(shù)密度:單位組距內(nèi)分布的頻數(shù),也稱為次數(shù)密度。n

23、異距分組因各組組距不同,各組頻數(shù)的分布受組距大小不同的影響,因此,各組絕對頻數(shù)的多少并不能反映頻數(shù)分布的實際情況。因此需要消除組距不等的影響,方法是用頻數(shù)密度(頻數(shù)密度用頻數(shù)密度(頻數(shù)密度=頻數(shù)頻數(shù)組組距)反映頻數(shù)分布的實際狀況距)反映頻數(shù)分布的實際狀況組距分組與不等距分組(在表現(xiàn)頻數(shù)分布上的差異)1.等距分組等距分組n各組頻數(shù)的分布不受組距大小的影響各組頻數(shù)的分布不受組距大小的影響n可直接根據(jù)絕對頻數(shù)來觀察頻數(shù)分布的特征可直接根據(jù)絕對頻數(shù)來觀察頻數(shù)分布的特征2.不等距分組不等距分組n各組頻數(shù)的分布受組距大小不同的影響各組頻數(shù)的分布受組距大小不同的影響n各組絕對頻數(shù)的多少不能反映頻數(shù)分布的實各

24、組絕對頻數(shù)的多少不能反映頻數(shù)分布的實際狀況際狀況n需要用頻數(shù)密度反映頻數(shù)分布的實際狀況需要用頻數(shù)密度反映頻數(shù)分布的實際狀況0-6歲(嬰幼兒組)、7-17歲(少年兒童組)、18-59(中青年組)、60歲以上(老年組)n例1:對總體進行分組時,采取等距分組還是不等距分組,主要取決于( )A 次數(shù)的多少B 變量的大小C 組數(shù)的多少D 現(xiàn)象的性質(zhì)和研究的需要n例2:用組中值作為組內(nèi)變量值的一般水平的代表值的理由是( )A 組中值就是組平均數(shù)B 組中值比組平均數(shù)更有代表性C 組中值比組平均數(shù)更有說服力D 無法得到組平均數(shù)n例3:用組中值作為組內(nèi)變量值的代表值,是因為( )A 組中值更有說服力B 組中值就

25、是組平均數(shù)C 組中值比組平均值更有代表性D 組中值可作為組平均數(shù)的近似值各各組組頻頻數(shù)數(shù)(次次數(shù)數(shù))頻頻數(shù)數(shù)(次次數(shù)數(shù))密密度度各各組組組組距距各各組組頻頻率率頻頻率率密密度度各各組組組組距距n例4:組距分組掩蓋了各組內(nèi)的數(shù)據(jù)分布情況,為放映各組數(shù)據(jù)的印版水平,通常用組中值作為該組數(shù)數(shù)據(jù)的代表值,假定條件之一是( )A 各組的頻數(shù)必須相等B 各組數(shù)據(jù)必須相等C 各組數(shù)據(jù)在本組內(nèi)呈均勻分布D 各組必須是封閉組n例5:次數(shù)密度是指( )A 平均每組內(nèi)分布的次數(shù)B 平均每組內(nèi)分布的頻率C 單位組距內(nèi)分布的次數(shù)D 組距除以次數(shù)異距分組異距分組(例題分析)(例題分析)某廠工人年齡分布情況某廠工人年齡分布

26、情況工人按年齡分組工人按年齡分組組距組距人數(shù)(人)人數(shù)(人)標(biāo)準(zhǔn)組距標(biāo)準(zhǔn)組距人數(shù)人數(shù)次數(shù)密度次數(shù)密度15202025253030353545455055551051728407065101728407032.5103.45.68146.52合計合計230異距分組異距分組(例題分析)(例題分析)異距分組(例題分析)二、數(shù)值型數(shù)據(jù)的圖示(一)分組數(shù)據(jù):直方圖和折線圖(二)未分組數(shù)據(jù):莖葉圖(三)時間序列數(shù)據(jù):線圖分組數(shù)據(jù)直方圖1. 1. 用矩形的用矩形的寬度和高度寬度和高度來表示頻數(shù)分布的圖形,來表示頻數(shù)分布的圖形,實際上是用矩形的實際上是用矩形的面積面積來表示各組的頻數(shù)分布來表示各組的頻數(shù)分布2

27、. 2. 在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖個矩形,即直方圖3. 3. 直方圖下的總面積等于直方圖下的總面積等于1 1分組數(shù)據(jù)的圖示(直方圖的繪制)直方圖下的面積之和等于1頻數(shù)分布(等距vs不等距)1. 對于等距分組的數(shù)據(jù),用矩形的高度直接表示各組的頻數(shù)分布; 對于不等距分組的數(shù)據(jù),用矩形的面積來表示各組的頻數(shù)分布。(用矩形的高度直接表示各組的頻數(shù)分布不再適用)2. 實際上,無論是等距分布數(shù)據(jù)還是不等距分組數(shù)據(jù),用矩形的面積或頻數(shù)密度來表示各組的頻數(shù)分布

28、更為合適,因為這樣可使直方圖下的總面積等于1.分組數(shù)據(jù)直方圖(直方圖與條形圖的區(qū)別)1.1.條形圖是用條形的長度條形圖是用條形的長度( (橫置時橫置時) )表示各類別頻數(shù)表示各類別頻數(shù)的多少,其寬度的多少,其寬度( (表示類別表示類別) )則是固定的則是固定的2.2.直方圖是用面積表示各組頻數(shù)的多少,矩形的高直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義的組距,其高度與寬度均有意義3.3.直方圖的各矩形通常是連續(xù)排列,條形圖則是分直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列開排列4.

29、4.條形圖主要用于展示條形圖主要用于展示分類數(shù)據(jù)分類數(shù)據(jù),直方圖則主要用,直方圖則主要用于展示于展示數(shù)值型數(shù)據(jù)數(shù)值型數(shù)據(jù)分組數(shù)據(jù)折線圖1.1.折線圖也稱頻數(shù)多邊形圖折線圖也稱頻數(shù)多邊形圖2.2.是在直方圖的基礎(chǔ)上,把直方圖頂部的中點是在直方圖的基礎(chǔ)上,把直方圖頂部的中點( (組組中值中值) )用直線連接起來,再把原來的直方圖抹掉用直線連接起來,再把原來的直方圖抹掉3.3.折線圖的兩個終點要與橫軸相交,具體的做法是折線圖的兩個終點要與橫軸相交,具體的做法是n第一個矩形的頂部中點通過豎邊中點(即該組第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頻數(shù)一半的位置)連接

30、到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸頂部中點與其豎邊中點連接到橫軸n折線圖下所圍成的面積與直方圖的面積相等,折線圖下所圍成的面積與直方圖的面積相等,二者所表示的頻數(shù)分布是一致的二者所表示的頻數(shù)分布是一致的折線圖與直方圖下的面積相等!數(shù)值型數(shù)據(jù)的圖示未分組數(shù)據(jù)莖葉圖1. 1. 用于顯示未分組的原始數(shù)據(jù)的分布用于顯示未分組的原始數(shù)據(jù)的分布2. 2. 由由“莖莖”和和“葉葉”兩部分構(gòu)成,其圖形是由數(shù)字組兩部分構(gòu)成,其圖形是由數(shù)字組成的成的3. 3. 以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉4. 4. 樹葉上只保留一位數(shù)字樹葉上只保留一位數(shù)字5

31、. 5. 對于對于n n(20(20 n n 300)300)個數(shù)據(jù),莖葉圖最大行數(shù)不超過個數(shù)據(jù),莖葉圖最大行數(shù)不超過 L L = 10 = 10 lg( lg(n n) ) 6. 6. 莖葉圖類似于橫置的直方圖,但又有區(qū)別莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息原始數(shù)值,保留了原始數(shù)據(jù)的信息未分組數(shù)據(jù)莖葉圖(例題分析)未分組數(shù)據(jù)莖葉圖(擴展的莖葉圖)數(shù)值型數(shù)據(jù)的圖示時間序列數(shù)據(jù)時間序列數(shù)據(jù)線圖線圖n 繪制線圖時應(yīng)注意以下幾點繪制線圖時應(yīng)注意以下幾點1. 時間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸時間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸2. 圖形的長寬比例要適當(dāng),其長寬比例大致為圖形的長寬比例要適當(dāng),其長寬比例大致為10:73. 一般情況下,縱軸數(shù)據(jù)下端應(yīng)從一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便開始,以便于比較。數(shù)據(jù)與于比較。數(shù)據(jù)與“0”之間的間距過大時,可以之間的間距過大時,可以采取折斷的符號將縱軸折斷采取折斷的符號將縱軸折斷時間序列數(shù)據(jù)線圖 (例題分析)19912000年城鄉(xiāng)居民家庭人均收入年城鄉(xiāng)居民家庭人均收入年份年份城鎮(zhèn)居民城鎮(zhèn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論