




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第第 2 章章 數(shù)據(jù)整理與展示數(shù)據(jù)整理與展示2.1 數(shù)據(jù)的預(yù)處理 2.2 分類和順序數(shù)據(jù)的整理與顯示2.3 數(shù)值型數(shù)據(jù)的整理與顯示2.4 統(tǒng)計表2.1 數(shù)據(jù)的預(yù)處理數(shù)據(jù)的預(yù)處理2.1.1 數(shù)據(jù)審核數(shù)據(jù)審核2.1.2 數(shù)據(jù)篩選數(shù)據(jù)篩選2.1.3 數(shù)據(jù)排序數(shù)據(jù)排序數(shù)據(jù)的預(yù)處理數(shù)據(jù)審核檢查數(shù)據(jù)中的錯誤數(shù)據(jù)篩選找出符合條件的數(shù)據(jù)數(shù)據(jù)排序升序和降序?qū)ふ覕?shù)據(jù)的基本特征數(shù)據(jù)審核原始數(shù)據(jù)(raw data) 審核的內(nèi)容審核的內(nèi)容完整性審核檢查應(yīng)調(diào)查的單位或個體是否有遺漏所有的調(diào)查項目或指標(biāo)是否填寫齊全準(zhǔn)確性審核檢查數(shù)據(jù)是否真實反映客觀實際情況,內(nèi)容是否符合實際1.檢查數(shù)據(jù)是否有錯誤,計算是否正確等數(shù)據(jù)的審核二
2、手?jǐn)?shù)據(jù)(second hand data)適用性審核弄清楚數(shù)據(jù)的來源、數(shù)據(jù)的口徑以及有關(guān)的背景材料確定數(shù)據(jù)是否符合自己分析研究的需要時效性審核盡可能使用最新的數(shù)據(jù)確認(rèn)是否有必要做進(jìn)一步的加工整理數(shù)據(jù)篩選(data filter)當(dāng)數(shù)據(jù)中的錯誤不能予以糾正,或者有些數(shù)據(jù)不符合調(diào)查的要求而又無法彌補(bǔ)時,需要對數(shù)據(jù)進(jìn)行篩選數(shù)據(jù)篩選的內(nèi)容將某些不符合要求的數(shù)據(jù)或有明顯錯誤的數(shù)據(jù)予以剔除將符合某種特定條件的數(shù)據(jù)篩選出來,而不符合特定條件的數(shù)據(jù)予以剔除用用Excel進(jìn)行數(shù)據(jù)篩選進(jìn)行數(shù)據(jù)篩選 數(shù)據(jù)篩選(data filter)數(shù)據(jù)排序 (data rank)按一定順序?qū)?shù)據(jù)排列,以發(fā)現(xiàn)一些明顯的特征或趨勢,
3、找到解決問題的線索排序有助于對數(shù)據(jù)檢查糾錯,以及為重新歸類或分組等提供依據(jù)在某些場合,排序本身就是分析的目的之一排序可借助于計算機(jī)完成數(shù)據(jù)排序 (方法)分類數(shù)據(jù)的排序字母型數(shù)據(jù),排序有升序降序之分,但習(xí)慣上用升序漢字型數(shù)據(jù),可按漢字的首位拼音字母排列,也可按筆畫排序,其中也有筆畫多少的升序降序之分?jǐn)?shù)值型數(shù)據(jù)的排序遞增排序:設(shè)一組數(shù)據(jù)為x1,x2,xn,遞增排序后可表示為:x(1)x(2)x(2)x(n)2.2.1 分類數(shù)據(jù)的整理與圖示分類數(shù)據(jù)的整理與圖示2.2.2 順序數(shù)據(jù)的整理與圖示順序數(shù)據(jù)的整理與圖示數(shù)據(jù)的整理與顯示(基本問題)要弄清所面對的數(shù)據(jù)類型,因為不同類型的數(shù)據(jù),所采取的處理方式和
4、方法是不同的對分類數(shù)據(jù)和順序數(shù)據(jù)主要是作分類整理對數(shù)值型數(shù)據(jù)則主要是作分組整理適合于低層次數(shù)據(jù)的整理和顯示方法也適合于高層次的數(shù)據(jù);但適合于高層次數(shù)據(jù)的整理和顯示方法并不適合于低層次的數(shù)據(jù)2.2.1 分類數(shù)據(jù)的整理與圖示分類數(shù)據(jù)的整理與圖示分類數(shù)據(jù)的整理(基本過程)1.列出各類別分類分類頻數(shù)頻數(shù)比例比例百分比百分比比率比率ABCDE分類數(shù)據(jù)的整理(可計算的統(tǒng)計量)頻數(shù)頻數(shù)(frequency) :落在各類別中的數(shù)據(jù)個數(shù)比例比例(proportion) :某一類別數(shù)據(jù)占全部數(shù)據(jù)的比值百分比百分比(percentage) :將對比的基數(shù)作為100而計算的比值比率比率(ratio) :不同類別數(shù)值的
5、比值分類數(shù)據(jù)整理頻數(shù)分布表 (例題分析)分類數(shù)據(jù)的圖示條形圖(bar Chart)用寬度相同的條形的高度或長短來表示各類別數(shù)據(jù)的圖形有單式條形圖、復(fù)式條形圖等形式主要用于反映分類數(shù)據(jù)的頻數(shù)分布繪制時,各類別可以放在縱軸,稱為條條形圖形圖,也可以放在橫軸,稱為柱形圖柱形圖分類數(shù)據(jù)的圖示條形圖 (例題分析)15119690481216頻數(shù)可口可樂旭日升冰茶百事可樂匯源果汁露露品牌不同品牌飲料的頻數(shù)分布不同品牌飲料的頻數(shù)分布分類數(shù)據(jù)的圖示餅圖(pie Chart)也稱圓形圖,是用圓形及圓內(nèi)扇形的角度來表示數(shù)值大小的圖形主要用于表示總體或樣本中各組成部分所占的比例,對于研究結(jié)構(gòu)性問題十分有用繪制圓形圖
6、時,總體中各部分所占的百分比用圓內(nèi)的各個扇形角度表示,這些扇形的中心角度,是按各部分?jǐn)?shù)據(jù)百分比占3600的相應(yīng)比例確定的分類數(shù)據(jù)的圖示餅圖 (例題分析)不同品牌飲料的構(gòu)成不同品牌飲料的構(gòu)成可口可樂30%旭日升冰茶22%匯源果汁12%百事可樂18%露露18%2.2.2 順序數(shù)據(jù)的整理與圖示順序數(shù)據(jù)的整理與圖示順序數(shù)據(jù)的整理(可計算的統(tǒng)計量) 1. 累積頻數(shù)累積頻數(shù)(cumulative frequencies):各類別頻數(shù)的逐級累加 2. 累積頻率累積頻率(cumulative percentages):各類別頻率(百分比)的逐級累加順序數(shù)據(jù)的頻數(shù)分布表(例題分析)甲城市家庭對住房狀況評價的頻數(shù)
7、分布甲城市家庭對住房狀況評價的頻數(shù)分布回答類別回答類別甲城市甲城市戶數(shù)戶數(shù)(戶戶)百分比百分比(%)向上累積向上累積 向下累積向下累積 戶數(shù)戶數(shù)(戶戶)百分比百分比(%)戶數(shù)戶數(shù)(戶戶)百分比百分比(%) 非常不滿意非常不滿意 不滿意不滿意 一般一般 滿意滿意 非常滿意非常滿意 24108 93 45 30 836311510 24132225270300 8.0 44.0 75.0 90.0100.0300276168 75 30100.092562510合計合計300100.0順序數(shù)據(jù)的頻數(shù)分布表 (例題分析)乙城市家庭對住房狀況評價的頻數(shù)分布乙城市家庭對住房狀況評價的頻數(shù)分布回答類別回答
8、類別乙城市乙城市戶數(shù)戶數(shù)(戶戶)百分比百分比(%)向上累積向上累積 向下累積向下累積 戶數(shù)戶數(shù)(戶戶)百分比百分比(%)戶數(shù)戶數(shù)(戶戶)百分比百分比(%) 非常不滿意非常不滿意 不滿意不滿意 一般一般 滿意滿意 非常滿意非常滿意2199786438 7.033.026.021.312.7 21120198262300 7.0 40.0 66.0 87.3100.0300279180102 38100.0 93.0 60.0 34.0 12.7合計合計300100.0順序數(shù)據(jù)的圖示累計頻數(shù)分布圖 (例題分析)243001322252700100200300400 非常不滿意 不滿意 一般 滿意
9、非常滿意累積戶數(shù)(戶)(a)向上累積向上累積27616830300750100200300400 非常不滿意 不滿意 一般 滿意 非常滿意累積戶數(shù)(戶)(b)向下累積向下累積環(huán)形圖(annular chart)環(huán)形圖中間有一個“空洞”,總體中的每一部分?jǐn)?shù)據(jù)用環(huán)中的一段表示環(huán)形圖與圓形圖類似,但又有區(qū)別圓形圖只能顯示一個總體各部分所占的比例環(huán)形圖則可以同時繪制多個總體的數(shù)據(jù)系列,每一個總體的數(shù)據(jù)系列為一個環(huán)環(huán)形圖可用于結(jié)構(gòu)比較研究 環(huán)形圖主要用于展示分類和順序數(shù)據(jù)環(huán)形圖 (例題分析)8%36%31%15%7%33%26%21%13%10% 非常不滿意 不滿意 一般 滿意 非常滿意 甲乙兩城市家庭
10、對住房狀況的評價甲乙兩城市家庭對住房狀況的評價2.3 數(shù)值型數(shù)據(jù)的整理與顯示數(shù)值型數(shù)據(jù)的整理與顯示2.3.1 數(shù)據(jù)分組數(shù)據(jù)分組2.3.2 數(shù)值型數(shù)據(jù)的圖示數(shù)值型數(shù)據(jù)的圖示2.3.1 數(shù)據(jù)分組數(shù)據(jù)分組 分組方法分組方法等距分組等距分組異距分組異距分組單變量值分組單變量值分組組距分組組距分組單變量值分組(要點) 1. 將一個變量值作為一組 2. 適合于離散變量 3. 適合于變量值較少的情況組距分組 (要點)將變量值的一個區(qū)間作為一組適合于連續(xù)變量適合于變量值較多的情況需要遵循“不重不漏”的原則可采用等距分組,也可采用不等距分組組距分組(步驟)確定組數(shù):組數(shù)的確定應(yīng)以能夠顯示數(shù)據(jù)的分布特征和規(guī)律為目
11、的。在實際分組時,可以經(jīng)驗公式(斯特吉斯公式)來確定組數(shù)KNnKlg32.312lglg1組距分組(幾個概念) 1. 下限下限(low limit) :一個組的最小值 2. 上限上限(upper limit) :一個組的最大值 3. 組距組距(class width) :上限與下限之差 4. 組中值組中值(class midpoint) :下限與上限之間的中點值頻數(shù)分布表的編制(例題分析)頻數(shù)分布表的編制(步驟)確定組數(shù):根據(jù) 經(jīng)驗公式得組數(shù)K為:1082lg120lg1K等距分組表(上下組限重疊連續(xù)變量適用)(axb)等距分組表(上下組限間斷離散變量適用)等距分組表(使用開口組最大值和最小值
12、與其他數(shù)據(jù)相差懸殊時適用)組距分組與不等距分組(在表現(xiàn)頻數(shù)分布上的差異)等距分組各組頻數(shù)的分布不受組距大小的影響可直接根據(jù)絕對頻數(shù)來觀察頻數(shù)分布的特征不等距分組各組頻數(shù)的分布受組距大小不同的影響各組絕對頻數(shù)的多少不能反映頻數(shù)分布的實際狀況需要用頻數(shù)密度(頻數(shù)密度=頻數(shù)/組距)反映頻數(shù)分布的實際狀況數(shù)值型數(shù)據(jù)的圖示分組數(shù)據(jù)直方圖(histogram)用矩形的寬度和高度來表示頻數(shù)分布的圖形在直角坐標(biāo)中,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應(yīng)的頻數(shù)就形成了一個矩形,即直方圖分組數(shù)據(jù)的圖示(直方圖的繪制)分組數(shù)據(jù)直方圖(直方圖與條形圖的區(qū)別)條形圖是用條形的長度(橫置時)表示各類別頻數(shù)的多
13、少,其寬度(表示類別)則是固定的直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或百分比,寬度則表示各組的組距,其高度與寬度均有意義直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列條形圖主要用于展示分類數(shù)據(jù),直方圖則主要用于展示數(shù)值型數(shù)據(jù)分組數(shù)據(jù)折線圖(frequency polygon)折線圖也稱頻數(shù)多邊形圖是在直方圖的基礎(chǔ)上,把直方圖頂部的中點(組中值)用直線連接起來,再把原來的直方圖抹掉折線圖的兩個終點要與橫軸相交,具體的做法是第一個矩形的頂部中點通過豎邊中點(即該組頻數(shù)一半的位置)連接到橫軸,最后一個矩形頂部中點與其豎邊中點連接到橫軸折線圖下所圍成的面積與直方圖的面積相等,
14、二者所表示的頻數(shù)分布是一致的分組數(shù)據(jù)的圖示(折線圖的繪制)數(shù)值型數(shù)據(jù)的圖示未分組數(shù)據(jù)莖葉圖(stem-and-leaf display)用于顯示未分組的原始數(shù)據(jù)的分布由“莖”和“葉”兩部分構(gòu)成,其圖形是由數(shù)字組成的以該組數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉樹葉上只保留一位數(shù)字對于n(20 n 300)個數(shù)據(jù),莖葉圖最大行數(shù)不超過 L = 10 lg n 6. 莖葉圖類似于橫置的直方圖,但又有區(qū)別直方圖可觀察一組數(shù)據(jù)的分布狀況,但沒有給出具體的數(shù)值莖葉圖既能給出數(shù)據(jù)的分布狀況,又能給出每一個原始數(shù)值,保留了原始數(shù)據(jù)的信息未分組數(shù)據(jù)莖葉圖(例題分析)未分組數(shù)據(jù)箱線圖(box plot)用于顯示未分
15、組的原始數(shù)據(jù)的分布箱線圖由一組數(shù)據(jù)的5個特征值繪制而成,它由一個箱子和兩條線段組成箱線圖的繪制方法首先找出一組數(shù)據(jù)的5個特征值,即最大值最大值、最小最小值值、中位數(shù)中位數(shù)Me和兩個四分位數(shù)四分位數(shù)(下四分位數(shù)QL和上四分位數(shù)QU)連接兩個四分(位)數(shù)畫出箱子,再將兩個極值點與箱子相連接 未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(箱線圖的構(gòu)成)未分組數(shù)據(jù)單批數(shù)據(jù)箱線圖(例題分析)分布的形狀與箱線圖未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析)11名學(xué)生各科的考試成績數(shù)據(jù)名學(xué)生各科的考試成績數(shù)據(jù)課程名稱課程名稱學(xué)生編號學(xué)生編號1234567891011英語英語經(jīng)濟(jì)數(shù)學(xué)經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)西方經(jīng)濟(jì)學(xué)市場營銷學(xué)市場營銷學(xué)財務(wù)管
16、理財務(wù)管理基礎(chǔ)會計學(xué)基礎(chǔ)會計學(xué)統(tǒng)計學(xué)統(tǒng)計學(xué)計算機(jī)應(yīng)用基礎(chǔ)計算機(jī)應(yīng)用基礎(chǔ)76659374687055859095818775739178975176857092688171748869846573957078669073788470936379806087816786918377769070828382928481706972787578918866948085718674687962818155787075687177未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖(例題分析)Min-Max25%-75%Median value455565758595105英語經(jīng)濟(jì)數(shù)學(xué)西方經(jīng)濟(jì)學(xué)市場營銷學(xué)財務(wù)管理基礎(chǔ)會計學(xué)統(tǒng)計學(xué)計算
17、機(jī)應(yīng)用基礎(chǔ)min-max25%-75%median value455565758595105學(xué)生1學(xué)生2學(xué)生3學(xué)生4學(xué)生5學(xué)生6學(xué)生7學(xué)生8學(xué)生9學(xué)生10學(xué)生11未分組數(shù)據(jù)多批數(shù)據(jù)箱線圖 (例題分析)數(shù)值型數(shù)據(jù)的圖示時間序列數(shù)據(jù)線圖(line plot) 繪制線圖時應(yīng)注意以下幾點繪制線圖時應(yīng)注意以下幾點時間一般繪在橫軸,指標(biāo)數(shù)據(jù)繪在縱軸圖形的長寬比例要適當(dāng),其長寬比例大致為10 : 71. 一般情況下,縱軸數(shù)據(jù)下端應(yīng)從“0”開始,以便于比較。數(shù)據(jù)與“0”之間的間距過大時,可以采取折斷的符號將縱軸折斷時間序列數(shù)據(jù)線圖 (例題分析) 19912000年城鄉(xiāng)居民家庭人均收入年城鄉(xiāng)居民家庭人均收入年份
18、年份城鎮(zhèn)居民城鎮(zhèn)居民農(nóng)村居民農(nóng)村居民19911992199319941995199619971998199920001700.62026.62577.43496.24283.04838.95160.35425.15854.06280.0 708.6 784.0 921.61221.01577.71926.12091.12162.02210.32254.4時間序列數(shù)據(jù)線圖 (例題分析) 城鄉(xiāng)居民家庭人均收入 城鄉(xiāng)居民家庭人均收入020004000600080001991199219931994199519961997199819992000年份收入城鎮(zhèn)居民農(nóng)村居民數(shù)值型數(shù)據(jù)的圖示顯示多個變量的圖
19、示方法在顯示或?qū)Ρ雀髯兞康臄?shù)值總和時十分有用假定各變量的取值具有相同的正負(fù)號,總的絕對值與圖形所圍成的區(qū)域成正比可用于研究多個樣本之間的相似程度多變量數(shù)據(jù)雷達(dá)圖(radar chart) 設(shè)有n組樣本S1,S2, , Sn,每個樣本測得P個變量X1,X2 , , XP,要繪制這P個變量的雷達(dá)圖,其具體做法是多變量數(shù)據(jù)雷達(dá)圖(雷達(dá)圖的制作)多變量數(shù)據(jù)雷達(dá)圖 (例題分析)2000年城鄉(xiāng)居民家庭平均每人生活消費支出構(gòu)成年城鄉(xiāng)居民家庭平均每人生活消費支出構(gòu)成(%)項項 目目城鎮(zhèn)居民城鎮(zhèn)居民農(nóng)村居民農(nóng)村居民 食品食品 衣著衣著 家庭設(shè)備用品及服務(wù)家庭設(shè)備用品及服務(wù) 醫(yī)療保健醫(yī)療保健 交通通訊交通通訊 娛
20、樂教育文化服務(wù)娛樂教育文化服務(wù) 居住居住 雜項商品與服務(wù)雜項商品與服務(wù)39.1810.01 8.79 6.36 7.9012.5610.01 5.17 49.30 5.75 4.52 5.24 5.58 11.18 15.47 3.14多變量數(shù)據(jù)雷達(dá)圖 (例題分析)2000年城鄉(xiāng)居民家庭人均消費支出構(gòu)成2000年城鄉(xiāng)居民家庭人均消費支出構(gòu)成01020304050食品衣著家庭設(shè)備用品及服務(wù)醫(yī)療保健交通通訊娛樂教育文化服務(wù)居住雜項商品與服務(wù)城鎮(zhèn)居民 農(nóng)村居民數(shù)據(jù)類型及圖示 (小結(jié))條條 形形 圖圖 餅餅 圖圖 環(huán)環(huán) 形形 圖圖匯匯 總總 表表品品 質(zhì)質(zhì) 數(shù)數(shù) 據(jù)據(jù)直直 方方 圖圖折折 線線 圖圖分分 組組 數(shù)數(shù) 據(jù)據(jù)莖莖 葉葉 圖圖箱箱 線線 圖圖原原 始始 數(shù)數(shù) 據(jù)據(jù)線線 圖圖時時 序序 數(shù)數(shù) 據(jù)據(jù)雷雷 達(dá)達(dá) 圖圖多多 元元 數(shù)數(shù) 據(jù)據(jù)數(shù)數(shù) 值值 型型 數(shù)數(shù) 據(jù)據(jù)數(shù)數(shù) 據(jù)據(jù) 的的 類類 型型頻數(shù)分布的類型3.4 統(tǒng)計表3.4.1 統(tǒng)計表的構(gòu)成統(tǒng)計表的構(gòu)成3.4.2 統(tǒng)計表的設(shè)計統(tǒng)計表的設(shè)計統(tǒng)計表的結(jié)構(gòu)19992000年城鎮(zhèn)居民家庭抽樣調(diào)查資料年
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- u盤供貨合同范本
- 住宅贈予合同范本
- 農(nóng)業(yè)種子買賣協(xié)議合同范本
- 化妝服務(wù)合同范本簡易
- 業(yè)務(wù)指導(dǎo)合同范本
- 2024年招商銀行呼和浩特分行招聘考試真題
- 加盟學(xué)員簽約合同范本
- 買土地合同范本
- 加油站聘用站長合同范本
- 借款項目合同范本
- 《馬克思主義政治經(jīng)濟(jì)學(xué)概論(第二版)》第八章 資本主義經(jīng)濟(jì)危機(jī)和歷史趨勢
- 勞動教育《蒸饅頭》課件
- 一年級20以內(nèi)加減法計算題(100道)
- 新北師大版高中英語選擇性必修一詞匯表(word精校版)
- 2023年新安全生產(chǎn)法
- 卡通可愛風(fēng)格學(xué)生課程表模板
- 英語四線三格A4空白紙
- 分娩舍母豬分娩管理
- GB/T 9119-2010板式平焊鋼制管法蘭
- UNIX操作系統(tǒng)基礎(chǔ)(全)
- 《塔臺競標(biāo)標(biāo)書》設(shè)計單
評論
0/150
提交評論