數(shù)據(jù)計量尺度_第1頁
數(shù)據(jù)計量尺度_第2頁
數(shù)據(jù)計量尺度_第3頁
數(shù)據(jù)計量尺度_第4頁
數(shù)據(jù)計量尺度_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、關于數(shù)據(jù)的計量尺度第一張,PPT共五十八頁,創(chuàng)作于2022年6月(1)定類尺度 (Nominal Scale)也稱分類尺度例如:性別、民族、職業(yè)數(shù)據(jù)表現(xiàn)為“類別” 各類之間無等級次序 各類別可以用數(shù)字代碼表示根據(jù)定類尺度得到的數(shù)據(jù)為分類數(shù)據(jù)。第二張,PPT共五十八頁,創(chuàng)作于2022年6月(2)定序尺度(Ordinal Scale)也稱順序尺度例如健康狀況、質量等級可對等級、大小等排序未測量出類別之間的準確差值根據(jù)定序尺度得到的數(shù)據(jù)為順序數(shù)據(jù)。第三張,PPT共五十八頁,創(chuàng)作于2022年6月(3)定距尺度(Interval Scale)也稱間隔尺度例如年份、攝氏溫度數(shù)據(jù)表現(xiàn)為“數(shù)值”可以進行加減運

2、算“0”是只是尺度上的一個點,不代表“不存在”根據(jù)定距尺度得到的數(shù)據(jù)為間距數(shù)據(jù)。第四張,PPT共五十八頁,創(chuàng)作于2022年6月(4)定比尺度 (Ratio Scale)也稱比率尺度例如體重、身高數(shù)據(jù)表現(xiàn)為“數(shù)值”可以進行加減、乘除運算“0”表示“沒有”或“不存在”根據(jù)定比尺度得到的數(shù)據(jù)為比率數(shù)據(jù)。第五張,PPT共五十八頁,創(chuàng)作于2022年6月四種計量尺度的比較四種計量尺度的比較定類尺度定序尺度定距尺度定比尺度 分類( = , ) 排序( ) 間距( + ,- ) 比值( , ) 計量尺度數(shù)學特性第六張,PPT共五十八頁,創(chuàng)作于2022年6月四種計量尺度的比較1、四種尺度所包含的信息量是依次遞增

3、的,級別由低到高。2、根據(jù)較高層次的計量尺度可以獲得較低層次的計量尺度。3、不同的尺度數(shù)據(jù)對應著不同數(shù)據(jù)顯示方法和分析方法。第七張,PPT共五十八頁,創(chuàng)作于2022年6月8數(shù)據(jù)的基本類型第八張,PPT共五十八頁,創(chuàng)作于2022年6月9問卷題目的類型大致可以分為單選、多選、排序、開放題目四種類型,他們的變量的定義和處理的方法各有不同,詳細舉例介紹如下:第九張,PPT共五十八頁,創(chuàng)作于2022年6月3.2 統(tǒng)計圖數(shù)據(jù)類型定性數(shù)據(jù)定量數(shù)據(jù)條形圖餅 圖線 圖莖葉圖箱線圖直方圖第十張,PPT共五十八頁,創(chuàng)作于2022年6月3.2.1 線圖(Line Chart)利用線形的升降起伏來表現(xiàn)描述的變量在一段時

4、期內的變動情況,主要用于顯示時間數(shù)列的數(shù)據(jù)。1996年-2003年城鄉(xiāng)居民人民幣儲蓄存款年底余額第十一張,PPT共五十八頁,創(chuàng)作于2022年6月雙變項線形圖(延伸線)輸出結果雙變項線形圖(復線圖)輸出結果3.2.1 線圖(Line Chart)第十二張,PPT共五十八頁,創(chuàng)作于2022年6月3.2.2 條形圖(Bar Chart)用寬度相同的條形高度或長短來表示數(shù)據(jù)變動的圖形,條形的排列可以橫排,也可以縱排。條形圖有單式、復式等形式。2003年我國就業(yè)人員情況(萬人)第十三張,PPT共五十八頁,創(chuàng)作于2022年6月3.2.3 圓形圖(Pie Chart)也叫餅圖,它是用圓形及圓內扇形的面積來表

5、示數(shù)值大小的圖形。主要用于總體內部的結構,各組成部分所占比例等。2003年我國國內生產總值中各產業(yè)比重第十四張,PPT共五十八頁,創(chuàng)作于2022年6月3.2.4 直方圖(Histogram)用來反映定量變量的分布狀況。在統(tǒng)計分組的基礎上,用橫軸表示數(shù)據(jù)分組,縱軸表示頻數(shù)或頻率,各組與相應的頻數(shù)就形成了一個矩形,即直方圖。注意對不等距分組:縱軸必須表示為頻數(shù)密度。頻數(shù)密度=頻數(shù)/組距(面積之和=總頻數(shù))手工繪制直方圖時需要先對數(shù)據(jù)進行分組;用統(tǒng)計軟件spss作直方圖時統(tǒng)計軟件可以自動進行分組。第十五張,PPT共五十八頁,創(chuàng)作于2022年6月直方圖(等距分組)某會計師事務所對20家公司進行年終審計

6、所需時間(天)的頻數(shù)分布表審計時間(天)頻數(shù)10-15415-20820-25525-30230-351合計20第十六張,PPT共五十八頁,創(chuàng)作于2022年6月直方圖(不等距分組)某會計師事務所對20家公司進行年終審計所需時間(天)的頻數(shù)分布表審計時間(天)頻數(shù)頻數(shù)密度10-1540.815-2081.620-255125-3530.3合計20-第十七張,PPT共五十八頁,創(chuàng)作于2022年6月直方圖與條形圖的異同都是用來反映數(shù)據(jù)的分布狀況,適用于不同類型的數(shù)據(jù)。條形圖是用條形的高度表示各類別頻數(shù)的多少,其寬度(表示類別)則是固定的。直方圖是用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或

7、百分比,寬度則表示各組的組距,其高度與寬度均有意義。直方圖的各矩形通常是連續(xù)排列,條形圖則是分開排列。第十八張,PPT共五十八頁,創(chuàng)作于2022年6月主要用于顯示未分組的原始數(shù)據(jù)的分布。由“莖”和“葉”兩部分構成,其圖形是由數(shù)字組成的。通常以數(shù)據(jù)的高位數(shù)值作樹莖,低位數(shù)字作樹葉,樹葉上只保留一位數(shù)字。樹葉的豎列要對齊,以計算各組的次數(shù)。原始數(shù)據(jù):24, 26, 24, 21, 27, 27, 30, 41, 32, 38從小到大排序后的數(shù)據(jù):21, 24, 24, 26, 27, 27,30, 32, 38, 413 0 2 84 12 1 4 4 6 7 7303.2.5 莖葉圖 (Stem

8、-and-Leaf Display)莖葉圖第十九張,PPT共五十八頁,創(chuàng)作于2022年6月SPSS Statistics生成的一個莖葉圖40名教師的年齡的數(shù)據(jù):40,41,48,51,37,35,36,50,33,42,28,33,36,29,28,29,34,35,27,36,28,29,34,26,35,40,27,43,45,39,42,41,48,55,43,42,42,51,52,64Stem-and-Leaf Plot Frequency Stem & Leaf 9.00 2 . 677888999 4.00 3 .3344 8.00 3 .55566679 10.00 4.001

9、1222233 3.00 4 .588 4.00 5 .0112 1.00 5 .5 1.00Extremes (=64) Stem width: 10.00 Each leaf: 1 case(s) 第二十張,PPT共五十八頁,創(chuàng)作于2022年6月常用的集中趨勢的測度指標:算術平均數(shù)中位數(shù)眾數(shù)集中趨勢:一組數(shù)據(jù)向其中心值靠攏的傾向和程度。集中趨勢測度:尋找數(shù)據(jù)水平的代表值或中心值。第二十一張,PPT共五十八頁,創(chuàng)作于2022年6月4.1.1 算術平均數(shù)(均值,Arithmetic Mean)總體均值常用 表示。樣本均值常用 表示。樣本均值的計算公式: 簡單平均數(shù):加權平均數(shù)(分組數(shù)據(jù)) :

10、4.1 集中趨勢的測定第二十二張,PPT共五十八頁,創(chuàng)作于2022年6月算術平均數(shù)的性質1、所有的定量數(shù)據(jù)都有算術平均數(shù)。2、計算算術平均數(shù)時使用了所有數(shù)據(jù)。3、一組數(shù)只有一個均值。4、各變量值與均值的離差之和等于零。張村有個張千萬,九個鄰居窮光蛋;統(tǒng)計平均算資產,個個都是張百萬。 缺點:易受極端值的影響。第二十三張,PPT共五十八頁,創(chuàng)作于2022年6月一組數(shù)據(jù)按大小順序排列后,處在數(shù)列中點位置的數(shù)值。特點:對一組數(shù)據(jù)是唯一的。不受極端值的影響。主要用于順序數(shù)據(jù),也可用數(shù)值型數(shù)據(jù),但不能用于分類數(shù)據(jù)。4.1.2 中位數(shù)(Median) 4.1 集中趨勢的測定第二十四張,PPT共五十八頁,創(chuàng)作

11、于2022年6月根據(jù)原始數(shù)據(jù)計算中位數(shù)n為奇數(shù)時等于第(n+1)/2個數(shù)。n為偶數(shù)時等于第n/2和n/2+1個數(shù)的平均值1,2 ,5,9 ,11中位數(shù)=51,2 ,5 , 9,11,18中位數(shù)=(5+9)/2=7第二十五張,PPT共五十八頁,創(chuàng)作于2022年6月一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的變量值。主要特點:不受極端值的影響。有的數(shù)據(jù)無眾數(shù)或有多個眾數(shù)。對未分組定量資料很少使用。4.1.3 眾數(shù)(Mode) 4.1 集中趨勢的測定第二十六張,PPT共五十八頁,創(chuàng)作于2022年6月眾數(shù)的不惟一性眾數(shù)無眾數(shù)眾數(shù) 1眾數(shù)2第二十七張,PPT共五十八頁,創(chuàng)作于2022年6月眾數(shù)、中位數(shù)和算術平均數(shù)的關系對稱

12、分布 均值= 中位數(shù)= 眾數(shù)左偏分布均值 中位數(shù) 眾數(shù)右偏分布眾數(shù) 中位數(shù)均值第二十八張,PPT共五十八頁,創(chuàng)作于2022年6月反映各變量值遠離其中心值的程度(離散程度),從另一個側面說明了集中趨勢測度值的代表程度。常用指標:全距(極差)四分位距方差和標準差離散系數(shù) 4.2 離散程度的測定三個不同的曲線表示三個不同的總體,其均值相同,但離散趨勢不同。第二十九張,PPT共五十八頁,創(chuàng)作于2022年6月全距也稱極差,是一組數(shù)據(jù)的最大值與最小值之差。R=最大值最小值組距分組數(shù)據(jù)可根據(jù)最高組上限 -最低組下限計算。受極端值的影響。 全距=? 2,5,6,7,8,9,10,12,15,16,204.2.

13、1 全距 (Range) 4.2 離散程度的測定7891078910第三十張,PPT共五十八頁,創(chuàng)作于2022年6月等于上四分位數(shù)與下四分位數(shù)之差反映了中間50%數(shù)據(jù)的離散程度,數(shù)值越小說明中間的數(shù)據(jù)越集中。不受極端值的影響??梢杂糜诤饬恐形粩?shù)的代表性。 2,5,6,7,8,9,10,12,15,16,20Q1=6, Q2=9, Q3=154.2.2 四分位距 (Inter-Quartile Range) 4.2 離散程度的測定第三十一張,PPT共五十八頁,創(chuàng)作于2022年6月方差是一組數(shù)據(jù)中各數(shù)值與其算術平均數(shù)離差平方的平均數(shù),標準差是方差正的平方根??傮w方差和樣本方差的符號不同,計算公式也

14、不一樣。是反映定量數(shù)據(jù)離散程度的最常用的指標。4.2.3 方差和標準差 4.2 離散程度的測定4 6 8 10 12x = 8.3第三十二張,PPT共五十八頁,創(chuàng)作于2022年6月方差的計算公式總體方差 樣本方差 未分組數(shù)據(jù)分組數(shù)據(jù) 樣本方差用(n-1)去除,從數(shù)學角度看是因為它是總體方差2的無偏估計量。第三十三張,PPT共五十八頁,創(chuàng)作于2022年6月標準差與其相應的均值之比,表示為百分數(shù)。特點:反映了相對于均值的相對離散程度;可用于比較計量單位不同的數(shù)據(jù)的離散程度;計量單位相同時,如果兩組數(shù)據(jù)的均值相差懸殊,離散系數(shù)可能比標準差等絕對指標更有意義。4.2.4 離散系數(shù)(Coefficien

15、t of Variation) 4.2 離散程度的測定第三十四張,PPT共五十八頁,創(chuàng)作于2022年6月偏態(tài)和峰度的類型偏態(tài)左偏分布右偏分布正態(tài)分布扁平分布峰態(tài)尖峰分布第三十五張,PPT共五十八頁,創(chuàng)作于2022年6月數(shù)據(jù)分布的不對稱性稱作偏態(tài)。偏態(tài)系數(shù)(SK)是對數(shù)據(jù)分布的不對稱性(偏斜程度)的測度。偏態(tài)系數(shù)有多種計算方法,在統(tǒng)計軟件中(如Excel等)通常采用以下公式: 4.3.1 偏態(tài)及其測定( Skewness ) 4.3 分布形態(tài)的測定第三十六張,PPT共五十八頁,創(chuàng)作于2022年6月偏態(tài)系數(shù)的含義左偏分布(也稱負偏分布):偏態(tài)系數(shù) SK 0;偏態(tài)系數(shù)的絕對值越大,偏斜越嚴重。數(shù)據(jù)向

16、右邊延伸得更多對稱分布:偏態(tài)系數(shù)=0。 第三十七張,PPT共五十八頁,創(chuàng)作于2022年6月峰度:數(shù)據(jù)分布的扁平或尖峰程度。峰度系數(shù)(K):數(shù)據(jù)分布峰度的度量值,對數(shù)據(jù)分布尖峰或扁平程度的測度。統(tǒng)計軟件(如Excel等)中常用以下公式計算4.3.2 峰度及其測定( Kurtosis ) 4.3 分布形態(tài)的測定第三十八張,PPT共五十八頁,創(chuàng)作于2022年6月峰度系數(shù)的含義扁平分布尖峰分布峰度系數(shù)K0,與正態(tài)分布相比該分布一般為尖峰、肥尾,肩部較瘦。均值和方差相同的正態(tài)分布第三十九張,PPT共五十八頁,創(chuàng)作于2022年6月 5.2.2 相關系數(shù)的計算相關系數(shù)(Coefficient of Corr

17、elation)是用來衡量變量之間相關程度的指標,根據(jù)變量的多少和屬性可以有多種不同的計算方法。衡量兩個定量變量之間線性相關程度的常用指標是皮爾遜(Pearson)相關系數(shù)。通常以表示總體的相關系數(shù),以r表示樣本的相關系數(shù)。 第四十張,PPT共五十八頁,創(chuàng)作于2022年6月r的取值范圍為:-1r1;r越接近1,X與Y之間的線性關系越好;r =1為完全正相關關系;r =-1為完全負相關關系r =0,兩個變量之間不存在線性關系或不相關。一般可按三級劃分:|r|0.4為低度線性相關;0.4|r|0.7為顯著性相關;0.7|r|1為高度線性相關。 相關系數(shù)r 的特征第四十一張,PPT共五十八頁,創(chuàng)作于

18、2022年6月5.2.3 相關系數(shù)的顯著性檢驗樣本相關系數(shù)r受到抽樣波動的影響,是一個隨機變量。相關系數(shù)非常高的樣本也有可能來自無相關關系的總體。為了排除這種情況,需要對相關系數(shù)進行假設檢驗。第四十二張,PPT共五十八頁,創(chuàng)作于2022年6月(1)Multiple R,又稱為相關系數(shù),它用來衡量變量x和y之間相關程度的大小。 R為0.9968,表示二者之間的關系是強正相關。1. 回歸統(tǒng)計表實驗任務二:使用Excel的分析工具庫進行回歸第四十三張,PPT共五十八頁,創(chuàng)作于2022年6月R的取值范圍為:-1R1;R越接近1,X與Y之間的線性關系越好;R =1為完全正相關關系;R =-1為完全負相關

19、關系R =0,兩個變量之間不存在線性關系或不相關。一般可按三級劃分:|r|0.4為低度線性相關;0.4|r|0.7為顯著性相關;0.7|r|1為高度線性相關。 實驗任務二:使用Excel的分析工具庫進行回歸第四十四張,PPT共五十八頁,創(chuàng)作于2022年6月(2)R Square(擬合優(yōu)度系數(shù)R2 ):用來說明用自變量解釋因變量變差的程度,以測量對因變量的擬合效果。 擬合優(yōu)度系數(shù)為0.9936,表明用自變量可解釋因變量變差的99.36%。實驗任務二:使用Excel的分析工具庫進行回歸第四十五張,PPT共五十八頁,創(chuàng)作于2022年6月決定系數(shù)的取值R2的取值范圍是0,1。R2越接近于1,表明回歸平

20、方和占總離差平方和的比例越大,回歸直線與各觀測點越接近,回歸直線的擬合程度就越好。在一元線性回歸中,相關系數(shù)r的平方等于判定系數(shù),符號與自變量x的系數(shù)一致。因此可以根據(jù)回歸結果求出相關系數(shù)。 所有的回歸程序都會給出R2的值.第四十六張,PPT共五十八頁,創(chuàng)作于2022年6月(3)Adjusted R Square (調整的擬合優(yōu)度系數(shù)):僅用于多元回歸才有意義,它用于衡量加入獨立變量后模型的擬合程度。當有新的獨立變量加入后,即使這一變量同因變量之間不相關,未經修正的R2也要增大,修正的R2僅用于比較含有同一個因變量的各種模型。(4)標準誤差:又稱為標準回歸誤差或估計標準誤差,它用來衡量擬合程度

21、的大小,也用于計算與回歸有關的其他統(tǒng)計量,此值越小,說明擬合程度越好。實驗任務二:使用Excel的分析工具庫進行回歸第四十七張,PPT共五十八頁,創(chuàng)作于2022年6月實驗任務二:使用Excel的分析工具庫進行回歸擬合優(yōu)度 1、決定系數(shù) 2、估計標準誤差顯著性檢驗 3、t檢驗 4、F檢驗第四十八張,PPT共五十八頁,創(chuàng)作于2022年6月季節(jié)指數(shù) 乘法模型中的季節(jié)成分通過季節(jié)指數(shù)來反映。季節(jié)指數(shù)(季節(jié)比率):反映季節(jié)變動的相對數(shù)。1、月(或季)的指數(shù)之和等于1200%(或400%) 。2、季節(jié)指數(shù)離100越遠,季節(jié)變動程度越大,數(shù)據(jù)越遠離其趨勢值。第四十九張,PPT共五十八頁,創(chuàng)作于2022年6月

22、因子分析因子分析在一定程度上可被視為主成分分析的深化和拓展?;驹硎菍⒕哂幸欢ㄏ嚓P關系的多個變量綜合為數(shù)量較少的幾個因子,研究一種具有錯綜復雜關系的實測指標是如何受少數(shù)幾個內在的獨立因子所支配的。第五十張,PPT共五十八頁,創(chuàng)作于2022年6月SPSS因子分析操作6、單擊“得分”,選中“保存為變量”,“顯示因子得分系數(shù)矩陣”,單擊“繼續(xù)”;其余選項使用默認值。單擊“確定” 。Display factor score coefficient matrix第五十一張,PPT共五十八頁,創(chuàng)作于2022年6月因子分析結果分析除了“外貌”變量外其他變量的共同度都比較高。變量共同度表變量共同度:各變量中

23、所含原始信息能被提取的公共因子所解釋的程度。變量的共同度越接近1,說明被變量公共因子解釋的程度越高,因子分析的效果越好。第五十二張,PPT共五十八頁,創(chuàng)作于2022年6月前4個因子的貢獻率為81.49%。旋轉之后各因子的方差貢獻率可能會發(fā)生變化!SPSS因子分析操作貢獻率第五十三張,PPT共五十八頁,創(chuàng)作于2022年6月旋轉前后的因子載荷矩陣旋轉成分矩陣,每行都有一個較大的值。因子旋轉后1234簡歷格式.116.830.109-.136外貌.440.151.399.227研究能力.064.128.007.928興趣愛好.220.245.871-.081自信心.916-.107.163-.065洞察力.863.097.255.002誠信度.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論