版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二講單變量的統(tǒng)計(jì)描述變量層次的劃分A.定類(lèi)層次;B.定序?qū)哟?C.定距層次變量的統(tǒng)計(jì)描述
A.分布統(tǒng)計(jì)表統(tǒng)計(jì)圖;B.集中趨勢(shì)測(cè)量法;C.離散趨勢(shì)測(cè)量法一、變量的層次1、定類(lèi)變量定類(lèi)變量是變量層次最低的,它的取值只有類(lèi)別屬性之分,而無(wú)大小程度之分.如民族,婚姻等.2、定序變量定序變量的層次高于定類(lèi)變量.它的取值除了有類(lèi)別屬性之外,還有等級(jí)次序的差別.常見(jiàn)的如受教育程度,滿(mǎn)意度,社會(huì)經(jīng)濟(jì)地位等.3、定距變量定距變量的層次又高于定序變量.定距變量的取值,除了具有次序?qū)傩酝?取值之間的距離可以度量.如家庭住房面積,家庭人口數(shù)等.4、定比變量定比變量是將兩類(lèi)相關(guān)的數(shù)加以對(duì)比,形成的相對(duì)數(shù),用以反映現(xiàn)象的構(gòu)成、比重、密度和速度等數(shù)量關(guān)系。例如將家庭人口數(shù)與家庭總支出對(duì)比計(jì)算家庭人均支出水平。
二、單變量的統(tǒng)計(jì)描述方法基本描述
集中趨勢(shì)離散趨勢(shì)定類(lèi)層次
次數(shù)、比例、比率、表格、圖示
眾數(shù)異眾比率
定序?qū)哟?/p>
次數(shù)、比例、比率、表格、圖示、累計(jì)次數(shù)、累計(jì)百分比中位數(shù)四分位差
定距層次
次數(shù)、比例、比率、表格、圖示、累計(jì)次數(shù)、累計(jì)百分比、分組
均值標(biāo)準(zhǔn)差
(一)分布統(tǒng)計(jì)表統(tǒng)計(jì)圖1、分布統(tǒng)計(jì)學(xué)里的分布是指一個(gè)概念或變量,它的各種情況出現(xiàn)的次數(shù)或頻數(shù),也稱(chēng)頻次分布。如住房產(chǎn)別包括12種情況,按被訪(fǎng)人的回答,可以得到12對(duì)數(shù)據(jù):(x1,n1),(x2,n2)…(x12,n12).括號(hào)中的第一項(xiàng)表示變量的可能選項(xiàng),第二項(xiàng)表示所對(duì)應(yīng)的頻次。需要注意的是:(1)變量取值必須完備,只有這樣才能使被訪(fǎng)者一一無(wú)遺地進(jìn)行歸類(lèi)。(2)變量取值必須互斥,這樣才能使每一個(gè)觀察值歸入一類(lèi),且僅僅歸入一類(lèi)。2、統(tǒng)計(jì)表用表格形式來(lái)表示變量的分布。統(tǒng)計(jì)表必須具備的內(nèi)容有:表號(hào)(統(tǒng)計(jì)表x,x),表頭(包括標(biāo)題、時(shí)間、地點(diǎn)),標(biāo)識(shí)行(產(chǎn)別、頻數(shù)、頻率),主體行(第一項(xiàng)位置,按列填寫(xiě)變量的不同選項(xiàng);第二項(xiàng)位置,按列填寫(xiě)變量取值相應(yīng)的頻次和百分比等等)。要寫(xiě)明統(tǒng)計(jì)的總數(shù)。表尾需要寫(xiě)清資料來(lái)源。定類(lèi)變量的統(tǒng)計(jì)表
表1、天津市居民住房的產(chǎn)別分布(1997)產(chǎn)別次數(shù)百分比1、直管公產(chǎn)43143.12、單位產(chǎn)16916.93、自有資產(chǎn)13713.74、房改購(gòu)全部產(chǎn)權(quán)18718.75、房改購(gòu)部分產(chǎn)權(quán)525.26、合作產(chǎn)權(quán)20.27、軍產(chǎn)101.08、宗教產(chǎn)101.012、其他產(chǎn)20.2Total1000100.0教育fcfcf%C%C%一級(jí)685506812.4100.012.4二級(jí)9048215816.387.628.7三級(jí)10639226419.371.348.0四級(jí)19328645735.152.083.1五級(jí)939355016.916.9100.0總數(shù)550
100.0
定序變量統(tǒng)計(jì)表
表2某企業(yè)員工的教育水平
定距變量統(tǒng)計(jì)表
表3、天津市不同收入組居民的住房與收入現(xiàn)狀(1997)收入的十等份分組使用面積(平方米)居住面積(平方米)月租金(元)家庭月平均收入(元)128.4919.3417.68472.00233.6523.0426.28726.83336.3823.7122.90867.42432.4522.0224.571003.86536.1724.2924.211154.36638.9026.9226.961306.41740.0826.6429.951481.37842.2526.973.641673.79943.5826.8029.131995.301058.7034.6630.422955.38定距變量制表需要考慮的問(wèn)題1、組數(shù)組數(shù)太少會(huì)掩蓋變量變動(dòng)時(shí)頻次的變化,組數(shù)太多,會(huì)使每組內(nèi)頻次過(guò)少,看不出明顯的規(guī)律。一般根據(jù)理論和經(jīng)驗(yàn)進(jìn)行分組。2、等距分組與非等距分組一般情況下采用等距分組,但研究一些特殊問(wèn)題,如貧困問(wèn)題,需要對(duì)低收入分得細(xì)一些。3、組限(classlimits)就是每組的范圍,包括上限和下限。對(duì)于離散型變量一般采取相鄰組限不重疊的原則,而對(duì)于連續(xù)型變量,可能出現(xiàn)相鄰組限重疊的情況,這時(shí)采取的原則就是“上組限不在內(nèi)”原則。4、分組步驟第一,搜集數(shù)據(jù);第二,在數(shù)據(jù)中找出最大值L,最小值S及極差值R;第三,把數(shù)據(jù)分組,如K組;第四,計(jì)算組距h;第五,計(jì)算組中值。3、統(tǒng)計(jì)圖定類(lèi)變量:圓瓣圖;條形圖定序變量:條形圖定距變量:直方圖;折線(xiàn)圖(二)集中趨勢(shì)測(cè)量法(1)集中趨勢(shì)測(cè)量法(measuresofcentraltendency):就是找出一個(gè)數(shù)值來(lái)代表變量的資料分布,以反映資料的集結(jié)情況。該方法的意義,就是根據(jù)該代表值(或稱(chēng)典型值)來(lái)估計(jì)或預(yù)測(cè)每個(gè)研究對(duì)象的數(shù)值。(2)運(yùn)用該方法要舍去變量的某些信息,但由于所根據(jù)的數(shù)值最有代表性,所產(chǎn)生的誤差最小。(3)有三種方法供選擇集中值:一是根據(jù)頻次,哪個(gè)變量值具有的頻次最多,就選擇哪個(gè)變量值。二是根據(jù)居中。三是根據(jù)平均。表4、各種集中趨勢(shì)量度的比較
均值中位數(shù)眾數(shù)適用于定距數(shù)據(jù)適用于定序數(shù)據(jù)適用于定類(lèi)數(shù)據(jù)計(jì)算時(shí)要用到全部數(shù)據(jù)只需中間數(shù)據(jù)可最快求出受極端值的影響對(duì)極端值不敏感有時(shí)對(duì)個(gè)別值的變動(dòng)也很敏感分組變化時(shí)影響不大分組變化時(shí)有影響分組變化時(shí)影響較大眾值、中位值和均值的比較(1)三者設(shè)計(jì)的目的是相同的,都是希望一個(gè)數(shù)值來(lái)描述整體特征,以便簡(jiǎn)化資料。(2)眾值僅使用了資料中最大頻次這一信息,因此,資料中信息的使用是不完善的。(3)雖然均值對(duì)資料的信息利用充分,但對(duì)嚴(yán)重偏態(tài)的分布,會(huì)失去它應(yīng)有的代表性。(4)對(duì)于對(duì)稱(chēng)的圖形,三者位置重疊,當(dāng)圖形正偏或負(fù)偏時(shí),均值變化最快,中位值次之,眾數(shù)不變。
(二)離散趨勢(shì)測(cè)量法(1)離散趨勢(shì)測(cè)量法(measurementsofdispersion),是要求出一個(gè)值來(lái)表示個(gè)案與個(gè)案之間的差異情況。(2)試比較以下兩個(gè)班次考試成績(jī):甲:100,90,80,70,60,50,40
乙:85,80,75,70,65,60,55如果僅用集中趨勢(shì)測(cè)量法來(lái)測(cè)量?jī)蓚€(gè)班的成績(jī),兩班是相等的。但兩班的分布顯然有差異,需要考慮資料的分散特征。表5、各種離散趨勢(shì)量度的比較
標(biāo)準(zhǔn)差四分位差異眾比率適用于定距數(shù)據(jù)適用于定序數(shù)據(jù)適用于定類(lèi)數(shù)據(jù)計(jì)算時(shí)用到全部數(shù)據(jù)只需要其中兩段的數(shù)據(jù)可最快求出受極端值的影響大對(duì)極端值不敏感有時(shí)對(duì)個(gè)別值的變動(dòng)也很敏感(3)離異比率(異眾比率)(VariationRatio)離異比率就是非眾值的次數(shù)與全部樣本數(shù)目的比率。公式如下:
其中,N是全部樣本數(shù)目,f是眾值的次數(shù),二者之差就是非眾值的次數(shù)。顯然,非眾值的比例越小,眾值的代表性就越好,信息量越大。反之,非眾值所占的相對(duì)頻數(shù)越大,眾值的代表性越差,所提供的信息量也就越小。(4)四分位差(InterquartileRange)四分位差是定序以上變量度量分散程度的方法。計(jì)算方法是將樣本由低至高排列,然后分為四個(gè)等分(即每個(gè)等分包括25%的個(gè)案),則第一個(gè)四分位置的值(Q1)與第三個(gè)四分位置的值(Q3)的差異,就是四分位差(簡(jiǎn)寫(xiě)為Q)。公式為:Q=Q3-Q1。
25%25%25%25%
低Q1Q2Q3Q4高5、標(biāo)準(zhǔn)差定距變量可以利用全距,四分位差計(jì)算離散程度,但要損失大量的信息。分析定距變量的離散程度,最常用的方法是標(biāo)準(zhǔn)差(簡(jiǎn)寫(xiě)S),即將各數(shù)值與其均值差的平方和除以全部樣板數(shù)目,然后取其平方根,公式如下:S=還可以根據(jù)分組資料,公式為:
變量(X)72-1181864861316969-41657-16256=73.00506表6三群體住房“使用面積”集中和離散趨勢(shì)對(duì)比使用面積均值標(biāo)準(zhǔn)差變異系數(shù)租用公房戶(hù)34.9914.440.413原有私房戶(hù)41.2727.030.658房改中獲得私房戶(hù)48.0622.150.461單變量統(tǒng)計(jì)描述與SPSS統(tǒng)計(jì)軟件
1、頻數(shù)分析分析步驟:(1)單擊Analysis菜單,選擇Descriptivestatistics中的Frequencies選擇項(xiàng),打開(kāi)相應(yīng)的對(duì)話(huà)框。在左側(cè)的源變量框中選擇一個(gè)或多個(gè)變量,單擊向右箭頭按鈕,使其進(jìn)入Variable框中;(2)根據(jù)需要選擇相應(yīng)的選擇項(xiàng)
DisplayFrequencyTable選擇此項(xiàng)將顯示頻數(shù)分布表。選擇Statistics,打開(kāi)統(tǒng)計(jì)量選擇對(duì)話(huà)框。在對(duì)話(huà)框中選擇輸出統(tǒng)計(jì)量??蛇x擇的統(tǒng)計(jì)量分四組,每組中的統(tǒng)計(jì)量可以同時(shí)選擇。A、PercentileValues百分位數(shù)組,可以選擇:
Quartiles:四分位數(shù),顯示25%、50%、75%的百分?jǐn)?shù);
Cutpointforequalgroups:將數(shù)據(jù)平分為所設(shè)定的相等等份,所選擇的數(shù)值范圍為2—100間的整數(shù)。例如,如果鍵入4,那么數(shù)據(jù)將會(huì)被四等分,即計(jì)算四分位數(shù)值。
Percentile(s):由用戶(hù)定義的百分位數(shù)。鍵入的范圍在0—100之間。單變量統(tǒng)計(jì)描述與SPSS統(tǒng)計(jì)軟件B、Dispersion離散趨勢(shì)組:
Std.deviation標(biāo)準(zhǔn)差
Variance方差
Range極值,最大值與最小值之差
Minimum最小值
Maximum最大值
S.E.Mean均值的標(biāo)準(zhǔn)誤C、CentralTendency集中趨勢(shì)組:
Mean算術(shù)平均數(shù)
Median中位數(shù)
Mode眾數(shù)
Sum算術(shù)和單變量統(tǒng)計(jì)描述與SPSS統(tǒng)計(jì)軟件D、Distribution分布參數(shù)組,可以選擇以上選擇項(xiàng)選擇完,單擊Continue確認(rèn)這些選擇,返回主對(duì)話(huà)框。Chart統(tǒng)計(jì)圖形單擊Chart按紐展開(kāi)統(tǒng)計(jì)圖對(duì)話(huà)框,對(duì)圖形的類(lèi)型及坐標(biāo)等進(jìn)行設(shè)置。FrequenciesFormat:設(shè)置頻數(shù)表輸出的格式,單擊Format按紐打開(kāi)對(duì)話(huà)框Orderby排序組,在該組中選擇頻數(shù)表中變量排列順序。共四個(gè)選項(xiàng):
AscendingValues按變量值的升序排列,這是默認(rèn)的排列方式。
DescendingValues按變量的降序排列
Ascendingcounts按頻數(shù)的升序排列
Descendingcounts按頻數(shù)的降序排列。單變量統(tǒng)計(jì)描述與SPSS統(tǒng)計(jì)軟件2、統(tǒng)計(jì)量的描述變量的描述統(tǒng)計(jì)量有平均值、標(biāo)準(zhǔn)差、最大值、最小值、方差、極值和平均數(shù)的標(biāo)準(zhǔn)誤。A、分析步驟單擊Analysis菜單,選擇Descriptivestatistics中的選擇項(xiàng),打開(kāi)對(duì)所選擇的每一個(gè)變量在數(shù)據(jù)框中產(chǎn)生其標(biāo)準(zhǔn)化值;DisplayLabel顯示變量的標(biāo)簽;在主對(duì)話(huà)框中單擊Option按紐,選擇所要描述的統(tǒng)計(jì)量與分布單擊OK按鈕提交系統(tǒng)執(zhí)行。B、數(shù)據(jù)分組對(duì)于定距層次的變量,有時(shí)需要先分組,然后在進(jìn)行統(tǒng)計(jì)分布和描述。分組方法如下:?jiǎn)螕鬞ransform菜單,選擇recode中的intodifferentVariables選擇項(xiàng)。鍵入要分組的變量,并定義一個(gè)新變量名選擇OldandNewValues命令框定義組限,并賦予一個(gè)新值。三、二變量的統(tǒng)計(jì)描述1,交叉分組與列聯(lián)表交叉分組下的頻數(shù)、頻率分析的主要任務(wù)有兩個(gè):第一、根據(jù)搜集到的樣本數(shù)據(jù)產(chǎn)生表2、表3的二維交叉列聯(lián)表;第二,在交叉列聯(lián)表的基礎(chǔ)上,分析和比較兩兩變量之間是否具有獨(dú)立性或相關(guān)性。2,考慮控制變量下的交叉分組與列聯(lián)表表7、不同收入組的住房類(lèi)型(頻數(shù)表)獨(dú)用三間及以上獨(dú)用兩間獨(dú)用一間合計(jì)500元以下1172341500—10008164852571000—150018188542601500—200017100181352000—25
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 軟件行業(yè)市場(chǎng)營(yíng)銷(xiāo)總結(jié)
- 職業(yè)高中體育老師個(gè)人教學(xué)工作年終總結(jié)合集(5篇)
- 幼兒園小班教案《感恩大樹(shù)》及教學(xué)反思
- 超市零售行業(yè)會(huì)計(jì)工作總結(jié)
- 2024年版特定擔(dān)保事務(wù)合作合同模板版B版
- 辦公用品行業(yè)營(yíng)業(yè)員工作總結(jié)
- 2024年外債借款合同展期與債務(wù)重組及還款能力評(píng)估范本3篇
- 2024年度水文地質(zhì)勘察與評(píng)價(jià)服務(wù)合同3篇
- 果茶制作課程設(shè)計(jì)
- 特殊鑿井課程設(shè)計(jì)
- 機(jī)架結(jié)構(gòu)設(shè)計(jì)
- 護(hù)理部副主任績(jī)效考核評(píng)分細(xì)則表
- 手衛(wèi)生規(guī)范課件
- “統(tǒng)計(jì)與概率”在小學(xué)數(shù)學(xué)教材中的編排分析
- 臭氧發(fā)生器確認(rèn)方案W
- xx中心小學(xué)綜合實(shí)踐基地計(jì)劃模板(完整版)
- 談心談話(huà)記錄表 (空白表)
- LY/T 1863-2009自然保護(hù)區(qū)生態(tài)旅游評(píng)價(jià)指標(biāo)
- T-JSTJXH 15-2022 裝配式勁性柱-鋼梁框架結(jié)構(gòu)設(shè)計(jì)規(guī)程
- 2023年上海市市高考物理一模試卷含解析
- 市政工程人行道維修方案
評(píng)論
0/150
提交評(píng)論