SPSS軟件在醫(yī)學統(tǒng)計的應用_第1頁
SPSS軟件在醫(yī)學統(tǒng)計的應用_第2頁
SPSS軟件在醫(yī)學統(tǒng)計的應用_第3頁
SPSS軟件在醫(yī)學統(tǒng)計的應用_第4頁
SPSS軟件在醫(yī)學統(tǒng)計的應用_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第三講 統(tǒng)計描述與常用統(tǒng)計圖Part I 數(shù)值變量的統(tǒng)計描述一、數(shù)值變量統(tǒng)計描述的內(nèi)容數(shù)值變量(Numerical variable),數(shù)理統(tǒng)計里常被稱為連續(xù)型隨機變量,它的特點是有單位,其可能取值充滿某個區(qū)間。對數(shù)值變量作描述性統(tǒng)計(Descriptive statistics)內(nèi)容主要包括:1. 作頻數(shù)表(frequency table)和直方圖(histogram),了解資料的分布特征(對稱or 偏態(tài))2. 根據(jù)分布特征,選擇適合的平均數(shù)指標,反映其集中趨勢(Central tendency)3. 根據(jù)分布特征,選擇適合的變異度指標,反映其離散趨勢(Dispersion)例1 某校100

2、名健康男生的血清總蛋白含量(g/L),血清總蛋白.sav74.379.575.073.575.874.073.567.275.873.578.875.673.575.075.872.079.576.573.579.568.875.078.872.068.876.573.572.775.070.478.078.874.364.376.574.374.770.472.776.570.472.075.875.870.476.565.077.273.572.780.572.065.080.371.277.676.568.873.577.280.572.074.369.781.267.381.667.3

3、72.784.369.774.371.274.375.072.075.467.381.675.071.271.269.773.570.475.072.767.370.376.573.572.068.073.568.074.372.772.774.370.4例2 某年某地200名正常成人的血鉛含量(g/100g),正常成人血鉛含量.sav34444455555555556666666777777777777788888888888999999910101010101010101011111111111212121212121213131313131313131313131314141414141

4、41414141415151515151515161616161616171717171717171717171717181818181819191919191920202020202020202121212121222222222222232323242424242424252526262626262727282829293030313131313232323232323333363838394041414347505360三、SPSS編制頻數(shù)表的方法1. 打開血清總蛋白.sav,里面有編號id、總蛋白x兩列變量,有100個觀測值,最小值為64.3,最大值為84.3,全距R =84.3-64

5、.3=20,如果頻數(shù)表的組數(shù)為10的話,組距i=2。2. Transform->visual bander(可視化分組) -> variable to band:x -> banded variable: xx upper endpoints: exclude 3. 進入make cutpoints界面,first cutpoint location: 66,width: 2,則可知會有11個組段4. 選make labels,OK運行,SPSS提示會新產(chǎn)生一個分組變量5. 列頻數(shù)表:Analyze -> Descriptive statistics -> fre

6、quencies -> xx,得以下結果 FrequencyPercentValid PercentCumulative PercentValid<66.033.03.03.066.0 - 67.955.05.08.068.0 - 69.988.08.016.070.0 - 71.91111.011.027.072.0 - 73.92525.025.052.074.0 - 75.92424.024.076.076.0 - 77.91010.010.086.078.0 - 79.977.07.093.080.0 - 81.966.06.099.084.0+11.01.0100.0To

7、tal100100.0100.0 6. 整理為符合規(guī)范的統(tǒng)計表表3.1 100名健康男生的血清總蛋白(g/L)的頻數(shù)分布組段(1)頻數(shù)(2)頻率(3)累計頻率(4)64.0 33.03.066.0 55.08.068.0 88.016.070.0 1111.027.072.0 2525.052.074.0 2424.076.076.0 1010.086.078.0 77.093.080.0 66.099.082.0 84.011.0100.0合計100100.0四、SPSS作直方圖的方法Graphs -> histogram -> variable: xx -> displa

8、y normal curve,得出圖3.1。注意該圖的橫軸取值為0到12,實際它代表的是表3.1的組段(1),Mean等計算結果也無實際意義。需要對該圖作進一步編輯,得到符合規(guī)范的直方圖(圖3.2)。圖3.1 SPSS結果總蛋白(g/L)頻數(shù)圖3.2 符合統(tǒng)計要求的直方圖從頻數(shù)表和直方圖看出,健康男生的血清總蛋白資料屬于對稱分布資料,中間位置在7276g/L處,越往兩側,頻數(shù)逐漸減少。練習1 用頻數(shù)表和直方圖描述例2的某年某地200名正常成人的血鉛資料的分布特征。表3.2 200名正常成人的血鉛值(g/100g)的頻數(shù)分布組段(1)頻數(shù)(2)頻率(3)累計頻率(4)3 8 13 18 23 2

9、8 33 3843 48 53 58 62合計200100.0二、反映集中趨勢、離散趨勢的常用指標英文中文含義計算公式適用資料Mean均數(shù)(期望)X / n對稱分布,尤其是正態(tài)分布Median中位數(shù)M偏態(tài)分布Range全距R =Xmax-Xmin末端有確定值Interquartile Range四分位數(shù)間距Q = P75-P25偏態(tài)分布Variance 方差S2對稱分布,尤其是正態(tài)分布Standard deviation標準差S對稱分布,尤其是正態(tài)分布總體方差 樣本方差 總體標準差 樣本標準差 練習2對血清總蛋白資料,用Analyze-> Descriptive statistics -

10、>frequencies命令,計算均數(shù)、中位數(shù)、第25分位數(shù)、第75分位數(shù)、方差、標準差、四分位間距等指標。(注:不列頻數(shù)表)練習3對血清總蛋白資料,用Analyze-> Descriptive statistics ->descriptives命令作分析,在假定X服從均數(shù)為,標準差為的正態(tài)分布的情況下,對X進行標準化處理,得出ZX,ZX將服從均數(shù)為0,標準差為1的標準正態(tài)分布。如果和值已知,如果樣本量n較大,練習4對雇員數(shù)據(jù)employee data.sav,用Analyze-> Descriptive statistics ->explore命令作分析,描述不

11、同性別雇員的平均受教育年數(shù)educ和標準差。 某公司雇員的受教育情況性別人數(shù)均數(shù)(年)標準差(年)男25814.43.0女21612.42.3合計47413.52.9Part II 分類變量的統(tǒng)計描述一、分類變量的概念分類變量(Categorical variable),數(shù)理統(tǒng)計里被稱為離散型隨機變量。根據(jù)取值個數(shù)分為二分類、多分類變量。多分類變量又可進一步分為無序、有序多分類變量。舉例:employee data.sav,性別、種族、職業(yè)類別、年齡組、按受教育年數(shù)分組。二、SPSS描述分類變量資料1. 用Descriptive statistics -> frequencies描述單個

12、變量2. 用Descriptive statistics -> crosstabs描述兩個變量,得出二維列聯(lián)表,如四格表、R×C表。如果要同時描述三個及以上的變量,對應的就是三維甚至高維列聯(lián)表。3. 對構成比資料作圓圖(pie),對兩組或多組率比較的資料作直條圖(bar),對隨時間連續(xù)變化的資料作線圖(line)。練習5 描述474名觀測的性別構成,并輸出統(tǒng)計表和統(tǒng)計圖步驟:analyze ->descriptive statistics -> frequencies->gender 某公司雇員的性別構成性別人數(shù)構成(%)男25854.4女21645.6合計474100.0練習6 對全部觀測按性別gender與工作類別jobcat作交叉表crosstabs步驟:analyze ->des

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論