下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第三講 統(tǒng)計描述與常用統(tǒng)計圖Part I 數(shù)值變量的統(tǒng)計描述一、數(shù)值變量統(tǒng)計描述的內(nèi)容數(shù)值變量(Numerical variable),數(shù)理統(tǒng)計里常被稱為連續(xù)型隨機變量,它的特點是有單位,其可能取值充滿某個區(qū)間。對數(shù)值變量作描述性統(tǒng)計(Descriptive statistics)內(nèi)容主要包括:1. 作頻數(shù)表(frequency table)和直方圖(histogram),了解資料的分布特征(對稱or 偏態(tài))2. 根據(jù)分布特征,選擇適合的平均數(shù)指標,反映其集中趨勢(Central tendency)3. 根據(jù)分布特征,選擇適合的變異度指標,反映其離散趨勢(Dispersion)例1 某校100
2、名健康男生的血清總蛋白含量(g/L),血清總蛋白.sav74.379.575.073.575.874.073.567.275.873.578.875.673.575.075.872.079.576.573.579.568.875.078.872.068.876.573.572.775.070.478.078.874.364.376.574.374.770.472.776.570.472.075.875.870.476.565.077.273.572.780.572.065.080.371.277.676.568.873.577.280.572.074.369.781.267.381.667.3
3、72.784.369.774.371.274.375.072.075.467.381.675.071.271.269.773.570.475.072.767.370.376.573.572.068.073.568.074.372.772.774.370.4例2 某年某地200名正常成人的血鉛含量(g/100g),正常成人血鉛含量.sav34444455555555556666666777777777777788888888888999999910101010101010101011111111111212121212121213131313131313131313131314141414141
4、41414141415151515151515161616161616171717171717171717171717181818181819191919191920202020202020202121212121222222222222232323242424242424252526262626262727282829293030313131313232323232323333363838394041414347505360三、SPSS編制頻數(shù)表的方法1. 打開血清總蛋白.sav,里面有編號id、總蛋白x兩列變量,有100個觀測值,最小值為64.3,最大值為84.3,全距R =84.3-64
5、.3=20,如果頻數(shù)表的組數(shù)為10的話,組距i=2。2. Transform->visual bander(可視化分組) -> variable to band:x -> banded variable: xx upper endpoints: exclude 3. 進入make cutpoints界面,first cutpoint location: 66,width: 2,則可知會有11個組段4. 選make labels,OK運行,SPSS提示會新產(chǎn)生一個分組變量5. 列頻數(shù)表:Analyze -> Descriptive statistics -> fre
6、quencies -> xx,得以下結果 FrequencyPercentValid PercentCumulative PercentValid<66.033.03.03.066.0 - 67.955.05.08.068.0 - 69.988.08.016.070.0 - 71.91111.011.027.072.0 - 73.92525.025.052.074.0 - 75.92424.024.076.076.0 - 77.91010.010.086.078.0 - 79.977.07.093.080.0 - 81.966.06.099.084.0+11.01.0100.0To
7、tal100100.0100.0 6. 整理為符合規(guī)范的統(tǒng)計表表3.1 100名健康男生的血清總蛋白(g/L)的頻數(shù)分布組段(1)頻數(shù)(2)頻率(3)累計頻率(4)64.0 33.03.066.0 55.08.068.0 88.016.070.0 1111.027.072.0 2525.052.074.0 2424.076.076.0 1010.086.078.0 77.093.080.0 66.099.082.0 84.011.0100.0合計100100.0四、SPSS作直方圖的方法Graphs -> histogram -> variable: xx -> displa
8、y normal curve,得出圖3.1。注意該圖的橫軸取值為0到12,實際它代表的是表3.1的組段(1),Mean等計算結果也無實際意義。需要對該圖作進一步編輯,得到符合規(guī)范的直方圖(圖3.2)。圖3.1 SPSS結果總蛋白(g/L)頻數(shù)圖3.2 符合統(tǒng)計要求的直方圖從頻數(shù)表和直方圖看出,健康男生的血清總蛋白資料屬于對稱分布資料,中間位置在7276g/L處,越往兩側,頻數(shù)逐漸減少。練習1 用頻數(shù)表和直方圖描述例2的某年某地200名正常成人的血鉛資料的分布特征。表3.2 200名正常成人的血鉛值(g/100g)的頻數(shù)分布組段(1)頻數(shù)(2)頻率(3)累計頻率(4)3 8 13 18 23 2
9、8 33 3843 48 53 58 62合計200100.0二、反映集中趨勢、離散趨勢的常用指標英文中文含義計算公式適用資料Mean均數(shù)(期望)X / n對稱分布,尤其是正態(tài)分布Median中位數(shù)M偏態(tài)分布Range全距R =Xmax-Xmin末端有確定值Interquartile Range四分位數(shù)間距Q = P75-P25偏態(tài)分布Variance 方差S2對稱分布,尤其是正態(tài)分布Standard deviation標準差S對稱分布,尤其是正態(tài)分布總體方差 樣本方差 總體標準差 樣本標準差 練習2對血清總蛋白資料,用Analyze-> Descriptive statistics -
10、>frequencies命令,計算均數(shù)、中位數(shù)、第25分位數(shù)、第75分位數(shù)、方差、標準差、四分位間距等指標。(注:不列頻數(shù)表)練習3對血清總蛋白資料,用Analyze-> Descriptive statistics ->descriptives命令作分析,在假定X服從均數(shù)為,標準差為的正態(tài)分布的情況下,對X進行標準化處理,得出ZX,ZX將服從均數(shù)為0,標準差為1的標準正態(tài)分布。如果和值已知,如果樣本量n較大,練習4對雇員數(shù)據(jù)employee data.sav,用Analyze-> Descriptive statistics ->explore命令作分析,描述不
11、同性別雇員的平均受教育年數(shù)educ和標準差。 某公司雇員的受教育情況性別人數(shù)均數(shù)(年)標準差(年)男25814.43.0女21612.42.3合計47413.52.9Part II 分類變量的統(tǒng)計描述一、分類變量的概念分類變量(Categorical variable),數(shù)理統(tǒng)計里被稱為離散型隨機變量。根據(jù)取值個數(shù)分為二分類、多分類變量。多分類變量又可進一步分為無序、有序多分類變量。舉例:employee data.sav,性別、種族、職業(yè)類別、年齡組、按受教育年數(shù)分組。二、SPSS描述分類變量資料1. 用Descriptive statistics -> frequencies描述單個
12、變量2. 用Descriptive statistics -> crosstabs描述兩個變量,得出二維列聯(lián)表,如四格表、R×C表。如果要同時描述三個及以上的變量,對應的就是三維甚至高維列聯(lián)表。3. 對構成比資料作圓圖(pie),對兩組或多組率比較的資料作直條圖(bar),對隨時間連續(xù)變化的資料作線圖(line)。練習5 描述474名觀測的性別構成,并輸出統(tǒng)計表和統(tǒng)計圖步驟:analyze ->descriptive statistics -> frequencies->gender 某公司雇員的性別構成性別人數(shù)構成(%)男25854.4女21645.6合計474100.0練習6 對全部觀測按性別gender與工作類別jobcat作交叉表crosstabs步驟:analyze ->des
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025版港口電氣安裝工程及設備租賃合同3篇
- 2024年生產(chǎn)車間承包與智能化生產(chǎn)線改造合同3篇
- 2024年美術作品交易標準協(xié)議版B版
- 2025版股權轉讓合同解除協(xié)議2篇
- 2024年車輛掛靠出租協(xié)議標準文本版B版
- 2025版餐飲業(yè)廣告代理合作協(xié)議3篇
- 2025年化妝品研發(fā)成果轉化采購合同范本3篇
- 2025版酒店會議室場地租賃及酒店住宿套餐服務合同3篇
- 2025版智能機器人研發(fā)中心共享用工合作協(xié)議范本3篇
- 課題申報書:大學中學融通視域下拔尖創(chuàng)新人才早期培養(yǎng)評價標準體系構建的實證研究
- 小學信息科技《數(shù)據(jù)與編碼-探索生活中的“編碼”》教學設計
- 工程款代扣代付款協(xié)議書(2篇)
- 2024年湖北省高考化學試卷真題(含答案解析)
- 物業(yè)充電樁合作加盟協(xié)議書范文
- 2023春國開會計實務專題形考任務4題庫1及答案
- 現(xiàn)有民辦學校選擇登記為營利性民辦學校辦理流程
- 機械工安全操作規(guī)程有哪些(11篇)
- 期末測試卷(一)(試題)2023-2024學年二年級上冊數(shù)學蘇教版
- 2024中國華電集團限公司校招+社招高頻難、易錯點500題模擬試題附帶答案詳解
- 國家開放大學電大《會計信息系統(tǒng)》期末終考題庫及標準參考答案
- 【飛科電器公司基于杜邦分析法的財務分析案例(7700字論文)】
評論
0/150
提交評論