版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、計(jì)量資料的統(tǒng)計(jì)描述 目錄 概概 述述 1 統(tǒng)計(jì)圖表統(tǒng)計(jì)圖表 2 統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)指標(biāo) 3 小小 結(jié)結(jié) 4 STATA命令命令 5 概述 統(tǒng)計(jì)圖表統(tǒng)計(jì)圖表 統(tǒng)計(jì)指標(biāo)統(tǒng)計(jì)指標(biāo) 頻數(shù)表;頻數(shù)頻數(shù)表;頻數(shù)/頻率圖頻率圖 集中趨勢;離散趨勢集中趨勢;離散趨勢 計(jì)量資料的統(tǒng)計(jì)描計(jì)量資料的統(tǒng)計(jì)描 述述 統(tǒng)計(jì)圖表 o頻數(shù)表 n某市1995年110名7歲男童身高資料 121.4121.4119.2119.2124.7124.7125125115115112.8112.8120.2120.2110.2110.2120.9120.9120.1120.1 125.5125.5120.3120.3122.3122.3118
2、.2118.2116.7116.7121.7121.7116.8116.8121.6121.6120.2120.2122122 121.7121.7118.8118.8121.8121.8124.5124.5121.7121.7122.7122.7116.3116.3124124119119124.5124.5 121.8121.8124.9124.9130130123.5123.5128.1128.1119.7119.7126.1126.1131.3131.3123.8123.8116.7116.7 122.2122.2122.8122.8128.6128.6122122132.5132.5
3、122122123.5123.5116.3116.3126.1126.1119.2119.2 126.4126.4118.4118.4121121119.1119.1116.9116.9131.1131.1120.4120.4115.2115.2118118122.4122.4 120.3120.3116.9116.9126.4126.4114.2114.2127.2127.2118.3118.3127.8127.8123123117.4117.4123.2123.2 119.9119.9122.1122.1120.4120.4124.8124.8122.1122.1114.4114.4120
4、.5120.5120120122.8122.8116.8116.8 125.8125.8120.1120.1124.8124.8122.7122.7119.4119.4128.2128.2124.1124.1127.2127.2120120122.7122.7 118.3118.3127.1127.1122.5122.5116.3116.3125.1125.1124.4124.4112.3112.3121.3121.3127127113.5113.5 118.8118.8127.6127.6125.2125.2121.5121.5122.5122.5129.1129.1122.6122.613
5、4.5134.5118.3118.3132.8132.8 統(tǒng)計(jì)圖表 頻數(shù)表的制作頻數(shù)表的制作 確定組數(shù):不宜過多或過少,一般確定組數(shù):不宜過多或過少,一般10組組 確定組距:可等可不等;確定組距:可等可不等; 一般等組距一般等組距=極差極差/組數(shù);組數(shù); 本例組距,實(shí)際取本例組距,實(shí)際取2 確定各組上下限確定各組上下限(每個(gè)組段的起點(diǎn)和終點(diǎn)每個(gè)組段的起點(diǎn)和終點(diǎn)): 第一組包含最小值第一組包含最小值 組段不能重疊組段不能重疊 每一組段都為半開半閉區(qū)間每一組段都為半開半閉區(qū)間 最后一組應(yīng)為閉區(qū)間最后一組應(yīng)為閉區(qū)間 離散型資料的組段通常為一個(gè)取值離散型資料的組段通常為一個(gè)取值 利用Stata產(chǎn)生頻數(shù)
6、表 o Excel文件: o 直接粘貼到Stata軟件中 o 求最大值和最小值的命令:su x o 最小值為,取最小區(qū)組的下限為110 o gen y=int(x-110)/2)*2)+110 o tab y o 注意:stata命令一般都是小寫英文字母 x 121.4 125.5 121.7 121.8 122.2 126.4 120.3 119.9 125.8 118.3 118.8 119.2 120.3 118.8 124.9 122.8 118.4 116.9 統(tǒng)計(jì)圖表 表2.1 110名7歲男童身高頻數(shù)分布 統(tǒng)計(jì)圖表 連續(xù)變量連續(xù)變量 離散變量離散變量 以直方頂點(diǎn)的縱坐標(biāo)以直方頂點(diǎn)
7、的縱坐標(biāo)(等距分組等距分組)或直方的面積大小或直方的面積大小 (不等距分組不等距分組)表示頻數(shù)的多少表示頻數(shù)的多少 以各直條的長短表示頻數(shù)的多少以各直條的長短表示頻數(shù)的多少 頻數(shù)分布圖頻數(shù)分布圖 統(tǒng)計(jì)圖表 o連續(xù)變量頻數(shù)分布圖 等距分組:橫軸表示觀察變量,縱軸表示每個(gè)橫軸組段的 頻數(shù)。 Frequency g 110112114116118120122124126128130132134136 0 2 4 6 8 10 12 14 16 18 20 22 統(tǒng)計(jì)圖表 o連續(xù)變量頻數(shù)分布圖 不等距分組:橫軸表示觀察變量取值,由于不等距分組會(huì)影 響頻數(shù)描述,所以縱軸表示每個(gè)橫軸單位的頻數(shù)/組距 統(tǒng)計(jì)
8、圖表 o頻數(shù)表/圖的用途 揭示資料分布類型:頻數(shù)圖較頻數(shù)表更直觀揭示資料分布類型:頻數(shù)圖較頻數(shù)表更直觀 描述頻數(shù)分布的重要特征:集中趨勢與離散趨描述頻數(shù)分布的重要特征:集中趨勢與離散趨 勢勢 便于發(fā)現(xiàn)特大與特小的可疑值便于發(fā)現(xiàn)特大與特小的可疑值 便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和做統(tǒng)計(jì)處理便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和做統(tǒng)計(jì)處理 統(tǒng)計(jì)指標(biāo) o集中趨勢描述 算術(shù)均數(shù):簡稱均數(shù) n總體均數(shù)總體均數(shù),樣本均,樣本均數(shù)數(shù) n當(dāng)數(shù)據(jù)對(duì)稱分布時(shí),位于分布的中心,是頻數(shù)分布最集中的當(dāng)數(shù)據(jù)對(duì)稱分布時(shí),位于分布的中心,是頻數(shù)分布最集中的 位置位置 直接法: 加權(quán)法: (一般適合頻數(shù)表資料) X X n i fX X f 統(tǒng)計(jì)指
9、標(biāo) o集中趨勢描述 幾何均數(shù)G n適用于經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的數(shù)據(jù),如醫(yī)學(xué)上的滴適用于經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的數(shù)據(jù),如醫(yī)學(xué)上的滴 n (一般適合頻數(shù)表資料) 12. n n GX XX lg lg() fX G f 統(tǒng)計(jì)指標(biāo) o集中趨勢描述 中位數(shù) n將一組觀察值從小到大排列位置居中的數(shù)將一組觀察值從小到大排列位置居中的數(shù) n適用于適用于 任何分布的定量數(shù)據(jù) 不完全資料(開口資料):沒有確切最大值或最小值的資 料 當(dāng)n為偶數(shù)時(shí) 當(dāng)n為奇數(shù)時(shí) 1 22 1 () 2 nn MXX 1 2 n MX 統(tǒng)計(jì)指標(biāo) o集中趨勢描述 n中位數(shù)計(jì)算中位數(shù)計(jì)算 n 離散型變量:直接法 n 連續(xù)型變量:借助頻
10、數(shù)分布表 o 以組中值代替公式中的X o 計(jì)算公式 o LM中位數(shù)所在組下限;iM中位數(shù)所在組的組距;fM中 位數(shù)所在組的頻數(shù); 中位數(shù)所在組前一組的累積 頻數(shù) () 2 M ML M in MLf f L f 統(tǒng)計(jì)指標(biāo) o離散程度的描述 o極差 o極差(range):最大值-最小值 o 優(yōu)點(diǎn):簡單明了 o 缺點(diǎn):不能反映其它數(shù)據(jù)的變異 o 樣本量較大時(shí)極差也較大 o 不宜比較 統(tǒng)計(jì)指標(biāo) o離散程度的描述 四分位間距 n百分位數(shù)百分位數(shù)(percentile):位置指標(biāo):位置指標(biāo) n第x百分位數(shù)Px:將所有數(shù)據(jù)從小到大排列后,處于第x 百分位置的數(shù)值。中位數(shù)記為 P50。 n連續(xù)型變量連續(xù)型變
11、量 ( %) ( %)n xn x ( %) ( %)n xn x ( %) ( %) 1 1 () 2 xn xn x PXX ( %) 1n x PxX ( %)n x為乘積取整部分 (%) x XXL x i PLnXf f 統(tǒng)計(jì)指標(biāo) o 離散程度的描述 o 四分位間距 o 上下四分位數(shù)(QU、QL):第25百分位數(shù)和 第75百分位數(shù) o 四分位間距P75-P25: o 上下四分位數(shù)之間的距離,包括了一半的數(shù) 據(jù),越大說明離散程度越高 o 描述了50%數(shù)據(jù)的分布寬度 o 比極差穩(wěn)定 o 四分位數(shù)范圍P25P75inter-quartile range o 描述了50%數(shù)據(jù)分布的寬度 o
12、反映分布的位置特征 統(tǒng)計(jì)指標(biāo) o離散程度的描述 o方差 o方差variance :適用于對(duì)稱分布的 資料 o總體方差 o樣本方差 o離均差平方和:描述每個(gè)數(shù)據(jù)X相對(duì) 于 分布的集中程度;與樣本含量n 有關(guān),樣本含量不同時(shí)不宜直接比較 2 2 ()XX n 2 2 () 1 XX S n 2 S 2 X 統(tǒng)計(jì)指標(biāo) o離散程度的描述 o方差 o方差:相當(dāng)于平均每個(gè)數(shù)據(jù)的離均差 的平方;可用于不同樣本含量數(shù)據(jù)離 散度的比較。 o自由度(degree of freedom):當(dāng) 選定時(shí)n個(gè)X中能自由變動(dòng)的X的個(gè)數(shù) X 統(tǒng)計(jì)指標(biāo) o離散程度的描述 標(biāo)準(zhǔn)差 n標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差(standard deviati
13、on) 2 () 1 XX S n 2 2 2 () () X XXX n 統(tǒng)計(jì)指標(biāo) o 離散程度的描述 o 變異系數(shù) o 變異系數(shù)coefficiedt of variatlion CV o CV=標(biāo)準(zhǔn)差/均數(shù)100% o 描述了數(shù)據(jù)的變異相對(duì)其平均水平的大小 o 描述的是相對(duì)離散度 o 無單位量綱 o 比較度量衡單位不同資料的變異度 o 比較均數(shù)相差懸殊資料的變異度 數(shù)據(jù)分析中的一般統(tǒng)計(jì)描述策略 o 如果資料近似呈對(duì)稱分布,那么 o 如果資料取對(duì)數(shù)后才呈對(duì)稱分布,那么 o 如果資料呈偏態(tài)分布 o 在確認(rèn)性研究中,往往統(tǒng)計(jì)描述采用均數(shù),中位數(shù), 標(biāo)準(zhǔn)差, , ,最小值,最大值。 2575 (
14、)Median PP ( )ln( ) y y Gsyx其中 xs 25 P 75 P 小 結(jié) 集中趨勢指標(biāo):不同分布情況下,描述指標(biāo)的選擇集中趨勢指標(biāo):不同分布情況下,描述指標(biāo)的選擇 離散趨勢指標(biāo):各個(gè)指標(biāo)的應(yīng)用和特點(diǎn)離散趨勢指標(biāo):各個(gè)指標(biāo)的應(yīng)用和特點(diǎn) 如何從集中趨勢和離散趨勢兩個(gè)角度對(duì)數(shù)據(jù)進(jìn)行合理的描述如何從集中趨勢和離散趨勢兩個(gè)角度對(duì)數(shù)據(jù)進(jìn)行合理的描述 STATA命令 o ouse 光盤符:例題ex2-1 o翻開數(shù)據(jù)庫文件ex2-1.dta ogen f=int(x-110)/2)*2+110 o產(chǎn)生用以作頻數(shù)表的新變量“f otab f o對(duì)變量“f作頻數(shù)表 ograph f,bin(13) freq o作頻數(shù)圖 X STATA命令 o不等距分組頻數(shù)圖例2.2 ouse 光盤符:例題ex2-2 o翻開數(shù)據(jù)庫文件ex2-2.dta ograph num age, c (J) s(.) xlab (0 5 to 60) ylab(0 5 to 25) o 作頻數(shù)圖,其中c(J),以階梯狀 橫線連接各數(shù)據(jù)點(diǎn)。Xlab o 和ylab為x軸和y軸的刻度 STATA命令 o求均數(shù)、標(biāo)準(zhǔn)差(例2.1) ouse 光盤符:例題ex2-1 o直接法 osum x 綜述變量x o間接法 ogen xx=int(x-110)/2)*2+111 os
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年股權(quán)激勵(lì)合同:股權(quán)獎(jiǎng)勵(lì)與業(yè)績掛鉤條款3篇
- 2025年度濾袋材料費(fèi)用合同采購與項(xiàng)目進(jìn)度管理合同3篇
- 2025年度網(wǎng)絡(luò)安全防護(hù)設(shè)備采購合同范本與安全等級(jí)保護(hù)2篇
- 學(xué)生校園欺凌情況調(diào)查問卷
- 敢于擔(dān)當(dāng)善于化解難題體會(huì)
- 護(hù)理人力資源管理1
- 黨史知識(shí)競賽題庫及答案-一起學(xué)習(xí)黨史吧
- 八一南昌起義的意義是什么
- 2024版地方特色農(nóng)產(chǎn)品購銷合作合同版
- 2024集體土地租賃協(xié)議書
- 最新VTE指南解讀(靜脈血栓栓塞癥的臨床護(hù)理指南解讀)
- 生產(chǎn)計(jì)劃控制程序文件
- 山東省濟(jì)南市2022年中考英語情景運(yùn)用拔高練習(xí)(Word版含答案)
- 護(hù)理查房-糖尿病足 PPT課件
- 強(qiáng)力夯實(shí)加固地基質(zhì)量通病防治
- (高清正版)T-CAGHP 015—2018地質(zhì)災(zāi)害治理工程監(jiān)理預(yù)算標(biāo)準(zhǔn)(試行)
- Q∕GDW 12083-2021 輸變電設(shè)備物聯(lián)網(wǎng)無線節(jié)點(diǎn)設(shè)備技術(shù)規(guī)范
- 公司物流倉儲(chǔ)規(guī)劃方案及建議書
- 智能掃地機(jī)器人畢業(yè)設(shè)計(jì)
- 佳能EOS7D數(shù)碼單反相機(jī)說明書
- 大型焰火燃放活動(dòng)方案審批表
評(píng)論
0/150
提交評(píng)論