![第六課:描述性統(tǒng)計分析--Descriptive Stati_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/16/e3491369-d42e-4c75-8584-8698b99a81db/e3491369-d42e-4c75-8584-8698b99a81db1.gif)
![第六課:描述性統(tǒng)計分析--Descriptive Stati_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/16/e3491369-d42e-4c75-8584-8698b99a81db/e3491369-d42e-4c75-8584-8698b99a81db2.gif)
![第六課:描述性統(tǒng)計分析--Descriptive Stati_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/16/e3491369-d42e-4c75-8584-8698b99a81db/e3491369-d42e-4c75-8584-8698b99a81db3.gif)
![第六課:描述性統(tǒng)計分析--Descriptive Stati_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/16/e3491369-d42e-4c75-8584-8698b99a81db/e3491369-d42e-4c75-8584-8698b99a81db4.gif)
![第六課:描述性統(tǒng)計分析--Descriptive Stati_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-1/16/e3491369-d42e-4c75-8584-8698b99a81db/e3491369-d42e-4c75-8584-8698b99a81db5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第六章:描述性統(tǒng)計分析Descriptive Statistics菜單詳解(醫(yī)學(xué)統(tǒng)計之星:張文彤)上次更新日期: 6.1Frequencies過程界面說明分析實例結(jié)果解釋6.2Descriptives過程界面說明結(jié)果解釋6.3Explore過程 界面說明結(jié)果解釋6.4Crosstabs過程 界面說明分析實例結(jié)果解釋描述性統(tǒng)計分析是統(tǒng)計分析的第一步,做好這第一步是下面進(jìn)行正確統(tǒng)計推斷的先決條件。SPSS的許多模塊均可完成描述性分析,但專門為該目的而設(shè)計的幾個模塊則集中在Descriptive Statistics菜單中,最常用的是列在最前面的四個過程:Frequencies過程的特色是產(chǎn)生頻數(shù)表
2、;Descriptives過程則進(jìn)行一般性的統(tǒng)計描述;Explore過程用于對數(shù)據(jù)概況不清時的探索性分析;Crosstabs過程則完成計數(shù)資料和等級資料的統(tǒng)計描述和一般的統(tǒng)計檢驗,我們常用的X2 檢驗也在其中完成。本章講述的四個過程在9.0及以前版本中被放置在Summarize菜單中。§6.1 Frequencies過程頻數(shù)分布表是描述性統(tǒng)計中最常用的方法之一,F(xiàn)requencies過程就是專門為產(chǎn)生頻數(shù)表而設(shè)計的。它不僅可以產(chǎn)生詳細(xì)的頻數(shù)表,還可以按要求給出某百分位點的數(shù)值,以及常用的條圖,圓圖等統(tǒng)計圖。和國內(nèi)常用的頻數(shù)表不同,幾乎所有統(tǒng)計軟件給出的均是詳細(xì)頻數(shù)表,即并不按某種要求
3、確定組段數(shù)和組距,而是按照數(shù)值精確列表。如果想用Frequencies過程得到我們所熟悉的頻數(shù)表,請先用第二章學(xué)過的Recode過程產(chǎn)生一個新變量來代表所需的各組段。Frequencies對話框的界面如下所示:該界面在SPSS中實在太普通了,無須多言,重點介紹一下各部分的功能如下:【Display frequency tables復(fù)選框】確定是否在結(jié)果中輸出頻數(shù)表。【Statistics鈕】單擊后彈出Statistics對話框如下,用于定義需要計算的其他描述統(tǒng)計量?,F(xiàn)將各部分解釋如下:o o Central tendency復(fù)選框組 用于定義描述集中趨勢的一組指標(biāo):均數(shù)(Mean、中位數(shù)(Me
4、dian、眾數(shù)(Mode、總和(Sum。 o o Distribution復(fù)選框組 用于定義描述分布特征的兩個指標(biāo):偏度系數(shù)(Skewness)和峰度系數(shù)(Kurtosis。 o Values are group midpoints復(fù)選框 當(dāng)你輸出的數(shù)據(jù)是分組頻數(shù)數(shù)據(jù),并且具體數(shù)值是組中值時,選中該復(fù)選框以通知SPSS,免得它犯錯誤。眾數(shù)(Mode指所有數(shù)值中出現(xiàn)頻率最高的一個值,在國內(nèi)用的非常少。【Charts鈕】彈出Charts對話框,用于設(shè)定所做的統(tǒng)計圖。o Chart type單選鈕組 定義統(tǒng)計圖類型,有四種選擇:無、條圖(Bar chart)、圓圖(Pie chart、直方圖Hist
5、ogram),其中直方圖還可以選擇是否加上正態(tài)曲線(With normal curve)。 o Chart Values單選鈕組 定義是按照頻數(shù)還是按百分比做圖(即影響縱坐標(biāo)刻度)。【Format鈕】彈出Format對話框,用于定義輸出頻數(shù)表的格式,不過用處不大,一般不管。o Order by單選鈕組 定義頻數(shù)表的排列次序,有四個選項:Ascending values為根據(jù)數(shù)值大小按升序從小到大作頻數(shù)分布;Descending values為根據(jù)數(shù)值大小按降序從大到小作頻數(shù)分布;Ascending counts為根據(jù)頻數(shù)多少按升序從少到多作頻數(shù)分布;Descending counts為根據(jù)頻數(shù)
6、多少按降序從多到少作頻數(shù)分布。 o Multiple Variables單選鈕組 如果選擇了兩個以上變量做頻數(shù)表,則Compare variables可以將他們的結(jié)果在同一個頻數(shù)表過程輸出結(jié)果中顯示,便于互相比較,Organize output by variables則將結(jié)果在不同的頻數(shù)表過程輸出結(jié)果中顯示。 o Suppress Tables more than.復(fù)選框 當(dāng)頻數(shù)表的分組數(shù)大于下面設(shè)定數(shù)值時禁止它在結(jié)果中輸出,這樣可以避免產(chǎn)生巨型表格。分析實例4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71 5.69 4.12 4.56 4.37 5.39 6.
7、30 5.21 7.22 5.54 3.93 5.21 4.12 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77 6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.
8、58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60 4.09 5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18 6.14 3.24 4.90 3.05解:為節(jié)省篇幅,這里只給出精確頻數(shù)表的做法,假設(shè)數(shù)據(jù)已經(jīng)輸好,變量名為X,具體解法如下:1. Analyze=>Descriptive Statistics=>Frequencies 2. Variables框:選入X 3. 單擊Statistics鈕: 4. 選中Mean、Std.deviation、Media
9、n復(fù)選框 5. 單擊Percentiles:輸入2.5:單擊Add:輸入97.5:單擊Add: 6. 單擊Continue鈕 7. 單擊Charts鈕: 8. 選中Bar charts 9. 單擊Continue鈕 10. 單擊OK得出結(jié)果后手工計算出CV。上面做出的直方圖分組太多,需要進(jìn)一步編輯。上題除直方圖外的的輸出結(jié)果如下:Frequencies最上方為表格名稱,左上方為分析變量名,可見樣本量N為101例,缺失值0例,均數(shù)Mean=4.69,中位數(shù)Median=4.61,標(biāo)準(zhǔn)差STD=0.8616,P2.5=3.04,P97.5=6.45。系統(tǒng)對變量x作頻數(shù)分布表(此處只列出了開頭部分)
10、,Vaild右側(cè)為原始值,F(xiàn)requency為頻數(shù),Percent為各組頻數(shù)占總例數(shù)的百分比(包括缺失記錄在內(nèi)),Valid percent為各組頻數(shù)占總例數(shù)的有效百分比,Cum Percent為各組頻數(shù)占總例數(shù)的累積百分比。§6.2 Descriptives過程Descriptives過程是連續(xù)資料統(tǒng)計描述應(yīng)用最多的一個過程,他可對變量進(jìn)行描述性統(tǒng)計分析,計算并列出一系列相應(yīng)的統(tǒng)計指標(biāo)。這和其他過程相比并無不同。但該過程還有個特殊功能就是可將原始數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)正態(tài)評分值并以變量的形式存入數(shù)據(jù)庫供以后分析?!維ave standardized values as variables復(fù)
11、選框】確定是否將原始數(shù)據(jù)的標(biāo)準(zhǔn)正態(tài)評分存為新變量。【Options鈕】彈出Options對話框,大部分內(nèi)容均在前面Frequences過程的Statistics對話框中見過,只有最下方的Display Order單選鈕組是新的,可以選擇為變量列表順序、字母順序、均數(shù)升序或均數(shù)降序。下面是一個典型的Descriptives過程結(jié)果統(tǒng)計表:一望可知,這里的大部分內(nèi)容都在上一節(jié)見過,因此就不再多解釋了。講了兩個過程,也許大家已經(jīng)發(fā)現(xiàn)了:結(jié)果中的統(tǒng)計專業(yè)單詞多數(shù)在對話框中就已經(jīng)出現(xiàn),因此我們以后會詳細(xì)解釋對話框的內(nèi)容,結(jié)果中相同的單詞不再重復(fù)解釋。§6.3 Explore過程Explore過
12、程可對變量進(jìn)行更為深入詳盡的描述性統(tǒng)計分析,主要用于對資料的性質(zhì)、分布特點等完全不清楚時,故又稱之為探索性分析。它在一般描述性統(tǒng)計指標(biāo)的基礎(chǔ)上,增加有關(guān)數(shù)據(jù)其他特征的文字與圖形描述,如枝葉圖、箱圖等,顯得更加詳細(xì)、全面,有助于用戶制定繼續(xù)分析的方案?!綝isplay單選鈕組】用于選擇輸出結(jié)果中是否包含統(tǒng)計描述、統(tǒng)計圖或兩者均包括?!綝ependent List框】用于選入需要分析的變量。【Factor List框】如果想讓所分析的變量按某種因素取值分組分析,則在這里選入分組變量。【Label cases by框】選擇一個變量,他的取值將作為每條記錄的標(biāo)簽。最典型的情況是使用記錄ID號的變量?!?/p>
13、Statistics鈕】彈出Statistics對話框,用于選擇所需要的描述統(tǒng)計量。有如下選項:o Descriptives復(fù)選框:輸出均數(shù)、中位數(shù)、眾數(shù)、5%修正均數(shù)、標(biāo)準(zhǔn)誤、方差、標(biāo)準(zhǔn)差、最小值、最大值、全距、四分位全距、峰度系數(shù)、峰度系數(shù)的標(biāo)準(zhǔn)誤、偏度系數(shù)、偏度系數(shù)的標(biāo)準(zhǔn)誤及指定的均數(shù)可信區(qū)間。 o M-estimators復(fù)選框:作中心趨勢的粗略最大似然確定,輸出四個不同權(quán)重的最大似然確定數(shù)。 o Outliers復(fù)選框:輸出五個最大值與五個最小值。 o Percentiles復(fù)選框:輸出第5%、10%、25%、50%、75%、90%、95%位數(shù)?!綪lot鈕】彈出Plot對話框,用于
14、選擇所需要的統(tǒng)計圖。有如下選項:o Boxplots單選框組:確定箱式圖的繪制方式,可以是按組別分組繪制(Factor levels together,也可以不分組一起繪制(Depentends together,或者不繪制(None。 o Descriptive復(fù)選框組:可以選擇繪制莖葉圖(Stem-and-leaf和直方圖(Histogram。 o Normality plots with test復(fù)選框:繪制正態(tài)分布圖并進(jìn)行變量是否符合正態(tài)分布的檢驗。 o Spread vs. Level with Levene Test單選框組:當(dāng)選擇了分組變量時,繪制spread-versus-le
15、vel圖(我還沒有找到他的中文名字該叫什么),設(shè)置繪圖時變量的轉(zhuǎn)換方式,并進(jìn)行組間方差齊性檢驗?!綩ptions鈕】用于選擇對缺失值的處理方式,可以是不分析有任一缺失值的記錄、不分析計算某統(tǒng)計量時有缺失值的記錄,或報告缺失值。結(jié)果解釋以例6.1的數(shù)據(jù)為例,按默認(rèn)方式下的選擇,Explore過程的輸出如下:Explore首先是例行的處理記錄缺失值情況報告,可見101例均為有效值。上表詳細(xì)列出了常用的描述統(tǒng)計量,如果有標(biāo)準(zhǔn)誤也會列出(如偏度和峰度系數(shù))。XX Stem-and-Leaf PlotFrequency Stem & Leaf
16、60;Stem width: 1.0000 Each leaf: 1 case(s以上是莖葉圖,整數(shù)位為莖,小數(shù)位為葉。這樣可以非常直觀的看出數(shù)據(jù)的分布范圍及形態(tài),在國外非常流行。以上是箱式圖,中間的黑粗線為均數(shù),紅框為四分位間距的范圍,上下兩個細(xì)線為最大、最小值。§6.4 Crosstabs過程Crosstabs過程用于對計數(shù)資料和有序分類資料進(jìn)行統(tǒng)計描述和簡單的統(tǒng)計推斷。在分析時可以產(chǎn)生二維至n維列聯(lián)表,并計算相應(yīng)的百分?jǐn)?shù)指標(biāo)。統(tǒng)計推斷則包括了我們常用的X2檢驗、
17、Kappa值,分層X2(X2M-H)。如果安裝了相應(yīng)模塊,還可計算n維列聯(lián)表的確切概率(Fisher's Exact Test)值。Crosstabs過程不能產(chǎn)生一維頻數(shù)表(單變量頻數(shù)表),該功能由Frequencies過程實現(xiàn)?!綬ows框】用于選擇行*列表中的行變量?!綜olumns框】用于選擇行*列表中的列變量?!綥ayer框】Layer指的是層,對話框中的許多設(shè)置都可以分層設(shè)定,在同一層中的變量使用相同的設(shè)置,而不同層中的變量分別使用各自層的設(shè)置。如果要讓不同的變量做不同的分析,則將其選入Layer框,并用Previous和Next鈕設(shè)為不同層。Layer在這里用的比較少,在多
18、元回歸中我們將進(jìn)行詳細(xì)的解釋。【Display clustered bar charts復(fù)選框】顯示重疊條圖?!維uppress table復(fù)選框】禁止在結(jié)果中輸出行*列表。【Exact鈕】針對2*2以上的行*列表設(shè)定計算確切概率的方法,可以是不計算(Asymptotic only)、蒙特卡羅模擬(Monte Carlo)或確切計算(Exact)。蒙特卡羅模擬默認(rèn)進(jìn)行10000次模擬,給出99%可信區(qū)間;確切計算默認(rèn)計算時間限制在5分鐘內(nèi)。這些默認(rèn)值均可更改。如果你在安裝SPSS時沒有安裝EXACT模塊,則此處對話框中不會出現(xiàn)Exact鈕。在3*3及以上的行*列表中,確切概率的精確計算是極為漫
19、長的過程。我曾經(jīng)用SAS 6.12在P133機(jī)上計算過一個12格表的確切概率,整整跑了兩個小時后,SAS告訴我說機(jī)器內(nèi)存不足:(。SPSS的計算速度比SAS要慢許多倍,因此一般只需要選用蒙特卡羅模擬算出概率值的99%可信區(qū)間就行了,精度完全可以滿足需要,而速度極快(10000次模擬一般耗時在10秒左右)?!維tatistics鈕】彈出Statistics對話框,用于定義所需計算的統(tǒng)計量。o Chi-square復(fù)選框:計算X2值。 o Correlations復(fù)選框:計算行、列兩變量的Pearson相關(guān)系數(shù)和Spearman等級相關(guān)系數(shù)。 o Norminal復(fù)選框組:選擇是否輸出反映分類資料
20、相關(guān)性的指標(biāo),很少使用。a. Contingency coefficient復(fù)選框:即列聯(lián)系數(shù),其值界于01之間;b. Phi and Cramer's V復(fù)選框:這兩者也是基于X2值的,Phi在四格表X2檢驗中界于-11之間,在R*C表X2檢驗中界于01之間;Cramer's V 則界于01之間;c. Lambda復(fù)選框:在自變量預(yù)測中用于反映比例縮減誤差,其值為1時表明自變量預(yù)測應(yīng)變量好,為0時表明自變量預(yù)測應(yīng)變量差;d. Uncertainty coefficient復(fù)選框:不確定系數(shù),以熵為標(biāo)準(zhǔn)的比例縮減誤差,其值接近1時表明后一變量的信息很大程度來自前一變量,其值接近
21、0時表明后一變量的信息與前一變量無關(guān)。o Ordinal復(fù)選框組:選擇是否輸出反映有序分類資料相關(guān)性的指標(biāo),很少使用。a. Gamma復(fù)選框:界于01之間,所有觀察實際數(shù)集中于左上角和右下角時,其值為1;b. Somers'd復(fù)選框:為獨(dú)立變量上不存在同分的偶對中,同序?qū)ψ訑?shù)超過異序?qū)ψ訑?shù)的比例;c. Kendall's tau-b復(fù)選框:界于-11之間;d. Kendall's tau-c復(fù)選框:界于-11之間;o Eta復(fù)選框:計算Eta值,其平方值可認(rèn)為是應(yīng)變量受不同因素影響所致方差的比例; o Kappa復(fù)選框:計算Kappa值,即內(nèi)部一致性系數(shù); o Risk
22、復(fù)選框:計算比數(shù)比OR值; o McNemanr復(fù)選框:進(jìn)行McNemanr檢驗(一種非參檢驗); o Cochran's and Mantel-Haenszel statistics復(fù)選框:計算X2M-H統(tǒng)計量(分層X2,也有寫為X2CMH的),可在下方輸出H0假設(shè)的OR值,默認(rèn)為1?!綜ells鈕】彈出Cells對話框,用于定義列聯(lián)表單元格中需要計算的指標(biāo):o Counts復(fù)選框組:是否輸出實際觀察數(shù)(Observed和理論數(shù)(Expected); o Percentages復(fù)選框組:是否輸出行百分?jǐn)?shù)(Row)、列百分?jǐn)?shù)(Column)以及合計百分?jǐn)?shù)(Total); o Residuals復(fù)選框組:選擇殘差的顯示方式,可以是實際數(shù)與理論數(shù)的差值(Unstandardized)、標(biāo)化后的差值(Standardized,實際數(shù)與理論數(shù)的差值除理論數(shù)),或者由標(biāo)準(zhǔn)誤確立的單元格殘差(Adj. Standardized);【Format鈕】用于選擇行變量是升序還是降序排列。分析實例
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 家長的申請書
- 2025年度互聯(lián)網(wǎng)企業(yè)虛擬股權(quán)激勵協(xié)議書
- 2025年度消防產(chǎn)品認(rèn)證服務(wù)協(xié)議
- 申請書和申請
- 2025年度基礎(chǔ)設(shè)施建設(shè)貸款合同印花稅率調(diào)整公告
- 電子商務(wù)市場拓展的數(shù)字化營銷策略
- 電力企業(yè)風(fēng)險評估中的電力設(shè)施保護(hù)
- 電工材料在辦公自動化中的角色與作用
- 2025年度建筑節(jié)能玻璃幕墻節(jié)能性能檢測合同
- 二零二五年度普洱茶產(chǎn)業(yè)升級購銷合同規(guī)范樣本4篇
- 臟腑辨證與護(hù)理
- 虛擬化與云計算技術(shù)應(yīng)用實踐項目化教程 教案全套 第1-14周 虛擬化與云計算導(dǎo)論-騰訊云服務(wù)
- 甲基丙烯酸甲酯生產(chǎn)工藝畢業(yè)設(shè)計設(shè)備選型與布置模板
- 徐金桂行政法與行政訴訟法新講義
- 瀝青拌合設(shè)備結(jié)構(gòu)認(rèn)知
- 2023年北京高考政治真題試題及答案
- 復(fù)旦中華傳統(tǒng)體育課程講義05木蘭拳基本技術(shù)
- 北師大版五年級上冊數(shù)學(xué)教學(xué)課件第5課時 人民幣兌換
- 工程回訪記錄單
- 住房公積金投訴申請書
- 檢驗科生物安全風(fēng)險評估報告
評論
0/150
提交評論