版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
上節(jié)回顧一、數(shù)據(jù)的編碼、錄入與整理二、數(shù)據(jù)問卷與編碼三、編碼類型四、缺失值的處理五、數(shù)據(jù)處理中的操作術(shù)語六、定義變量與SPSS窗口七、數(shù)據(jù)的錄入八、數(shù)據(jù)的導入九、數(shù)據(jù)的整理第8講
SPSS基本統(tǒng)計分析
----描述統(tǒng)計一、基本統(tǒng)計分析概念目的通過變量的基本統(tǒng)計分析,能夠掌握和了解數(shù)據(jù)的基本統(tǒng)計特征和總體分布形態(tài),為進一步的數(shù)據(jù)分析作參考。方法
數(shù)據(jù)計算:計算常見的統(tǒng)計量的值,準確反映樣本數(shù)據(jù)的統(tǒng)計特征。
圖形繪制:繪制常見的統(tǒng)計圖形,通過圖形來直觀展現(xiàn)數(shù)據(jù)的分布特征,比較
數(shù)據(jù)分布的異同。
通常,兩種方法混合使用。SPSS對數(shù)據(jù)的基本統(tǒng)計分析包括頻數(shù)分析過程(Frenquencies):描述統(tǒng)計量分析過程(Descriptives):探索性分析過程(Explore):交叉列聯(lián)表分析過程(Crosstabs):比率分析(Ratio):P-P圖Q-Q圖
頻數(shù)分析二、頻數(shù)分析頻數(shù)概念統(tǒng)計的是每一組中觀測點的個數(shù),而不考慮其實際取值。二、頻數(shù)分析SPSS中的頻數(shù)分布表
頻數(shù)分析的基本功能之一:是編制頻數(shù)分布表頻數(shù)(Frenquency):變量值落在某個區(qū)間或者某個取值點的個數(shù)。百分比(Percent):各頻數(shù)占總樣本數(shù)的百分比。有效百分比(ValidPercent):各頻數(shù)占有效樣本數(shù)的百分比。累計百分比(CumulativePercent):各百分比逐級累加起來的結(jié)果,最終取值是100。取值不及格及格中等良好優(yōu)秀合計取值區(qū)間0-5960-6970-7980-8990-1000-100頻數(shù)1919321677百分比1.30%11.69%24.68%41.56%20.78%100.00%累計百分比1.30%12.99%37.66%79.22%100.00%100.00%返回二、頻數(shù)分析頻數(shù)分析中的統(tǒng)計圖
頻數(shù)分析的基本功能之二:是繪制統(tǒng)計圖,統(tǒng)計圖能非常清晰直觀地展示變量的取值狀況,包括以下三種圖:條形圖或柱形圖(BarChart):用寬度相同的條形的高度或長短來表示頻數(shù)分布或百分比餅圖(PieChart):扇形面積表示頻數(shù)或百分比直方圖(Histograms):用矩形的面積來表示頻數(shù)分布條形圖與直方圖區(qū)別條形圖1.用條形的長度表示各類別頻數(shù)的多少,其寬度是固定的2.各矩形通常是分開排列的;3.橫軸上是一個點,主要用于展示分類數(shù)據(jù)。直方圖1.用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或頻率寬度表示各組的組距;2.由于分組數(shù)據(jù)具有連續(xù)性,各矩形通常是連續(xù)排列;3.橫軸上是一個范圍,主要用于展示數(shù)值型數(shù)據(jù)。示例1如果想了解語文成績的分布情況,可以使用什么方法呢?頻數(shù)分布表?餅圖?直方圖?SPSS操作及案例(數(shù)據(jù)文件:3-StudentScore.sav)例一:繪制語文成績頻數(shù)分布表及餅圖
步驟1:對“語文”成績進行分段Transform→RecodeIntoDifferentVariables…或者:Transform→VisualBinning(可視化分段)二、頻數(shù)分析二、頻數(shù)分析SPSS操作及案例步驟2:對“分數(shù)分段”進行統(tǒng)計Analyze→DescriptiveStatistics→Frequencies…二、頻數(shù)分析SPSS操作及案例輸出結(jié)果可以保存為.spv或pdf或word或文本格式
二、頻數(shù)分析—擴展功能注:主要針對于定距型變量
計算分位數(shù)
分位數(shù)是變量在不同分位點上的取值
分位數(shù)從側(cè)面刻畫了變量的取值分布狀態(tài),分位數(shù)差越大,表示離散程度越大
計算其他基本統(tǒng)計量
集中程度離散趨勢分布形態(tài)二、頻數(shù)分析SPSS操作及案例例二:輸出三門成績4分位數(shù)
由四分位差知道中間50%的數(shù)據(jù)中數(shù)學
成績的分布比英語
和語文離散程度高。
基本描述統(tǒng)計量三、基本描述統(tǒng)計量概念
通過頻數(shù)分析對數(shù)據(jù)的總體分布狀況有了基本了解之后,通常還需要對定距變量的分布特征有更為精確的認識,這就需要通過計算基本描述統(tǒng)計量等途徑來實現(xiàn)。
常見的描述統(tǒng)計量大致可以分為三類:第一類:描述集中程度(CentralTendency)的統(tǒng)計量第二類:描述離散趨勢(Dispersion)的統(tǒng)計量第三類:描述分布形態(tài)(Distribution)的統(tǒng)計量變量的值之間可以比較大小,兩個值的差有實際意義,這樣的變量叫定距變量。在調(diào)查被訪者的“年齡”和“每月平均收入”,都是定距變量。三、基本描述統(tǒng)計量描述集中程度的統(tǒng)計量指一組數(shù)據(jù)向某一中心集中的程度,即在某一中心附近觀測值數(shù)目較多,遠離該中心的觀測值數(shù)目較少。有如下統(tǒng)計量:
平均值(Mean):即算術(shù)平均值(=(X1+X2+…+Xn)/n)。
易受極端值影響。
中位數(shù)(Median):把變量的值有序排列,位于中間位置的值即中位數(shù)。
是位置平均置,不易受極端值的影響。
眾數(shù)(Mode):樣本中出現(xiàn)次數(shù)最多的值,代表數(shù)據(jù)的集中程度。
例如:鞋廠制定生產(chǎn)計劃;評價社會的老齡化程度
三、基本描述統(tǒng)計量描述離散趨勢的統(tǒng)計量與“集中趨勢”相反,“離散趨勢”反映的是一組資料中各個觀察值之間的差異或離散程度。即考察所有數(shù)據(jù)相對于“中心值”分布的疏密程序。有如下統(tǒng)計量:方差(Variance):
樣本方差越大,說明變量值之間的差異越大,樣本方差沒有單位。標準差(std.deviation):
樣本標準差越大,說明變量的觀測值之間
的差異越大,距離均值這個“中心”的離散程
度越大。極差(Range):也稱全距或跨度或范圍,R=最大值-最小值
極差不考慮最大值與最小值之間的觀測值,僅僅依靠端點值來確定,因而穩(wěn)定性差。
三、基本描述統(tǒng)計量描述離散趨勢的統(tǒng)計量均值標準誤差(S.E.Mean,StandardErrorofMean,簡稱標準誤):樣本數(shù)據(jù)是從總體數(shù)據(jù)中抽取出來的。雖然在一定程度上,樣本數(shù)據(jù)可以反映總體數(shù)據(jù)的特征。但在不同次抽樣中所得的樣本均值是不同的,并且它們與總體均值間存在差異。均值標準誤差:就是描述這些樣本均值與總體均值之間平均差異程度的統(tǒng)計量。即:樣本均值的標準差(也即:樣本均值的離散程度)三、基本描述統(tǒng)計量描述分布形態(tài)的統(tǒng)計量
考察數(shù)據(jù)分布形態(tài)特征的統(tǒng)計量,例如,數(shù)據(jù)分布是否對稱、偏斜程度以及陡緩程度,主要有如下兩種統(tǒng)計量:偏度(Skewness):
偏度值>0,為正偏或右偏,表示均值右邊的數(shù)較少;偏度值<0,為負偏或左偏。峰度(Kurtosis):
峰度值>0,數(shù)據(jù)分布比標準正態(tài)分布更陡峭,為尖峰分布,表示極端值較多;峰度值<0,數(shù)據(jù)分布比標準正態(tài)分布更平緩,為平峰分布。返回三、基本描述統(tǒng)計量SPSS操作及案例分析(數(shù)據(jù)文件:3-StudentScore.sav)
例三:計算全部學生各門成績的平均值、標準差、最大值和最小值,并考察學生成績的分布形態(tài)。思考語文成績均值右邊數(shù)據(jù)多還是左邊數(shù)據(jù)多?思考哪門課程的極端值較多?三、基本描述統(tǒng)計量SPSS操作及案例分析
數(shù)據(jù)文件:3-StudentScore.sav
Analyze→DescriptiveStatistics→Descriptives…注:描述統(tǒng)計分析過程較為特殊的一個功能就是將原變量變換成標準正態(tài)分布下的得分。保存數(shù)據(jù)的標準化處理值(又稱Z分數(shù))Z分數(shù)>0表示樣本值大于均值Z分數(shù)<0表示樣本值小于均值Z分數(shù)>3表示樣本為異常值
探索性分析四、探索性分析概念
數(shù)據(jù)探索是統(tǒng)計分析中非常重要的一步,可以幫助我們決定選擇哪種統(tǒng)計方法進行數(shù)據(jù)分析可以:(1)考察數(shù)據(jù)的正確性
考察數(shù)據(jù)中的一些異常值,分析這些值產(chǎn)生的原因,判斷其正確性,再決定修改、刪除或保留它們。(2)考察數(shù)據(jù)的分布特征
考察數(shù)據(jù)的正態(tài)分布特征可以為以后進行統(tǒng)計分析時采用正確的統(tǒng)計方法提供正確的依據(jù)。四、探索性分析通過莖葉圖(Stem-and-LeafPlots)描述頻度分布莖葉圖由數(shù)字構(gòu)成,表達變量的頻數(shù)分布。Analyze→DescriptiveStatistics→Explore…
例如,語文成績莖葉圖。
通過箱圖(Boxplots)描述數(shù)據(jù)分布箱圖也稱為箱線圖(箱式圖),顯示了變量數(shù)據(jù)的中位數(shù)、25%百分位數(shù)和75%百分位數(shù),并給出偏離總體分布的奇異個案和極端個案。四、探索性分析通過箱圖(Boxplots)描述數(shù)據(jù)分布
語文成績箱圖四、探索性分析通過箱圖(Boxplots)描述數(shù)據(jù)分布并尋找異常值
四、探索性分析四、探索性分析通過正態(tài)分布檢驗的Q-Q概率圖描述數(shù)據(jù)分布的正態(tài)性
正態(tài)概率圖以變量(語文成績)的觀測值為X軸坐標,以該變量分布的Z分數(shù)為縱坐標。斜線為正態(tài)分布的Z分數(shù)的期望標準線,若觀測點離線越近,表示點越符合正態(tài)分布。反之,越不符合正態(tài)分布。四、探索性分析通過正態(tài)分布檢驗的Q-Q概率圖描述數(shù)據(jù)分布的正態(tài)性Analyze→DescriptiveStatistics→Explore…四、探索性分析SPSS操作及案例分析例四:按數(shù)據(jù)文件:4-Explore.sav考察不同性別學生“英語”、“數(shù)學”、“語文”三門課程成績的分布、極端值以及正態(tài)分布性和方差的齊性。四、探索性分析SPSS操作及案例分析箱圖四、探索性分析SPSS操作及案例分析
從K-S檢驗以及S-W檢驗兩種方法的Sig.值看,均大于0.05,表明三門課程成績按男女分開的樣本都是正態(tài)分布的。四、探索性分析SPSS操作及案例分析
例四:操作步驟(數(shù)據(jù)文件:4-Explore.sav)
Analyze→DescriptiveStatistics→Explore...頻數(shù)分析解決了單個分類變量的分布特征。如何分析兩個分類型變量之間的分布特征?
交叉列聯(lián)表分析五、交叉列聯(lián)表分析概念
通過頻數(shù)分析,能夠掌握單個分類變量的數(shù)據(jù)分布情況。
實際情況,往往需要對兩個或者多個分類變量的頻數(shù)分布進行聯(lián)合觀察,此時涉及多個分類變量的聯(lián)合描述,進而分析變量之間的相互影響和關(guān)系。
本節(jié)主要講交叉列聯(lián)表分析過程,它包括如下兩大基本任務(wù):
五、交叉列聯(lián)表分析根據(jù)樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表
交叉列聯(lián)表是兩個或兩個以上的變量交叉分組后形成的頻數(shù)分布表。例如,一個二維交叉列聯(lián)表,反映了不同戶籍和是否購房交叉分組下的分數(shù)頻數(shù)分布情況。例五:數(shù)據(jù)文件:
住房狀況數(shù)據(jù).sav五、交叉列聯(lián)表分析返回行百分比列百分比根據(jù)樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表操作步驟:Analyze→DescriptiveStatistics→Crosstabs…五、交叉列聯(lián)表分析五、交叉列聯(lián)表分析在交叉列聯(lián)表的基礎(chǔ)上,對兩兩變量間是否存在一定的相關(guān)性進行分析分析:從表中可以看出,在0.05置信度水平下,雙尾檢驗值為0.002,小于置信度水平(0.05),因此,我們有理由認為,戶籍與是否購房之間的關(guān)系顯著,即不同戶籍的人對于是否購房看法不一致。列聯(lián)表的卡方檢驗用于檢驗兩個分類變量的關(guān)聯(lián)程度。注:如果列鏈表中有20%以上單元格的期望頻數(shù)小于5,則一般不宜使用卡方檢驗。此時可以使用似然率卡方檢驗修正。思考題1根據(jù)employeedata.sav的數(shù)據(jù)分析性別與工種有無關(guān)系?思考題2根據(jù)下面數(shù)據(jù)分析性別與對商品顏色喜好間有無關(guān)系?男女黃色120140藍色160120黑色120140如何完成多選題的頻數(shù)分布呢?六、多選項分析多重應答(MultipleResponse),又稱多選題,是市場調(diào)查研究中十分常見的數(shù)據(jù)形式。多重應答數(shù)據(jù)本質(zhì)上屬于分類數(shù)據(jù),但由于各選項均是對同一個問題的回答,之間存在一定的相關(guān),將各選項單獨進行分析并不恰當。對多重應答數(shù)據(jù)最常見的分析是使用SPSS中的“MultipleResponse”命令,通過定義變量集的方式,對選項進行簡單的頻數(shù)分析和交叉列聯(lián)分析。多選項分析思路多選項分析的基本思路是:第一,按照多選項二分法或多選項分類法將多選項問題分解成若干個問題,并設(shè)置若干個SPSS變量。第二,采用多選項頻數(shù)分析或多選項交叉分組下的頻數(shù)分析多選題分析中比較特別的描述指標有以下幾個應答人數(shù)(count):指選擇各選項的人數(shù),或者說原始頻數(shù)。應答人次(responses):指選擇各選項的人次,對于單個選項,應答人次和應答人數(shù)是相同的;但對于整個問題而言,應答人次可能遠遠大于應答人數(shù)。多選項分析案例請問您目前已經(jīng)擁有的數(shù)碼產(chǎn)品有哪些?多重應答的標準紀錄方式有兩種:(1)多重二分法(Multipledichotomymethod)。對于多項選擇題的每一個選項看作一個變量來定義。0代表沒有被選中,1代表被選中。這樣,多項選擇題中有幾個選項
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2023-2024學年遼寧省沈陽市皇姑區(qū)虹橋中學七年級(上)調(diào)研數(shù)學試卷(一)
- 滬科版八年級數(shù)學上冊第12章一次函數(shù)12-2一次函數(shù)第1課時正比例函數(shù)課件
- 魯教版八年級數(shù)學上冊專項素養(yǎng)綜合練(七)利用旋轉(zhuǎn)的性質(zhì)解決線段和角的問題(1)課件
- 北師大版八年級生物上冊第6單元生命的延續(xù)第20章生物的遺傳和變異第2節(jié)性狀遺傳的物質(zhì)基礎(chǔ)課件
- 蘇教版八年級生物上冊專項素養(yǎng)綜合練(六)填圖專項課件
- 統(tǒng)編版五年級語文上冊第四單元綜合測試卷及答案
- 人教版八年級數(shù)學上冊《第十三章軸對稱》單元測試卷帶答案
- 三年級下冊道德與法治-【說課稿】3 我很誠實
- 化 學碳的氧化物(第1課時)課件-2024-2025學年九年級化學人教版(2024)上冊
- 【五年級】上冊道德與法治-5上1單元《面對成長中的新問題》
- 2024年秋季新人教PEP版三年級上冊英語全冊教案
- GB/T 15688-2024動植物油脂不溶性雜質(zhì)含量的測定
- 新教材外研版高中英語選擇性必修第一冊各單元重點語法歸納總結(jié).文檔
- 愚公移山英文 -中國故事英文版課件
- 易燃易爆物質(zhì)和物品參考名錄-國家應急管理部研究中心編制
- 劉漢盛點評推薦的100張HiFi碟
- 中藥養(yǎng)雞配方合集
- 腹膜后間隙解剖及CT診斷
- 《國際商務(wù)談判》課程標準
- 四川農(nóng)作物分布以及種植作物面積
- 部編版五年級上冊《將相和》第二課時語文教案
評論
0/150
提交評論