spss復習資料整理_第1頁
spss復習資料整理_第2頁
spss復習資料整理_第3頁
spss復習資料整理_第4頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第一章1.SPSS是軟件英文名稱的首字母縮寫,其最初為StatisticalPackagefortheSocialSciences的縮寫,即“社會科學統(tǒng)計軟件包”。2.SPSS系統(tǒng)運行管理方式(SPSS的幾種基本運行方式)有:(1)完全窗口菜單運行方式(2)程序運行管理方式(3)混合運行管理方式3.SPSS的界面提供的五個窗口:數(shù)據(jù)編輯窗口、結(jié)果管理窗口、結(jié)果編輯窗口、語法編輯窗口、腳本窗口。第二章1.SPSS的文件類型:語法文件(*.sps)、數(shù)據(jù)文件(*.sav)、結(jié)果輸出文件(*.spv)。2.SPSS數(shù)據(jù)編輯器的每一行數(shù)據(jù)稱為一個個案(Case),每一個數(shù)據(jù)代表個體的屬性,即變量(Variable)。3.SPSS變量名的命名規(guī)則:1)必須以英文字母開頭,其他部分可以含有字母、數(shù)字、下劃線(即“-”);2)變量名盡量避免和SPSS已有的關(guān)鍵字重復,例如sum、compute、anova等;3)SPSS13及以后版本支持變量名最長為64Byte,即變量名最長為64個英文字符,或者32個中文字符;4)SPSS變量名不區(qū)分大小寫,即SPSS認為Name、name、nAme這三個變量名沒有區(qū)別。4.變量度量類型:定量(個數(shù)、高度、溫度等)、定序(“十分重要”、“重要”、“一般”、“不重要”)、定類(名字、地址、電話等)。5.列和寬度的區(qū)別:變量寬度:對字符型變量,該數(shù)值決定了你能輸入的字符串的長度;列:設定該變量數(shù)據(jù)視圖中列的寬度。6.變量的值標簽:即對數(shù)值含義的解釋。例如:值標簽12男女7.默認的缺失值類型:數(shù)值型類型(.)、字符串類型(空格)。8.數(shù)據(jù)文件的合并包括:縱向合并和橫向合并(合并個案和合并變量),合并變量包括一對一合并和一對多合并。9.SPSS用“(*)”表示變量來自于當前活動數(shù)據(jù)文件中的變量,而用“(+)”表示將要和當前數(shù)據(jù)文件進行合并的數(shù)據(jù)文件中的變量。10.在合并數(shù)據(jù)文件之前,所有需要合并的數(shù)據(jù)文件必須預先按照關(guān)鍵變量進行升序排列。否則,合并文件程序?qū)⑹ ?1.(選擇題)一對一合并變量時,兩個文件都要提供個案;一對多合并時,活動的和非活動的文件都可以作為關(guān)鍵字。課后練習題:6.下列可以作為SPSS變量名的是A).PRENTS12B).1NameC).NOTTRUED).@result7.SPSS中可以設置工作目錄,具體設置可以按照以下菜單:A).【選項】→【設置】B).【編輯】→【選項】→【設置】C).【編輯】→【選項】→【文件位置】D).【文件】→【選項】→【設置】8.當合并Student-Infor.sav(參見表2-1)和Student-Scores.sav(參見表2-2)兩個數(shù)據(jù)文件為一個數(shù)據(jù)集Student-Records.sav時,是增加記錄還是增加變量?(表略,參見P67)A).增加記錄B).增加變量C).都不是D).都正確9.對上題的文件合并中,那個變量是關(guān)鍵變量:(對應知識點11)A)學生IDB).性別C).年齡和班級D).科目E).成績10.在合并兩個SPSS文件時,正確的說法是:A).如果是添加變量,SPSS可以顯示變量是來源于那個數(shù)據(jù)文件B).如果是添加個案,SPSS可以顯示變量是來源于那個數(shù)據(jù)文件C).合并兩個SPSS文件后,將無法辨別個案來自于哪一個文件D).以上都不正確第三章1.可是離散化的作用以及兩類方法作用:可視離散化用于為定量變量創(chuàng)建分類變量,從而實現(xiàn)連續(xù)變量的離散化。在統(tǒng)計分析中,有時候需要了解總體的大致分布狀況,而不需要了解屬性的具體信息。兩類方法:直接輸入分割點和根據(jù)條件自動生成分割點。2.數(shù)據(jù)缺失的可能原因,缺失值的定義以及如何處理缺失值?1)原因:eq\o\ac(○,1)在數(shù)據(jù)收集階段,收集者沒有收集到相應數(shù)據(jù);eq\o\ac(○,2)應答著拒絕回答該問題,比如該問題涉及個人隱私;eq\o\ac(○,3)該問題對該應答者不適用,比如該問題是針對女性的,而應答者為男性。2)定義:缺失值是指粗糙數(shù)據(jù)中由于缺少信息而造成的數(shù)據(jù)的聚類,分組,刪失或截斷。它指的是現(xiàn)有數(shù)據(jù)集中某個或某些屬性的值是不完全的。3)如何處理:首先應該想到重新回到數(shù)據(jù)收集階段盡量收集到該數(shù)據(jù),如果實在收集不到該數(shù)據(jù),再考慮怎么處理缺失值,如果缺失數(shù)據(jù)不影響到具體的統(tǒng)計分析,則不對缺失值作任何處理(即缺失數(shù)據(jù)還是作為缺失數(shù)據(jù)處理),如果缺失數(shù)據(jù)影響到了具體的統(tǒng)計分析,則必須考慮采取適當方法來填補缺失數(shù)據(jù)。3.SPSS提供的填補缺失值的方法有哪些?(作簡要說明)1)序列均值為取整列數(shù)據(jù)的均值;2)臨近點均值為去該缺失值臨近的幾個點的均值,具體幾個點由附近點的跨度來設定;3)臨近點的中位數(shù)為取該缺失值鄰近的幾個點的中位數(shù),具體幾個點由附近點的跨度來設定;4)線性插值法應用線性插值法填補缺失值。用該列數(shù)據(jù)缺失值前一個數(shù)據(jù)和后一個數(shù)據(jù)建立插值直線,然后用缺失點在線性插值函數(shù)的函數(shù)值填充該缺失值;5)點處的線性趨勢法應用缺失值所在的整個序列建立線性回歸方程,然后用該回歸方程在缺失點的預測值填充缺失值。4.什么叫數(shù)據(jù)校驗,作用是什么?數(shù)據(jù)校驗即查找錯誤數(shù)據(jù)或者不一致數(shù)據(jù)的過程。作用:如果數(shù)據(jù)沒有收集到則盡量想辦法補全;如果是錄入錯誤則重新錄入;如果數(shù)據(jù)確實錯誤,則可將這些數(shù)據(jù)設置成缺失值(即丟棄這些數(shù)據(jù)不進行分析)。5.在選擇個案If對話框中,構(gòu)建選擇“‘男性1’、‘黑種人2’、‘東北地區(qū)1第四章1.統(tǒng)計分析的目的,描述性統(tǒng)計分析方法與推斷性統(tǒng)計分析方法有什么不同?目的:是研究觀察對象總體的特點。區(qū)別:描述性統(tǒng)計分析方法是指應用分類、制表、圖形以及概括性數(shù)據(jù)指標(如均值、方差)來概括數(shù)據(jù)分布特征的方法。兒推斷性統(tǒng)計分析方法則是通過隨機抽樣,應用統(tǒng)計方法把從樣本數(shù)據(jù)得到的結(jié)論推廣到總體的數(shù)據(jù)分析方法。2.描述數(shù)據(jù)特征的統(tǒng)計量的兩大類:一類表示數(shù)據(jù)的中心位置,另一類表示數(shù)據(jù)的離散程度。3.比較均值、中位數(shù)、眾數(shù)的區(qū)別與聯(lián)系。均值:eq\o\ac(○,1)用于數(shù)值型的數(shù)據(jù),不能用于定類、定序型數(shù)據(jù);eq\o\ac(○,2)易受極端值的影響;中位數(shù):eq\o\ac(○,1)主要用于定序數(shù)據(jù),不能用于定類數(shù)據(jù);eq\o\ac(○,2)不受極端值影響;眾數(shù):eq\o\ac(○,1)主要用于定類數(shù)據(jù);eq\o\ac(○,2)不受極端值影響;eq\o\ac(○,3)可能沒有眾數(shù)或多個眾數(shù)。對于數(shù)據(jù)變量和定序變量,可以用均值、中位數(shù)、眾數(shù);對于定類數(shù)據(jù),只有眾數(shù)。4.對極差、方差、標準差作解釋。極差反映了變量的變異范圍或離散幅度,在相同樣本容量的兩組數(shù)據(jù)中,全距大的一組數(shù)據(jù)比全距小的一組數(shù)據(jù)要分散。方差和標準差越大,變量值之間的差異越大,距離平均數(shù)這個“中心”離散越大;越小,則這些數(shù)據(jù)更接近平均值。5.分位數(shù)的類型,各自的含義。四分位差是什么,大小說明什么?百分位數(shù):一百等份,即P1.P2.P3.P4……P100;四分位數(shù)將觀測數(shù)值按從小到大進行排序,然后分成四等份,出于三個分割點位置的觀測值就是四分位數(shù),即Q1.Q2.Q3;十分位數(shù)將觀測數(shù)值按從小到大進行排序,然后分成十等份,出于九個分割點位置的觀測值就是十分位數(shù),即D1.D2.D3.……D9。四分位差通常為Q3和Q1的差,用來衡量觀測值的離散程度,四分位差越大則說明所觀測的數(shù)據(jù)越分散,越小則說明所觀測數(shù)據(jù)越集中。6.分布的形狀有偏度和峰度。偏度是用來描述變量取值分布的偏斜方向,它衡量分布對稱與否、分布不對稱的方向和程度,取值一般在-3和3之間;峰度是用來描述變量取值分布形態(tài)陡緩程度的統(tǒng)計量,是指分布圖形的尖峭程度或峰凸程度,取值范圍可正可負可為零。7.標準化分數(shù)也叫標準化值或Z分數(shù),用于對變量的標準化處理。意義:變量值X,Z分數(shù)表示大于或小于平均數(shù)幾個標準差,可用來比較從兩個不同單位抽取出來的兩值。8.統(tǒng)計圖定類型:餅圖、條形圖(【分析】→【描述統(tǒng)計】→【頻率】下),帕累托圖(【分析】→【質(zhì)量控制】→【排列圖】)。數(shù)值型:莖葉圖、箱圖、直方圖(在【分析】→【描述統(tǒng)計】→【探索】下)。9.對莖葉圖、箱圖的解釋。莖葉圖是描述定量變量的一種圖形方式,它除了能夠給出直方圖所給出的分布的信息外,還能夠還原大部分原始數(shù)據(jù)的信息。箱圖是總結(jié)五數(shù)(最小值、第一四分位數(shù)、中位數(shù)、第三個四分位數(shù)、最大值)的圖形表現(xiàn)。(用‘o’表示離群值,用‘*’表示極端值,一般極端值會大一些。)(要求會讀圖,P132-133)。課后練習3.說明莖葉圖和直方圖區(qū)別。如果想盡可能展現(xiàn)原始數(shù)據(jù)的信息,應該采用哪一種圖形?莖葉圖:莖葉圖是描述定量變量的一種圖形方式,它除了能夠給出直方圖所給出的分布的信息外,還能夠還原大部分原始數(shù)據(jù)的信息。優(yōu)點:變量取值較多,不影響其顯示效果;缺點:如果觀測值較大,顯示效果不好。直方圖:應用于連續(xù)型數(shù)據(jù),表現(xiàn)在圖形上直方圖的各個正方條形之間沒有任何間隔。優(yōu)點:變量值較多,觀測值較多不影響顯示效果,概括性好,反映次數(shù)分布直觀;缺點:有信息損失,組數(shù)的確定帶有一定的主觀性。如果想盡可能展現(xiàn)原始數(shù)據(jù)的信息,應該采用莖葉圖。???4.說明帕累托圖和直方圖的區(qū)別。帕累

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論