版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
數(shù)據(jù)分析方法及軟件應(yīng)用授課教師:楊小寶北京交通大學2016.092023/2/4第2章SPSS的數(shù)據(jù)文件2.1SPSS數(shù)據(jù)文件的特點2.2定義變量屬性(重點)2.3SPSS數(shù)據(jù)的錄入、編輯(自學)2.4
SPSS數(shù)據(jù)的保存2.5讀取其他格式的數(shù)據(jù)文件(重點)2.6SPSS數(shù)據(jù)文件的合并(自學)2.1SPSS數(shù)據(jù)文件的特點SPSS的數(shù)據(jù)文件擴展名是.sav;SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件,它由數(shù)據(jù)結(jié)構(gòu)和內(nèi)容兩部分組成,其中的數(shù)據(jù)結(jié)構(gòu)記錄數(shù)據(jù)變量的名稱、類型、變量寬度、小數(shù)位數(shù)、變量名標簽、變量值標簽、缺失值、顯示寬度、對齊方式和度量尺度等必要信息,數(shù)據(jù)的內(nèi)容才是那些待分析的具體數(shù)據(jù)。數(shù)據(jù)結(jié)構(gòu)數(shù)據(jù)內(nèi)容
基于上述特點,建立SPSS數(shù)據(jù)文件時應(yīng)完成兩項任務(wù):描述SPSS數(shù)據(jù)的結(jié)構(gòu)(變量視圖)錄入編輯SPSS數(shù)據(jù)的內(nèi)容(數(shù)據(jù)視圖)(1)原始數(shù)據(jù)的組織方式數(shù)據(jù)編輯窗口中的一行稱為一個個案或記錄(Case),所有個案組成SPSS數(shù)據(jù)文件的內(nèi)容。數(shù)據(jù)編輯窗口的一列稱為一個變量(Variable),每個變量都有一個名字,稱為變量名,它是訪問和分析SPSS每個變量的唯一標志。SPSS數(shù)據(jù)文件的結(jié)構(gòu)就是對每個變量及相關(guān)特征的描述。SPSS數(shù)據(jù)的組織方式直接的問卷數(shù)據(jù)(2)頻數(shù)數(shù)據(jù)的組織方式例:職稱年齡段35歲以下(1)36-49歲(2)50歲以上(3)教授(1)0158副教授(2)10202講師(3)20101助教(4)3520頻數(shù)數(shù)據(jù)的組織方式中:一行為變量的一個分組(或多個變量交叉分組下的一個分組),所有行囊括了該變量的所有分組情況,一列仍為一個變量,代表某個問題(或某個方面)及頻數(shù)。分組匯總后的數(shù)據(jù)頻數(shù)數(shù)據(jù)的組織方式—SPSS格式職稱年齡段人數(shù)110121513821102220232312032103314135422430變量名(Name)數(shù)據(jù)類型(Type)、寬度(Width)、列寬度(Columns)-重點變量名標簽(Label)變量值標簽(Values)-重點缺失數(shù)據(jù)(Missing)變量對齊格式(Align)度量標準(Measure)-重點2.2定義變量屬性
變量名是變量訪問和分析的唯一標志。在定義SPSS數(shù)據(jù)結(jié)構(gòu)時應(yīng)首先給出每列變量的變量名。變量的命名規(guī)則如下:1.以前版本的首字符應(yīng)以英文字母開頭,20版本的可以直接是漢字開頭。后面可以跟除了!、?、*之外的字母或數(shù)字。下劃線、圓點不能為變量名的最后一個字符。SPSS允許用漢字作為變量名。1)變量名(Variablename)定義時直接錄入即可2.變量名的字符個數(shù)最好不多于8個;變量名不區(qū)分大小寫字母。3.SPSS有默認的變量名,以字母“VAR”開頭,后面補足5位數(shù)字,如VAR00001,VAR00012等。變量名不能與SPSS內(nèi)部特有的具有特定含義的保留字同名,如ALL,BY,AND,NOT,OR等。4.變量名最好與其代表的數(shù)據(jù)含義相對應(yīng),每個變量名必須具有唯一性。2)數(shù)據(jù)類型(Type)
每種類型的變量都有自己的變量寬度、小數(shù)位和顯示寬度,其中變量寬度是變量允許的最大字符位數(shù),列寬度是數(shù)據(jù)編輯窗口中顯示每列的字符位數(shù)。通常這兩個寬度是一致的。2)變量寬度(Width)、顯示寬度(Columns)3)變量名標簽(Variablelabel)變量名標簽是對變量名含義的進一步解釋說明,它可以增強變量名的可視性和統(tǒng)計分析結(jié)果的可讀性。變量名標簽可用中文,總長度可達120個字符,但在統(tǒng)計分析結(jié)果的顯示中一般不能顯示如此長的變量名標簽信息。定義時直接錄入即可4)變量值標簽(Valuelabel)
變量值標簽是對變量取值含義的解釋說明信息,對于品質(zhì)型數(shù)據(jù)(定性數(shù)據(jù)包括分類和順序數(shù)據(jù))尤為重要,比如1代表男性,2代表女性,它不但明確了數(shù)據(jù)的含義,也增強了最后統(tǒng)計分析結(jié)果的可讀性,變量值標簽可以用中文。鼠標單擊再單擊右邊的省略號彈出值標簽定義窗口逐個添加5)缺失數(shù)據(jù)(Missingvalues)數(shù)據(jù)中存在明顯錯誤或明顯不合理的數(shù)據(jù)或漏填數(shù)據(jù)項時統(tǒng)計學上稱為不完全數(shù)據(jù)或缺失數(shù)據(jù)。數(shù)據(jù)中如果存在缺失數(shù)據(jù),分析時通常不能直接采用,要進行說明。SPSS用戶缺失值定義窗口鼠標單擊再單擊右邊的省略號彈出缺失值定義窗口逐個添加6)變量對齊格式(Align)定義顯示對齊方式,對齊方式分為右對齊、左對齊和中間對齊;系統(tǒng)中,數(shù)值型變量默認為右對齊,字符型變量默認為左對齊。7)度量標準(Measure)
統(tǒng)計學依據(jù)數(shù)據(jù)的度量尺度將數(shù)據(jù)劃分為三大類:名義(Nominal)—分類數(shù)據(jù),如民族、宗教信仰、性別、黨派;序號(Ordinal)—順序數(shù)據(jù),如職稱、職務(wù)、對某事物的贊同程度;度量(Scale)—數(shù)值型數(shù)據(jù),如身高、體重。通常建立SPSS數(shù)據(jù)文件時應(yīng)首先定義數(shù)據(jù)的結(jié)構(gòu)部分,然后再輸入數(shù)據(jù),但實際應(yīng)用中,邊錄入、邊分析、邊修改數(shù)據(jù)結(jié)構(gòu)的情況也是常見的。數(shù)據(jù)的結(jié)構(gòu)定義完成之后,可以在變量視圖(VariableView)卡片中瀏覽,也可以通過菜單選項實用程序(Utilities)變量(Variable)來實現(xiàn)。SPSS數(shù)據(jù)的錄入(與Excel類似,自學)
SPSS數(shù)據(jù)的編輯(與Excel類似,自學)
SPSS數(shù)據(jù)的定位
插入和刪除一條個案
插入和刪除一個變量
數(shù)據(jù)的移動、復(fù)制和刪除2.3SPSS數(shù)據(jù)的錄入、編輯(自學)查找
1、SPSS文件格式,擴展名為.sav2、Excel格式文件,擴展名為.xls3、dbf格式文件,擴展名為.dbf4、文本格式文件,擴展名為.datSPSS支持的數(shù)據(jù)格式2.4SPSS數(shù)據(jù)的保存文件File保存Save,對于新的:提示文件名和類型;對于舊的,覆蓋原來的,不再提問;文件File另存為SaveAs,另存一個數(shù)據(jù)文件,也有格式(類型)問題;變量Variable按鈕允許用戶指定保存哪些變量,不保存哪些變量,變量名前畫叉的變量將被保存到磁盤中。保存數(shù)據(jù)的基本操作保存為SPSS格式時將數(shù)據(jù)保存為Excel文件格式時,將變量名寫入表格Writevariablesnamestospreadsheet選項呈可用狀態(tài),它的作用是指定是否將SPSS變量名寫入Excel工作表的第一行上。直接讀入其它格式的數(shù)據(jù)文件使用文本向?qū)ёx入文本文件(自學)使用數(shù)據(jù)庫向?qū)ёx入數(shù)據(jù)(自學)2.5讀取其它格式的數(shù)據(jù)文件1)直接讀入其它格式的數(shù)據(jù)文件SPSS現(xiàn)在可以直接讀入許多格式的數(shù)據(jù)文件,其中就包括EXCEL各個版本的數(shù)據(jù)文件。選擇菜單文件File打開Open數(shù)據(jù)Data;或直接單擊快捷工具欄上的OpenFile按鈕,系統(tǒng)就會彈出OpenFile對話框,單擊“文件類型”列表框,在里面能看到直接打開的數(shù)據(jù)文件格式。
注:讀入Excel文件時,SPSS默認將Excel工作表中的全部數(shù)據(jù)讀到SPSS數(shù)據(jù)編輯窗口,但也可以指定僅讀取工作表中某個區(qū)域內(nèi)的數(shù)據(jù)(如A5:B10)。工作表上的一行數(shù)據(jù)為SPSS中的一個個案。如果Excel工作表文件第一行或指定讀取區(qū)域內(nèi)的第一行存儲了變量名信息,則應(yīng)選擇讀取變量名Readvariablenames項,即以第一行的文字信息作為SPSS的變量名,否則不選。讀取EXCEL數(shù)據(jù)文件2)使用文本向?qū)ёx入文本文件選擇菜單文件File打開文本數(shù)據(jù)ReadTextData,系統(tǒng)就會彈出OpenFile對話框,和前面的情況完全一樣,只是文件類型自動跳到了Text(*.txt)。也可直接單擊快捷工具欄上的OpenFile按鈕,系統(tǒng)就會彈出OpenFile對話框,單擊“文件類型”列表框,在里面能看到直接打開的文本文件格式。類似于從文本格式轉(zhuǎn)為EXCEL格式的操作例:現(xiàn)有一數(shù)據(jù)文件以純文本的形式保存,且第一行為變量名,請將其讀入SPSS。在文件File打開文本數(shù)據(jù)ReadTextData對話框選中相應(yīng)的文件名并單擊“確定”,系統(tǒng)會自動啟動文本導(dǎo)入向?qū)υ捒蛉缦拢侯愃朴趶奈谋靖袷睫D(zhuǎn)為EXCEL格式的操作選擇菜單文件File打開數(shù)據(jù)庫OpenDatabase
新建查詢NewQuery,系統(tǒng)會彈出數(shù)據(jù)庫向?qū)У牡谝粋€窗口,其中會列出你使用的機器上已安裝的所有數(shù)據(jù)庫驅(qū)動程序,選中所需的數(shù)據(jù)源,然后單擊下一步,向?qū)徊揭徊降奶崾灸闳绾巫?,直至將?shù)據(jù)讀入SPSS。3)使用數(shù)據(jù)庫向?qū)ёx入數(shù)據(jù)縱向合并數(shù)據(jù)文件橫向合并數(shù)據(jù)文件2.6SPSS數(shù)據(jù)文件合并(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 彩鋼房屋維修工程承包合同7篇
- 2025年沈陽航空職業(yè)技術(shù)學院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 2025年江西外語外貿(mào)職業(yè)學院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 生產(chǎn)設(shè)備采購合同
- 簡單產(chǎn)品購銷的合同范本
- 清潔生產(chǎn)技術(shù)服務(wù)合同書模板
- 考核目標的挑戰(zhàn)性與可衡量性
- 抵押和借款合同
- 住房裝修合同范本
- 酒店單位合同協(xié)議書
- 充電樁知識培訓課件
- 2025年七年級下冊道德與法治主要知識點
- 2025年交通運輸部長江口航道管理局招聘4人歷年高頻重點提升(共500題)附帶答案詳解
- 老年髖部骨折患者圍術(shù)期下肢深靜脈血栓基礎(chǔ)預(yù)防專家共識(2024版)解讀
- 偏癱足內(nèi)翻的治療
- 藥企質(zhì)量主管競聘
- 信息對抗與認知戰(zhàn)研究-洞察分析
- 手術(shù)室??谱o士工作總結(jié)匯報
- 2025屆高三聽力技巧指導(dǎo)-預(yù)讀、預(yù)測
- 四年級下冊部編版語文教學參考教師用書
- 月球基地建設(shè)與運行管理模式
評論
0/150
提交評論