




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第二章
數據文件的建立和管理3/23/20241本章主要內容第一節(jié)SPSS數據文件第二節(jié)SPSS數據的結構和定義方法第三節(jié)SPSS數據的錄入和編輯第四節(jié)SPSS數據的保存第五節(jié)讀取其他格式的數據文件第六節(jié)SPSS數據文件的合并3/23/20242第一節(jié)SPSS數據文件1、SPSS數據文件的特點:SPSS數據文件有別于其他文件,是一個有特殊格式的文件,它是一種有結構的數據文件,它由數據結構和內容兩部分組成,其中,數據結構記錄數據變量的名稱、類型、變量寬度、小數位數、變量名標簽、變量值標簽、缺失值、顯示寬度、對齊方式和度量尺度等必要信息,內容才是那些待分析的具體數據?;谏鲜鎏攸c,建立SPSS數據文件時應完成兩項任務,即描述數據的結構和錄入編輯數據。3/23/20243數據編輯窗口中的一行稱為一個個案或記錄(Case),所有個案組成SPSS數據文件的內容。數據編輯窗口的一列稱為一個變量(Variable),每個變量都有一個名字,稱為變量名,它是訪問和分析SPSS每個變量的唯一標志。SPSS數據文件的結構就是對每個變量及相關特征的描述。2、SPSS數據的組織方式(1)原始數據的組織方式3/23/20244(2)頻數數據的組織方式例:職稱年齡段35歲以下(1)36-49歲(2)50歲以上(3)教授(1)0158副教授(2)10202講師(3)20101助教(4)35203/23/20245頻數數據的組織方式職稱年齡段人數1101215138211022202323120321033141354224303/23/20246第二節(jié)SPSS數據的結構和定義方法
SPSS數據的結構是對SPSS每列變量及其相關屬性的描述,主要包括變量名、數據類型、變量寬度、小數位數、變量名標簽、變量值標簽、顯示寬度、缺失值、對齊方式、度量尺度等信息。3/23/20247變量名(Variablename)變量名是變量訪問和分析的唯一標志。在定義SPSS數據結構時應首先給出每列變量的變量名。變量的命名規(guī)則如下:1.應以英文字母或漢字開頭,后面可跟除了!、?、*之外的字母或數字,下劃線、圓點不能作為變量名的最后一個字符。SPSS允許用漢字作為變量名。2.變量名的字符個數最好不多于8個;變量名不區(qū)分大小寫字母。3.SPSS有默認的變量名,以字母“VAR”開頭,后面補足5位數字,如VAR00001,VAR00002等。變量名不能與SPSS內部特有的具有特定含義的保留字同名,如ALL,BY,AND,NOT,OR等。4.變量名最好與其代表的數據含義相對應,每個變量名必須具有唯一性。3/23/20248數據類型(Type)數據類型是指每個變量取值的類型。SPSS中有三種基本數據類型:數值型、字符型和日期型。數值型(1)標準型(Numeric)(2)科學記數法型(ScientificNotation)(3)逗號型(Comma)(4)圓點型(Dot)(5)美元符號型(Dollar)(6)用戶自定義型(CustomCurrency)字符型(String)日期型(Date)3/23/20249數據類型表SPSS變量類型系統(tǒng)默認長度小數位數輸入方式顯示方式范例輸入顯示Numeric82標準格式或科學記數法標準格式數值變量圓點表示小數點的數值38.4238.42Comma82帶逗點的數值或科學記數法圓點做小數點,逗點做三位分割符的數值1,343,438.11,343,438.1Dot82帶圓點的數值或科學記數法逗點做小數點,圓點做三位分割符的數值34,3434E23.434,34Scietificnotation82科學記數法或標準格式科學記數法457.8E4457.8E4Date日期格式非常多顯示格式非常多Dollar82可帶$或不帶$輸入或科學記數法有效數值前帶$以逗點為分割符$12343$12343CustomCurrencyString8無一串字符串一串字符串BelieveBelieve
3/23/202410數值型數值型是SPSS最常用的數據類型,通常由阿拉伯數字和其它特殊符號等組成。其中的標準型(numeric)是SPSS默認的數據類型,默認的顯示寬度為8位,包括正負符號位、小數點和小數位在內,小數位默認為2位。如果數據的實際寬度大于8位,spss將自動按照科學計數法顯示,數據的顯示并不影響數據的存儲,也不影響數據的計算。3/23/202411字符型字符型也是SPSS較常用的數據類型,由一個字符串組成。如職工號碼、姓名、地址等變量都可以定義為字符型數據。字符型數據的默認顯示寬度為8個字符,不能夠進行算術運算,并區(qū)分大小寫字母。字符型數據在SPSS命令處理過程中應用一對雙引號括起來,但在輸入數據時不應輸入雙引號,否則雙引號將會作為字符型數據的一部分。3/23/202412日期型日期型數據用來表示日期或者時間,如生日、成立日期等變量可以定義為日期型數據。顯示格式:dd-mmm-yyyy;mm/dd/yyyy等等。3/23/202413變量寬度(Width)、列寬度(Columns)每種類型的變量都有自己的變量寬度、小數位和顯示寬度,其中變量寬度是變量允許的最大字符位數,列寬度是數據編輯窗口中顯示每列的字符位數。通常這兩個寬度是一致的。3/23/202414變量名標簽(Variablelabel)變量名標簽是對變量名含義的進一步解釋說明,它可以增強變量名的可視性和統(tǒng)計分析結果的可讀性。變量名標簽可用中文,總長度可達120個字符,但在統(tǒng)計分析結果的顯示中一般不能顯示如此長的變量名標簽信息。3/23/202415變量值標簽(Valuelabel)
變量值標簽是對變量取值含義的解釋說明信息,對于品質型數據尤為重要,比如1代表男性,2代表女性,它不但明確了數據的含義,也增強了最后統(tǒng)計分析結果的可讀性,變量值標簽可以用中文。3/23/202416缺失數據(Missingvalues)
數據中存在明顯錯誤或明顯不合理的數據或漏填數據項時統(tǒng)計學上稱為不完全數據或缺失數據。數據中如果存在缺失數據,分析時通常不能直接采用,要進行說明。SPSS中說明缺失數據的方法是指定用戶缺失值。這樣,spss在分析時,就能夠將這些缺失值與正常的數據區(qū)分開來,并依據用戶指定的缺失值處理策略對其進行處理或分析。Spss還有一類默認的缺失值,稱為系統(tǒng)缺失值,數值及日期型變量用圓點表示,字符型變量用空表示。3/23/202417
SPSS中說明缺失數據的基本方法是指定用戶缺失值。用戶缺失值可以是:對字符型或數值型變量,用戶缺失值可以是1至3個特定的離散值(Discretemissingvalues);對一個數值型變量,用戶缺失值可以在一個連續(xù)的閉區(qū)間內并同時再附加一個區(qū)間以外的離散值(Rangeplusoneoptionaldiscrete)。
3/23/202418SPSS用戶缺失值定義窗口3/23/202419變量對齊格式(Align)
定義顯示對齊方式,對齊方式分為右對齊、左對齊和中間對齊。系統(tǒng)中,數值型變量默認為右對齊,字符型變量默認為左對齊。3/23/202420計量尺度(Measure)統(tǒng)計學依據數據的計量尺度將數據劃分為三大類,即數值型數據(Scale),如身高、體重;順序型數據(Ordinal),如職稱、職務、對某事物的贊同程度;分類型數據(Nominal),如民族、宗教信仰、性別、黨派。數值型數據通常用數字表示;順序型數據具有內在固有大小或高低順序,但它又不同于數值型數據,一般用非數字表示;分類型數據沒有內在固有大小或高低順序,一般用非數字表示。3/23/202421SPSS中變量定義的操作單擊VariableView進入:單擊,定義變量名單擊,定義變量類型定義變量標簽變量值標簽定義計量尺度定義變量寬度定義對齊方式
定義變量類型對話框
定義變量值標簽對話框定義變量缺省值對話框3/23/202422通常建立SPSS數據文件時應首先定義數據的結構部分,然后再輸入數據,但實際應用中,邊錄入、邊分析、邊修改數據結構的情況也是常見的。數據的結構定義完成之后,可以在VariableView卡片中瀏覽,也可以通過菜單選項Utilities/Variable來實現。3/23/20242302-1SPSS數據文件的建立舉例根據居民儲蓄調查數據,建立SPSS格式的數據文件。3/23/202424第三節(jié)SPSS數據的錄入與編輯
1.錄入定義好SPSS數據結構后,可將具體的數據輸入到SPSS中,最終形成SPSS數據文件。SPSS數據的錄入操作在數據編輯窗口中的DataView卡片中實現。其操作方法與Excel基本類似,也是以電子表格的方式進行錄入。錄入帶有變量值標簽的數據時,可以在下拉按鈕中的值標簽列表中選擇一個輸入。3/23/2024252.SPSS數據的編輯數據必須輸入正確才能保證正確的分析結果。但很難一次輸入正確,所以就需要進行修改,一般包括數據的定位、插入、刪除、修改、復制等。3/23/202426(1)SPSS數據的定位數據的定位目的是將當前數據單元定位到某個特定的單元中。有兩種定位方式:
1)按個案號碼定位:Edit→GotoCase
將當前單元格定位在任何單元格中,選擇菜單Edit→GotoCase
,出現如下對話框,輸入欲定位的個案號碼并確認。
輸入要尋找觀測量序號3/23/202427
2)按變量值定位:Edit→Find將當前單元定位在某變量列的任何一個個案上選擇菜單Edit→Find
,出現如下對話框輸入定位變量值并確認
于是,SPSS自動對指定的變量進行搜索,并將當前單元定位于定位變量值相等的第一個個案上。3/23/202428(2)插入和刪除一個個案插入一個個案,即在數據編輯窗口的某個個案前插入一個新個案:將當前數據單元確定在一個個案上,選擇菜單
Edit→InsertCase(或工具欄插入個案圖標按鈕)刪除一個個案,在欲刪除的個案號碼上單擊鼠標左鍵,于是待刪除的個案數據全部反向顯示;單擊鼠標右鍵,從彈出菜單中選擇cut選項。3/23/202429(3)插入和刪除一個變量插入一個變量,即在數據編輯窗口的某個變量前插入一個新變量:將當前數據單元確定在一個變量上,選擇菜單
Edit→InsertVariable
刪除一個變量,在欲刪除的變量名上單擊鼠標左鍵,于是待刪除的數據全部反向顯示;單擊鼠標右鍵,從彈出菜單中選擇cut選項。3/23/202430(4)數據的移動、復制和刪除數據的移動、復制和刪除:與一般的應用程序相同選擇操作對象(變量、個案、若干連續(xù)單元等)剪切:Edit→Cut(Ctrl+X)復制:Edit→Copy(Ctrl+C)粘貼:Edit→Paste(Ctrl+V)
恢復刪除或修改前數據Edit→Undo(或工具欄Undo圖標按鈕)3/23/202431插入變量與刪除變量插入個案與刪除個案數據的剪切、粘貼與復制1.插入變量在添加處單擊Var,單擊右鼠標鍵出現右側對話框,單擊InsertVariables2.刪除變量1.插入個案在添加處單擊觀測量,單擊右鼠標鍵出現右側對話框,單擊InsertCase2.刪除個案剪切復制粘貼若想恢復,打開Edit→Undo3/23/202432SPSS支持的數據格式
1、SPSS文件格式,擴展名為.sav2、Excel格式文件,擴展名為.xls3、dbf格式文件,擴展名為.dbf4、文本格式文件,擴展名為.dat第四節(jié)SPSS數據的保存3/23/202433將數據保存為SPSS數據文件或其他格式的數據文件的基本操作是:File→Save,對于新的:提示文件名和類型;對于舊的,覆蓋原來的,不再提問;File→SaveAs,另存一個數據文件,也有格式(類型)問題;Variable按鈕允許用戶指定保存哪些變量,不保存哪些變量,變量名前畫叉的變量將被保存到磁盤中。將數據保存為Excel文件格式時,Writevariablesnamestospreadsheet選項呈可用狀態(tài),它的作用是指定是否將SPSS變量名寫入Excel工作表的第一行上。3/23/202434第五節(jié)讀取其他格式的數據文件
SPSS能夠直接讀取其他格式的數據文件,并將其保存為SPSS格式的數據。1.直接讀取其他格式的數據文件:(1)選擇菜單File→Open→Data;(2)選擇數據文件的類型,并輸入數據文件名。2.使用數據庫查詢打開
?利用通用數據庫ODBC接口讀取數據文件
?在9.0及以前版本中非常重要3.使用文本向導讀入文本文件:選擇菜單
File→ReadTextData3/23/202435
直接打開SPSS可以直接讀入許多格式的數據文件,其中就包括EXCEL各個版本的數據文件。選擇菜單File→Open→Data或直接單擊快捷工具欄上的OpenFile按鈕,系統(tǒng)就會彈出OpenFile對話框,單擊“文件類型”列表框,在里面能看到直接打開的數據文件格式,分別是:3/23/202436
注:讀入Excel文件時,SPSS默認將Excel工作表中的全部數據讀到SPSS數據編輯窗口,但也可以指定僅讀取工作表中某個區(qū)域內的數據(如A5:B10)。工作表上的一行數據為SPSS中的一個個案。如果Excel工作表文件第一行或指定讀取區(qū)域內的第一行存儲了變量名信息,則應選擇Readvariablenames項,即以第一行的文字信息作為SPSS的變量名,否則不選。3/23/202437
使用數據庫查詢打開
SPSS可以直接打開許多類型的數據文件,但這并不是說它可以打開所有類型的數據文件,比如FoxPro3.0以上版本的*.dbf文件就不能直接打開。為此,SPSS還提供了另一個適用范圍更廣、較為專業(yè)的數據接口——數據庫查詢。實際上,SPSS在這里使用的是一種叫ODBC(OpenDatabaseCapture)的數據接口,該接口被大多數數據庫軟件和辦公軟件(如MSOffice)支持,通過它,應用程序可以直接訪問以結構化查詢語言(SQL)做為數據訪問標準的數據庫管理系統(tǒng)。選擇菜單File→OpenDatabase→NewQuery,系統(tǒng)會彈出數據庫向導的第一個窗口,其中會列出你使用的機器上已安裝的所有數據庫驅動程序,選中所需的數據源,然后單擊下一步,向導會一步一步的提示你如何做,直至將數據讀入SPSS。3/23/202438
使用文本導入向導讀入文本文件選擇菜單File→ReadTextData,系統(tǒng)就會彈出OpenFile對話框,和前面的情況完全一樣,只是文件類型自動跳到了Text(*.txt)。實際上,該功能在SPSS中已被整合到了OpenFile對話框中之所以在菜單上保留該條目的原因是讀入純文本的情況非常普遍,放在這里更加醒目。02-2舉例:創(chuàng)建一個以純文本的形式保存的數據文件,且第一行為變量名,請將其讀入SPSS。在
File→ReadTextData對話框選中相應的文件名并單擊“確定”,系統(tǒng)會自動啟動文本導入向導對話框如下:3/23/202439Spss是否已經正確的識別和分割了數據項3/23/202440數據間如何分割數據文件的第一行上是否有變量名3/23/202441數據部分從文本文件的第幾行開始個案數據在文本文件中是如何安排的3/23/202442指定文本文件的分割符號字符型數據表示方法3/23/2024433/23/2024443/23/202445第六節(jié)SPSS數據文件的合并
當數據量較多時經常會把一份大的數據分成幾個小的部分,有幾個錄入員分別錄入,以期加快數據錄入速度,但一份完整的數據被分別存儲在幾個數據文件中,如果要分析這份數據就必須首先將若干個小的數據文件合并起來。要實現兩個或多個SPSS數據文件的合并,應首先將其中的某個數據文件讀入數據編輯窗口中,然后依次與其他數據文件合并。合并方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 尿道口溢尿護理討論
- Excel表格公式培訓
- 小學數學教師培訓心得
- 寵物用品店創(chuàng)業(yè)計劃書
- 急診護理團隊精神
- 常用眼藥水知識
- 影視劇組食堂服務合同
- 個人業(yè)績考核協(xié)議
- 中班分享課課件
- 農田整治與流轉協(xié)作協(xié)議
- 2025-2030羊毛制品行業(yè)市場調研分析及發(fā)展趨勢與投資前景研究報告
- 新零售背景下的電子商務嘗試試題及答案
- TSGD7002-2023-壓力管道元件型式試驗規(guī)則
- DZ∕T 0222-2006 地質災害防治工程監(jiān)理規(guī)范(正式版)
- 四川省中小流域暴雨洪水計算表格(尾礦庫洪水計算)
- CAD進階練習100題
- 楓香精油(征求意見稿)
- 電鍍企業(yè)安全風險辨識分級管控清單
- 2022年北京市專升本英語真題
- 貨幣金融學筆記(共60頁)
- 湘少版六年級下冊英語連詞成句年級聯(lián)考習題
評論
0/150
提交評論