最新spss數(shù)據(jù)文件的建立與操作_第1頁
最新spss數(shù)據(jù)文件的建立與操作_第2頁
最新spss數(shù)據(jù)文件的建立與操作_第3頁
最新spss數(shù)據(jù)文件的建立與操作_第4頁
最新spss數(shù)據(jù)文件的建立與操作_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第2章 數(shù)據(jù)文件的建立與操作 u1.數(shù)據(jù)文件的建立u2.數(shù)據(jù)的編輯u3.數(shù)據(jù)文件的操作u4.變量級別的數(shù)據(jù)管理1.數(shù)據(jù)文件的建立u建立spss數(shù)據(jù)文件是利用spss進行數(shù)據(jù)管理和統(tǒng)計分析的首要工作。用于分析的數(shù)據(jù)資料有兩種,一種是原始資料,需要將它們錄入進spss軟件,建立數(shù)據(jù)文件;另一種是己經(jīng)被錄入為其他數(shù)據(jù)格式的資料,需要將其內(nèi)容導入到spss中。u1.1 數(shù)據(jù)文件的特點u1.2 定義變量u1.3 錄入數(shù)據(jù)u1.4 外部數(shù)據(jù)的導入1.1 數(shù)據(jù)文件的特點uspss數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件,它由數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)內(nèi)容兩部分組成,其中結(jié)構(gòu)部分用于定義數(shù)據(jù)類型、寬度、缺失值等,而內(nèi)容才是我們具體

2、要分析的數(shù)據(jù)。uspss數(shù)據(jù)文件的擴展名是.sav對每個變量及相關(guān)屬性的描述就是對每個變量及相關(guān)屬性的描述就是spss 數(shù)據(jù)文件的結(jié)構(gòu)數(shù)據(jù)文件的結(jié)構(gòu)數(shù)據(jù)數(shù)據(jù)變量名變量名個案個案case變量變量u因此spss中建立數(shù)據(jù)文件的步驟包括兩項工作:n定義數(shù)據(jù)文件結(jié)構(gòu)(定義變量)n錄入spss數(shù)據(jù)屬性屬性變量變量1.2 定義變量u可以使用file菜單中的new命令來建立一個數(shù)據(jù)文件,也可以在啟動spss時選擇type in data選項輸入新的數(shù)據(jù)文件。u在數(shù)據(jù)編輯窗口(spss data editor)中點擊左下端的variable view標簽變量窗口。u在variable view中,定義變量的屬

3、性。uspss中的變量有十個屬性:n變量名(name)變量類型(type) n變量寬度(width)小數(shù)點的位數(shù)(decimals)n變量名標簽(label)變量值標簽(values)n缺失值(missing)列的顯示寬度(columns)n對齊方式(align)測(計)量尺度(measure)u要定義一個變量時,至少要定義變量名和變量類型。變量名(name)u變量名是變量參與分析的唯一標志,定義變量結(jié)構(gòu)時首先應給出每個變量的變量名。否則,系統(tǒng)默認為var00001、var00002、var00003等。為變量命名要遵循一定的規(guī)則。n長度少于64個字符(32個漢字),可以用漢字n要唯一,不區(qū)別

4、大小寫字符,將fan與fan看作同一個變量n盡量見名識義n不符合規(guī)則系統(tǒng)會給出提示變量類型(type) (包括width與decimals)uspss的變量類型(type)共有3種:數(shù)值型、字符型和日期型。數(shù)值型變量按不同的要求共分為標準型、逗號型、圓點型、科學計數(shù)型、美元型和自定義貨幣型,系統(tǒng)默認的為標準數(shù)值型變量(numerical)。u單擊變量視圖(variable view)中的type選項組,選項組中右側(cè)會出現(xiàn)省略號按鈕,單擊該按鈕,會彈出variable type(變量類型)對話框。 u 變量長度的系統(tǒng)默認值可以由主菜單的edit中的option中的data窗口重新設(shè)置字符數(shù)超過8

5、個字符的字符型變量稱為長字符型變量,等于或少于8個字符的稱為短字符型變量。字符型變量不能參與運算,系統(tǒng)將同一字母的大、小寫認為是兩個不同的字符。自定義貨幣型(custom currency)spss提供5種自定義數(shù)值變量的類型。對應的自定義類型,系統(tǒng)自動命名為cca、ccb、ccc、ccd、cce型,系統(tǒng)默認為逗號數(shù)值型,如123456.78顯示為123,456.78??梢杂芍鞑藛蔚膃dit中的option中的currency窗口定義常用的數(shù)值型變量。例如,要定義人民幣的輸入格式,則在prefix文本框中輸入“¥”,在suffix文本框中輸入“元”,則在數(shù)據(jù)編輯窗口定義為cca類型的數(shù)據(jù)中,輸

6、入1234,數(shù)據(jù)顯示為“¥1,234元”。 測(計)量尺度(measure)u統(tǒng)計數(shù)據(jù)是對客觀現(xiàn)象計量的結(jié)果,按照對事物計量的精確程度,可將所采用的計量尺度由低級向高級分為:定類尺度、定序尺度、定距尺度、定比尺度。unorminaln 定類尺度是對事物的類別或?qū)傩缘囊环N測度,按照事物的某種屬性對其進行分類或分組。定類變量的特點是其值僅代表了事物的類別和屬性,僅能測度類別差異,不能比較各類之間的大小,所以各類之間沒有順序或等級。n 在spss中,能使用定類尺度的數(shù)據(jù)可以是數(shù)值型,也可以是字符型變量。必須符合窮盡和互斥的原則。窮盡的原則就是指每個個體都必須能歸為一個類別,互斥的原則是指每個個體都只

7、能歸為一個類別。n 相應變量為定類變量或(無序)分類變量。uordinaln定序尺度是對事物之間等級或順序差別的一種測度。n定序尺度的特點是可以測度類別差,還可以測度次序差,但是定序尺度無法測出數(shù)據(jù)之間的準確差值,所以其計量結(jié)果只能排序,不能進行算術(shù)四則運算。n對定類尺度的變量只能計算頻數(shù)和頻率量。定序變量除可以計算頻率之外,還可以計算累計頻率。n相應變量為定序變量或有序分類變量。uintervaln 定距尺度是對事物類別或次序之間間距的測度。定距變量的特點是其不僅能將事物區(qū)分為不同類型并進行排序,而且可準確指出類別之間的差距是多少。 n 測量結(jié)果往往表現(xiàn)為數(shù)值,所以計量結(jié)果可以進行加減運算。

8、uscalen 定比尺度是能夠測算兩個測度值之間比值的一種計量尺度,它的測量結(jié)果同定距變量一樣也表現(xiàn)為數(shù)值,其與定距變量的差別在于有一固定的絕對“零點”,而定距變量則沒有,定距變量中的“0” 并不表示“沒有”,僅僅是一個測量值,而定比變量中的“0” 就真正表示“沒有”。n 定比變量是測量尺度的最高水平,它除了具有其他三種測量尺度的全部特點外,還具有可計算兩個測度值之間比值的特點,因此它可進行加、減、乘、除運算,而定距變量只可進行加減運算。u由于定距尺度與定比尺度在絕大多數(shù)統(tǒng)計分析中沒有本質(zhì)上的差別,在spss中就將其合并為一類,統(tǒng)稱為“scale”測量尺度(間隔尺度)。u相應變量為間隔變量或連

9、續(xù)性變量。u在這4種測量尺度之間,按照信息量的高低,可將高層次測量尺度的測量結(jié)果轉(zhuǎn)換為低層測量尺度的測量結(jié)果,但這樣會損失一部分信息。不能將低層次的測量尺度轉(zhuǎn)換為高層次測量尺度的結(jié)果,這樣可能會引入錯誤的信息。u當輸入的是數(shù)字時,系統(tǒng)默認的是scale,當輸入的是字符串時,系統(tǒng)默認的是nominal。變量名標簽(label)與變量值標簽(values)u變量名標簽(label)n 變量名標簽是對變量名附加的解釋說明,增加結(jié)果數(shù)據(jù)的可讀性。由于早期版本的變量名不能超過八個字符,有時不能清楚地表達變量的含義,這時要靠變量名標簽來對變量名加以解釋。如果變量名有標簽,系統(tǒng)在輸出時以標簽代替變量名輸出。

10、u變量值標簽(value)n 是對變量的具體數(shù)值所代表的意義的標注。n 大多數(shù)變量值都是以符號或數(shù)字來表示的。但對于定類變量和定序變量,用數(shù)字或符號不能夠很明確地表現(xiàn)出變量值的意義時,可以用變量值標簽來說明它們所代表的實際意義。u 定義完變量值標簽后,在spss主窗口中,在菜單欄中選擇view | value labels命令,則在spss主窗口中經(jīng)過變量值標簽定義的數(shù)值型變量顯示為所定義的變量值。缺失值(missing)umissing項是一個重要而且容易被忽視的選項,它用于定義變量缺失值。u缺失值missing,即錯誤的數(shù)據(jù),對于沒有測量到的和測量、記錄、錄入錯的數(shù)值,在spss中可以處理

11、成缺失值。uspss中缺失值有用戶自定義缺失值和系統(tǒng)缺失值兩大類。對于字符型變量,系統(tǒng)默認的缺失值為空格。對數(shù)值型變量,系統(tǒng)默認的缺失值為一個圓點“.”。u用戶可以自己定義缺失值。n 例如對于性別變量正常值為1和2,但在錄入時,0、3等是容易被錄入的錯誤值。將其定義為缺失值后,系統(tǒng)將認為它們是非法值,在統(tǒng)計時會被剔除。1.3 錄入數(shù)據(jù)u定義了變量的各種屬性后,回到data view視圖中,就可以直接在表中錄入數(shù)據(jù)。在錄入數(shù)據(jù)過程中可以點擊save或save as作為數(shù)據(jù)文件保存。n按變量輸入數(shù)據(jù)n按觀測量輸入數(shù)據(jù)n輸入帶有變量值標簽的數(shù)據(jù)1.4 外部數(shù)據(jù)的導入u為了在統(tǒng)計分析過程中能有效的利用

12、其它軟件產(chǎn)生的數(shù)據(jù),spss軟件編輯窗口除可以使用*.sav擴展名數(shù)據(jù)文件,還可以直接打開和保存其它類型的數(shù)據(jù)文件。u讀取excel格式的文件u讀取文本格式的文件 讀取excel格式的文件u以spss自帶的文件demo.xis為例,來看spss如何直接讀取這個文件,該文件位于spss目錄下的tutorialsample_files子目錄中。讀取文本格式的文件u以spss自帶的文件demo.txt為例,來看spss如何直接讀取這個文件,該文件位于spss目錄下的tutorialsample_files子目錄中。2.數(shù)據(jù)的編輯u查看變量信息n 可以在數(shù)據(jù)編輯器窗口中選擇variable view視

13、區(qū)瀏覽變量信息,也可以通過spss菜單欄中utilities菜單中的variables命令來查看變量信息u查看文件信息n 通過file菜單中的display data file information命令來實現(xiàn) uspss數(shù)據(jù)的定位u插入與刪除變量u插入與刪除觀測量u數(shù)據(jù)的剪切、復制和粘貼u撤銷操作3.數(shù)據(jù)文件的操作u數(shù)據(jù)文件的打開與保存u數(shù)據(jù)排序u數(shù)據(jù)文件的分解u數(shù)據(jù)文件的合并u數(shù)據(jù)文件的轉(zhuǎn)置3.1 數(shù)據(jù)排序u使用右鍵菜單u菜單欄中選擇data | sort cases命令 3.2 數(shù)據(jù)文件的分解u拆分數(shù)據(jù)文件的觀測量,觀測量按某種條件進行分組;(有些統(tǒng)計命令本身具有分組的功能,有些則需要在

14、這里定義分組,再進行某種統(tǒng)計)。3.3 數(shù)據(jù)文件的合并u有時分析數(shù)據(jù)文件時會需要將幾個數(shù)據(jù)文件合并在一起分析,數(shù)據(jù)文件共有兩種合并方式:橫向合并和縱向合并。其中,橫向合并是指從外部文件中增加變量到當前數(shù)據(jù)文件,而縱向合并是指從外部數(shù)據(jù)文件中增加觀測量到當前數(shù)據(jù)文件中。u增加變量(橫向合并)n橫向合并是將一個spss數(shù)據(jù)文件的內(nèi)容接到數(shù)據(jù)編輯窗口中當前數(shù)據(jù)的右邊。n橫向合并應遵循三個條件兩個數(shù)據(jù)文件必須至少有一個變量名相同的公共變量,這個變量是兩個數(shù)據(jù)文件橫向?qū)喜⒌囊罁?jù),稱為關(guān)鍵變量。如學號、貴賓卡號等,關(guān)鍵變量可以是多個。兩個數(shù)據(jù)文件都必須事先按關(guān)鍵變量進行升序排列。為方便spss 數(shù)據(jù)文

15、件的合并,在不同數(shù)據(jù)文件中,數(shù)據(jù)含義不相同的列,變量名不應取相同的名稱。u通過一個例子理解數(shù)據(jù)文件的橫向合并。n【例】將數(shù)據(jù)transform3.sav中的變量添加到transform.sav中。n在菜單欄中選擇data | merge files | add variables命令關(guān)于合并后的數(shù)據(jù)文件中的數(shù)據(jù)按哪種方式提供,spss有三個選項可供選擇:1.both files provide cases:是spss默認的方式,指合并后的數(shù)據(jù)由原來的兩個數(shù)據(jù)文件共同提供,即由原來兩個數(shù)據(jù)文件中的記錄共同組成合并后的數(shù)據(jù)文件。2.external file is keyed table:指在當前

16、己打開數(shù)據(jù)基礎(chǔ)u增加個案(縱向合并)n縱向合并是在兩個具有相同變量的數(shù)據(jù)文件中,將其中一個數(shù)據(jù)文件的個案追加到當前數(shù)據(jù)文件的個案中,形成新的數(shù)據(jù)文件。n縱向合并應遵循兩個條件兩個待合并的spss數(shù)據(jù)文件,其內(nèi)容合并是有實際意義的。 為方便spss數(shù)據(jù)文件的合并,在不同數(shù)據(jù)文件中,數(shù)據(jù)含義相同的列,最好起相同的名字,變量類型和變量長度也要盡量相同。u通過一個例子理解數(shù)據(jù)文件的橫向合并。n【例】將數(shù)據(jù)transform2.sav中的記錄添加到transform.sav中。n在菜單欄中選擇data | merge files | add cases命令3.4 數(shù)據(jù)文件的轉(zhuǎn)置u數(shù)據(jù)的轉(zhuǎn)置(transp

17、ose)可將數(shù)據(jù)文件行(個案)、列(變量)互換,類似于矩陣轉(zhuǎn)置。從菜單欄中選擇data | transpose(轉(zhuǎn)置)命令。4.變量級別的數(shù)據(jù)管理u4.1 計算新變量u4.2 對變量值進行分組合并4.1 計算新變量u計算新變量的功能就是在原有spss數(shù)據(jù)文件的基礎(chǔ)之上,根據(jù)用戶的要求,使用spss算術(shù)表達式及函數(shù),對所有記錄或滿足spss條件表達式的記錄,計算出一個新結(jié)果,并將結(jié)果存入一個用戶指定的變量中。u【例】數(shù)據(jù)transform.sav是某年級學生的數(shù)學、英語、語文三門課程的成績,現(xiàn)在需要統(tǒng)計英語成績在60分以上的學生的語文和數(shù)學的平均成績。u在菜單欄中選擇transform | co

18、mpute命令4.2 對變量值進行分組合并u數(shù)據(jù)分析中,將連續(xù)變量轉(zhuǎn)換為分類變量,或者將分類變量不同的變量等級進行合并是常見的工作。而recode過程可以很好地完成這一類任務。recode into same variable 是對原始變量的取值進行修改;而recode into different variable是根據(jù)原始變量的取值生成一個新變量來表示分組情況。但為了保存原始信息的完整性,一般選后者。u對連續(xù)變量進行分組u分類變量類別的合并對連續(xù)變量進行分組u在spss中可以將連續(xù)變量轉(zhuǎn)換為離散(定類或定序)變量,按照某種一一對應的關(guān)系生成新變量值,可以將新值賦給原變量,也可以生成一個新變量。recode(包括 into same

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論