SPSS教程第二章2.數(shù)據(jù)編輯與整理_第1頁
SPSS教程第二章2.數(shù)據(jù)編輯與整理_第2頁
SPSS教程第二章2.數(shù)據(jù)編輯與整理_第3頁
SPSS教程第二章2.數(shù)據(jù)編輯與整理_第4頁
SPSS教程第二章2.數(shù)據(jù)編輯與整理_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、二、數(shù)據(jù)編輯與整理1 數(shù)據(jù)整理在主菜單中點(diǎn)擊Data菜單命令,彈出數(shù)據(jù)文件子菜單,如下圖。主要功能有:定義時間,插入變量或記錄,到某一記錄,觀測值排序,數(shù)據(jù)轉(zhuǎn)置,合并文件,數(shù)據(jù)分類匯總,正交設(shè)計方案,折分文件,選擇觀測值單位,變量加權(quán)等。1.1 定義時間變量(Define Dates.)在菜單中選中Data- Define Dates.命令,彈出日期格式設(shè)置對話框,在對話框中選中需要的格式。例如,我們要定義一個以天數(shù)為單位的日期變量,就在“Cases Are:”欄里選中“Days”,在“First Case ls”的“Day”輸入框輸入“1”。然后單擊 ?OK ?按鈕。這樣系統(tǒng)就在數(shù)據(jù)編輯窗口

2、新添加了“DAY_”和“DATE_”兩個變量,“DAY_”變量為數(shù)值型,“DATE_”變量為字符型。 1.2 插入變量(Insert Variable)在數(shù)據(jù)編輯窗口選定要插入變量位置的后一個變量,可以從工具條直接點(diǎn)擊插入變量按鈕,或從菜單中選擇Data-Insert Variable命令。數(shù)據(jù)編輯窗口產(chǎn)生一個新的變量列。1.3 插入記錄(Insert Case)在數(shù)據(jù)編輯窗口選定要插入記錄位置的后一個記錄,可以從工具條直接點(diǎn)擊插入記錄按鈕,或從菜單中選擇Data-Insert Case命令。數(shù)據(jù)編輯窗口產(chǎn)生一個新的記錄行。1.4 觀察值排序(Sort Cases)從菜單中選擇Data- So

3、rt Cases命令,彈出觀測值排序?qū)υ捒?。Sort by: 選擇排序變量。對所選變量的觀測值排序。如果選擇了兩個以上的變量,其排序結(jié)果將按變量在本欄的選入順序依次排序。Sort Order: 排序方式: Ascending: 升序排列。數(shù)值型變量由小到大排列,字符型變量按ABCD字母順序排列。系統(tǒng)默認(rèn)項(xiàng)。 Descending: 數(shù)值型變量由大到小排列,字符型變量按ZYX字母順序由后向前排列。1.5 數(shù)據(jù)轉(zhuǎn)置(Transpose)將工作區(qū)數(shù)據(jù)的行和列互換,使新文件的行是原數(shù)據(jù)的列,新文件的列是原數(shù)據(jù)的行。從菜單選擇“Data-Transpose.”命令,彈出數(shù)據(jù)轉(zhuǎn)置對話框如下圖。Variab

4、le(S): 把需要轉(zhuǎn)換的變量添加到本變量框里。Name Variable: 設(shè)置變量轉(zhuǎn)置后的名稱變量。如果該變量是字符型,則新變量為原字符;如果該變量為數(shù)值型,則新變量名以字母V開頭,其后是原數(shù)值;若缺省,系統(tǒng)自動生成新變量名。此外,系統(tǒng)自動生成一變量名為“CASE_LBL”的新變量,存放原數(shù)據(jù)的變量名。完成設(shè)置后,單擊OK按鈕完成轉(zhuǎn)置,系統(tǒng)把轉(zhuǎn)置的數(shù)據(jù)存放在數(shù)據(jù)工作區(qū)。用戶可以在數(shù)據(jù)編輯窗口,編輯和保存。1.6 合并文件(Merge File)(1)添加記錄將其他文件的記錄添加到當(dāng)前文件中,合并后新數(shù)據(jù)的記錄應(yīng)該為兩文件之和。從菜單選擇“Data- Merge File-Add Cases

5、.”命令。選定添加文件后, 單擊 打開按鈕。彈出添加記錄對話框如下圖。Unpaired Variables: 顯示兩個數(shù)據(jù)文件中變量名及變量類型不完全相同的變量,即不能完全匹配的變量。標(biāo)有“*”的變量是工作區(qū)的變量,標(biāo)有“+”的變量是連接文件的變量。Variables in New Working Data 連接后新變量顯示框。需要連接的變量從左邊“Unpaired Variables:”框里添加本框中。Indicate case source as variable 在新數(shù)據(jù)文件中顯示變量記錄來源。選中此項(xiàng)后,在新數(shù)據(jù)文件中建立一個以下框中命名的變量來標(biāo)記記錄來源于那一個文件,0表示原文件,

6、1表示連接的文件。系統(tǒng)缺省的變量名為:source01。要將合并后的數(shù)據(jù)保存,只能從菜單選擇“File- Save As.”命令。(2)添加變量(Add Variables)將其他文件的變量添加到當(dāng)前文件中。從菜單選擇“Data- Merge File-Add Variables.”命令。選定添加文件后, 單擊 打開按鈕。彈出添加記錄對話框如下圖。New Working Data: 顯示兩個文件中變量名或變量類型不完全相同的變量,這些變量將在合并后的新文件中以獨(dú)立的變量存在。若想在新文件中不包含某個變量,可選中將它移出,送入Excluded Variables框中。Excluded Varia

7、bles:若兩個文件中有變量名或變量類型相同的變量,則當(dāng)前文件中的該變量顯示在New Working Data框里,連接文件的該變量顯示在本框里。若想把連接文件的該變量合并到新文件中并以獨(dú)立的變量存在,需單擊 Rename.按鈕給該變量命名。若兩個變量是一對關(guān)鍵變量,即每個觀測單位的數(shù)值大小完全相同,合并到新文件中將成為一列變量,需要調(diào)用Sort Cases過程,依該變量值的大小對當(dāng)前文件中的觀測單位排序,然后激活“Match cases on key variables in sort:”選項(xiàng),說明按關(guān)鍵變量選擇觀測單位的方式。 Match cases on key variables in

8、 sort: 根據(jù)關(guān)鍵變量匹配觀測單位。Both files provide cases:觀測單位由兩個數(shù)據(jù)文件提供。Extemal files is keyed table:保持工作區(qū)文件中變量值,并將連接文件與工作區(qū)文件關(guān)鍵變量值相等的,指定的變量的數(shù)值合并到新文件中。Working Data File is keyed table:保持連接文件中變量值,并將工作區(qū)文件與連接文件關(guān)鍵變量值相等的, 指定的變量的數(shù)值合并到新文件中。Key Variables:關(guān)鍵變量欄。將“Excluded Variables”欄變量選入本框中。1.7 折分文件(Split Files)我們在進(jìn)行數(shù)據(jù)處理時

9、,有時需要將某些分類變量進(jìn)行分層分析,例如對品種感病性中的發(fā)病和不發(fā)病分別進(jìn)行分析,此時就需要通過折分文件來實(shí)現(xiàn)。我們先在數(shù)據(jù)編輯窗口打開一個例子文件“DATA4-1.SAV”,然后在從菜單選擇“Data- Split Files”命令,彈出折分文件對話框如下圖。 Analyze all cases, do not create groups: 分析所有觀測對象,不進(jìn)行折分。系統(tǒng)默認(rèn)。 Compare Groups: 根據(jù)分類變量進(jìn)行分折。選中此項(xiàng)后,“Groups Based on”被激活。若框內(nèi)選入2個以上的分類變量(最多可選擇8個),測分類順序與選入的順序相同。 Organize out

10、put by Groups: 根據(jù)分類變量進(jìn)行分折(最多可選擇8個分類變量)。選擇此項(xiàng)后,輸出的方式按每一種不同的類組合給出一個完整的結(jié)果。而“Compare Groups”選項(xiàng)則是在每一過程的輸出時體現(xiàn)所有不同的分類組合。 Sort the file by grouping variables: 按分層變量值將記錄由小到大升序排列,然后再折分文件。 File is already sorted: 不排序,文件已經(jīng)分類排序的選此項(xiàng)。1.8 選擇記錄(Select Cases)在數(shù)據(jù)分析時,有時可能只對某些記錄感興趣。例如,在判別分析時,可能用其中90%的記錄數(shù)據(jù)建立判別函數(shù),用其余10%的記錄

11、來考核判別函數(shù)。此時,可以通過選擇記錄的操作。我們先在數(shù)據(jù)編輯窗口打開一個例子文件“DATA4-1.SAV”,現(xiàn)在只對暴雨前的數(shù)據(jù)感興趣。然后,在從菜單選擇“Data- Select Cases”命令,彈出選擇記錄對話框如下圖。1)Select: 選擇方式 All cases:選擇全部記錄,系統(tǒng)默認(rèn)。 If condition is satisfied: 選擇滿足條件的記錄。選擇此項(xiàng)后, If 按鈕被激活,單擊該按鈕,探出條件設(shè)置對話框。本例設(shè)置“調(diào)查時候=1”如下圖所示。 Random Sample of cases: 隨機(jī)抽取一定比例的觀測記錄。選擇此項(xiàng)后, Sample.按鈕被激活,單擊

12、該按鈕,彈出隨機(jī)抽取設(shè)置對話框。如圖所示。Sample Size 樣本大小設(shè)置: Approximately 20 % of all cases: 按設(shè)置欄里輸入的百分比抽取記錄。本例抽取20%的記錄。 Exactly 10 Cases from the first 20 cases: 從開始的多少個記錄中隨機(jī)抽取多少個記錄。本例是從前20個 記錄中隨機(jī)抽取10個記錄。 Based on time on case range 按記錄編號抽取記錄。設(shè)置觀測記錄(Observation:)的起始記錄號(First Case),缺省為第1個記錄號開始;設(shè)置結(jié)束記錄號(Last Case)。如下圖 U

13、se filter variable: 用過濾變量選取記錄。過濾變量值大于0的記錄將被選取。2) Unselected Cases Are 未被選取記錄的處理方式:Filtered:未被選取的記錄保留在文件中,出于未被選中狀態(tài),其編號內(nèi)標(biāo)有對角斜線,其過濾變量賦值為0。Deleted:未被選取的記錄從文件中刪除。1.9 常用編輯操作 標(biāo)記編輯數(shù)據(jù)單一單元:用鼠標(biāo)對準(zhǔn)該單元單擊。選擇單元塊:在數(shù)據(jù)顯示區(qū)點(diǎn)拖左鍵選中單元格區(qū)域。選則一個記錄:在編號列里點(diǎn)擊鼠標(biāo)左鍵選則多個記錄:在編號列里點(diǎn)擊用鼠標(biāo)左鍵向上或向下拖移。選則一個變量:在變量名顯示行里點(diǎn)擊鼠標(biāo)左鍵選則多個變量:在變量名顯示行里用鼠標(biāo)左鍵

14、向左或向右拖移。 數(shù)據(jù)的剪貼、拷貝或刪除在標(biāo)記的編輯塊上,點(diǎn)擊鼠標(biāo)右鍵,在彈出的菜單里選擇Cut/Copy/Clear命令?;蛘咴诓藛卫镞x擇Edit-Cut/Copy/Clear命令。 數(shù)據(jù)粘貼在所粘貼的數(shù)據(jù)單元格上,點(diǎn)擊鼠標(biāo)右鍵,在彈出的菜單里選擇Paste命令?;蛘咴谒迟N的數(shù)據(jù)單元格上點(diǎn)擊鼠標(biāo)左鍵,在在菜單里選擇Edit-Paste命令。2 數(shù)據(jù)轉(zhuǎn)換(Transform)在有些情況下,原始數(shù)據(jù)難以滿足數(shù)據(jù)分析的要求,需要對原始數(shù)據(jù)進(jìn)行適當(dāng)?shù)霓D(zhuǎn)換。SPSS具體強(qiáng)大的數(shù)據(jù)轉(zhuǎn)換功能,它不僅可以進(jìn)行簡單的變量轉(zhuǎn)換和重新建立分類變量,還可以進(jìn)行復(fù)雜的統(tǒng)計函數(shù)運(yùn)算以及邏輯函數(shù)運(yùn)算。在主菜單中點(diǎn)擊Tr

15、ansform命令,彈出數(shù)據(jù)轉(zhuǎn)換子菜單,如圖所示。計算產(chǎn)生變量 重新賦值 測量方位 計數(shù)統(tǒng)計 觀測值單位排序 自動重新賦值 產(chǎn)生時間序列變量 缺失值代替 隨機(jī)數(shù) 2.1 計算產(chǎn)生變量(Compute.)計算產(chǎn)生變量是根據(jù)已存在的變量,經(jīng)函數(shù)計算后,建立新變量或替換原變量值。例如,我們在方差分析中常常要求對百分?jǐn)?shù)和層數(shù)描敘的數(shù)據(jù)作反正弦函數(shù)的轉(zhuǎn)換(sin-1SQRT(x))。 ARSIN(SQRT(x)首先,打開數(shù)據(jù)文據(jù)文件(DATA1-1.SAV),將數(shù)據(jù)調(diào)入工作區(qū)。然后,從菜單選擇Transform- Compute.命令,彈出計算產(chǎn)生變量對話框,如下圖:Target Variable: 目

16、標(biāo)變量名指定欄??梢暂斎胄碌淖兞?,也可以輸入已有的變量。輸入變量后,下邊的 Type & Label.按鈕就會被激活,點(diǎn)擊它出現(xiàn)變量定義的對話框,可以設(shè)置以下變量屬性。Label 欄:Label 輸入標(biāo)簽名。Use expression as label: 以數(shù)學(xué)表達(dá)式作為標(biāo)簽。Type 欄:Use Expression as label: 數(shù)字型變量String 字符型變量,Width: 8 字符寬度。Numeric Expression: 數(shù)學(xué)表達(dá)式輸入使用鍵盤或利用系統(tǒng)提供的計算面板輸入數(shù)學(xué)表達(dá)式。也可以將Functions(函數(shù))框里的函數(shù)選入表達(dá)式中。系統(tǒng)提供了70多種函數(shù),它包括算

17、術(shù)函數(shù),統(tǒng)計函數(shù),分布函數(shù),日期函數(shù),缺失值函數(shù)和字符函數(shù)。If定義條件Include all cases: 包括所有記錄。Include if cases satisfies condition: 符合條件的記錄。選中此項(xiàng)后,條件輸入框激活,在此框中輸入 變量的邏輯表達(dá)式。SPSS 算術(shù)函數(shù) 函數(shù) 說明 示例 (x=3.6, y=2)ABS(x)絕對值函數(shù) ABS(y-x) 1.6 ARTAN(x)反正切函數(shù),得弧度值 ARTAN(y) 1.11 ARSIN(x)反正弦函數(shù),得弧度值 ARSIN(x/4) 1.12 COS(x)余弦函數(shù)(弧度單位) COS(y) 0.47 EXP(x)以e為

18、底的指數(shù)函數(shù) EXP(y) 7.39 LG10(x)以10為底的對數(shù)函數(shù) LG10(y*100) 2.3 LN(x)以e為底的對數(shù)函數(shù) LN(y) 0.69 MOD(x)取余函數(shù) MOD(x,y) 1.6 RND(x)四舍五入后去正 RND(x) 4 SIN(x)正弦函數(shù)(弧度單位) SIN(y) 0.909 SQRT(x)平方根函數(shù) SQRT(y) 1.41 TRUNC(x)取整函數(shù) TRUNC(x) 3 注:x 可以是變量、常量,也可以是函數(shù)。 2.2 自動重新賦值(Automatic Recode)有的時候,我們需要重新把數(shù)值變量或字符變量按它本身的數(shù)值大小轉(zhuǎn)換成為從1開始的順序整數(shù),并存放在新變量對應(yīng)的記錄中。首先,打開數(shù)據(jù)文據(jù)文件(DATA3-1.SAV),將數(shù)據(jù)調(diào)入工作區(qū)。然后,從菜單選擇“Tran

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論