版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第4章 文件級別的數(shù)據(jù)管理文件級別的數(shù)據(jù)管理數(shù)據(jù)編輯窗口的Data菜單為用戶創(chuàng)建和定義數(shù)據(jù)提供了方便的功能。這個菜單是SPSS統(tǒng)計軟件數(shù)據(jù)整理的特有功能菜單。它的功能包括:對變量排序;文件合并、拆分。(1)簡單命令:包括插入變量、插入記錄、到達(dá)某條記錄,復(fù)制數(shù)據(jù)集。他們的功能實際上都可以用鼠標(biāo)在數(shù)據(jù)表界面上直接完成,很少會使用菜單來調(diào)用。(2)常用的簡單過程:包括排序、拆分文件、個案篩選和個案加權(quán)。(3)數(shù)據(jù)重組導(dǎo)向:用于進(jìn)行數(shù)據(jù)轉(zhuǎn)置,或者對重復(fù)測量數(shù)據(jù)進(jìn)行長型、寬型記錄間的轉(zhuǎn)換。(4)文件合并過程:將幾個數(shù)據(jù)文件合并為一個大的spss數(shù)據(jù)文件,含橫向合并和縱向合并兩種情況。(5)與數(shù)字字典有
2、關(guān)的功能:定義變量屬性,復(fù)制變量屬性,新建設(shè)定屬性。 (6)與數(shù)據(jù)準(zhǔn)備有關(guān)的功能:針對復(fù)雜數(shù)據(jù)管理。用于數(shù)據(jù)自動查錯的數(shù)據(jù)驗證模塊,查找異常記錄的重復(fù)個案,異常數(shù)據(jù)查找向?qū)?。?)其他過程:包括正交設(shè)計,定義日期變量、數(shù)據(jù)匯總和多重響應(yīng)集。定義變量屬性定義變量日期插入觀測量拷貝數(shù)據(jù)屬性插入一個變量定位觀測量觀測量排序重構(gòu)數(shù)據(jù)結(jié)構(gòu)分類或不分類匯總正交設(shè)計數(shù)據(jù)文件轉(zhuǎn)置合并數(shù)據(jù)文件標(biāo)識重復(fù)觀測量拆分?jǐn)?shù)據(jù)文件選擇觀測量觀測量加權(quán)4.1 常用過程常用過程一、排序的兩種方法:(1)在數(shù)據(jù)表格的變量名處單擊右鍵,彈出的右鍵菜單最后兩項就是“sort Ascending”和“Sort Descending”。
3、(2)對于多變量排序,則需要使用Sort Cases過程來進(jìn)行。二、多變量排序需要注意的三點:(1)在多重排序中,制定排序變量名是很關(guān)鍵的,先指定的變量在排序時必然優(yōu)先于后制訂的變量。(2)可以指定按某變量值升序排序的同時按另一變量值降序排序,或相反。(3)排序以后,原來記錄數(shù)據(jù)的排列次序?qū)⒈淮騺y。2 拆分文件拆分文件Split File 分割文件的功能是把當(dāng)前工作分割成兩個或兩個以上的組,隨后的分析將對每個組進(jìn)行。例:CCSS按月份進(jìn)行拆分,計算S3的統(tǒng)計描述。3 選擇個案Select Cases:當(dāng)用戶不需要分析全部的數(shù)據(jù),而是按要求分析其中的一部分,使用該選擇。篩選CCSS中的月份為20
4、0912All case:選擇所有數(shù)據(jù);If condition is satisfied: 按指定條件選擇數(shù)據(jù)。Random Sample of cases:對觀察值進(jìn)行隨機(jī)抽樣。 Use filter variable:用指定變量作過濾。先選擇一個變量,系統(tǒng)自動在數(shù)據(jù)管理器中將該變量值為0的觀測單位標(biāo)上刪除記號,系統(tǒng)對標(biāo)有刪除記號的觀測單位不作分析。Based on time or case range:順序抽樣。單擊Range按紐,打開Select Case: Range對話框,用戶自行定義從第幾個觀察值開始抽到第幾個觀察值結(jié)束。4 加權(quán)個案Weight Cases:設(shè)定某變量為頻數(shù)變量
5、。:設(shè)定某變量為頻數(shù)變量。以頻數(shù)格式錄入的數(shù)據(jù)以頻數(shù)格式錄入的數(shù)據(jù)非等概率抽樣非等概率抽樣5 分類匯總分類匯總所謂分類匯總就是按指定的分類變量對觀測值進(jìn)行分組,對每組記錄的各變量求指定的描述統(tǒng)計量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當(dāng)前數(shù)據(jù)文件。一、匯總的概念一、匯總的概念二、進(jìn)行分類二、進(jìn)行分類匯總的方法匯總的方法1、打開“data”菜單,選擇“Aggregate”,展開aggregate data”對話框。2、在左側(cè)的源變量框中選擇一個或多個變量作為分類變量進(jìn)入分類變量(Break Variables)框中。3、在左側(cè)的源變量框中選擇一個或多個變量作為要求匯總的變量進(jìn)入?yún)R總變量(Aggre
6、gate Variables)框中,即要求這些變量的值進(jìn)行分類匯總。4、“name& label” (名稱與標(biāo)簽):單擊此按鈕可以修改組合后所生成新變量名稱以及標(biāo)簽:可以在name后面的矩形框中輸入新變量名。在Label后面的矩形框中輸入新變量標(biāo)簽。單擊“continue”按鈕繼續(xù)。5、“Function”(函數(shù)) 選擇此項可以確定匯總變量的描述內(nèi)容;系統(tǒng)默認(rèn)函數(shù)為平均數(shù)。例:按time和S0對CCSS的變量進(jìn)行均數(shù)匯總,并保存到Sum_index14.2 數(shù)據(jù)文件的重組與轉(zhuǎn)置數(shù)據(jù)文件的重組與轉(zhuǎn)置一、數(shù)據(jù)的長型與寬型格式:長型格式和寬型格式指的是重復(fù)測量數(shù)據(jù)的兩種不同的排列方式。由于重復(fù)測量模
7、型可以使用不同的統(tǒng)計模型加以分析,因此根據(jù)模型的要求進(jìn)行長型格式和寬型格式之間的互轉(zhuǎn)換是數(shù)據(jù)分析中經(jīng)常要遇到的問題。二、長型格式轉(zhuǎn)換為寬型格式:二、長型格式轉(zhuǎn)換為寬型格式:Restructure。選擇Data Restructure,系統(tǒng)就會彈出下圖導(dǎo)向。G enerated VariablesG enerated Variablesscore.1score.1:Scorescore.2score.2:Scorescore.3score.3:Scorescore.4score.4:ScoreTrial1234O riginal VariableScoreNam eLabelResul tPro
8、cessi ng St atist icsProcessi ng St atist ics48124.0574Cases InCases O utCases In/Cases O utVari ables InVari ables O utIndex Values三、數(shù)據(jù)轉(zhuǎn)置Transpose:用于對數(shù)進(jìn)行行列轉(zhuǎn)置,數(shù)據(jù)文件的轉(zhuǎn)置就是將數(shù)據(jù)編輯窗口中數(shù)據(jù)的行列互換,即將記錄轉(zhuǎn)為變量,將變量轉(zhuǎn)為記錄后,重新顯示在數(shù)據(jù)編輯窗口中。Variable(s):放入將要行列轉(zhuǎn)置的變量名。在數(shù)據(jù)文件中,未放入欄中的變量會遺失。字符串變量不能轉(zhuǎn)換,如強(qiáng)迫轉(zhuǎn)換,變量值轉(zhuǎn)變?yōu)橄到y(tǒng)缺失值。Name variable
9、:變量命名欄,在左側(cè)源變量欄中選擇一個變量,放入name variable欄,技改變量的數(shù)據(jù)作為轉(zhuǎn)置后的變量名。4.3 多個數(shù)據(jù)文件的合并多個數(shù)據(jù)文件的合并縱向連接:幾個數(shù)據(jù)集中的數(shù)據(jù)相加,組成一個新的數(shù)據(jù)集,新數(shù)據(jù)集中的記錄是原來幾個數(shù)據(jù)集中記錄數(shù)的總和。橫向連接:指的是按照記錄的次序,或者某個關(guān)鍵變量的數(shù)值,將不同數(shù)據(jù)集中的不同變量合并為一個數(shù)據(jù)集,新數(shù)據(jù)集中的變量數(shù)是所有原數(shù)據(jù)集中不重名變量的總和。一、數(shù)據(jù)文件的縱向連接一、數(shù)據(jù)文件的縱向連接縱向合并實質(zhì)就是將兩個數(shù)據(jù)文件的變量列,按照各個變量名的含義,一一對應(yīng)的進(jìn)行首尾相接??v向合并必須遵循兩個條件:第一,兩個合并的spss數(shù)據(jù)文件,其
10、內(nèi)容合并是有實際意義的。第二,為方便spss數(shù)據(jù)文件的合并,在不同的數(shù)據(jù)文件中,最好起相同的名字,變量類型和變量長度也要盡量相同。Unpaired variable:不匹配變量欄。指變量名相同而變量定義不同的變量,或變量名不同的變量。Variable in new working data:新工作數(shù)據(jù)變量欄。Indicate case source as variable:指示記錄來源的變量選項/二、數(shù)據(jù)文件的橫向合并二、數(shù)據(jù)文件的橫向合并橫向合并的實質(zhì)是將兩個數(shù)據(jù)文件的記錄,按照記錄對應(yīng),一一進(jìn)行左右對接。橫向合并遵循三個條件:第一,如果不是按照記錄號對應(yīng)的規(guī)律進(jìn)行合并,則兩個數(shù)據(jù)文件必須至
11、少有一個變量名相同的公共變量,這個變量是兩個數(shù)據(jù)文件橫向合并的依據(jù),成為關(guān)鍵變量。第二,如果是使用關(guān)鍵變量進(jìn)行合并的對應(yīng),則兩個數(shù)據(jù)文件都必須事先按關(guān)鍵變量進(jìn)行升序排列。第三,為方便SPSS文件的合并,在不同的數(shù)據(jù)文件中,數(shù)據(jù)含義不相同的列,變量名不應(yīng)取相同的名稱。Excluded Variables:拒絕變量名。外部文件與當(dāng)前數(shù)據(jù)的同變量,拒絕加到新工作區(qū)中。New Working Data:新工作數(shù)據(jù)變量欄。Match Case on Key Variable in sort:排序文件中按關(guān)鍵變量匹配記錄選項。Both files provide case:由外部文件和當(dāng)前數(shù)據(jù)量兩者提供記
12、錄。External file is keyed table:外部文件為關(guān)鍵表,以當(dāng)前數(shù)據(jù)為基準(zhǔn),外部文件匹配當(dāng)前數(shù)據(jù)的關(guān)鍵變量值,如匹配成功,外部文件的新變量值加入到當(dāng)前數(shù)據(jù)的新變量中,匹配不成功則不加入。Working Data File is keyed table:當(dāng)前數(shù)據(jù)為關(guān)鍵表。Key Variables:關(guān)鍵變量欄,在拒絕變量選擇某變量作為關(guān)鍵變量。Indicate case source as variable:指示記錄來源的變量選項。4.4 與數(shù)據(jù)字典有關(guān)的功能1 數(shù)據(jù)字典的定義與應(yīng)用在大型的數(shù)據(jù)分析項目中,數(shù)據(jù)管理是非常重要的一個環(huán)節(jié),為了保證工作質(zhì)量,數(shù)據(jù)處理人員往往會事
13、先定義好一個非常詳細(xì)的數(shù)據(jù)格式,包括變量格式、變量標(biāo)簽、標(biāo)簽值、缺失值定義等,這被稱為數(shù)據(jù)字典。一、變量屬性定義導(dǎo)向:Define Variable Properties 具體說來,可以列出所選變量的所有值;分辨沒有值標(biāo)簽的值,并且提供自動給出值標(biāo)簽的功能;可以將另一個變量的屬性拷貝到所選變量,也可以將所選變量的屬性拷貝到其他變量。二、復(fù)制數(shù)據(jù)文件屬性導(dǎo)向Copy Data Properties 過程用于將定義好的數(shù)據(jù)字典直接應(yīng)用到當(dāng)前文件中。操作時不僅可以將一個外部數(shù)據(jù)文件相關(guān)屬性拷貝到當(dāng)前數(shù)據(jù)文件中,還可以進(jìn)行自行定義,只選擇某些變量,或者某些屬性進(jìn)行拷貝,這無疑大大提高了連續(xù)性項目對原有資源的利用程度。4.5 與數(shù)據(jù)準(zhǔn)備有關(guān)的功能1 數(shù)據(jù)驗證模塊2 標(biāo)識重復(fù)個案3 標(biāo)識異常個案1. 數(shù)據(jù)驗證模塊單變量規(guī)則交叉變量規(guī)則1.定義驗證規(guī)則2.進(jìn)行數(shù)據(jù)驗證2. 標(biāo)識重復(fù)個案運(yùn)行結(jié)束后,結(jié)果窗口會給出本次操作的信息匯總:Stat isticsStat isticsIndicator of each last m atching case as Prim ary120Vali dM i ssingNIndicator
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑行業(yè)實習(xí)報告
- 畫展活動策劃方案15篇
- 2024年秋九年級歷史上冊 第6單元 資本主義制度的初步確立 第19課 法國大革命和拿破侖帝國教學(xué)實錄 新人教版
- 企業(yè)員工個人工作總結(jié)(15篇)
- 家教的心得體會
- 語文(期末)練習(xí)試題及答案
- 物理化學(xué)基礎(chǔ)知識練習(xí)卷含答案
- 中醫(yī)兒科學(xué)復(fù)習(xí)測試卷含答案
- 會計人員辭職報告(集錦15篇)
- 2024年汽車電子元件研發(fā)與全球銷售合作協(xié)議3篇
- 中國法制史期末題庫
- 國家開放大學(xué)電大本科《古代小說戲曲專題》2023-2024期末試題及答案(試卷代號:1340)
- 2019年最新部編版四年級語文上冊第七單元達(dá)標(biāo)檢測卷含答案(新版)
- 年處理500噸玄參提取車間初步設(shè)計
- 數(shù)學(xué)專業(yè)英語論文含中文版
- 淺談演出公司的組織結(jié)構(gòu)設(shè)置
- 2006年度銀行業(yè)金融機(jī)構(gòu)信息科技風(fēng)險評價審計要點(共5頁)
- 資產(chǎn)負(fù)債表、業(yè)務(wù)活動表(民非)
- 《土地利用規(guī)劃》簡答題復(fù)習(xí)
- 繼電保護(hù)誤動事故的處理.ppt
- 農(nóng)村基層人大代表述職報告
評論
0/150
提交評論