spss數(shù)據(jù)的錄入與管理課件_第1頁
spss數(shù)據(jù)的錄入與管理課件_第2頁
spss數(shù)據(jù)的錄入與管理課件_第3頁
spss數(shù)據(jù)的錄入與管理課件_第4頁
spss數(shù)據(jù)的錄入與管理課件_第5頁
已閱讀5頁,還剩75頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取

第三章變量級別的數(shù)據(jù)管理第四章文件級別的數(shù)據(jù)管理通過閱讀文學作品,我們能提高文學鑒賞水平,培養(yǎng)文學情趣;spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)1第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取

第三章變量級別的數(shù)據(jù)管理第四章文件級別的數(shù)據(jù)管理第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取2第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取數(shù)據(jù)的直接錄入非電子化的原始數(shù)據(jù)資料,需要直接將調(diào)查問卷中的數(shù)據(jù)錄入進SPSS軟件中,建立數(shù)據(jù)文件。外部數(shù)據(jù)的獲取已經(jīng)被錄入為其他數(shù)據(jù)格式的資料,需要將其內(nèi)容直接讀入SPSS中。第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取數(shù)據(jù)的直接錄入32.2數(shù)據(jù)格式原則:(1)不同個案的數(shù)據(jù)不能再同一條記錄中出現(xiàn),即同一個案的數(shù)據(jù)應當獨占一行。(2)每一個測量指標/影響因素只能占據(jù)一列的位置,即同一指標的測量數(shù)值都應當錄入到同一個變量中去。2.2數(shù)據(jù)格式原則:4“數(shù)據(jù)錄入三部曲”(1)定義各變量名,即給每個指標起個名字;(2)指定每個變量的各種屬性,即對每個指標的一些統(tǒng)計特性做出指定;(3)錄入數(shù)據(jù),即把每個被訪者各指標取值錄入為電子格式?!皵?shù)據(jù)錄入三部曲”(1)定義各變量名,即給每個指標起個名字;5變量屬性1、變量的存儲類型數(shù)值型字符串日期型(1)數(shù)值型(Numeric)最常用是由0~9的阿拉伯數(shù)字和其他特殊符號,如美元符號、逗號或圓點組成的。(工資、年齡、成績等)標準數(shù)值型逗號數(shù)值型:每3位用逗號分隔圓點數(shù)值型:每3位用圓點分隔科學計數(shù)型美元數(shù)值型:顯示時帶美元符號用戶自定義型變量屬性1、變量的存儲類型6(2)字符型(String)較常用

默認顯示寬度為8個字符位,區(qū)分大小寫字母,并且不能進行數(shù)學運算。用一對引號引起來(3)日期型(Date)表示日期或時間mm/dd/yy或類似的兩位數(shù)年份記錄方式(2)字符型(String)72、變量的測量尺度定類尺度定序尺度定距尺度定比尺度(1)定類尺度是對事物的類別或?qū)傩缘囊环N測量,按照事物的某種屬性對其進行分類或分組。其值僅代表了事物的類別和屬性,僅能測定類別差,不能比較各類之間的大小,所以各類之間沒有順序或等級。只能計算頻數(shù)和頻率“S0城市”2、變量的測量尺度8(2)定序尺度對事物之間等級或順序差類別的一種測度,可以比較優(yōu)劣或排序,但無法測出類別之間的準確差值。可以計算頻率、累計頻率“S4學歷”(3)定距尺度對事物類別或次序之間間距的測度。不僅能將事物區(qū)分為不同類型并進行排序,而且可以準確指出類別之間差距是多少。“溫度”(4)定比尺度能夠測量兩個測量值之間的比值“零點”溫度與重量(2)定序尺度93、變量名與變量值標簽變量值標簽是對變量取值含義的解釋說明信息。4、缺失值系統(tǒng)缺失值:“.”/空字符串自定義缺失值:“缺失值屬性對話框”5、角色(1)輸入(2)目標(3)兩者(4)無(5)分區(qū)(6)拆分3、變量名與變量值標簽102.3數(shù)據(jù)的直接錄入1、開放題的錄入“ID”——數(shù)值型開放題“姓名”——字符型開放題2、單選題的錄入“性別”字符直接錄入字符代碼+值標簽

數(shù)值代碼+值標簽3、半開放題的錄入“其他,請指出”選項兩個變量:(1)選項

(2)獨立的開放題:第一個變量名直接加“a”2.3數(shù)據(jù)的直接錄入1、開放題的錄入115、多選題的錄入稱為“多重響應”數(shù)據(jù)錄入后需定義多選題集“多重二分法”“多重分類法”(1)多重二分法指在編碼時,對應每一個選項都要定義一個變量,有幾個選項就有幾個變量,這些變量分別代表對其中一個選項的選擇結(jié)果,一般均為二分類,而其中必然有一個類別代表選中了這一選項。5、多選題的錄入12(2)多重分類法利用多個變量來對一個多選題的答案進行定義,應該用多少個變量由被訪者實際可能給出的最多答案數(shù)而定。而且,這些變量必須為數(shù)值型變量,利用值標簽將答案標出,所有變量采用一套值標簽。之所以稱為多重分類法,是因為每個變量都是多分類的,每個變量代表被訪者的一次選擇。設定多選題變量集Tables模塊和多重響應菜單(分析多重響應定義變量集)(2)多重分類法136、半開放多選題與半開放單選題非常相似6、半開放多選題142.4外部數(shù)據(jù)的獲取SPSS格式:“文件”“打開”“數(shù)據(jù)”非SPSS格式:直接打開(Excel格式)

利用文本向?qū)ёx入文本數(shù)據(jù)(文本數(shù)據(jù))

利用數(shù)據(jù)庫ODBC接口讀?。ˋccess數(shù)據(jù))2.4外部數(shù)據(jù)的獲取SPSS格式:“文件”“打開151、讀取電子表格數(shù)據(jù)文件“文件”“打開”“數(shù)據(jù)”或Demo.xls事先打開了解文件結(jié)構(gòu):(1)包含幾個數(shù)據(jù)表(2)若只需讀入部分,了解精確位置(3)第1行是否為變量名1、讀取電子表格數(shù)據(jù)文件162、讀取文本數(shù)據(jù)文件“文件”“打開文本數(shù)據(jù)”

“文件”“打開”“數(shù)據(jù)”demo.txt2、讀取文本數(shù)據(jù)文件173、用ODBC接口讀取各種數(shù)據(jù)庫文件demo.mdb“文件”“打開數(shù)據(jù)庫”“新建查詢”3、用ODBC接口讀取各種數(shù)據(jù)庫文件182.5數(shù)據(jù)的保存1、保存為SAV格式2、保存為其他數(shù)據(jù)格式2.5數(shù)據(jù)的保存1、保存為SAV格式19第三章變量級別的數(shù)據(jù)管理變量級別的數(shù)據(jù)管理:“轉(zhuǎn)換”文件級別的數(shù)據(jù)管理:“數(shù)據(jù)”第三章變量級別的數(shù)據(jù)管理變量級別的數(shù)據(jù)管理:“轉(zhuǎn)換”20“轉(zhuǎn)換”1、計算新變量:最為常用和重要的過程2、變量轉(zhuǎn)換:從菜單第2項開始的多個計數(shù)過程、重編碼過程和離散化過程。實際上可以看成是“計算變量”過程某一方面的強化和打包。3、時間序列模型專用過程:“時間和日期向?qū)А?、“?chuàng)建時間序列”、“替換缺失值”4、自動數(shù)據(jù)準備5、其他:“隨機數(shù)字生成器”(第5章)、“運行掛起的轉(zhuǎn)換”“轉(zhuǎn)換”1、計算新變量:最為常用和重要的過程213.1變量賦值變量賦值就是指在原有數(shù)據(jù)的基礎上,根據(jù)用戶的要求,使用SPSS算術(shù)表達式及函數(shù),對所有記錄或滿足SPSS條件表達式的某些記錄進行四則運算,并將結(jié)果存入一個用戶指定的變量中,該指定變量可以是一個新變量,也可以是一個已經(jīng)存在的變量。1、算術(shù)表達式:由常量、SPSS變量名、SPSS算術(shù)運算符(+、-、*、/、**)圓括號等組成的式子。數(shù)據(jù)類型和結(jié)果均為數(shù)值型。2、函數(shù):函數(shù)名(參數(shù));8類函數(shù)3、條件表達式與邏輯表達式:用來指定對哪些記錄進行計算3.1變量賦值變量賦值就是指在原有數(shù)據(jù)的基礎上,根據(jù)用戶的22計算變量“轉(zhuǎn)換”“計算變量”“目標變量”文本框:用于輸入需要賦值的變量名候選變量列表“數(shù)字表達式”文本框:用于給目標變量賦值“函數(shù)組”列表框“函數(shù)和特殊變量”列表框函數(shù)解釋文字文本框計算變量“轉(zhuǎn)換”“計算變量”“目標變量”文本框:23spss數(shù)據(jù)的錄入與管理課件243.2已有變量值的分組合并將連續(xù)變量轉(zhuǎn)換為等級變量或?qū)⒎诸愖兞坎煌淖兞康燃夁M行合并。“重新編碼為相同變量”:對原始變量的取值直接進行重編碼“重新編碼為不同變量”:根據(jù)原始變量的取值生成一個新變量來記錄重編碼的結(jié)果。3.2已有變量值的分組合并將連續(xù)變量轉(zhuǎn)換為等級變量或?qū)⒎诸?5對連續(xù)性變量進行分組合并兩種方法:重編碼

可視化分段過程重編碼:“轉(zhuǎn)換”“重新編碼為不同變量”分類變量類別的合并對連續(xù)性變量進行分組合并兩種方法:重編碼26連續(xù)性變量的離散化可視化離散化過程:用于在可視界面下將連續(xù)變量進行分段,該過程可以使用百分位數(shù)、標準差范圍或者等間距方式將連續(xù)變量劃分為若干組段,并采用圖形化操作的方式,非常直觀好用。最優(yōu)離散化過程:是對前述可視化離散過程的進一步自動化,根據(jù)某些作為“關(guān)鍵指示變量”的分類變量,將原有的一個或多個連續(xù)性變量按照該分類變量類間差異最大化的優(yōu)化原則離散化為分類變量,然后就可以使用離散后變量而非原始數(shù)據(jù)值進行后續(xù)的分析了。連續(xù)性變量的離散化可視化離散化過程:用于在可視界面下將連續(xù)變273.4轉(zhuǎn)換菜單的其他功能變量的自動重編碼——用于將字符變量轉(zhuǎn)換為數(shù)值變量變量值的移動——某變量值的前移或后移指定數(shù)值的查找和計數(shù)——對某個個案進行計數(shù)變量的編秩——根據(jù)某變量的數(shù)值大小來排出次序,然后將次序結(jié)果存儲到一個新變量中去自動準備建模數(shù)據(jù)隨機數(shù)字生成器3.4轉(zhuǎn)換菜單的其他功能變量的自動重編碼——用于將字符變量28第四章文件級別的數(shù)據(jù)管理(1)簡單命令:插入變量、插入個案、到達某條個案、復制數(shù)據(jù)集等(2)常用簡單過程:排序、拆分文件、個案篩選和個案加權(quán),必須掌握。(3)數(shù)據(jù)重組向?qū)В河糜谶M行數(shù)據(jù)轉(zhuǎn)置,或者對重復測量數(shù)據(jù)進行長型、寬型記錄格式間的轉(zhuǎn)換。(4)文件合并向?qū)В簩讉€數(shù)據(jù)文件合并為一個大的SPSS數(shù)據(jù)文件,含橫向合并和縱向合并兩種情況。(5)數(shù)據(jù)字典相關(guān)向?qū)В喊ǘx變量屬性,復制變量屬性,以及新建設定屬性三個向?qū)Ы缑?。?)與數(shù)據(jù)準備有關(guān)的功能:用于復雜數(shù)據(jù)項目,用于簡化數(shù)據(jù)管理工作。(7)與統(tǒng)計模型密切相關(guān)過程:正交設計過程(8)其他過程:定義多重響應集、數(shù)據(jù)匯總過程等。第四章文件級別的數(shù)據(jù)管理(1)簡單命令:插入變量、插入個案294.1幾個常用的過程1、排序個案數(shù)據(jù)編輯窗口中的記錄的前后次序在默認情況下由錄入時的先后順序決定。(1)單變量排序:變量名處右擊,“升序排列”“降序排列”(2)多變量排序:使用“排序個案”對話框2、分割文件(SplitFile)3、選擇個案:用于只分析部分數(shù)據(jù)4、加權(quán)個案:(1)以頻數(shù)格式錄入的數(shù)據(jù)

(2)案例數(shù)據(jù)抽樣權(quán)重的調(diào)整5、分類匯總:按指定的分類變量對個案進行分組,并按分組對變量求指定的描述統(tǒng)計量。4.1幾個常用的過程1、排序個案304.3數(shù)據(jù)文件的重組與轉(zhuǎn)置1、數(shù)據(jù)的長型與寬型格式指的是重復測量數(shù)據(jù)的兩種不同的排列方式。長型格式:在重復測量數(shù)據(jù)中,每一次測量被單獨記錄為一個個案(anxiety.sav)寬型格式:在重復測量數(shù)據(jù)中,每一個個體被記錄為一個個案,他的所有測量被記錄在不同的變量中(anxiety2.sav)4.3數(shù)據(jù)文件的重組與轉(zhuǎn)置1、數(shù)據(jù)的長型與寬型格式312、長型格式轉(zhuǎn)換為寬型格式3、寬型格式轉(zhuǎn)換為長型格式4、數(shù)據(jù)轉(zhuǎn)置2、長型格式轉(zhuǎn)換為寬型格式324.3多個數(shù)據(jù)文件的合并1、縱向拼接指的是幾個數(shù)據(jù)集中的數(shù)據(jù)縱向相連,組成一個新的數(shù)據(jù)集,新數(shù)據(jù)集中的記錄數(shù)是原來幾個數(shù)據(jù)集中記錄數(shù)的總和。其實質(zhì)就是將兩個數(shù)據(jù)文件的變量按照各個變量名的含義一一對應進行首尾相接。(a和b)2、橫向合并指的是按照記錄的次序,或者某個關(guān)鍵變量的數(shù)值,將不同數(shù)據(jù)集中的不同變量拼接為一個數(shù)據(jù)集,新數(shù)據(jù)集中的變量數(shù)是所有原數(shù)據(jù)集中不重名變量的總和。實質(zhì)就是將兩個數(shù)據(jù)文件的記錄按照某種對應關(guān)系一一進行左右對接。(a和c)4.3多個數(shù)據(jù)文件的合并1、縱向拼接334.4與數(shù)據(jù)字典有關(guān)的功能如果有事先定義的數(shù)據(jù)字典格式,則可以先生成一個沒有記錄的空數(shù)據(jù)文件,將全部的數(shù)據(jù)字典設定好,將來在數(shù)據(jù)錄入完畢后使用復制文件屬性向?qū)子靡幌伦值浼纯?;如果沒有事先定義的數(shù)據(jù)字典格式,則可以在錄入工作進行了一段時間以后先使用變量屬性定義向?qū)瓿蓴?shù)據(jù)字典的設定工作,然后隨著錄入工作的進行經(jīng)常掃描數(shù)據(jù)的情況,以及時更新字典,最后在錄入工作完畢后使用復制文件屬性向?qū)米值涞淖罱K版本。如果數(shù)據(jù)管理任務不太復雜,也可以直接在數(shù)據(jù)字典中錄入數(shù)據(jù),或者直接在變量視圖中修改屬性,或者直接在SPSS中錄入/導入數(shù)據(jù),然后利用設置未知測量級別向?qū)砜焖僭O定數(shù)據(jù)字典。4.4與數(shù)據(jù)字典有關(guān)的功能如果有事先定義的數(shù)據(jù)字典格式,則341、定義變量屬性2、復制變量屬性3、新建自定義屬性4、設置未知測量屬性1、定義變量屬性354.5與數(shù)據(jù)準備有關(guān)的功能1、數(shù)據(jù)驗證模塊2、自動數(shù)據(jù)準備過程3、標識重復個案過程4、標識異常個案過程5、最優(yōu)離散化過程6、缺失值分析4.5與數(shù)據(jù)準備有關(guān)的功能1、數(shù)據(jù)驗證模塊36數(shù)據(jù)驗證模塊數(shù)據(jù)驗證模塊用于實現(xiàn)數(shù)據(jù)核查功能,用戶通過自行定義數(shù)據(jù)驗證規(guī)則,以確定個案取值是否有效。A單變量規(guī)則:單變量規(guī)則包含一組應用于單個變量的數(shù)值檢查規(guī)則,例如,范圍外值的檢查。對于單變量規(guī)則,有效值可以表示一個范圍,也可以表示為一個有效值列表。B交叉變量規(guī)則:交叉變量規(guī)則是用戶定義的涉及多個變量間邏輯關(guān)系的規(guī)則,由標記無效值的邏輯表達式定義,可以應用于單個變量,也可以應用于變量組合。數(shù)據(jù)驗證模塊數(shù)據(jù)驗證模塊用于實現(xiàn)數(shù)據(jù)核查功能,用戶通過自行定371、定義驗證規(guī)則“數(shù)據(jù)”“驗證”“定義規(guī)則”2、進行數(shù)據(jù)驗證“數(shù)據(jù)”“驗證”“驗證數(shù)據(jù)”3、加載預定義規(guī)則“數(shù)據(jù)”“驗證”“加載預定義規(guī)則”PredefinedValidationRules.sav1、定義驗證規(guī)則38標識重復個案標識異常個案標識重復個案39匯報結(jié)束謝謝大家!請各位批評指正匯報結(jié)束謝謝大家!請各位批評指正40spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取

第三章變量級別的數(shù)據(jù)管理第四章文件級別的數(shù)據(jù)管理通過閱讀文學作品,我們能提高文學鑒賞水平,培養(yǎng)文學情趣;spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)41第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取

第三章變量級別的數(shù)據(jù)管理第四章文件級別的數(shù)據(jù)管理第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取42第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取數(shù)據(jù)的直接錄入非電子化的原始數(shù)據(jù)資料,需要直接將調(diào)查問卷中的數(shù)據(jù)錄入進SPSS軟件中,建立數(shù)據(jù)文件。外部數(shù)據(jù)的獲取已經(jīng)被錄入為其他數(shù)據(jù)格式的資料,需要將其內(nèi)容直接讀入SPSS中。第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取數(shù)據(jù)的直接錄入432.2數(shù)據(jù)格式原則:(1)不同個案的數(shù)據(jù)不能再同一條記錄中出現(xiàn),即同一個案的數(shù)據(jù)應當獨占一行。(2)每一個測量指標/影響因素只能占據(jù)一列的位置,即同一指標的測量數(shù)值都應當錄入到同一個變量中去。2.2數(shù)據(jù)格式原則:44“數(shù)據(jù)錄入三部曲”(1)定義各變量名,即給每個指標起個名字;(2)指定每個變量的各種屬性,即對每個指標的一些統(tǒng)計特性做出指定;(3)錄入數(shù)據(jù),即把每個被訪者各指標取值錄入為電子格式。“數(shù)據(jù)錄入三部曲”(1)定義各變量名,即給每個指標起個名字;45變量屬性1、變量的存儲類型數(shù)值型字符串日期型(1)數(shù)值型(Numeric)最常用是由0~9的阿拉伯數(shù)字和其他特殊符號,如美元符號、逗號或圓點組成的。(工資、年齡、成績等)標準數(shù)值型逗號數(shù)值型:每3位用逗號分隔圓點數(shù)值型:每3位用圓點分隔科學計數(shù)型美元數(shù)值型:顯示時帶美元符號用戶自定義型變量屬性1、變量的存儲類型46(2)字符型(String)較常用

默認顯示寬度為8個字符位,區(qū)分大小寫字母,并且不能進行數(shù)學運算。用一對引號引起來(3)日期型(Date)表示日期或時間mm/dd/yy或類似的兩位數(shù)年份記錄方式(2)字符型(String)472、變量的測量尺度定類尺度定序尺度定距尺度定比尺度(1)定類尺度是對事物的類別或?qū)傩缘囊环N測量,按照事物的某種屬性對其進行分類或分組。其值僅代表了事物的類別和屬性,僅能測定類別差,不能比較各類之間的大小,所以各類之間沒有順序或等級。只能計算頻數(shù)和頻率“S0城市”2、變量的測量尺度48(2)定序尺度對事物之間等級或順序差類別的一種測度,可以比較優(yōu)劣或排序,但無法測出類別之間的準確差值??梢杂嬎泐l率、累計頻率“S4學歷”(3)定距尺度對事物類別或次序之間間距的測度。不僅能將事物區(qū)分為不同類型并進行排序,而且可以準確指出類別之間差距是多少。“溫度”(4)定比尺度能夠測量兩個測量值之間的比值“零點”溫度與重量(2)定序尺度493、變量名與變量值標簽變量值標簽是對變量取值含義的解釋說明信息。4、缺失值系統(tǒng)缺失值:“.”/空字符串自定義缺失值:“缺失值屬性對話框”5、角色(1)輸入(2)目標(3)兩者(4)無(5)分區(qū)(6)拆分3、變量名與變量值標簽502.3數(shù)據(jù)的直接錄入1、開放題的錄入“ID”——數(shù)值型開放題“姓名”——字符型開放題2、單選題的錄入“性別”字符直接錄入字符代碼+值標簽

數(shù)值代碼+值標簽3、半開放題的錄入“其他,請指出”選項兩個變量:(1)選項

(2)獨立的開放題:第一個變量名直接加“a”2.3數(shù)據(jù)的直接錄入1、開放題的錄入515、多選題的錄入稱為“多重響應”數(shù)據(jù)錄入后需定義多選題集“多重二分法”“多重分類法”(1)多重二分法指在編碼時,對應每一個選項都要定義一個變量,有幾個選項就有幾個變量,這些變量分別代表對其中一個選項的選擇結(jié)果,一般均為二分類,而其中必然有一個類別代表選中了這一選項。5、多選題的錄入52(2)多重分類法利用多個變量來對一個多選題的答案進行定義,應該用多少個變量由被訪者實際可能給出的最多答案數(shù)而定。而且,這些變量必須為數(shù)值型變量,利用值標簽將答案標出,所有變量采用一套值標簽。之所以稱為多重分類法,是因為每個變量都是多分類的,每個變量代表被訪者的一次選擇。設定多選題變量集Tables模塊和多重響應菜單(分析多重響應定義變量集)(2)多重分類法536、半開放多選題與半開放單選題非常相似6、半開放多選題542.4外部數(shù)據(jù)的獲取SPSS格式:“文件”“打開”“數(shù)據(jù)”非SPSS格式:直接打開(Excel格式)

利用文本向?qū)ёx入文本數(shù)據(jù)(文本數(shù)據(jù))

利用數(shù)據(jù)庫ODBC接口讀?。ˋccess數(shù)據(jù))2.4外部數(shù)據(jù)的獲取SPSS格式:“文件”“打開551、讀取電子表格數(shù)據(jù)文件“文件”“打開”“數(shù)據(jù)”或Demo.xls事先打開了解文件結(jié)構(gòu):(1)包含幾個數(shù)據(jù)表(2)若只需讀入部分,了解精確位置(3)第1行是否為變量名1、讀取電子表格數(shù)據(jù)文件562、讀取文本數(shù)據(jù)文件“文件”“打開文本數(shù)據(jù)”

“文件”“打開”“數(shù)據(jù)”demo.txt2、讀取文本數(shù)據(jù)文件573、用ODBC接口讀取各種數(shù)據(jù)庫文件demo.mdb“文件”“打開數(shù)據(jù)庫”“新建查詢”3、用ODBC接口讀取各種數(shù)據(jù)庫文件582.5數(shù)據(jù)的保存1、保存為SAV格式2、保存為其他數(shù)據(jù)格式2.5數(shù)據(jù)的保存1、保存為SAV格式59第三章變量級別的數(shù)據(jù)管理變量級別的數(shù)據(jù)管理:“轉(zhuǎn)換”文件級別的數(shù)據(jù)管理:“數(shù)據(jù)”第三章變量級別的數(shù)據(jù)管理變量級別的數(shù)據(jù)管理:“轉(zhuǎn)換”60“轉(zhuǎn)換”1、計算新變量:最為常用和重要的過程2、變量轉(zhuǎn)換:從菜單第2項開始的多個計數(shù)過程、重編碼過程和離散化過程。實際上可以看成是“計算變量”過程某一方面的強化和打包。3、時間序列模型專用過程:“時間和日期向?qū)А薄ⅰ皠?chuàng)建時間序列”、“替換缺失值”4、自動數(shù)據(jù)準備5、其他:“隨機數(shù)字生成器”(第5章)、“運行掛起的轉(zhuǎn)換”“轉(zhuǎn)換”1、計算新變量:最為常用和重要的過程613.1變量賦值變量賦值就是指在原有數(shù)據(jù)的基礎上,根據(jù)用戶的要求,使用SPSS算術(shù)表達式及函數(shù),對所有記錄或滿足SPSS條件表達式的某些記錄進行四則運算,并將結(jié)果存入一個用戶指定的變量中,該指定變量可以是一個新變量,也可以是一個已經(jīng)存在的變量。1、算術(shù)表達式:由常量、SPSS變量名、SPSS算術(shù)運算符(+、-、*、/、**)圓括號等組成的式子。數(shù)據(jù)類型和結(jié)果均為數(shù)值型。2、函數(shù):函數(shù)名(參數(shù));8類函數(shù)3、條件表達式與邏輯表達式:用來指定對哪些記錄進行計算3.1變量賦值變量賦值就是指在原有數(shù)據(jù)的基礎上,根據(jù)用戶的62計算變量“轉(zhuǎn)換”“計算變量”“目標變量”文本框:用于輸入需要賦值的變量名候選變量列表“數(shù)字表達式”文本框:用于給目標變量賦值“函數(shù)組”列表框“函數(shù)和特殊變量”列表框函數(shù)解釋文字文本框計算變量“轉(zhuǎn)換”“計算變量”“目標變量”文本框:63spss數(shù)據(jù)的錄入與管理課件643.2已有變量值的分組合并將連續(xù)變量轉(zhuǎn)換為等級變量或?qū)⒎诸愖兞坎煌淖兞康燃夁M行合并?!爸匦戮幋a為相同變量”:對原始變量的取值直接進行重編碼“重新編碼為不同變量”:根據(jù)原始變量的取值生成一個新變量來記錄重編碼的結(jié)果。3.2已有變量值的分組合并將連續(xù)變量轉(zhuǎn)換為等級變量或?qū)⒎诸?5對連續(xù)性變量進行分組合并兩種方法:重編碼

可視化分段過程重編碼:“轉(zhuǎn)換”“重新編碼為不同變量”分類變量類別的合并對連續(xù)性變量進行分組合并兩種方法:重編碼66連續(xù)性變量的離散化可視化離散化過程:用于在可視界面下將連續(xù)變量進行分段,該過程可以使用百分位數(shù)、標準差范圍或者等間距方式將連續(xù)變量劃分為若干組段,并采用圖形化操作的方式,非常直觀好用。最優(yōu)離散化過程:是對前述可視化離散過程的進一步自動化,根據(jù)某些作為“關(guān)鍵指示變量”的分類變量,將原有的一個或多個連續(xù)性變量按照該分類變量類間差異最大化的優(yōu)化原則離散化為分類變量,然后就可以使用離散后變量而非原始數(shù)據(jù)值進行后續(xù)的分析了。連續(xù)性變量的離散化可視化離散化過程:用于在可視界面下將連續(xù)變673.4轉(zhuǎn)換菜單的其他功能變量的自動重編碼——用于將字符變量轉(zhuǎn)換為數(shù)值變量變量值的移動——某變量值的前移或后移指定數(shù)值的查找和計數(shù)——對某個個案進行計數(shù)變量的編秩——根據(jù)某變量的數(shù)值大小來排出次序,然后將次序結(jié)果存儲到一個新變量中去自動準備建模數(shù)據(jù)隨機數(shù)字生成器3.4轉(zhuǎn)換菜單的其他功能變量的自動重編碼——用于將字符變量68第四章文件級別的數(shù)據(jù)管理(1)簡單命令:插入變量、插入個案、到達某條個案、復制數(shù)據(jù)集等(2)常用簡單過程:排序、拆分文件、個案篩選和個案加權(quán),必須掌握。(3)數(shù)據(jù)重組向?qū)В河糜谶M行數(shù)據(jù)轉(zhuǎn)置,或者對重復測量數(shù)據(jù)進行長型、寬型記錄格式間的轉(zhuǎn)換。(4)文件合并向?qū)В簩讉€數(shù)據(jù)文件合并為一個大的SPSS數(shù)據(jù)文件,含橫向合并和縱向合并兩種情況。(5)數(shù)據(jù)字典相關(guān)向?qū)В喊ǘx變量屬性,復制變量屬性,以及新建設定屬性三個向?qū)Ы缑?。?)與數(shù)據(jù)準備有關(guān)的功能:用于復雜數(shù)據(jù)項目,用于簡化數(shù)據(jù)管理工作。(7)與統(tǒng)計模型密切相關(guān)過程:正交設計過程(8)其他過程:定義多重響應集、數(shù)據(jù)匯總過程等。第四章文件級別的數(shù)據(jù)管理(1)簡單命令:插入變量、插入個案694.1幾個常用的過程1、排序個案數(shù)據(jù)編輯窗口中的記錄的前后次序在默認情況下由錄入時的先后順序決定。(1)單變量排序:變量名處右擊,“升序排列”“降序排列”(2)多變量排序:使用“排序個案”對話框2、分割文件(SplitFile)3、選擇個案:用于只分析部分數(shù)據(jù)4、加權(quán)個案:(1)以頻數(shù)格式錄入的數(shù)據(jù)

(2)案例數(shù)據(jù)抽樣權(quán)重的調(diào)整5、分類匯總:按指定的分類變量對個案進行分組,并按分組對變量求指定的描述統(tǒng)計量。4.1幾個常用的過程1、排序個案704.3數(shù)據(jù)文件的重組與轉(zhuǎn)置1、數(shù)據(jù)的長型與寬型格式指的是重復測量數(shù)據(jù)的兩種不同的排列方式。長型格式:在重復測量數(shù)據(jù)中,每一次測量被單獨記錄為一個個案(anxiety.sav)寬型格式:在重復測量數(shù)據(jù)中,每一個個體被記錄為一個個案,他的所有測量被記錄在不同的變量中(anxiety2.sav)4.3數(shù)據(jù)文件的重組與轉(zhuǎn)置1、數(shù)據(jù)的長型與寬型格式712、長型格式轉(zhuǎn)換為寬型格式3、寬型格式轉(zhuǎn)換為長型格式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論