版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取
第三章變量級(jí)別的數(shù)據(jù)管理第四章文件級(jí)別的數(shù)據(jù)管理通過(guò)閱讀文學(xué)作品,我們能提高文學(xué)鑒賞水平,培養(yǎng)文學(xué)情趣;spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)1第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取
第三章變量級(jí)別的數(shù)據(jù)管理第四章文件級(jí)別的數(shù)據(jù)管理第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取2第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取數(shù)據(jù)的直接錄入非電子化的原始數(shù)據(jù)資料,需要直接將調(diào)查問(wèn)卷中的數(shù)據(jù)錄入進(jìn)SPSS軟件中,建立數(shù)據(jù)文件。外部數(shù)據(jù)的獲取已經(jīng)被錄入為其他數(shù)據(jù)格式的資料,需要將其內(nèi)容直接讀入SPSS中。第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取數(shù)據(jù)的直接錄入32.2數(shù)據(jù)格式原則:(1)不同個(gè)案的數(shù)據(jù)不能再同一條記錄中出現(xiàn),即同一個(gè)案的數(shù)據(jù)應(yīng)當(dāng)獨(dú)占一行。(2)每一個(gè)測(cè)量指標(biāo)/影響因素只能占據(jù)一列的位置,即同一指標(biāo)的測(cè)量數(shù)值都應(yīng)當(dāng)錄入到同一個(gè)變量中去。2.2數(shù)據(jù)格式原則:4“數(shù)據(jù)錄入三部曲”(1)定義各變量名,即給每個(gè)指標(biāo)起個(gè)名字;(2)指定每個(gè)變量的各種屬性,即對(duì)每個(gè)指標(biāo)的一些統(tǒng)計(jì)特性做出指定;(3)錄入數(shù)據(jù),即把每個(gè)被訪者各指標(biāo)取值錄入為電子格式?!皵?shù)據(jù)錄入三部曲”(1)定義各變量名,即給每個(gè)指標(biāo)起個(gè)名字;5變量屬性1、變量的存儲(chǔ)類型數(shù)值型字符串日期型(1)數(shù)值型(Numeric)最常用是由0~9的阿拉伯?dāng)?shù)字和其他特殊符號(hào),如美元符號(hào)、逗號(hào)或圓點(diǎn)組成的。(工資、年齡、成績(jī)等)標(biāo)準(zhǔn)數(shù)值型逗號(hào)數(shù)值型:每3位用逗號(hào)分隔圓點(diǎn)數(shù)值型:每3位用圓點(diǎn)分隔科學(xué)計(jì)數(shù)型美元數(shù)值型:顯示時(shí)帶美元符號(hào)用戶自定義型變量屬性1、變量的存儲(chǔ)類型6(2)字符型(String)較常用
默認(rèn)顯示寬度為8個(gè)字符位,區(qū)分大小寫字母,并且不能進(jìn)行數(shù)學(xué)運(yùn)算。用一對(duì)引號(hào)引起來(lái)(3)日期型(Date)表示日期或時(shí)間mm/dd/yy或類似的兩位數(shù)年份記錄方式(2)字符型(String)72、變量的測(cè)量尺度定類尺度定序尺度定距尺度定比尺度(1)定類尺度是對(duì)事物的類別或?qū)傩缘囊环N測(cè)量,按照事物的某種屬性對(duì)其進(jìn)行分類或分組。其值僅代表了事物的類別和屬性,僅能測(cè)定類別差,不能比較各類之間的大小,所以各類之間沒(méi)有順序或等級(jí)。只能計(jì)算頻數(shù)和頻率“S0城市”2、變量的測(cè)量尺度8(2)定序尺度對(duì)事物之間等級(jí)或順序差類別的一種測(cè)度,可以比較優(yōu)劣或排序,但無(wú)法測(cè)出類別之間的準(zhǔn)確差值??梢杂?jì)算頻率、累計(jì)頻率“S4學(xué)歷”(3)定距尺度對(duì)事物類別或次序之間間距的測(cè)度。不僅能將事物區(qū)分為不同類型并進(jìn)行排序,而且可以準(zhǔn)確指出類別之間差距是多少?!皽囟取保?)定比尺度能夠測(cè)量?jī)蓚€(gè)測(cè)量值之間的比值“零點(diǎn)”溫度與重量(2)定序尺度93、變量名與變量值標(biāo)簽變量值標(biāo)簽是對(duì)變量取值含義的解釋說(shuō)明信息。4、缺失值系統(tǒng)缺失值:“.”/空字符串自定義缺失值:“缺失值屬性對(duì)話框”5、角色(1)輸入(2)目標(biāo)(3)兩者(4)無(wú)(5)分區(qū)(6)拆分3、變量名與變量值標(biāo)簽102.3數(shù)據(jù)的直接錄入1、開(kāi)放題的錄入“ID”——數(shù)值型開(kāi)放題“姓名”——字符型開(kāi)放題2、單選題的錄入“性別”字符直接錄入字符代碼+值標(biāo)簽
數(shù)值代碼+值標(biāo)簽3、半開(kāi)放題的錄入“其他,請(qǐng)指出”選項(xiàng)兩個(gè)變量:(1)選項(xiàng)
(2)獨(dú)立的開(kāi)放題:第一個(gè)變量名直接加“a”2.3數(shù)據(jù)的直接錄入1、開(kāi)放題的錄入115、多選題的錄入稱為“多重響應(yīng)”數(shù)據(jù)錄入后需定義多選題集“多重二分法”“多重分類法”(1)多重二分法指在編碼時(shí),對(duì)應(yīng)每一個(gè)選項(xiàng)都要定義一個(gè)變量,有幾個(gè)選項(xiàng)就有幾個(gè)變量,這些變量分別代表對(duì)其中一個(gè)選項(xiàng)的選擇結(jié)果,一般均為二分類,而其中必然有一個(gè)類別代表選中了這一選項(xiàng)。5、多選題的錄入12(2)多重分類法利用多個(gè)變量來(lái)對(duì)一個(gè)多選題的答案進(jìn)行定義,應(yīng)該用多少個(gè)變量由被訪者實(shí)際可能給出的最多答案數(shù)而定。而且,這些變量必須為數(shù)值型變量,利用值標(biāo)簽將答案標(biāo)出,所有變量采用一套值標(biāo)簽。之所以稱為多重分類法,是因?yàn)槊總€(gè)變量都是多分類的,每個(gè)變量代表被訪者的一次選擇。設(shè)定多選題變量集Tables模塊和多重響應(yīng)菜單(分析多重響應(yīng)定義變量集)(2)多重分類法136、半開(kāi)放多選題與半開(kāi)放單選題非常相似6、半開(kāi)放多選題142.4外部數(shù)據(jù)的獲取SPSS格式:“文件”“打開(kāi)”“數(shù)據(jù)”非SPSS格式:直接打開(kāi)(Excel格式)
利用文本向?qū)ёx入文本數(shù)據(jù)(文本數(shù)據(jù))
利用數(shù)據(jù)庫(kù)ODBC接口讀?。ˋccess數(shù)據(jù))2.4外部數(shù)據(jù)的獲取SPSS格式:“文件”“打開(kāi)151、讀取電子表格數(shù)據(jù)文件“文件”“打開(kāi)”“數(shù)據(jù)”或Demo.xls事先打開(kāi)了解文件結(jié)構(gòu):(1)包含幾個(gè)數(shù)據(jù)表(2)若只需讀入部分,了解精確位置(3)第1行是否為變量名1、讀取電子表格數(shù)據(jù)文件162、讀取文本數(shù)據(jù)文件“文件”“打開(kāi)文本數(shù)據(jù)”
“文件”“打開(kāi)”“數(shù)據(jù)”demo.txt2、讀取文本數(shù)據(jù)文件173、用ODBC接口讀取各種數(shù)據(jù)庫(kù)文件demo.mdb“文件”“打開(kāi)數(shù)據(jù)庫(kù)”“新建查詢”3、用ODBC接口讀取各種數(shù)據(jù)庫(kù)文件182.5數(shù)據(jù)的保存1、保存為SAV格式2、保存為其他數(shù)據(jù)格式2.5數(shù)據(jù)的保存1、保存為SAV格式19第三章變量級(jí)別的數(shù)據(jù)管理變量級(jí)別的數(shù)據(jù)管理:“轉(zhuǎn)換”文件級(jí)別的數(shù)據(jù)管理:“數(shù)據(jù)”第三章變量級(jí)別的數(shù)據(jù)管理變量級(jí)別的數(shù)據(jù)管理:“轉(zhuǎn)換”20“轉(zhuǎn)換”1、計(jì)算新變量:最為常用和重要的過(guò)程2、變量轉(zhuǎn)換:從菜單第2項(xiàng)開(kāi)始的多個(gè)計(jì)數(shù)過(guò)程、重編碼過(guò)程和離散化過(guò)程。實(shí)際上可以看成是“計(jì)算變量”過(guò)程某一方面的強(qiáng)化和打包。3、時(shí)間序列模型專用過(guò)程:“時(shí)間和日期向?qū)А?、“?chuàng)建時(shí)間序列”、“替換缺失值”4、自動(dòng)數(shù)據(jù)準(zhǔn)備5、其他:“隨機(jī)數(shù)字生成器”(第5章)、“運(yùn)行掛起的轉(zhuǎn)換”“轉(zhuǎn)換”1、計(jì)算新變量:最為常用和重要的過(guò)程213.1變量賦值變量賦值就是指在原有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶的要求,使用SPSS算術(shù)表達(dá)式及函數(shù),對(duì)所有記錄或滿足SPSS條件表達(dá)式的某些記錄進(jìn)行四則運(yùn)算,并將結(jié)果存入一個(gè)用戶指定的變量中,該指定變量可以是一個(gè)新變量,也可以是一個(gè)已經(jīng)存在的變量。1、算術(shù)表達(dá)式:由常量、SPSS變量名、SPSS算術(shù)運(yùn)算符(+、-、*、/、**)圓括號(hào)等組成的式子。數(shù)據(jù)類型和結(jié)果均為數(shù)值型。2、函數(shù):函數(shù)名(參數(shù));8類函數(shù)3、條件表達(dá)式與邏輯表達(dá)式:用來(lái)指定對(duì)哪些記錄進(jìn)行計(jì)算3.1變量賦值變量賦值就是指在原有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶的22計(jì)算變量“轉(zhuǎn)換”“計(jì)算變量”“目標(biāo)變量”文本框:用于輸入需要賦值的變量名候選變量列表“數(shù)字表達(dá)式”文本框:用于給目標(biāo)變量賦值“函數(shù)組”列表框“函數(shù)和特殊變量”列表框函數(shù)解釋文字文本框計(jì)算變量“轉(zhuǎn)換”“計(jì)算變量”“目標(biāo)變量”文本框:23spss數(shù)據(jù)的錄入與管理課件243.2已有變量值的分組合并將連續(xù)變量轉(zhuǎn)換為等級(jí)變量或?qū)⒎诸愖兞坎煌淖兞康燃?jí)進(jìn)行合并?!爸匦戮幋a為相同變量”:對(duì)原始變量的取值直接進(jìn)行重編碼“重新編碼為不同變量”:根據(jù)原始變量的取值生成一個(gè)新變量來(lái)記錄重編碼的結(jié)果。3.2已有變量值的分組合并將連續(xù)變量轉(zhuǎn)換為等級(jí)變量或?qū)⒎诸?5對(duì)連續(xù)性變量進(jìn)行分組合并兩種方法:重編碼
可視化分段過(guò)程重編碼:“轉(zhuǎn)換”“重新編碼為不同變量”分類變量類別的合并對(duì)連續(xù)性變量進(jìn)行分組合并兩種方法:重編碼26連續(xù)性變量的離散化可視化離散化過(guò)程:用于在可視界面下將連續(xù)變量進(jìn)行分段,該過(guò)程可以使用百分位數(shù)、標(biāo)準(zhǔn)差范圍或者等間距方式將連續(xù)變量劃分為若干組段,并采用圖形化操作的方式,非常直觀好用。最優(yōu)離散化過(guò)程:是對(duì)前述可視化離散過(guò)程的進(jìn)一步自動(dòng)化,根據(jù)某些作為“關(guān)鍵指示變量”的分類變量,將原有的一個(gè)或多個(gè)連續(xù)性變量按照該分類變量類間差異最大化的優(yōu)化原則離散化為分類變量,然后就可以使用離散后變量而非原始數(shù)據(jù)值進(jìn)行后續(xù)的分析了。連續(xù)性變量的離散化可視化離散化過(guò)程:用于在可視界面下將連續(xù)變273.4轉(zhuǎn)換菜單的其他功能變量的自動(dòng)重編碼——用于將字符變量轉(zhuǎn)換為數(shù)值變量變量值的移動(dòng)——某變量值的前移或后移指定數(shù)值的查找和計(jì)數(shù)——對(duì)某個(gè)個(gè)案進(jìn)行計(jì)數(shù)變量的編秩——根據(jù)某變量的數(shù)值大小來(lái)排出次序,然后將次序結(jié)果存儲(chǔ)到一個(gè)新變量中去自動(dòng)準(zhǔn)備建模數(shù)據(jù)隨機(jī)數(shù)字生成器3.4轉(zhuǎn)換菜單的其他功能變量的自動(dòng)重編碼——用于將字符變量28第四章文件級(jí)別的數(shù)據(jù)管理(1)簡(jiǎn)單命令:插入變量、插入個(gè)案、到達(dá)某條個(gè)案、復(fù)制數(shù)據(jù)集等(2)常用簡(jiǎn)單過(guò)程:排序、拆分文件、個(gè)案篩選和個(gè)案加權(quán),必須掌握。(3)數(shù)據(jù)重組向?qū)В河糜谶M(jìn)行數(shù)據(jù)轉(zhuǎn)置,或者對(duì)重復(fù)測(cè)量數(shù)據(jù)進(jìn)行長(zhǎng)型、寬型記錄格式間的轉(zhuǎn)換。(4)文件合并向?qū)В簩讉€(gè)數(shù)據(jù)文件合并為一個(gè)大的SPSS數(shù)據(jù)文件,含橫向合并和縱向合并兩種情況。(5)數(shù)據(jù)字典相關(guān)向?qū)В喊ǘx變量屬性,復(fù)制變量屬性,以及新建設(shè)定屬性三個(gè)向?qū)Ы缑?。?)與數(shù)據(jù)準(zhǔn)備有關(guān)的功能:用于復(fù)雜數(shù)據(jù)項(xiàng)目,用于簡(jiǎn)化數(shù)據(jù)管理工作。(7)與統(tǒng)計(jì)模型密切相關(guān)過(guò)程:正交設(shè)計(jì)過(guò)程(8)其他過(guò)程:定義多重響應(yīng)集、數(shù)據(jù)匯總過(guò)程等。第四章文件級(jí)別的數(shù)據(jù)管理(1)簡(jiǎn)單命令:插入變量、插入個(gè)案294.1幾個(gè)常用的過(guò)程1、排序個(gè)案數(shù)據(jù)編輯窗口中的記錄的前后次序在默認(rèn)情況下由錄入時(shí)的先后順序決定。(1)單變量排序:變量名處右擊,“升序排列”“降序排列”(2)多變量排序:使用“排序個(gè)案”對(duì)話框2、分割文件(SplitFile)3、選擇個(gè)案:用于只分析部分?jǐn)?shù)據(jù)4、加權(quán)個(gè)案:(1)以頻數(shù)格式錄入的數(shù)據(jù)
(2)案例數(shù)據(jù)抽樣權(quán)重的調(diào)整5、分類匯總:按指定的分類變量對(duì)個(gè)案進(jìn)行分組,并按分組對(duì)變量求指定的描述統(tǒng)計(jì)量。4.1幾個(gè)常用的過(guò)程1、排序個(gè)案304.3數(shù)據(jù)文件的重組與轉(zhuǎn)置1、數(shù)據(jù)的長(zhǎng)型與寬型格式指的是重復(fù)測(cè)量數(shù)據(jù)的兩種不同的排列方式。長(zhǎng)型格式:在重復(fù)測(cè)量數(shù)據(jù)中,每一次測(cè)量被單獨(dú)記錄為一個(gè)個(gè)案(anxiety.sav)寬型格式:在重復(fù)測(cè)量數(shù)據(jù)中,每一個(gè)個(gè)體被記錄為一個(gè)個(gè)案,他的所有測(cè)量被記錄在不同的變量中(anxiety2.sav)4.3數(shù)據(jù)文件的重組與轉(zhuǎn)置1、數(shù)據(jù)的長(zhǎng)型與寬型格式312、長(zhǎng)型格式轉(zhuǎn)換為寬型格式3、寬型格式轉(zhuǎn)換為長(zhǎng)型格式4、數(shù)據(jù)轉(zhuǎn)置2、長(zhǎng)型格式轉(zhuǎn)換為寬型格式324.3多個(gè)數(shù)據(jù)文件的合并1、縱向拼接指的是幾個(gè)數(shù)據(jù)集中的數(shù)據(jù)縱向相連,組成一個(gè)新的數(shù)據(jù)集,新數(shù)據(jù)集中的記錄數(shù)是原來(lái)幾個(gè)數(shù)據(jù)集中記錄數(shù)的總和。其實(shí)質(zhì)就是將兩個(gè)數(shù)據(jù)文件的變量按照各個(gè)變量名的含義一一對(duì)應(yīng)進(jìn)行首尾相接。(a和b)2、橫向合并指的是按照記錄的次序,或者某個(gè)關(guān)鍵變量的數(shù)值,將不同數(shù)據(jù)集中的不同變量拼接為一個(gè)數(shù)據(jù)集,新數(shù)據(jù)集中的變量數(shù)是所有原數(shù)據(jù)集中不重名變量的總和。實(shí)質(zhì)就是將兩個(gè)數(shù)據(jù)文件的記錄按照某種對(duì)應(yīng)關(guān)系一一進(jìn)行左右對(duì)接。(a和c)4.3多個(gè)數(shù)據(jù)文件的合并1、縱向拼接334.4與數(shù)據(jù)字典有關(guān)的功能如果有事先定義的數(shù)據(jù)字典格式,則可以先生成一個(gè)沒(méi)有記錄的空數(shù)據(jù)文件,將全部的數(shù)據(jù)字典設(shè)定好,將來(lái)在數(shù)據(jù)錄入完畢后使用復(fù)制文件屬性向?qū)子靡幌伦值浼纯桑蝗绻麤](méi)有事先定義的數(shù)據(jù)字典格式,則可以在錄入工作進(jìn)行了一段時(shí)間以后先使用變量屬性定義向?qū)瓿蓴?shù)據(jù)字典的設(shè)定工作,然后隨著錄入工作的進(jìn)行經(jīng)常掃描數(shù)據(jù)的情況,以及時(shí)更新字典,最后在錄入工作完畢后使用復(fù)制文件屬性向?qū)?yīng)用字典的最終版本。如果數(shù)據(jù)管理任務(wù)不太復(fù)雜,也可以直接在數(shù)據(jù)字典中錄入數(shù)據(jù),或者直接在變量視圖中修改屬性,或者直接在SPSS中錄入/導(dǎo)入數(shù)據(jù),然后利用設(shè)置未知測(cè)量級(jí)別向?qū)?lái)快速設(shè)定數(shù)據(jù)字典。4.4與數(shù)據(jù)字典有關(guān)的功能如果有事先定義的數(shù)據(jù)字典格式,則341、定義變量屬性2、復(fù)制變量屬性3、新建自定義屬性4、設(shè)置未知測(cè)量屬性1、定義變量屬性354.5與數(shù)據(jù)準(zhǔn)備有關(guān)的功能1、數(shù)據(jù)驗(yàn)證模塊2、自動(dòng)數(shù)據(jù)準(zhǔn)備過(guò)程3、標(biāo)識(shí)重復(fù)個(gè)案過(guò)程4、標(biāo)識(shí)異常個(gè)案過(guò)程5、最優(yōu)離散化過(guò)程6、缺失值分析4.5與數(shù)據(jù)準(zhǔn)備有關(guān)的功能1、數(shù)據(jù)驗(yàn)證模塊36數(shù)據(jù)驗(yàn)證模塊數(shù)據(jù)驗(yàn)證模塊用于實(shí)現(xiàn)數(shù)據(jù)核查功能,用戶通過(guò)自行定義數(shù)據(jù)驗(yàn)證規(guī)則,以確定個(gè)案取值是否有效。A單變量規(guī)則:?jiǎn)巫兞恳?guī)則包含一組應(yīng)用于單個(gè)變量的數(shù)值檢查規(guī)則,例如,范圍外值的檢查。對(duì)于單變量規(guī)則,有效值可以表示一個(gè)范圍,也可以表示為一個(gè)有效值列表。B交叉變量規(guī)則:交叉變量規(guī)則是用戶定義的涉及多個(gè)變量間邏輯關(guān)系的規(guī)則,由標(biāo)記無(wú)效值的邏輯表達(dá)式定義,可以應(yīng)用于單個(gè)變量,也可以應(yīng)用于變量組合。數(shù)據(jù)驗(yàn)證模塊數(shù)據(jù)驗(yàn)證模塊用于實(shí)現(xiàn)數(shù)據(jù)核查功能,用戶通過(guò)自行定371、定義驗(yàn)證規(guī)則“數(shù)據(jù)”“驗(yàn)證”“定義規(guī)則”2、進(jìn)行數(shù)據(jù)驗(yàn)證“數(shù)據(jù)”“驗(yàn)證”“驗(yàn)證數(shù)據(jù)”3、加載預(yù)定義規(guī)則“數(shù)據(jù)”“驗(yàn)證”“加載預(yù)定義規(guī)則”PredefinedValidationRules.sav1、定義驗(yàn)證規(guī)則38標(biāo)識(shí)重復(fù)個(gè)案標(biāo)識(shí)異常個(gè)案標(biāo)識(shí)重復(fù)個(gè)案39匯報(bào)結(jié)束謝謝大家!請(qǐng)各位批評(píng)指正匯報(bào)結(jié)束謝謝大家!請(qǐng)各位批評(píng)指正40spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取
第三章變量級(jí)別的數(shù)據(jù)管理第四章文件級(jí)別的數(shù)據(jù)管理通過(guò)閱讀文學(xué)作品,我們能提高文學(xué)鑒賞水平,培養(yǎng)文學(xué)情趣;spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)的錄入與管理spss數(shù)據(jù)41第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取
第三章變量級(jí)別的數(shù)據(jù)管理第四章文件級(jí)別的數(shù)據(jù)管理第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取42第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取數(shù)據(jù)的直接錄入非電子化的原始數(shù)據(jù)資料,需要直接將調(diào)查問(wèn)卷中的數(shù)據(jù)錄入進(jìn)SPSS軟件中,建立數(shù)據(jù)文件。外部數(shù)據(jù)的獲取已經(jīng)被錄入為其他數(shù)據(jù)格式的資料,需要將其內(nèi)容直接讀入SPSS中。第二章數(shù)據(jù)錄入與數(shù)據(jù)獲取數(shù)據(jù)的直接錄入432.2數(shù)據(jù)格式原則:(1)不同個(gè)案的數(shù)據(jù)不能再同一條記錄中出現(xiàn),即同一個(gè)案的數(shù)據(jù)應(yīng)當(dāng)獨(dú)占一行。(2)每一個(gè)測(cè)量指標(biāo)/影響因素只能占據(jù)一列的位置,即同一指標(biāo)的測(cè)量數(shù)值都應(yīng)當(dāng)錄入到同一個(gè)變量中去。2.2數(shù)據(jù)格式原則:44“數(shù)據(jù)錄入三部曲”(1)定義各變量名,即給每個(gè)指標(biāo)起個(gè)名字;(2)指定每個(gè)變量的各種屬性,即對(duì)每個(gè)指標(biāo)的一些統(tǒng)計(jì)特性做出指定;(3)錄入數(shù)據(jù),即把每個(gè)被訪者各指標(biāo)取值錄入為電子格式。“數(shù)據(jù)錄入三部曲”(1)定義各變量名,即給每個(gè)指標(biāo)起個(gè)名字;45變量屬性1、變量的存儲(chǔ)類型數(shù)值型字符串日期型(1)數(shù)值型(Numeric)最常用是由0~9的阿拉伯?dāng)?shù)字和其他特殊符號(hào),如美元符號(hào)、逗號(hào)或圓點(diǎn)組成的。(工資、年齡、成績(jī)等)標(biāo)準(zhǔn)數(shù)值型逗號(hào)數(shù)值型:每3位用逗號(hào)分隔圓點(diǎn)數(shù)值型:每3位用圓點(diǎn)分隔科學(xué)計(jì)數(shù)型美元數(shù)值型:顯示時(shí)帶美元符號(hào)用戶自定義型變量屬性1、變量的存儲(chǔ)類型46(2)字符型(String)較常用
默認(rèn)顯示寬度為8個(gè)字符位,區(qū)分大小寫字母,并且不能進(jìn)行數(shù)學(xué)運(yùn)算。用一對(duì)引號(hào)引起來(lái)(3)日期型(Date)表示日期或時(shí)間mm/dd/yy或類似的兩位數(shù)年份記錄方式(2)字符型(String)472、變量的測(cè)量尺度定類尺度定序尺度定距尺度定比尺度(1)定類尺度是對(duì)事物的類別或?qū)傩缘囊环N測(cè)量,按照事物的某種屬性對(duì)其進(jìn)行分類或分組。其值僅代表了事物的類別和屬性,僅能測(cè)定類別差,不能比較各類之間的大小,所以各類之間沒(méi)有順序或等級(jí)。只能計(jì)算頻數(shù)和頻率“S0城市”2、變量的測(cè)量尺度48(2)定序尺度對(duì)事物之間等級(jí)或順序差類別的一種測(cè)度,可以比較優(yōu)劣或排序,但無(wú)法測(cè)出類別之間的準(zhǔn)確差值??梢杂?jì)算頻率、累計(jì)頻率“S4學(xué)歷”(3)定距尺度對(duì)事物類別或次序之間間距的測(cè)度。不僅能將事物區(qū)分為不同類型并進(jìn)行排序,而且可以準(zhǔn)確指出類別之間差距是多少?!皽囟取保?)定比尺度能夠測(cè)量?jī)蓚€(gè)測(cè)量值之間的比值“零點(diǎn)”溫度與重量(2)定序尺度493、變量名與變量值標(biāo)簽變量值標(biāo)簽是對(duì)變量取值含義的解釋說(shuō)明信息。4、缺失值系統(tǒng)缺失值:“.”/空字符串自定義缺失值:“缺失值屬性對(duì)話框”5、角色(1)輸入(2)目標(biāo)(3)兩者(4)無(wú)(5)分區(qū)(6)拆分3、變量名與變量值標(biāo)簽502.3數(shù)據(jù)的直接錄入1、開(kāi)放題的錄入“ID”——數(shù)值型開(kāi)放題“姓名”——字符型開(kāi)放題2、單選題的錄入“性別”字符直接錄入字符代碼+值標(biāo)簽
數(shù)值代碼+值標(biāo)簽3、半開(kāi)放題的錄入“其他,請(qǐng)指出”選項(xiàng)兩個(gè)變量:(1)選項(xiàng)
(2)獨(dú)立的開(kāi)放題:第一個(gè)變量名直接加“a”2.3數(shù)據(jù)的直接錄入1、開(kāi)放題的錄入515、多選題的錄入稱為“多重響應(yīng)”數(shù)據(jù)錄入后需定義多選題集“多重二分法”“多重分類法”(1)多重二分法指在編碼時(shí),對(duì)應(yīng)每一個(gè)選項(xiàng)都要定義一個(gè)變量,有幾個(gè)選項(xiàng)就有幾個(gè)變量,這些變量分別代表對(duì)其中一個(gè)選項(xiàng)的選擇結(jié)果,一般均為二分類,而其中必然有一個(gè)類別代表選中了這一選項(xiàng)。5、多選題的錄入52(2)多重分類法利用多個(gè)變量來(lái)對(duì)一個(gè)多選題的答案進(jìn)行定義,應(yīng)該用多少個(gè)變量由被訪者實(shí)際可能給出的最多答案數(shù)而定。而且,這些變量必須為數(shù)值型變量,利用值標(biāo)簽將答案標(biāo)出,所有變量采用一套值標(biāo)簽。之所以稱為多重分類法,是因?yàn)槊總€(gè)變量都是多分類的,每個(gè)變量代表被訪者的一次選擇。設(shè)定多選題變量集Tables模塊和多重響應(yīng)菜單(分析多重響應(yīng)定義變量集)(2)多重分類法536、半開(kāi)放多選題與半開(kāi)放單選題非常相似6、半開(kāi)放多選題542.4外部數(shù)據(jù)的獲取SPSS格式:“文件”“打開(kāi)”“數(shù)據(jù)”非SPSS格式:直接打開(kāi)(Excel格式)
利用文本向?qū)ёx入文本數(shù)據(jù)(文本數(shù)據(jù))
利用數(shù)據(jù)庫(kù)ODBC接口讀?。ˋccess數(shù)據(jù))2.4外部數(shù)據(jù)的獲取SPSS格式:“文件”“打開(kāi)551、讀取電子表格數(shù)據(jù)文件“文件”“打開(kāi)”“數(shù)據(jù)”或Demo.xls事先打開(kāi)了解文件結(jié)構(gòu):(1)包含幾個(gè)數(shù)據(jù)表(2)若只需讀入部分,了解精確位置(3)第1行是否為變量名1、讀取電子表格數(shù)據(jù)文件562、讀取文本數(shù)據(jù)文件“文件”“打開(kāi)文本數(shù)據(jù)”
“文件”“打開(kāi)”“數(shù)據(jù)”demo.txt2、讀取文本數(shù)據(jù)文件573、用ODBC接口讀取各種數(shù)據(jù)庫(kù)文件demo.mdb“文件”“打開(kāi)數(shù)據(jù)庫(kù)”“新建查詢”3、用ODBC接口讀取各種數(shù)據(jù)庫(kù)文件582.5數(shù)據(jù)的保存1、保存為SAV格式2、保存為其他數(shù)據(jù)格式2.5數(shù)據(jù)的保存1、保存為SAV格式59第三章變量級(jí)別的數(shù)據(jù)管理變量級(jí)別的數(shù)據(jù)管理:“轉(zhuǎn)換”文件級(jí)別的數(shù)據(jù)管理:“數(shù)據(jù)”第三章變量級(jí)別的數(shù)據(jù)管理變量級(jí)別的數(shù)據(jù)管理:“轉(zhuǎn)換”60“轉(zhuǎn)換”1、計(jì)算新變量:最為常用和重要的過(guò)程2、變量轉(zhuǎn)換:從菜單第2項(xiàng)開(kāi)始的多個(gè)計(jì)數(shù)過(guò)程、重編碼過(guò)程和離散化過(guò)程。實(shí)際上可以看成是“計(jì)算變量”過(guò)程某一方面的強(qiáng)化和打包。3、時(shí)間序列模型專用過(guò)程:“時(shí)間和日期向?qū)А?、“?chuàng)建時(shí)間序列”、“替換缺失值”4、自動(dòng)數(shù)據(jù)準(zhǔn)備5、其他:“隨機(jī)數(shù)字生成器”(第5章)、“運(yùn)行掛起的轉(zhuǎn)換”“轉(zhuǎn)換”1、計(jì)算新變量:最為常用和重要的過(guò)程613.1變量賦值變量賦值就是指在原有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶的要求,使用SPSS算術(shù)表達(dá)式及函數(shù),對(duì)所有記錄或滿足SPSS條件表達(dá)式的某些記錄進(jìn)行四則運(yùn)算,并將結(jié)果存入一個(gè)用戶指定的變量中,該指定變量可以是一個(gè)新變量,也可以是一個(gè)已經(jīng)存在的變量。1、算術(shù)表達(dá)式:由常量、SPSS變量名、SPSS算術(shù)運(yùn)算符(+、-、*、/、**)圓括號(hào)等組成的式子。數(shù)據(jù)類型和結(jié)果均為數(shù)值型。2、函數(shù):函數(shù)名(參數(shù));8類函數(shù)3、條件表達(dá)式與邏輯表達(dá)式:用來(lái)指定對(duì)哪些記錄進(jìn)行計(jì)算3.1變量賦值變量賦值就是指在原有數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶的62計(jì)算變量“轉(zhuǎn)換”“計(jì)算變量”“目標(biāo)變量”文本框:用于輸入需要賦值的變量名候選變量列表“數(shù)字表達(dá)式”文本框:用于給目標(biāo)變量賦值“函數(shù)組”列表框“函數(shù)和特殊變量”列表框函數(shù)解釋文字文本框計(jì)算變量“轉(zhuǎn)換”“計(jì)算變量”“目標(biāo)變量”文本框:63spss數(shù)據(jù)的錄入與管理課件643.2已有變量值的分組合并將連續(xù)變量轉(zhuǎn)換為等級(jí)變量或?qū)⒎诸愖兞坎煌淖兞康燃?jí)進(jìn)行合并?!爸匦戮幋a為相同變量”:對(duì)原始變量的取值直接進(jìn)行重編碼“重新編碼為不同變量”:根據(jù)原始變量的取值生成一個(gè)新變量來(lái)記錄重編碼的結(jié)果。3.2已有變量值的分組合并將連續(xù)變量轉(zhuǎn)換為等級(jí)變量或?qū)⒎诸?5對(duì)連續(xù)性變量進(jìn)行分組合并兩種方法:重編碼
可視化分段過(guò)程重編碼:“轉(zhuǎn)換”“重新編碼為不同變量”分類變量類別的合并對(duì)連續(xù)性變量進(jìn)行分組合并兩種方法:重編碼66連續(xù)性變量的離散化可視化離散化過(guò)程:用于在可視界面下將連續(xù)變量進(jìn)行分段,該過(guò)程可以使用百分位數(shù)、標(biāo)準(zhǔn)差范圍或者等間距方式將連續(xù)變量劃分為若干組段,并采用圖形化操作的方式,非常直觀好用。最優(yōu)離散化過(guò)程:是對(duì)前述可視化離散過(guò)程的進(jìn)一步自動(dòng)化,根據(jù)某些作為“關(guān)鍵指示變量”的分類變量,將原有的一個(gè)或多個(gè)連續(xù)性變量按照該分類變量類間差異最大化的優(yōu)化原則離散化為分類變量,然后就可以使用離散后變量而非原始數(shù)據(jù)值進(jìn)行后續(xù)的分析了。連續(xù)性變量的離散化可視化離散化過(guò)程:用于在可視界面下將連續(xù)變673.4轉(zhuǎn)換菜單的其他功能變量的自動(dòng)重編碼——用于將字符變量轉(zhuǎn)換為數(shù)值變量變量值的移動(dòng)——某變量值的前移或后移指定數(shù)值的查找和計(jì)數(shù)——對(duì)某個(gè)個(gè)案進(jìn)行計(jì)數(shù)變量的編秩——根據(jù)某變量的數(shù)值大小來(lái)排出次序,然后將次序結(jié)果存儲(chǔ)到一個(gè)新變量中去自動(dòng)準(zhǔn)備建模數(shù)據(jù)隨機(jī)數(shù)字生成器3.4轉(zhuǎn)換菜單的其他功能變量的自動(dòng)重編碼——用于將字符變量68第四章文件級(jí)別的數(shù)據(jù)管理(1)簡(jiǎn)單命令:插入變量、插入個(gè)案、到達(dá)某條個(gè)案、復(fù)制數(shù)據(jù)集等(2)常用簡(jiǎn)單過(guò)程:排序、拆分文件、個(gè)案篩選和個(gè)案加權(quán),必須掌握。(3)數(shù)據(jù)重組向?qū)В河糜谶M(jìn)行數(shù)據(jù)轉(zhuǎn)置,或者對(duì)重復(fù)測(cè)量數(shù)據(jù)進(jìn)行長(zhǎng)型、寬型記錄格式間的轉(zhuǎn)換。(4)文件合并向?qū)В簩讉€(gè)數(shù)據(jù)文件合并為一個(gè)大的SPSS數(shù)據(jù)文件,含橫向合并和縱向合并兩種情況。(5)數(shù)據(jù)字典相關(guān)向?qū)В喊ǘx變量屬性,復(fù)制變量屬性,以及新建設(shè)定屬性三個(gè)向?qū)Ы缑妗#?)與數(shù)據(jù)準(zhǔn)備有關(guān)的功能:用于復(fù)雜數(shù)據(jù)項(xiàng)目,用于簡(jiǎn)化數(shù)據(jù)管理工作。(7)與統(tǒng)計(jì)模型密切相關(guān)過(guò)程:正交設(shè)計(jì)過(guò)程(8)其他過(guò)程:定義多重響應(yīng)集、數(shù)據(jù)匯總過(guò)程等。第四章文件級(jí)別的數(shù)據(jù)管理(1)簡(jiǎn)單命令:插入變量、插入個(gè)案694.1幾個(gè)常用的過(guò)程1、排序個(gè)案數(shù)據(jù)編輯窗口中的記錄的前后次序在默認(rèn)情況下由錄入時(shí)的先后順序決定。(1)單變量排序:變量名處右擊,“升序排列”“降序排列”(2)多變量排序:使用“排序個(gè)案”對(duì)話框2、分割文件(SplitFile)3、選擇個(gè)案:用于只分析部分?jǐn)?shù)據(jù)4、加權(quán)個(gè)案:(1)以頻數(shù)格式錄入的數(shù)據(jù)
(2)案例數(shù)據(jù)抽樣權(quán)重的調(diào)整5、分類匯總:按指定的分類變量對(duì)個(gè)案進(jìn)行分組,并按分組對(duì)變量求指定的描述統(tǒng)計(jì)量。4.1幾個(gè)常用的過(guò)程1、排序個(gè)案704.3數(shù)據(jù)文件的重組與轉(zhuǎn)置1、數(shù)據(jù)的長(zhǎng)型與寬型格式指的是重復(fù)測(cè)量數(shù)據(jù)的兩種不同的排列方式。長(zhǎng)型格式:在重復(fù)測(cè)量數(shù)據(jù)中,每一次測(cè)量被單獨(dú)記錄為一個(gè)個(gè)案(anxiety.sav)寬型格式:在重復(fù)測(cè)量數(shù)據(jù)中,每一個(gè)個(gè)體被記錄為一個(gè)個(gè)案,他的所有測(cè)量被記錄在不同的變量中(anxiety2.sav)4.3數(shù)據(jù)文件的重組與轉(zhuǎn)置1、數(shù)據(jù)的長(zhǎng)型與寬型格式712、長(zhǎng)型格式轉(zhuǎn)換為寬型格式3、寬型格式轉(zhuǎn)換為長(zhǎng)型格式
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程合同條款承包協(xié)議書(shū)
- 2024年中級(jí)經(jīng)濟(jì)師考試題庫(kù)及參考答案(預(yù)熱題)
- 二零二五版美容院美甲美睫技術(shù)培訓(xùn)合同3篇
- 通省隧道施工方案
- 二零二五年度棉被產(chǎn)品進(jìn)出口貿(mào)易合作框架協(xié)議4篇
- 西裝腹肌健身課程設(shè)計(jì)
- 2025年度食品包裝代加工合作協(xié)議范本4篇
- 二零二五年度汽車融資租賃擔(dān)保合同3篇
- 二零二五民法典配套:保證擔(dān)保合同中的擔(dān)保權(quán)行使期限4篇
- 年度汽車防滑鏈戰(zhàn)略市場(chǎng)規(guī)劃報(bào)告
- 2025年工程合作協(xié)議書(shū)
- 2025年山東省東營(yíng)市東營(yíng)區(qū)融媒體中心招聘全媒體采編播專業(yè)技術(shù)人員10人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年宜賓人才限公司招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- KAT1-2023井下探放水技術(shù)規(guī)范
- 垃圾處理廠工程施工組織設(shè)計(jì)
- 天皰瘡患者護(hù)理
- 駕駛證學(xué)法減分(學(xué)法免分)題庫(kù)及答案200題完整版
- 2024年四川省瀘州市中考英語(yǔ)試題含解析
- 2025屆河南省九師聯(lián)盟商開(kāi)大聯(lián)考高一數(shù)學(xué)第一學(xué)期期末學(xué)業(yè)質(zhì)量監(jiān)測(cè)模擬試題含解析
- 撫養(yǎng)權(quán)起訴狀(31篇)
- 2024年“一崗雙責(zé)”制度(五篇)
評(píng)論
0/150
提交評(píng)論